Pas grand monde ne comprend le concept de “Fine-tuning” 😭

Article

Pas grand monde ne comprend le concept de “Fine-tuning” 😭 Pourtant c’est une des clés de l’IA générative! Copystormer, mon générateur de posts Linkedin, est basé sur des modèles fournis par OpenAI (text-davinci-003, gpt-3.5-turbo et gpt-4) Mais je me suis pas contenté de prendre les demandes comme “écrit un post sur le télétravail” pour la fournir aux modèles J’ai “fine-tuné” (ou peaufiné) ces modèles pour mon cas d’usage ✨ En pratique: 1️⃣ j’ai fourni à Open un dataset de milliers de posts Linkedin 2️⃣ j’ai demandé à OpenAI de créer de nouveaux modèles uniquement pour moi à partir de ce dataset → Résultat : Copystormer a un feeling très pointu du STYLE d’un post Linkedin ⚠️ MAIS ⚠️ Il s’agit uniquement de style! Ca ne permet pas d’améliorer le FOND des posts Pour qu'un modèle fournisse de l’information précise, c’est une technique totalement différente qu’il faut utiliser! Ça s’appelle la Recherche Vectorielle 🔍 Exemple: vous voulez créer un chatbot d’entreprise 👉 il aura pas le droit de se tromper ou d’halluciner 👉 il faudra qu’il cite ses sources pour qu’on puisse vérifier Dans ce cas: 1️⃣ Constituez une base de données avec votre documentation (sur Notion par exemple!) 2️⃣ Attribuez à chacun des docs un point dans l’espace (= un vecteur) en fonction du sujet Ex: un doc sur l’onboarding des nouveaux sera à proximité d’un autre doc RH comme celui expliquant la politique de RTT mais loin d’un doc sur les OKR du trimestre 3️⃣ Dès que quelqu’un pose une question au chatbot, la position dans l’espace de la question est calculé 4️⃣ Les docs “proches spatialement” de la question + la question sont envoyés au modèle qui a donc toute l’info pour répondre parfaitement ! C’est de cette façon que l’IA pourra avoir la bonne réponse ✔️ Et non avec du fine-tuning!

Publication

1 an(s) •

Commentaires Linkedin

39 commentaires

Réactions Linkedin
48