Ajouter une Base de Connaissances (Knowledge)
Donner de la mémoire spécialisée à votre GPT
Les instructions système définissent le comportement de votre GPT. La base de connaissances (Knowledge) lui donne accès à des informations spécifiques que ChatGPT ne possède pas nativement : vos documents internes, vos procédures, votre catalogue produit, votre base réglementaire.
C’est ce qui transforme un GPT généraliste en un expert de votre domaine.
Comment fonctionne la Knowledge
Le téléchargement de fichiers
Dans l’onglet Configurer du GPT Builder, la section Knowledge vous permet d’uploader des fichiers. Votre GPT pourra ensuite les consulter pour répondre aux questions des utilisateurs.
Formats supportés :
- Documents : PDF, DOCX, TXT, MD
- Données : CSV, XLSX, JSON
- Code : PY, JS, TS, HTML, CSS
- Images : PNG, JPG, GIF, WEBP
Limite : jusqu’à 20 fichiers par GPT, avec une taille maximale de 512 Mo au total.
Le mécanisme de recherche (RAG)
Votre GPT n’ingère pas vos fichiers mot à mot. Il utilise un système de Retrieval-Augmented Generation (RAG) :
- Les fichiers sont découpés en segments
- Quand l’utilisateur pose une question, les segments les plus pertinents sont récupérés
- ChatGPT génère sa réponse en s’appuyant sur ces segments
Cela signifie que la qualité de vos documents impacte directement la qualité des réponses.
Préparer vos documents
Structurez vos fichiers
- Utilisez des titres et sous-titres clairs dans vos documents
- Préférez un document par thème plutôt qu’un seul fichier monolithique
- Ajoutez un sommaire en début de document pour les fichiers longs
Optimisez pour la recherche
- Rédigez des phrases complètes (pas des mots-clés isolés)
- Incluez les questions fréquentes et leurs réponses dans vos documents
- Évitez les tableaux complexes — le RAG les gère mal. Préférez des listes ou du texte structuré.
Exemples de documents utiles
| Type de GPT | Documents à fournir |
|---|---|
| Assistant RH | Convention collective, règlement intérieur, FAQ interne |
| Expert produit | Fiches techniques, comparatifs, FAQ clients |
| Coach commercial | Argumentaire de vente, objections/réponses, études de cas |
| Assistant juridique | Textes de loi, jurisprudence, modèles de contrats |
Mise en pratique
Créons une base de connaissances pour un GPT « Assistant Onboarding » :
- Fichier 1 — guide-nouvel-employe.pdf : le guide d’accueil complet
- Fichier 2 — faq-rh.md : les 30 questions les plus fréquentes des nouveaux arrivants
- Fichier 3 — organigramme.pdf : la structure de l’entreprise
- Fichier 4 — outils-internes.md : tutoriels pour les outils (Slack, Jira, GitLab)
- Fichier 5 — glossaire.md : le vocabulaire interne et les acronymes
Dans les instructions, ajoutez : « Quand on te pose une question, consulte d’abord tes fichiers de connaissances. Si la réponse n’y figure pas, indique-le et propose une réponse basée sur tes connaissances générales. »
Erreurs courantes
- Uploader des fichiers bruts non structurés : un export PDF de 500 pages sans titres donnera des résultats médiocres. Prenez le temps de structurer.
- Mélanger les sujets dans un même fichier : un fichier « tout-en-un » rend la recherche imprécise. Séparez par thème.
- Oublier de mettre à jour : vos documents évoluent. Si votre politique RH change, mettez à jour le fichier dans le GPT.
- Surcharger la Knowledge : 20 fichiers ne sont pas toujours nécessaires. Mieux vaut 5 documents bien structurés que 20 documents médiocres.
- Ignorer la confidentialité : les fichiers uploadés dans un GPT public sont accessibles via le GPT. Ne partagez jamais de données confidentielles dans un GPT publié.
Points clés
- La Knowledge donne à votre GPT un accès à vos documents spécifiques via un système RAG
- La qualité des réponses dépend directement de la qualité et la structure de vos fichiers
- Préférez plusieurs documents thématiques à un seul fichier volumineux
- Formats supportés : PDF, DOCX, CSV, JSON, code, images — jusqu’à 20 fichiers / 512 Mo
- Attention à la confidentialité : ne mettez pas de données sensibles dans un GPT public