Aller au contenu principal

Ajouter une Base de Connaissances (Knowledge)

Donner de la mémoire spécialisée à votre GPT

Les instructions système définissent le comportement de votre GPT. La base de connaissances (Knowledge) lui donne accès à des informations spécifiques que ChatGPT ne possède pas nativement : vos documents internes, vos procédures, votre catalogue produit, votre base réglementaire.

C’est ce qui transforme un GPT généraliste en un expert de votre domaine.

Comment fonctionne la Knowledge

Le téléchargement de fichiers

Dans l’onglet Configurer du GPT Builder, la section Knowledge vous permet d’uploader des fichiers. Votre GPT pourra ensuite les consulter pour répondre aux questions des utilisateurs.

Formats supportés :

  • Documents : PDF, DOCX, TXT, MD
  • Données : CSV, XLSX, JSON
  • Code : PY, JS, TS, HTML, CSS
  • Images : PNG, JPG, GIF, WEBP

Limite : jusqu’à 20 fichiers par GPT, avec une taille maximale de 512 Mo au total.

Le mécanisme de recherche (RAG)

Votre GPT n’ingère pas vos fichiers mot à mot. Il utilise un système de Retrieval-Augmented Generation (RAG) :

  1. Les fichiers sont découpés en segments
  2. Quand l’utilisateur pose une question, les segments les plus pertinents sont récupérés
  3. ChatGPT génère sa réponse en s’appuyant sur ces segments

Cela signifie que la qualité de vos documents impacte directement la qualité des réponses.

Préparer vos documents

Structurez vos fichiers

  • Utilisez des titres et sous-titres clairs dans vos documents
  • Préférez un document par thème plutôt qu’un seul fichier monolithique
  • Ajoutez un sommaire en début de document pour les fichiers longs

Optimisez pour la recherche

  • Rédigez des phrases complètes (pas des mots-clés isolés)
  • Incluez les questions fréquentes et leurs réponses dans vos documents
  • Évitez les tableaux complexes — le RAG les gère mal. Préférez des listes ou du texte structuré.

Exemples de documents utiles

Type de GPTDocuments à fournir
Assistant RHConvention collective, règlement intérieur, FAQ interne
Expert produitFiches techniques, comparatifs, FAQ clients
Coach commercialArgumentaire de vente, objections/réponses, études de cas
Assistant juridiqueTextes de loi, jurisprudence, modèles de contrats

Mise en pratique

Créons une base de connaissances pour un GPT « Assistant Onboarding » :

  1. Fichier 1 — guide-nouvel-employe.pdf : le guide d’accueil complet
  2. Fichier 2 — faq-rh.md : les 30 questions les plus fréquentes des nouveaux arrivants
  3. Fichier 3 — organigramme.pdf : la structure de l’entreprise
  4. Fichier 4 — outils-internes.md : tutoriels pour les outils (Slack, Jira, GitLab)
  5. Fichier 5 — glossaire.md : le vocabulaire interne et les acronymes

Dans les instructions, ajoutez : « Quand on te pose une question, consulte d’abord tes fichiers de connaissances. Si la réponse n’y figure pas, indique-le et propose une réponse basée sur tes connaissances générales. »

Erreurs courantes

  • Uploader des fichiers bruts non structurés : un export PDF de 500 pages sans titres donnera des résultats médiocres. Prenez le temps de structurer.
  • Mélanger les sujets dans un même fichier : un fichier « tout-en-un » rend la recherche imprécise. Séparez par thème.
  • Oublier de mettre à jour : vos documents évoluent. Si votre politique RH change, mettez à jour le fichier dans le GPT.
  • Surcharger la Knowledge : 20 fichiers ne sont pas toujours nécessaires. Mieux vaut 5 documents bien structurés que 20 documents médiocres.
  • Ignorer la confidentialité : les fichiers uploadés dans un GPT public sont accessibles via le GPT. Ne partagez jamais de données confidentielles dans un GPT publié.

Points clés

  • La Knowledge donne à votre GPT un accès à vos documents spécifiques via un système RAG
  • La qualité des réponses dépend directement de la qualité et la structure de vos fichiers
  • Préférez plusieurs documents thématiques à un seul fichier volumineux
  • Formats supportés : PDF, DOCX, CSV, JSON, code, images — jusqu’à 20 fichiers / 512 Mo
  • Attention à la confidentialité : ne mettez pas de données sensibles dans un GPT public