Aller au contenu principal

Introduction au RAG

Le RAG (Retrieval Augmented Generation) est une technique pour travailler avec de gros documents. Plutot que d’injecter un rapport financier de 800 pages dans un seul prompt, le RAG trouve et inclut uniquement les sections les plus pertinentes pour chaque question.

Option 1 : tout mettre dans le prompt

Extraire tout le texte et l’injecter directement dans le prompt. Problemes :

  • Limite stricte sur la quantite de texte que Claude peut traiter
  • Claude est moins efficace avec des prompts tres longs
  • Les prompts plus longs coutent plus cher et prennent plus de temps

Option 2 : decouper en segments (c’est le RAG)

Decouper le document en segments lors d’une etape de preprocessing, puis ne chercher et inclure que les segments pertinents a chaque question utilisateur.

Avantages

  • Claude se concentre sur le contenu le plus pertinent
  • Passe a l’echelle pour de tres gros documents
  • Fonctionne avec plusieurs documents
  • Prompts plus petits = moins cher et plus rapide

Inconvenients

  • Necessite une etape de preprocessing
  • Il faut un mecanisme de recherche pour trouver les segments pertinents
  • Les segments inclus peuvent manquer de contexte
  • Plusieurs strategies de decoupage possibles

Composants cles du RAG

  1. Preprocessing et decoupage de documents
  2. Mecanisme de recherche pour trouver les segments pertinents
  3. Selection intelligente des segments a inclure dans les prompts