Aller au contenu principal

Introduction au RAG

La generation augmentee par la recherche (RAG, Retrieval Augmented Generation) est une technique qui permet de travailler avec de grands documents en les decoupant en morceaux plus petits et en ne fournissant a Claude que les parties les plus pertinentes pour chaque question.

Le probleme des grands documents

Quand vous avez un document massif (un rapport financier de 800 pages par exemple) et voulez poser des questions specifiques, comment transmettre les bonnes informations a Claude ?

Option 1 : Tout inclure dans le prompt

L’approche directe consiste a extraire tout le texte et a le mettre dans un seul prompt. Limites serieuses :

  • Les limites de tokens empechent les tres longs documents de tenir
  • Claude devient moins efficace avec des prompts extremement longs
  • Les prompts plus gros coutent plus cher et prennent plus de temps
  • La performance se degrade quand il y a trop d’informations a trier

Option 2 : Decouper en morceaux (RAG)

Le RAG prend une approche plus intelligente en pretraitant les documents en morceaux gerables, puis en ne recuperant que les chunks pertinents pour chaque question :

  1. Decouper le document en chunks (Perspectives strategiques, Facteurs de risque, Bilan, etc.)
  2. Quand un utilisateur pose une question, analyser ce qu’il cherche
  3. Trouver les chunks les plus pertinents pour sa question
  4. N’inclure que ces chunks pertinents dans le prompt a Claude

Avantages du RAG

  • Claude peut se concentrer sur le contenu le plus pertinent
  • Passe a l’echelle pour de tres grands documents et collections
  • Fonctionne a travers des collections de documents
  • Des prompts plus petits = traitement plus rapide et couts reduits

Defis du RAG

  • Necessite une etape de pretraitement pour decouper les documents
  • Necessite un mecanisme de recherche pour trouver les chunks pertinents
  • Les chunks recuperes pourraient ne pas contenir tout le contexte necessaire
  • Nombreuses facons de decouper le texte, chacune avec ses compromis

Quand utiliser le RAG

Le RAG excelle quand vous travaillez avec de grands documents ou collections ou les utilisateurs posent des questions specifiques qui ne necessitent que des portions du contenu. La complexite du pretraitement se justifie quand vous devez depasser ce qui tient dans un seul prompt.