Eviter les hallucinations
Le probleme
Claude peut parfois “halluciner” : produire des affirmations fausses ou non justifiees. C’est un comportement connu de tous les grands modeles de langage.
Techniques de mitigation
1. Donner une porte de sortie
Dites a Claude qu’il est acceptable de ne pas savoir :
"Reponds uniquement si tu es certain de la reponse. Si tu n'es pas sur, dis 'Je ne suis pas certain.'"
Cela reduit la tendance de Claude a inventer des reponses pour etre “utile”.
2. Exiger des preuves avant de repondre
Pour les questions basees sur des documents, demandez a Claude d’extraire d’abord des citations pertinentes, puis de baser sa reponse uniquement sur ces citations :
"Commence par extraire les passages pertinents du document entre des balises <citations></citations>.
Ensuite, reponds a la question en te basant uniquement sur ces citations.
Si aucune citation ne repond a la question, dis-le explicitement."
3. Baisser la temperature
Une temperature proche de 0 produit des reponses plus conservatrices et standardisees. Cela peut reduire les hallucinations, surtout pour des questions factuelles.
4. Combiner les techniques
Les meilleures strategies combinent plusieurs approches :
- Clarte et precision dans les instructions
- Balises XML pour separer les donnees
- Reflexion etape par etape
- Porte de sortie explicite
Informations distractrices
Quand un document contient des informations proches mais pas exactement pertinentes, Claude peut etre trompe. La technique “extraire d’abord, repondre ensuite” est particulierement efficace dans ce cas.
Exercices
Exercice 1 : Corriger une hallucination
Claude affirme parfois des faits errones sur des celebrites. Modifiez le prompt pour lui donner la possibilite de dire “je ne suis pas sur”.
Exercice 2 : Hallucination sur un document
Etant donne un long document, demandez a Claude de repondre a une question en extrayant d’abord des citations, puis en basant sa reponse uniquement sur ces citations.