Eviter les hallucinations — Prompt Engineering

Le probleme

Claude peut parfois “halluciner” : produire des affirmations fausses ou non justifiees. C’est un comportement connu de tous les grands modeles de langage.

Techniques de mitigation

1. Donner une porte de sortie

Dites a Claude qu’il est acceptable de ne pas savoir :

"Reponds uniquement si tu es certain de la reponse. Si tu n'es pas sur, dis 'Je ne suis pas certain.'"

Cela reduit la tendance de Claude a inventer des reponses pour etre “utile”.

2. Exiger des preuves avant de repondre

Pour les questions basees sur des documents, demandez a Claude d’extraire d’abord des citations pertinentes, puis de baser sa reponse uniquement sur ces citations :

"Commence par extraire les passages pertinents du document entre des balises <citations></citations>.
Ensuite, reponds a la question en te basant uniquement sur ces citations.
Si aucune citation ne repond a la question, dis-le explicitement."

3. Baisser la temperature

Une temperature proche de 0 produit des reponses plus conservatrices et standardisees. Cela peut reduire les hallucinations, surtout pour des questions factuelles.

4. Combiner les techniques

Les meilleures strategies combinent plusieurs approches :

Clarte et precision dans les instructions
Balises XML pour separer les donnees
Reflexion etape par etape
Porte de sortie explicite

Informations distractrices

Quand un document contient des informations proches mais pas exactement pertinentes, Claude peut etre trompe. La technique “extraire d’abord, repondre ensuite” est particulierement efficace dans ce cas.

Exercices

Exercice 1 : Corriger une hallucination

Claude affirme parfois des faits errones sur des celebrites. Modifiez le prompt pour lui donner la possibilite de dire “je ne suis pas sur”.

Exercice 2 : Hallucination sur un document

Etant donne un long document, demandez a Claude de repondre a une question en extrayant d’abord des citations, puis en basant sa reponse uniquement sur ces citations.