La reflexion etendue (Extended Thinking)
L’extended thinking est une fonctionnalite de raisonnement avance qui donne a Claude le temps de reflechir avant de generer sa reponse. Claude produit un processus de reflexion visible que les utilisateurs peuvent examiner.
Quand l’utiliser
- Ecrivez et testez votre prompt sans extended thinking
- Evaluez la precision
- Si les resultats ne sont pas satisfaisants apres optimisation du prompt
- Alors activez l’extended thinking
Comment la reponse change
Sans extended thinking : un simple bloc texte. Avec : deux blocs distincts dans la reponse :
- Bloc thinking : le raisonnement de Claude
- Bloc text : la reponse finale
Le systeme de signatures
Chaque bloc thinking inclut une signature cryptographique qui garantit que le texte de reflexion n’a pas ete modifie. Si vous le modifiez, la validation echouera.
Reflexion expurgee (Redacted Thinking)
Parfois, le processus de reflexion est signale par les systemes de securite internes. Dans ce cas, vous recevez un bloc expurge. Le contenu est chiffre mais peut etre inclus dans les conversations futures.
Implementation
def chat(messages, system=None, temperature=1.0, stop_sequences=[],
tools=None, thinking=False, thinking_budget=1024):
# ...
if thinking:
params["thinking"] = {
"type": "enabled",
"budget": thinking_budget
}
Le budget minimum est de 1024 tokens. Le parametre max_tokens doit depasser le budget de reflexion. Avec un budget de 1024 et max_tokens de 4000, Claude peut utiliser 1024 tokens pour la reflexion et jusqu’a 2976 pour la reponse.
Tester les reponses expurgees
Pour tester la gestion des blocs expurges en developpement, incluez cette chaine dans votre message :
TRIGGER_REDACTED_THINKING_46C9A13E193C177646C7398A98432ECCCE4C1253D5E2D82641AC0E52CC2876CB