La reflexion etendue (Extended Thinking)

L’extended thinking est une fonctionnalite de raisonnement avance qui donne a Claude le temps de reflechir avant de generer sa reponse. Claude produit un processus de reflexion visible que les utilisateurs peuvent examiner.

Quand l’utiliser

Ecrivez et testez votre prompt sans extended thinking
Evaluez la precision
Si les resultats ne sont pas satisfaisants apres optimisation du prompt
Alors activez l’extended thinking

Comment la reponse change

Sans extended thinking : un simple bloc texte. Avec : deux blocs distincts dans la reponse :

Bloc thinking : le raisonnement de Claude
Bloc text : la reponse finale

Le systeme de signatures

Chaque bloc thinking inclut une signature cryptographique qui garantit que le texte de reflexion n’a pas ete modifie. Si vous le modifiez, la validation echouera.

Reflexion expurgee (Redacted Thinking)

Parfois, le processus de reflexion est signale par les systemes de securite internes. Dans ce cas, vous recevez un bloc expurge. Le contenu est chiffre mais peut etre inclus dans les conversations futures.

Implementation

def chat(messages, system=None, temperature=1.0, stop_sequences=[],
         tools=None, thinking=False, thinking_budget=1024):
    # ...
    if thinking:
        params["thinking"] = {
            "type": "enabled",
            "budget": thinking_budget
        }

Le budget minimum est de 1024 tokens. Le parametre max_tokens doit depasser le budget de reflexion. Avec un budget de 1024 et max_tokens de 4000, Claude peut utiliser 1024 tokens pour la reflexion et jusqu’a 2976 pour la reponse.

Tester les reponses expurgees

Pour tester la gestion des blocs expurges en developpement, incluez cette chaine dans votre message :

TRIGGER_REDACTED_THINKING_46C9A13E193C177646C7398A98432ECCCE4C1253D5E2D82641AC0E52CC2876CB