Extraction flexible avec outils
Ecrire des schemas JSON detailles pour chaque tache d’extraction de donnees peut etre fastidieux. Il existe une astuce qui vous permet de specifier la structure de donnees desiree directement dans le prompt au lieu de creer des schemas complexes.
L’approche du schema flexible
Au lieu d’ecrire un schema detaille pour chaque tache, creez un seul outil generique appele to_json qui accepte n’importe quelle structure d’objet. Le schema d’entree autorise les proprietes additionnelles, et vous specifiez vos exigences exactes dans le prompt lui-meme.
Cette approche elimine un point de friction majeur : la gestion constante de grands schemas JSON. Les resultats ne seront pas tout a fait aussi bons qu’avec un schema dedie, mais vous obtiendrez du JSON de haute qualite avec beaucoup moins de travail.
Comment ca fonctionne
- Creer un seul schema flexible qui accepte n’importe quelle structure d’objet
- Dans votre prompt, specifier exactement la structure de donnees voulue
- Dire a Claude d’appeler l’outil
to_jsonavec la structure specifiee - Utiliser
tool_choicepour forcer Claude a utiliser votre outil
Configurer le prompt
Soyez tres explicite sur la structure voulue :
Analysez l'article ci-dessous et extrayez les donnees cles.
Puis appelez l'outil to_json.
<article_text>
{result["text"]}
</article_text>
Quand vous appelez to_json, passez la structure suivante :
{{
"title": str # titre de l'article,
"author": str # auteur de l'article,
"topics": List[str] # Liste des sujets mentionnes
}}
Modifier facilement la structure
Le vrai avantage apparait quand vous devez modifier la structure. Au lieu de reecrire un schema entier, mettez simplement a jour le prompt. Ajouter un champ ? Une seule ligne :
"num_topics": int # Nombre de sujets mentionnes
Aucune modification de schema necessaire.
Quand utiliser chaque approche
Schema flexible (ideal pour) :
- Prototypage rapide et experimentation
- Taches d’extraction de donnees simples
- Situations ou les exigences changent frequemment
Schema dedie (ideal pour) :
- Taches critiques d’extraction en production
- Structures de donnees imbriquees complexes
- Quand vous avez besoin de la precision maximale
L’approche flexible offre environ 90% de la qualite avec 10% du travail de configuration.