Le support d'images
Les capacites de vision de Claude permettent d’inclure des images dans vos messages et de demander des analyses sophistiquees : description, comparaison, comptage d’objets, ou analyses visuelles complexes.
Limites techniques
- Jusqu’a 100 images par requete
- 5 Mo maximum par image
- Une seule image : max 8000px en hauteur/largeur
- Plusieurs images : max 2000px chacune
- Formats : base64 ou URL
- Calcul de tokens :
(largeur px x hauteur px) / 750
Inclure une image
with open("image.png", "rb") as f:
image_bytes = base64.standard_b64encode(f.read()).decode("utf-8")
add_user_message(messages, [
{
"type": "image",
"source": {
"type": "base64",
"media_type": "image/png",
"data": image_bytes,
}
},
{
"type": "text",
"text": "Que vois-tu dans cette image ?"
}
])
L’importance du prompting
Les techniques de prompting sont critiques pour la vision. Un prompt simple comme “Combien de billes dans cette image ?” peut donner un resultat faux.
Analyse etape par etape
Analyse cette image de billes et determine le nombre exact :
1. Identifie chaque bille unique une par une. Attribue-lui un numero.
2. Verifie en recomptant depuis le coin inferieur gauche, rangee par rangee.
Quel est le nombre exact et verifie de billes ?
Exemples one-shot
Incluez un exemple avec son resultat connu avant l’image cible pour ameliorer significativement la precision.
Exemple concret : evaluation de risque incendie
Avec des images satellite, Claude peut analyser la vegetation autour d’une habitation, evaluer les branches en surplomb, identifier les chemins de combustible, et attribuer un score de risque de 1 a 4. La cle : un prompt detaille et structure guidant l’analyse etape par etape.