Aller au contenu principal

Le support d'images

Les capacites de vision de Claude permettent d’inclure des images dans vos messages et de demander des analyses sophistiquees : description, comparaison, comptage d’objets, ou analyses visuelles complexes.

Limites techniques

  • Jusqu’a 100 images par requete
  • 5 Mo maximum par image
  • Une seule image : max 8000px en hauteur/largeur
  • Plusieurs images : max 2000px chacune
  • Formats : base64 ou URL
  • Calcul de tokens : (largeur px x hauteur px) / 750

Inclure une image

with open("image.png", "rb") as f:
    image_bytes = base64.standard_b64encode(f.read()).decode("utf-8")

add_user_message(messages, [
    {
        "type": "image",
        "source": {
            "type": "base64",
            "media_type": "image/png",
            "data": image_bytes,
        }
    },
    {
        "type": "text",
        "text": "Que vois-tu dans cette image ?"
    }
])

L’importance du prompting

Les techniques de prompting sont critiques pour la vision. Un prompt simple comme “Combien de billes dans cette image ?” peut donner un resultat faux.

Analyse etape par etape

Analyse cette image de billes et determine le nombre exact :
1. Identifie chaque bille unique une par une. Attribue-lui un numero.
2. Verifie en recomptant depuis le coin inferieur gauche, rangee par rangee.

Quel est le nombre exact et verifie de billes ?

Exemples one-shot

Incluez un exemple avec son resultat connu avant l’image cible pour ameliorer significativement la precision.

Exemple concret : evaluation de risque incendie

Avec des images satellite, Claude peut analyser la vegetation autour d’une habitation, evaluer les branches en surplomb, identifier les chemins de combustible, et attribuer un score de risque de 1 a 4. La cle : un prompt detaille et structure guidant l’analyse etape par etape.