Aller au contenu principal

Support des images

Les capacites de vision de Claude permettent d’inclure des images dans vos messages et de demander a Claude de les analyser, comparer, compter des objets, ou effectuer pratiquement n’importe quelle tache visuelle.

Limites a connaitre

  • Jusqu’a 20 images dans une seule requete (tous messages confondus)
  • Taille maximale de 3.75 Mo
  • Hauteur/largeur maximale de 8000 px
  • Chaque image compte comme un certain nombre de tokens : tokens = (largeur px x hauteur px) / 750

Envoyer une image

with open("image.png", "rb") as f:
    image_bytes = f.read()

add_user_message(messages, [
    {
        "image": {
            "format": "png",
            "source": {"bytes": image_bytes}
        }
    },
    {"text": "Que voyez-vous dans cette image ?"}
])

Vous pouvez envoyer plusieurs images dans un seul message en ajoutant plusieurs parties image. Claude peut alors analyser les relations entre les images, les comparer, ou repondre a des questions necessitant la comprehension de plusieurs entrees visuelles.

Techniques de prompting pour les images

Toutes les techniques d’ingenierie de prompt s’appliquent aux images. Vous pouvez augmenter la precision de Claude en fournissant des directives, des etapes d’analyse, ou des exemples one-shot/multi-shot.

Au lieu de simplement demander “Combien de billes y a-t-il ?”, fournissez une approche structuree :

Analysez cette image de billes et determinez le compte exact :
1. Identifiez chaque bille une par une, en assignant un numero
2. Verifiez votre resultat en recomptant depuis le coin bas-gauche, rangee par rangee
Quel est le nombre exact et verifie de billes ?

Exemple concret : evaluation des risques d’incendie

Une application pratique : l’evaluation automatisee des risques d’incendie pour les compagnies d’assurance via l’imagerie satellite. Le systeme analyse :

  • Arbres denses pres de la residence
  • Routes d’acces difficiles pour les vehicules d’urgence
  • Branches surplombant la residence
  • Densite globale et espacement des arbres
with open('./images/prop7.png', 'rb') as f:
    image_bytes = f.read()

messages = []
add_user_message(messages, [
    {"image": {"format": "png", "source": {"bytes": image_bytes}}},
    {"text": prompt}
])

response = chat(messages)

La cle du succes avec l’analyse visuelle complexe : fournissez des prompts detailles et structures qui guident Claude a travers des etapes d’analyse specifiques plutot que de demander une simple evaluation.