Analyser des images et photos
La vision de ChatGPT : comprendre les images
ChatGPT ne se limite pas au texte. Grâce aux capacités multimodales de GPT-5.3, il peut voir et analyser des images : photos, captures d’écran, graphiques, documents scannés, schémas. C’est une fonctionnalité puissante qui ouvre des cas d’usage très concrets pour votre quotidien.
Comment envoyer une image à ChatGPT
Plusieurs méthodes selon votre plateforme :
Sur le web et desktop
- Cliquez sur l’icône trombone dans la barre de saisie et sélectionnez une image depuis votre ordinateur
- Glissez-déposez une image directement dans la zone de conversation
- Collez une image depuis le presse-papier (Ctrl+V / Cmd+V)
- Sur l’application desktop : utilisez la capture d’écran intégrée pour sélectionner une zone
Sur mobile
- Appuyez sur l’icône trombone puis choisissez « Photo Library » ou « Camera »
- Prenez une photo en direct avec la caméra intégrée
Vous pouvez envoyer plusieurs images dans un même message et demander à ChatGPT de les comparer.
Cas d’usage concrets
Analyser un graphique ou un tableau
Prenez en photo ou capturez un graphique (rapport annuel, dashboard, présentation) :
[image du graphique] « Analyse ce graphique. Quelles sont les tendances principales ? Y a-t-il des anomalies ? Résume les conclusions en 3 bullet points. »
Lire un document scanné ou manuscrit
ChatGPT peut lire du texte dans une image — même manuscrit (OCR intégré) :
[photo d’un document] « Transcris le texte de ce document. Puis résume-le en 3 phrases. »
Identifier et décrire
[photo d’une plante] « Quelle est cette plante ? Est-elle toxique ? Comment l’entretenir ? »
[photo d’un plat] « Quel est ce plat ? Donne-moi la recette approximative. »
[photo d’une erreur écran] « Voici l’erreur qui s’affiche sur mon écran. Que signifie-t-elle et comment la résoudre ? »
Analyser un design ou une interface
[capture d’écran d’un site web] « Analyse cette page d’accueil. Points forts et points faibles en termes d’UX/UI. Propose 3 améliorations concrètes. »
Traduire du texte dans une image
[photo d’un panneau en japonais] « Traduis le texte de cette image en français. »
Analyser une facture ou un reçu
[photo d’une facture] « Extrais les informations de cette facture : fournisseur, date, montant HT, TVA, montant TTC. »
Limites de la vision
Il est important de connaître les limites :
- Pas de reconnaissance de personnes : ChatGPT ne peut pas identifier qui est sur une photo (pour des raisons de confidentialité)
- Texte flou ou petit : si le texte est trop petit ou flou dans l’image, la lecture sera imprécise. Prenez des photos nettes et bien cadrées
- Images complexes : les schémas très détaillés ou les plans architecturaux peuvent être mal interprétés
- Pas de vidéo : ChatGPT analyse des images fixes, pas des vidéos (vous pouvez extraire des frames)
Conseils pour de meilleurs résultats
- Cadrez bien : une image nette et bien cadrée donne de meilleurs résultats
- Un sujet à la fois : si vous avez plusieurs éléments à analyser, envoyez-les séparément
- Ajoutez du contexte : ne dites pas juste « analyse cette image ». Précisez ce que vous cherchez
- Combinez texte et image : « Voici le logo de mon concurrent [image]. Compare-le avec le nôtre [image]. Quel est le positionnement visuel de chacun ? »
Mise en pratique
Réalisez ces trois exercices :
- Document : photographiez ou capturez une page d’un rapport ou d’une facture. Demandez à ChatGPT d’extraire les informations clés.
- Graphique : capturez un graphique (depuis un article, un dashboard, une présentation) et demandez une analyse des tendances.
- Environnement : prenez une photo de votre bureau ou d’un objet et demandez à ChatGPT de le décrire ou de l’identifier.
Erreurs courantes
- Envoyer des images trop basses en résolution : ChatGPT a besoin de voir clairement pour bien analyser. Évitez les captures d’écran minuscules ou les photos floues.
- Ne pas donner de contexte avec l’image : « Qu’est-ce que c’est ? » donne une réponse générale. « Voici le graphique de nos ventes Q1. Analyse la tendance et identifie les mois problématiques » donne une réponse ciblée.
- Attendre une précision parfaite sur les chiffres : ChatGPT lit les chiffres dans les images avec une bonne fiabilité mais pas une précision de 100 %. Pour des données critiques, vérifiez manuellement.
Points clés à retenir
- ChatGPT peut analyser photos, captures d’écran, graphiques, documents scannés et même texte manuscrit
- Envoyez des images via le trombone, le glisser-déposer, le presse-papier ou la caméra mobile
- Ajoutez toujours du contexte textuel avec votre image pour guider l’analyse
- Les principales limites : pas de reconnaissance de personnes, sensible à la qualité de l’image
- Combinez texte et images dans un même message pour des analyses plus riches