Aller au contenu principal

Analyser des images et photos

La vision de ChatGPT : comprendre les images

ChatGPT ne se limite pas au texte. Grâce aux capacités multimodales de GPT-5.3, il peut voir et analyser des images : photos, captures d’écran, graphiques, documents scannés, schémas. C’est une fonctionnalité puissante qui ouvre des cas d’usage très concrets pour votre quotidien.

Comment envoyer une image à ChatGPT

Plusieurs méthodes selon votre plateforme :

Sur le web et desktop

  • Cliquez sur l’icône trombone dans la barre de saisie et sélectionnez une image depuis votre ordinateur
  • Glissez-déposez une image directement dans la zone de conversation
  • Collez une image depuis le presse-papier (Ctrl+V / Cmd+V)
  • Sur l’application desktop : utilisez la capture d’écran intégrée pour sélectionner une zone

Sur mobile

  • Appuyez sur l’icône trombone puis choisissez « Photo Library » ou « Camera »
  • Prenez une photo en direct avec la caméra intégrée

Vous pouvez envoyer plusieurs images dans un même message et demander à ChatGPT de les comparer.

Cas d’usage concrets

Analyser un graphique ou un tableau

Prenez en photo ou capturez un graphique (rapport annuel, dashboard, présentation) :

[image du graphique] « Analyse ce graphique. Quelles sont les tendances principales ? Y a-t-il des anomalies ? Résume les conclusions en 3 bullet points. »

Lire un document scanné ou manuscrit

ChatGPT peut lire du texte dans une image — même manuscrit (OCR intégré) :

[photo d’un document] « Transcris le texte de ce document. Puis résume-le en 3 phrases. »

Identifier et décrire

[photo d’une plante] « Quelle est cette plante ? Est-elle toxique ? Comment l’entretenir ? »

[photo d’un plat] « Quel est ce plat ? Donne-moi la recette approximative. »

[photo d’une erreur écran] « Voici l’erreur qui s’affiche sur mon écran. Que signifie-t-elle et comment la résoudre ? »

Analyser un design ou une interface

[capture d’écran d’un site web] « Analyse cette page d’accueil. Points forts et points faibles en termes d’UX/UI. Propose 3 améliorations concrètes. »

Traduire du texte dans une image

[photo d’un panneau en japonais] « Traduis le texte de cette image en français. »

Analyser une facture ou un reçu

[photo d’une facture] « Extrais les informations de cette facture : fournisseur, date, montant HT, TVA, montant TTC. »

Limites de la vision

Il est important de connaître les limites :

  • Pas de reconnaissance de personnes : ChatGPT ne peut pas identifier qui est sur une photo (pour des raisons de confidentialité)
  • Texte flou ou petit : si le texte est trop petit ou flou dans l’image, la lecture sera imprécise. Prenez des photos nettes et bien cadrées
  • Images complexes : les schémas très détaillés ou les plans architecturaux peuvent être mal interprétés
  • Pas de vidéo : ChatGPT analyse des images fixes, pas des vidéos (vous pouvez extraire des frames)

Conseils pour de meilleurs résultats

  • Cadrez bien : une image nette et bien cadrée donne de meilleurs résultats
  • Un sujet à la fois : si vous avez plusieurs éléments à analyser, envoyez-les séparément
  • Ajoutez du contexte : ne dites pas juste « analyse cette image ». Précisez ce que vous cherchez
  • Combinez texte et image : « Voici le logo de mon concurrent [image]. Compare-le avec le nôtre [image]. Quel est le positionnement visuel de chacun ? »

Mise en pratique

Réalisez ces trois exercices :

  1. Document : photographiez ou capturez une page d’un rapport ou d’une facture. Demandez à ChatGPT d’extraire les informations clés.
  2. Graphique : capturez un graphique (depuis un article, un dashboard, une présentation) et demandez une analyse des tendances.
  3. Environnement : prenez une photo de votre bureau ou d’un objet et demandez à ChatGPT de le décrire ou de l’identifier.

Erreurs courantes

  • Envoyer des images trop basses en résolution : ChatGPT a besoin de voir clairement pour bien analyser. Évitez les captures d’écran minuscules ou les photos floues.
  • Ne pas donner de contexte avec l’image : « Qu’est-ce que c’est ? » donne une réponse générale. « Voici le graphique de nos ventes Q1. Analyse la tendance et identifie les mois problématiques » donne une réponse ciblée.
  • Attendre une précision parfaite sur les chiffres : ChatGPT lit les chiffres dans les images avec une bonne fiabilité mais pas une précision de 100 %. Pour des données critiques, vérifiez manuellement.

Points clés à retenir

  • ChatGPT peut analyser photos, captures d’écran, graphiques, documents scannés et même texte manuscrit
  • Envoyez des images via le trombone, le glisser-déposer, le presse-papier ou la caméra mobile
  • Ajoutez toujours du contexte textuel avec votre image pour guider l’analyse
  • Les principales limites : pas de reconnaissance de personnes, sensible à la qualité de l’image
  • Combinez texte et images dans un même message pour des analyses plus riches