Aller au contenu principal

L'API de génération d'images en 2026

L’API de génération d’images en 2026

La génération d’images par intelligence artificielle a considérablement évolué. En 2026, GPT Image est le modèle de référence proposé par OpenAI pour créer et éditer des images via l’API. Il remplace les anciens modèles DALL·E 2 et DALL·E 3, désormais obsolètes.

Cette leçon vous présente l’écosystème actuel, les capacités de GPT Image et la manière dont vous allez interagir avec l’API tout au long de ce cours.

Ce que GPT Image change

GPT Image apporte plusieurs avancées majeures par rapport à ses prédécesseurs :

  • Rendu typographique fidèle — le texte dans les images est désormais lisible et précis
  • Compréhension contextuelle — le modèle interprète des instructions complexes avec nuances
  • Édition native — possibilité de modifier des images existantes (inpainting, outpainting)
  • Cohérence stylistique — maintien du style sur plusieurs générations successives
  • Résolutions multiples — de 1024×1024 à 1536×1536 selon vos besoins

Les deux endpoints principaux

L’API OpenAI expose deux méthodes pour la génération d’images :

Génération depuis un prompt

from openai import OpenAI

client = OpenAI()

response = client.images.generate(
    model="gpt-image-1",
    prompt="Un phare breton au coucher du soleil, style aquarelle",
    n=1,
    size="1024x1024"
)

image_url = response.data[0].url
print(image_url)

Édition d’une image existante

response = client.images.edit(
    model="gpt-image-1",
    image=open("photo_originale.png", "rb"),
    mask=open("masque.png", "rb"),
    prompt="Remplacer le ciel par un ciel étoilé"
)

Vous approfondirez chacune de ces méthodes dans les leçons suivantes.

Installation et configuration

Avant de commencer, installez le SDK OpenAI :

pip install openai

Configurez votre clé API dans un fichier .env :

OPENAI_API_KEY=sk-votre-cle-api

Puis chargez-la dans vos scripts :

import os
from dotenv import load_dotenv
from openai import OpenAI

load_dotenv()
client = OpenAI()  # utilise automatiquement OPENAI_API_KEY

Modèle et tarification

Le modèle actuel s’appelle gpt-image-1. Voici les points essentiels à retenir :

ParamètreValeur
Modèlegpt-image-1
Résolutions1024×1024, 1024×1536, 1536×1024
Qualitéslow, medium, high
Formats de sortieURL temporaire, base64, ou bytes
TarificationPar image générée, variable selon qualité et taille

Les URL temporaires expirent après environ une heure. Pour un usage en production, récupérez systématiquement les données en base64 ou sauvegardez immédiatement le fichier.

Structure du cours

Ce cours est organisé en quatre sections :

  1. GPT Image via l’API — les fondamentaux de la génération et de l’édition
  2. Cas d’usage images — applications concrètes en e-commerce, marketing et design
  3. Techniques avancées — prompts visuels complexes et intégration multi-outils
  4. Production — optimisation des coûts et modération du contenu

Chaque leçon contient du code Python fonctionnel que vous pouvez exécuter directement.

Votre premier test

Pour vérifier que tout fonctionne, exécutez ce script minimal :

from openai import OpenAI

client = OpenAI()

response = client.images.generate(
    model="gpt-image-1",
    prompt="Un chat roux assis sur une pile de livres, photo réaliste",
    n=1,
    size="1024x1024",
    quality="medium"
)

print(f"Image générée : {response.data[0].url}")

Si vous obtenez une URL en réponse, votre environnement est prêt. Vous pouvez passer à la leçon suivante.