Aller au contenu principal

Support des PDF

Claude peut lire et analyser des documents PDF aussi facilement qu’il gere les images. Cette capacite ouvre des possibilites puissantes pour l’analyse de documents, le resume et les workflows de questions-reponses.

Structure du message pour les PDF

Le processus est similaire au traitement des images, mais utilise un objet "document" au lieu de "image" :

with open("./earth.pdf", "rb") as f:
    file_bytes = f.read()

messages = []
add_user_message(
    messages,
    [
        {
            "document": {
                "format": "pdf",
                "name": "earth",
                "source": {"bytes": file_bytes}
            }
        },
        {"text": "Resumez ce document en une phrase"},
    ],
)

response = chat(messages)

Points cles de la structure :

  • Utilisez "document" au lieu de "image"
  • Definissez "format": "pdf"
  • Incluez un champ "name" avec le nom du fichier sans extension
  • La "source" contient les octets du fichier

Ce que Claude peut faire avec les PDF

  • Extraire et resumer les informations cles
  • Repondre a des questions specifiques sur le contenu
  • Analyser la structure et le formatage du document
  • Traiter des documents multi-pages efficacement
  • Travailler avec des PDF contenant du texte et des images

Le traitement PDF devient encore plus puissant quand il est combine avec les citations, qui permettent a Claude de referencer des parties specifiques du document dans ses reponses.