Aller au contenu principal

Support des fichiers PDF

Claude peut lire et analyser des fichiers PDF directement, ce qui en fait un outil puissant pour le traitement de documents. Cette fonctionnalite est tres similaire au traitement d’images, avec quelques differences dans la structure du code.

Envoyer un PDF a Claude

Le code pour traiter un PDF est quasiment identique a celui des images. Les principales differences se situent dans les types de fichier et les noms de variables :

import base64

# Charger et encoder le PDF en base64
with open("earth.pdf", "rb") as f:
    file_bytes = base64.standard_b64encode(f.read()).decode("utf-8")

messages = []

add_user_message(
    messages,
    [
        # Bloc document (pas "image")
        {
            "type": "document",
            "source": {
                "type": "base64",
                "media_type": "application/pdf",
                "data": file_bytes,
            },
        },
        # Bloc texte avec la consigne
        {"type": "text", "text": "Summarize the document in one sentence"},
    ],
)

chat(messages)

Differences par rapport au traitement d’images

Quand on adapte le code de traitement d’images pour les PDF, quatre elements changent :

ElementImagesPDF
Extension.png, .jpg, etc..pdf
Nom de variableimage_bytesfile_bytes
Type du bloc"image""document"
Media type"image/png""application/pdf"

Ce que Claude peut extraire des PDF

Les capacites de traitement PDF de Claude vont bien au-dela de la simple extraction de texte. Il peut analyser et comprendre :

  • Le texte sur l’ensemble du document
  • Les images et graphiques integres dans le PDF
  • Les tableaux et les relations entre les donnees
  • La structure et la mise en forme du document

Cela fait de Claude une solution tout-en-un pour extraire n’importe quel type d’information d’un PDF, que ce soit pour des resumes, de l’analyse de donnees ou l’extraction de contenu specifique.

Cas d’usage courants

Voici quelques utilisations frequentes du support PDF :

  • Synthese de documents : resumer un rapport de 50 pages en quelques paragraphes
  • Extraction de donnees : recuperer des chiffres cles depuis des rapports financiers
  • Analyse de contrats : identifier les clauses importantes dans des documents juridiques
  • Traitement de factures : extraire les montants, dates et references
  • Questions-reponses : poser des questions precises sur le contenu d’un document
Exercice pratique
  1. Chargez un PDF via l’API en utilisant l’encodage base64
  2. Demandez a Claude de resumer le document en une phrase
  3. Testez avec un PDF contenant des tableaux et demandez a Claude d’extraire les donnees dans un format structure (JSON ou CSV)
  4. Envoyez un PDF avec des graphiques et demandez a Claude de decrire les tendances visuelles
  5. Comparez les resultats sur un PDF scanne (image) vs un PDF avec du texte selectionnable