Loading...
    • Créer
    • Admin
    • Modèles et tarification
    • SDK clients
    • Référence API
    Search...
    ⌘K
    Premiers pas
    Introduction à ClaudeDémarrage rapide
    Créer avec Claude
    Aperçu des fonctionnalitésUtiliser l'API MessagesCompétence Claude APIGérer les raisons d'arrêt
    Capacités du modèle
    Extended thinkingAdaptive thinkingEffortBudgets de tâches (bêta)Mode rapide (bêta : aperçu de recherche)Sorties structuréesCitationsMessages en continuTraitement par lotsRésultats de rechercheRefus en continuSupport multilingueEmbeddings
    Outils
    AperçuFonctionnement de l'utilisation des outilsOutil de recherche webOutil de récupération webOutil d'exécution de codeOutil AdvisorOutil MemoryOutil BashOutil Computer useOutil Éditeur de texte
    Infrastructure des outils
    Référence des outilsRecherche d'outilsAppel programmatique des outilsStreaming granulaire des outils
    Gestion du contexte
    Fenêtres de contexteCompactionÉdition du contexteMise en cache des invitesComptage des tokens
    Travailler avec des fichiers
    API FilesSupport PDFImages et vision
    Compétences
    AperçuDémarrage rapideMeilleures pratiquesCompétences pour l'entrepriseCompétences dans l'API
    MCP
    Serveurs MCP distantsConnecteur MCP
    Ingénierie des invites
    AperçuMeilleures pratiques d'invitesOutils d'invites Console
    Tester et évaluer
    Définir le succès et créer des évaluationsUtiliser l'outil d'évaluation dans ConsoleRéduire la latence
    Renforcer les garde-fous
    Réduire les hallucinationsAugmenter la cohérence des résultatsAtténuer les jailbreaksRéduire les fuites d'invites
    Ressources
    Glossaire
    Notes de version
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Travailler avec des fichiers

    Support des PDF

    Traitez les PDF avec Claude. Extrayez du texte, analysez des graphiques et comprenez le contenu visuel de vos documents.

    This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

    Vous pouvez poser des questions à Claude sur n'importe quel texte, image, graphique et tableau dans les PDF que vous fournissez. Quelques exemples de cas d'usage :

    • Analyser des rapports financiers et comprendre les graphiques/tableaux
    • Extraire les informations clés des documents juridiques
    • Assistance à la traduction de documents
    • Convertir les informations de documents en formats structurés

    Avant de commencer

    Vérifier les exigences des PDF

    Claude fonctionne avec n'importe quel PDF standard. Assurez-vous que votre taille de requête répond à ces exigences :

    ExigenceLimite
    Taille maximale de la requête32 MB (varie selon la plateforme)
    Nombre maximum de pages par requête600 (100 pour les modèles avec une fenêtre de contexte de 200k tokens)
    FormatPDF standard (sans mots de passe/chiffrement)

    Les deux limites s'appliquent à l'ensemble de la charge utile de la requête, y compris tout autre contenu envoyé avec les PDF. Pour les grands PDF, envisagez de télécharger avec l'API Files et de référencer par file_id pour garder les charges utiles de requête petites.

    Les PDF denses (nombreuses pages en petite police, tableaux complexes ou graphiques lourds) peuvent remplir la fenêtre de contexte avant d'atteindre la limite de pages. Les requêtes avec de grands PDF peuvent également échouer avant d'atteindre la limite de pages, même en utilisant l'API Files. Essayez de diviser le document en sections ; pour les fichiers volumineux, puisque chaque page est traitée comme une image, la réduction de la résolution des images intégrées peut également aider.

    Puisque le support des PDF repose sur les capacités de vision de Claude, il est soumis aux mêmes limitations et considérations que les autres tâches de vision.

    Plateformes et modèles pris en charge

    Le support des PDF est actuellement pris en charge via l'accès direct à l'API et Google Vertex AI. Tous les modèles actifs prennent en charge le traitement des PDF.

    Le support des PDF est maintenant disponible sur Amazon Bedrock avec les considérations suivantes :

    Support des PDF sur Amazon Bedrock

    Lors de l'utilisation du support des PDF via l'API Converse d'Amazon Bedrock, il existe deux modes distincts de traitement des documents :

    Important : Pour accéder aux capacités complètes de compréhension visuelle des PDF de Claude dans l'API Converse, vous devez activer les citations. Sans les citations activées, l'API revient à l'extraction de texte basique uniquement. En savoir plus sur l'utilisation des citations.

    Modes de traitement des documents

    1. Converse Document Chat (Mode original - Extraction de texte uniquement)

      • Fournit l'extraction de texte basique à partir des PDF
      • Ne peut pas analyser les images, graphiques ou mises en page visuelles dans les PDF
      • Utilise environ 1 000 tokens pour un PDF de 3 pages
      • Utilisé automatiquement lorsque les citations ne sont pas activées
    2. Claude PDF Chat (Nouveau mode - Compréhension visuelle complète)

      • Fournit une analyse visuelle complète des PDF
      • Peut comprendre et analyser les graphiques, diagrammes, images et mises en page visuelles
      • Traite chaque page à la fois comme du texte et comme une image pour une compréhension complète
      • Utilise environ 7 000 tokens pour un PDF de 3 pages

    Limitations clés

    • API Converse : L'analyse visuelle des PDF nécessite que les citations soient activées. Il n'existe actuellement aucune option pour utiliser l'analyse visuelle sans citations (contrairement à l'API InvokeModel).
    • API InvokeModel : Fournit un contrôle complet sur le traitement des PDF sans citations forcées.

    Problèmes courants

    Si les clients signalent que Claude ne voit pas les images ou graphiques dans leurs PDF lors de l'utilisation de l'API Converse, ils devront probablement activer le drapeau des citations. Sans cela, Converse revient à l'extraction de texte basique uniquement.

    C'est une contrainte connue avec l'API Converse. Pour les applications qui nécessitent une analyse visuelle des PDF sans citations, envisagez d'utiliser l'API InvokeModel à la place.

    Pour les fichiers non-PDF comme .csv, .xlsx, .docx, .md ou .txt, voir Travailler avec d'autres formats de fichiers.


    Traiter les PDF avec Claude

    Envoyer votre première requête PDF

    Commençons par un exemple simple en utilisant l'API Messages. Vous pouvez fournir des PDF à Claude de trois façons :

    1. Comme référence URL à un PDF hébergé en ligne
    2. Comme PDF codé en base64 dans des blocs de contenu document
    3. Par un file_id de l'API Files

    Option 1 : Document PDF basé sur une URL

    L'approche la plus simple est de référencer un PDF directement à partir d'une URL :

    Option 2 : Document PDF codé en base64

    Si vous devez envoyer des PDF à partir de votre système local ou lorsqu'une URL n'est pas disponible :

    Option 3 : API Files

    Pour les PDF que vous utiliserez à plusieurs reprises, ou lorsque vous souhaitez éviter les frais généraux d'encodage, utilisez l'API Files :

    Comment fonctionne le support des PDF

    Lorsque vous envoyez un PDF à Claude, les étapes suivantes se produisent :

    1. 1

      Le système extrait le contenu du document.

      • Le système convertit chaque page du document en image.
      • Le texte de chaque page est extrait et fourni aux côtés de l'image de chaque page.
    2. 2

      Claude analyse à la fois le texte et les images pour mieux comprendre le document.

      • Les documents sont fournis comme une combinaison de texte et d'images pour analyse.
      • Cela permet aux utilisateurs de demander des informations sur les éléments visuels d'un PDF, tels que les graphiques, diagrammes et autres contenus non textuels.
    3. 3

      Claude répond, en référençant le contenu du PDF si pertinent.

      Claude peut référencer à la fois le contenu textuel et visuel lorsqu'il répond. Vous pouvez améliorer davantage les performances en intégrant le support des PDF avec :

      • Mise en cache des invites : Pour améliorer les performances pour l'analyse répétée.
      • Traitement par lots : Pour le traitement de documents à haut volume.
      • Utilisation d'outils : Pour extraire des informations spécifiques des documents à utiliser comme entrées d'outils.

    Estimer vos coûts

    Le nombre de tokens d'un fichier PDF dépend du texte total extrait du document ainsi que du nombre de pages :

    • Coûts des tokens de texte : Chaque page utilise généralement 1 500 à 3 000 tokens par page selon la densité du contenu. La tarification standard de l'API s'applique sans frais supplémentaires pour les PDF.
    • Coûts des tokens d'image : Puisque chaque page est convertie en image, les mêmes calculs de coûts basés sur les images sont appliqués.

    Vous pouvez utiliser le comptage des tokens pour estimer les coûts pour vos PDF spécifiques.


    Optimiser le traitement des PDF

    Améliorer les performances

    Suivez ces meilleures pratiques pour des résultats optimaux :

    • Placez les PDF avant le texte dans vos requêtes
    • Utilisez des polices standard
    • Assurez-vous que le texte est clair et lisible
    • Faites pivoter les pages à l'orientation verticale appropriée
    • Utilisez les numéros de page logiques (du lecteur PDF) dans les invites
    • Divisez les grands PDF en sections si nécessaire
    • Activez la mise en cache des invites pour l'analyse répétée

    Augmentez votre implémentation

    Pour le traitement à haut volume, considérez ces approches :

    Utilisez la mise en cache des invites

    Mettez en cache les PDF pour améliorer les performances sur les requêtes répétées :

    Traiter les lots de documents

    Utilisez l'API Message Batches pour les flux de travail à haut volume :

    Étapes suivantes

    Essayez les exemples PDF

    Explorez des exemples pratiques de traitement PDF dans la recette du cookbook.

    Was this page helpful?

    • Avant de commencer
    • Vérifier les exigences des PDF
    • Plateformes et modèles pris en charge
    • Support des PDF sur Amazon Bedrock
    • Traiter les PDF avec Claude
    • Envoyer votre première requête PDF
    • Comment fonctionne le support des PDF
    • Estimer vos coûts
    • Optimiser le traitement des PDF
    • Améliorer les performances
    • Augmentez votre implémentation
    • Étapes suivantes
  1. Nécessite que les citations soient activées dans l'API Converse
  2. client = anthropic.Anthropic()
    message = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {
                            "type": "url",
                            "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                        },
                    },
                    {"type": "text", "text": "What are the key findings in this document?"},
                ],
            }
        ],
    )
    
    print(message.content)
    import base64
    import httpx
    
    # First, load and encode the PDF
    pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
    pdf_data = base64.standard_b64encode(httpx.get(pdf_url).content).decode("utf-8")
    
    # Alternative: Load from a local file
    # with open("document.pdf", "rb") as f:
    #     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")
    
    # Send to Claude using base64 encoding
    client = anthropic.Anthropic()
    message = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {
                            "type": "base64",
                            "media_type": "application/pdf",
                            "data": pdf_data,
                        },
                    },
                    {"type": "text", "text": "What are the key findings in this document?"},
                ],
            }
        ],
    )
    
    print(message.content)
    client = anthropic.Anthropic()
    
    # Upload the PDF file
    with open("document.pdf", "rb") as f:
        file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))
    
    # Use the uploaded file in a message
    message = client.beta.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        betas=["files-api-2025-04-14"],
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {"type": "file", "file_id": file_upload.id},
                    },
                    {"type": "text", "text": "What are the key findings in this document?"},
                ],
            }
        ],
    )
    
    print(message.content)
    client = anthropic.Anthropic()
    # ...
    message = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {
                            "type": "base64",
                            "media_type": "application/pdf",
                            "data": pdf_data,
                        },
                        "cache_control": {"type": "ephemeral"},
                    },
                    {"type": "text", "text": "Analyze this document."},
                ],
            }
        ],
    )
    client = anthropic.Anthropic()
    # ...
    message_batch = client.messages.batches.create(
        requests=[
            {
                "custom_id": "doc1",
                "params": {
                    "model": "claude-opus-4-7",
                    "max_tokens": 1024,
                    "messages": [
                        {
                            "role": "user",
                            "content": [
                                {
                                    "type": "document",
                                    "source": {
                                        "type": "base64",
                                        "media_type": "application/pdf",
                                        "data": pdf_data,
                                    },
                                },
                                {"type": "text", "text": "Summarize this document."},
                            ],
                        }
                    ],
                },
            }
        ]
    )
    Consultez la référence API

    Consultez la documentation complète de l'API pour la prise en charge des PDF.