Loading...
  • Erstellen
  • Admin
  • Modelle & Preise
  • Client-SDKs
  • API-Referenz
Search...
⌘K
Log in
PDF-Unterstützung
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Erstellen/Mit Dateien arbeiten

PDF-Unterstützung

Verarbeiten Sie PDFs mit Claude. Extrahieren Sie Text, analysieren Sie Diagramme und verstehen Sie visuelle Inhalte aus Ihren Dokumenten.

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

Sie können Claude nach beliebigem Text, Bildern, Diagrammen und Tabellen in bereitgestellten PDFs fragen. Einige Beispielanwendungsfälle:

  • Analyse von Finanzberichten und Verständnis von Diagrammen/Tabellen
  • Extrahieren von Schlüsselinformationen aus Rechtsdokumenten
  • Übersetzungshilfe für Dokumente
  • Umwandlung von Dokumentinformationen in strukturierte Formate

Bevor Sie beginnen

PDF-Anforderungen überprüfen

Claude funktioniert mit jedem Standard-PDF. Stellen Sie sicher, dass Ihre Anfragegröße diese Anforderungen erfüllt:

AnforderungLimit
Maximale Anfragegröße32 MB (variiert je nach Plattform)
Maximale Seiten pro Anfrage600 (100 für Modelle mit einem 200k-Token-Kontextfenster)
FormatStandard-PDF (keine Passwörter/Verschlüsselung)

Beide Limits gelten für die gesamte Anfrage-Payload, einschließlich aller anderen Inhalte, die zusammen mit PDFs gesendet werden. Für große PDFs sollten Sie das Hochladen mit der Files API in Betracht ziehen und nach file_id referenzieren, um die Anfrage-Payloads klein zu halten.

Dichte PDFs (viele Seiten mit kleiner Schrift, komplexe Tabellen oder umfangreiche Grafiken) können das Kontextfenster füllen, bevor das Seitenlimit erreicht wird. Anfragen mit großen PDFs können auch fehlschlagen, bevor das Seitenlimit erreicht wird, selbst wenn Sie die Files API verwenden. Versuchen Sie, das Dokument in Abschnitte aufzuteilen; bei großen Dateien kann das Heruntersampling eingebetteter Bilder auch hilfreich sein, da jede Seite als Bild verarbeitet wird.

Da die PDF-Unterstützung auf Claudes Visionsfähigkeiten basiert, unterliegt sie den gleichen Einschränkungen und Überlegungen wie andere Visions-Aufgaben.

Unterstützte Plattformen und Modelle

Die PDF-Unterstützung wird derzeit über direkten API-Zugriff und Google Vertex AI unterstützt. Alle aktiven Modelle unterstützen die PDF-Verarbeitung.

Die PDF-Unterstützung ist jetzt auf Amazon Bedrock mit den folgenden Überlegungen verfügbar:

Amazon Bedrock PDF-Unterstützung

Bei Verwendung der PDF-Unterstützung über die Converse API von Amazon Bedrock gibt es zwei unterschiedliche Dokumentverarbeitungsmodi:

Wichtig: Um auf Claudes vollständige visuelle PDF-Verständnisfähigkeiten in der Converse API zuzugreifen, müssen Sie Zitate aktivieren. Ohne aktivierte Zitate fällt die API auf die grundlegende Textextraktion zurück. Erfahren Sie mehr über Arbeiten mit Zitaten.

Dokumentverarbeitungsmodi

  1. Converse Document Chat (Originalmodus - Nur Textextraktion)

    • Bietet grundlegende Textextraktion aus PDFs
    • Kann Bilder, Diagramme oder visuelle Layouts in PDFs nicht analysieren
    • Verwendet ungefähr 1.000 Token für ein 3-seitiges PDF
    • Wird automatisch verwendet, wenn Zitate nicht aktiviert sind
  2. Claude PDF Chat (Neuer Modus - Vollständiges visuelles Verständnis)

    • Bietet vollständige visuelle Analyse von PDFs
    • Kann Diagramme, Grafiken, Bilder und visuelle Layouts verstehen und analysieren
    • Verarbeitet jede Seite als Text und Bild für umfassendes Verständnis
    • Verwendet ungefähr 7.000 Token für ein 3-seitiges PDF
    • Erfordert, dass Zitate in der Converse API aktiviert sind

Wichtige Einschränkungen

  • Converse API: Die visuelle PDF-Analyse erfordert, dass Zitate aktiviert sind. Es gibt derzeit keine Option, um visuelle Analyse ohne Zitate zu verwenden (anders als die InvokeModel API).
  • InvokeModel API: Bietet vollständige Kontrolle über die PDF-Verarbeitung ohne erzwungene Zitate.

Häufige Probleme

Wenn Kunden berichten, dass Claude Bilder oder Diagramme in ihren PDFs bei Verwendung der Converse API nicht sieht, müssen sie wahrscheinlich das Zitate-Flag aktivieren. Ohne es fällt Converse auf die grundlegende Textextraktion zurück.

Dies ist eine bekannte Einschränkung der Converse API. Für Anwendungen, die visuelle PDF-Analyse ohne Zitate erfordern, erwägen Sie stattdessen die Verwendung der InvokeModel API.

Für Nicht-PDF-Dateien wie .csv, .xlsx, .docx, .md oder .txt Dateien siehe Arbeiten mit anderen Dateiformaten.


PDFs mit Claude verarbeiten

Senden Sie Ihre erste PDF-Anfrage

Beginnen wir mit einem einfachen Beispiel unter Verwendung der Messages API. Sie können PDFs an Claude auf drei Arten bereitstellen:

  1. Als URL-Referenz zu einem online gehosteten PDF
  2. Als base64-codiertes PDF in document Content-Blöcken
  3. Nach file_id aus der Files API

Option 1: URL-basiertes PDF-Dokument

Der einfachste Ansatz ist, direkt von einer URL auf ein PDF zu verweisen:

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "url",
                        "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Option 2: Base64-codiertes PDF-Dokument

Wenn Sie PDFs von Ihrem lokalen System senden müssen oder wenn eine URL nicht verfügbar ist:

import base64
import httpx

# First, load and encode the PDF
pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
pdf_data = base64.standard_b64encode(httpx.get(pdf_url).content).decode("utf-8")

# Alternative: Load from a local file
# with open("document.pdf", "rb") as f:
#     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")

# Send to Claude using base64 encoding
client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Option 3: Files API

Für PDFs, die Sie wiederholt verwenden, oder wenn Sie Codierungs-Overhead vermeiden möchten, verwenden Sie die Files API:

client = anthropic.Anthropic()

# Upload the PDF file
with open("document.pdf", "rb") as f:
    file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))

# Use the uploaded file in a message
message = client.beta.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    betas=["files-api-2025-04-14"],
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {"type": "file", "file_id": file_upload.id},
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Wie die PDF-Unterstützung funktioniert

Wenn Sie ein PDF an Claude senden, finden die folgenden Schritte statt:

  1. 1

    Das System extrahiert den Inhalt des Dokuments.

    • Das System konvertiert jede Seite des Dokuments in ein Bild.
    • Der Text von jeder Seite wird extrahiert und zusammen mit dem Bild jeder Seite bereitgestellt.
  2. 2

    Claude analysiert sowohl den Text als auch die Bilder, um das Dokument besser zu verstehen.

    • Dokumente werden als Kombination von Text und Bildern zur Analyse bereitgestellt.
    • Dies ermöglicht es Benutzern, Einblicke in visuelle Elemente eines PDF zu erhalten, wie Diagramme, Schaubilder und andere nicht-textliche Inhalte.
  3. 3

    Claude antwortet und verweist auf die Inhalte des PDF, falls relevant.

    Claude kann sowohl auf textliche als auch auf visuelle Inhalte verweisen, wenn es antwortet. Sie können die Leistung weiter verbessern, indem Sie die PDF-Unterstützung mit folgenden Funktionen integrieren:

    • Prompt Caching: Um die Leistung für wiederholte Analysen zu verbessern.
    • Batch-Verarbeitung: Für die Verarbeitung großer Mengen von Dokumenten.
    • Tool-Nutzung: Um spezifische Informationen aus Dokumenten zu extrahieren, die als Tool-Eingaben verwendet werden.

Schätzen Sie Ihre Kosten

Die Token-Anzahl einer PDF-Datei hängt vom insgesamt aus dem Dokument extrahierten Text sowie von der Anzahl der Seiten ab:

  • Text-Token-Kosten: Jede Seite verwendet typischerweise 1.500-3.000 Token pro Seite, abhängig von der Inhaltsdichte. Standard-API-Preise gelten ohne zusätzliche PDF-Gebühren.
  • Bild-Token-Kosten: Da jede Seite in ein Bild konvertiert wird, gelten die gleichen bildgestützten Kostenberechnungen.

Sie können Token-Zählung verwenden, um Kosten für Ihre spezifischen PDFs zu schätzen.


PDF-Verarbeitung optimieren

Verbessern Sie die Leistung

Befolgen Sie diese Best Practices für optimale Ergebnisse:

  • Platzieren Sie PDFs vor Text in Ihren Anfragen
  • Verwenden Sie Standard-Schriftarten
  • Stellen Sie sicher, dass der Text klar und lesbar ist
  • Drehen Sie Seiten in die richtige aufrechte Ausrichtung
  • Verwenden Sie logische Seitennummern (aus dem PDF-Viewer) in Eingabeaufforderungen
  • Teilen Sie große PDFs bei Bedarf in Abschnitte auf
  • Aktivieren Sie Prompt Caching für wiederholte Analysen

Skalieren Sie Ihre Implementierung

Für die Verarbeitung großer Mengen sollten Sie diese Ansätze in Betracht ziehen:

Nutzen Sie Prompt-Caching

Cachen Sie PDFs, um die Leistung bei wiederholten Abfragen zu verbessern:

client = anthropic.Anthropic()
# ...
message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                    "cache_control": {"type": "ephemeral"},
                },
                {"type": "text", "text": "Analyze this document."},
            ],
        }
    ],
)

Verarbeiten Sie Dokument-Batches

Verwenden Sie die Message Batches API für Workflows mit großem Volumen:

client = anthropic.Anthropic()
# ...
message_batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": "doc1",
            "params": {
                "model": "claude-opus-4-7",
                "max_tokens": 1024,
                "messages": [
                    {
                        "role": "user",
                        "content": [
                            {
                                "type": "document",
                                "source": {
                                    "type": "base64",
                                    "media_type": "application/pdf",
                                    "data": pdf_data,
                                },
                            },
                            {"type": "text", "text": "Summarize this document."},
                        ],
                    }
                ],
            },
        }
    ]
)

Nächste Schritte

PDF-Beispiele ausprobieren

Erkunden Sie praktische Beispiele der PDF-Verarbeitung im Cookbook-Rezept.

API-Referenz anzeigen

Sehen Sie die vollständige API-Dokumentation für PDF-Unterstützung.

Was this page helpful?

  • Bevor Sie beginnen
  • PDF-Anforderungen überprüfen
  • Unterstützte Plattformen und Modelle
  • Amazon Bedrock PDF-Unterstützung
  • PDFs mit Claude verarbeiten
  • Senden Sie Ihre erste PDF-Anfrage
  • Wie die PDF-Unterstützung funktioniert
  • Schätzen Sie Ihre Kosten
  • PDF-Verarbeitung optimieren
  • Verbessern Sie die Leistung
  • Skalieren Sie Ihre Implementierung
  • Nächste Schritte