Loading...
  • Bangun
  • Admin
  • Model & harga
  • Client SDK
  • Referensi API
Search...
⌘K
Log in
Dukungan PDF
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Bangun/Bekerja dengan file

Dukungan PDF

Proses PDF dengan Claude. Ekstrak teks, analisis bagan, dan pahami konten visual dari dokumen Anda.

Was this page helpful?

  • Sebelum Anda memulai
  • Periksa persyaratan PDF
  • Platform dan model yang didukung
  • Dukungan PDF Amazon Bedrock
  • Proses PDF dengan Claude
  • Kirim permintaan PDF pertama Anda
  • Cara kerja dukungan PDF
  • Perkirakan biaya Anda
  • Optimalkan pemrosesan PDF
  • Tingkatkan kinerja
  • Skalakan implementasi Anda
  • Langkah berikutnya

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

Anda dapat bertanya kepada Claude tentang teks, gambar, bagan, dan tabel apa pun dalam PDF yang Anda berikan. Beberapa contoh kasus penggunaan:

  • Menganalisis laporan keuangan dan memahami bagan/tabel
  • Mengekstrak informasi kunci dari dokumen hukum
  • Bantuan terjemahan untuk dokumen
  • Mengonversi informasi dokumen ke format terstruktur

Sebelum Anda memulai

Periksa persyaratan PDF

Claude bekerja dengan PDF standar apa pun. Pastikan ukuran permintaan Anda memenuhi persyaratan berikut:

PersyaratanBatas
Ukuran permintaan maksimal32 MB (bervariasi menurut platform)
Halaman maksimal per permintaan600 (100 untuk model dengan jendela konteks token 200k)
FormatPDF Standar (tanpa kata sandi/enkripsi)

Kedua batas berada pada seluruh muatan permintaan, termasuk konten lain apa pun yang dikirim bersama PDF. Untuk PDF besar, pertimbangkan untuk mengunggah dengan Files API dan mereferensikan dengan file_id untuk menjaga muatan permintaan tetap kecil.

PDF padat (banyak halaman font kecil, tabel kompleks, atau grafis berat) dapat mengisi jendela konteks sebelum mencapai batas halaman. Permintaan dengan PDF besar juga dapat gagal sebelum mencapai batas halaman, bahkan saat menggunakan Files API. Coba bagi dokumen menjadi bagian-bagian; untuk file besar, karena setiap halaman diproses sebagai gambar, downsampling gambar tertanam juga dapat membantu.

Karena dukungan PDF bergantung pada kemampuan visi Claude, dukungan ini tunduk pada batasan dan pertimbangan yang sama seperti tugas visi lainnya.

Platform dan model yang didukung

Dukungan PDF saat ini didukung melalui akses API langsung dan Google Vertex AI. Semua model aktif mendukung pemrosesan PDF.

Dukungan PDF sekarang tersedia di Amazon Bedrock dengan pertimbangan berikut:

Dukungan PDF Amazon Bedrock

Saat menggunakan dukungan PDF melalui Converse API Amazon Bedrock, ada dua mode pemrosesan dokumen yang berbeda:

Penting: Untuk mengakses kemampuan pemahaman PDF visual penuh Claude di Converse API, Anda harus mengaktifkan kutipan. Tanpa kutipan yang diaktifkan, API kembali ke ekstraksi teks dasar saja. Pelajari lebih lanjut tentang bekerja dengan kutipan.

Mode Pemrosesan Dokumen

  1. Converse Document Chat (Mode asli - Ekstraksi teks saja)

    • Menyediakan ekstraksi teks dasar dari PDF
    • Tidak dapat menganalisis gambar, bagan, atau tata letak visual dalam PDF
    • Menggunakan sekitar 1.000 token untuk PDF 3 halaman
    • Digunakan secara otomatis saat kutipan tidak diaktifkan
  2. Claude PDF Chat (Mode baru - Pemahaman visual penuh)

    • Menyediakan analisis visual lengkap PDF
    • Dapat memahami dan menganalisis bagan, grafik, gambar, dan tata letak visual
    • Memproses setiap halaman sebagai teks dan gambar untuk pemahaman komprehensif
    • Menggunakan sekitar 7.000 token untuk PDF 3 halaman

Batasan Utama

  • Converse API: Analisis PDF visual memerlukan kutipan untuk diaktifkan. Saat ini tidak ada opsi untuk menggunakan analisis visual tanpa kutipan (tidak seperti InvokeModel API).
  • InvokeModel API: Menyediakan kontrol penuh atas pemrosesan PDF tanpa kutipan paksa.

Masalah Umum

Jika pelanggan melaporkan bahwa Claude tidak melihat gambar atau bagan dalam PDF mereka saat menggunakan Converse API, mereka mungkin perlu mengaktifkan flag kutipan. Tanpa itu, Converse kembali ke ekstraksi teks dasar saja.

Ini adalah batasan yang diketahui dengan Converse API. Untuk aplikasi yang memerlukan analisis PDF visual tanpa kutipan, pertimbangkan untuk menggunakan InvokeModel API sebagai gantinya.

Untuk file non-PDF seperti file .csv, .xlsx, .docx, .md, atau .txt, lihat Bekerja dengan format file lain.


Proses PDF dengan Claude

Kirim permintaan PDF pertama Anda

Mari kita mulai dengan contoh sederhana menggunakan Messages API. Anda dapat memberikan PDF kepada Claude dengan tiga cara:

  1. Sebagai referensi URL ke PDF yang dihosting online
  2. Sebagai PDF yang dikodekan base64 dalam blok konten document
  3. Dengan file_id dari Files API

Opsi 1: Dokumen PDF berbasis URL

Pendekatan paling sederhana adalah mereferensikan PDF langsung dari URL:

Opsi 2: Dokumen PDF yang dikodekan base64

Jika Anda perlu mengirim PDF dari sistem lokal Anda atau saat URL tidak tersedia:

Opsi 3: Files API

Untuk PDF yang akan Anda gunakan berulang kali, atau saat Anda ingin menghindari overhead pengkodean, gunakan Files API:

Cara kerja dukungan PDF

Saat Anda mengirim PDF ke Claude, langkah-langkah berikut terjadi:

  1. 1

    Sistem mengekstrak konten dokumen.

    • Sistem mengonversi setiap halaman dokumen menjadi gambar.
    • Teks dari setiap halaman diekstrak dan disediakan bersama gambar setiap halaman.
  2. 2

    Claude menganalisis teks dan gambar untuk lebih memahami dokumen.

    • Dokumen disediakan sebagai kombinasi teks dan gambar untuk analisis.
    • Ini memungkinkan pengguna untuk meminta wawasan tentang elemen visual PDF, seperti bagan, diagram, dan konten non-tekstual lainnya.
  3. 3

    Claude merespons, mereferensikan konten PDF jika relevan.

    Claude dapat mereferensikan konten tekstual dan visual saat merespons. Anda dapat lebih meningkatkan kinerja dengan mengintegrasikan dukungan PDF dengan:

    • Prompt caching: Untuk meningkatkan kinerja untuk analisis berulang.
    • Batch processing: Untuk pemrosesan dokumen volume tinggi.
    • Tool use: Untuk mengekstrak informasi spesifik dari dokumen untuk digunakan sebagai input alat.

Perkirakan biaya Anda

Jumlah token dari file PDF tergantung pada total teks yang diekstrak dari dokumen serta jumlah halaman:

  • Biaya token teks: Setiap halaman biasanya menggunakan 1.500-3.000 token per halaman tergantung pada kepadatan konten. Harga API standar berlaku tanpa biaya PDF tambahan.
  • Biaya token gambar: Karena setiap halaman dikonversi menjadi gambar, perhitungan biaya berbasis gambar yang sama diterapkan.

Anda dapat menggunakan token counting untuk memperkirakan biaya untuk PDF spesifik Anda.


Optimalkan pemrosesan PDF

Tingkatkan kinerja

Ikuti praktik terbaik ini untuk hasil optimal:

  • Tempatkan PDF sebelum teks dalam permintaan Anda
  • Gunakan font standar
  • Pastikan teks jelas dan mudah dibaca
  • Putar halaman ke orientasi tegak yang tepat
  • Gunakan nomor halaman logis (dari penampil PDF) dalam prompt
  • Bagi PDF besar menjadi potongan saat diperlukan
  • Aktifkan prompt caching untuk analisis berulang

Skalakan implementasi Anda

Untuk pemrosesan volume tinggi, pertimbangkan pendekatan berikut:

Gunakan prompt caching

Cache PDF untuk meningkatkan performa pada kueri berulang:

Proses batch dokumen

Gunakan Message Batches API untuk alur kerja volume tinggi:

Langkah berikutnya

Coba contoh PDF

Jelajahi contoh praktis pemrosesan PDF dalam resep cookbook.

  • Memerlukan kutipan untuk diaktifkan di Converse API
  • client = anthropic.Anthropic()
    message = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {
                            "type": "url",
                            "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                        },
                    },
                    {"type": "text", "text": "What are the key findings in this document?"},
                ],
            }
        ],
    )
    
    print(message.content)
    import base64
    import httpx
    
    # First, load and encode the PDF
    pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
    pdf_data = base64.standard_b64encode(httpx.get(pdf_url).content).decode("utf-8")
    
    # Alternative: Load from a local file
    # with open("document.pdf", "rb") as f:
    #     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")
    
    # Send to Claude using base64 encoding
    client = anthropic.Anthropic()
    message = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {
                            "type": "base64",
                            "media_type": "application/pdf",
                            "data": pdf_data,
                        },
                    },
                    {"type": "text", "text": "What are the key findings in this document?"},
                ],
            }
        ],
    )
    
    print(message.content)
    client = anthropic.Anthropic()
    
    # Upload the PDF file
    with open("document.pdf", "rb") as f:
        file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))
    
    # Use the uploaded file in a message
    message = client.beta.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        betas=["files-api-2025-04-14"],
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {"type": "file", "file_id": file_upload.id},
                    },
                    {"type": "text", "text": "What are the key findings in this document?"},
                ],
            }
        ],
    )
    
    print(message.content)
    client = anthropic.Anthropic()
    # ...
    message = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {
                            "type": "base64",
                            "media_type": "application/pdf",
                            "data": pdf_data,
                        },
                        "cache_control": {"type": "ephemeral"},
                    },
                    {"type": "text", "text": "Analyze this document."},
                ],
            }
        ],
    )
    client = anthropic.Anthropic()
    # ...
    message_batch = client.messages.batches.create(
        requests=[
            {
                "custom_id": "doc1",
                "params": {
                    "model": "claude-opus-4-7",
                    "max_tokens": 1024,
                    "messages": [
                        {
                            "role": "user",
                            "content": [
                                {
                                    "type": "document",
                                    "source": {
                                        "type": "base64",
                                        "media_type": "application/pdf",
                                        "data": pdf_data,
                                    },
                                },
                                {"type": "text", "text": "Summarize this document."},
                            ],
                        }
                    ],
                },
            }
        ]
    )
    Lihat referensi API

    Lihat dokumentasi API lengkap untuk dukungan PDF.