Loading...
    • Bangun
    • Admin
    • Model & harga
    • Client SDKs
    • API Reference
    Search...
    ⌘K
    Langkah pertama
    Pengenalan ClaudePanduan cepat
    Membangun dengan Claude
    Ikhtisar fiturMenggunakan Messages APIClaude API skillMenangani alasan penghentian
    Kemampuan model
    Extended thinkingAdaptive thinkingUpayaAnggaran tugas (beta)Mode cepat (beta: pratinjau penelitian)Output terstrukturKutipanStreaming MessagesPemrosesan batchHasil pencarianStreaming penolakanDukungan multibahasaEmbeddings
    Alat
    IkhtisarCara kerja penggunaan alatAlat pencarian webAlat pengambilan webAlat eksekusi kodeAlat penasihatAlat memoriAlat BashAlat penggunaan komputerAlat editor teks
    Infrastruktur alat
    Referensi alatPencarian alatPemanggilan alat terprogramStreaming alat berbutir halus
    Manajemen konteks
    Jendela konteksPemadatanPengeditan konteksPrompt cachingPenghitungan token
    Bekerja dengan file
    Files APIDukungan PDFGambar dan visi
    Skills
    IkhtisarPanduan cepatPraktik terbaikSkills untuk enterpriseSkills dalam API
    MCP
    Server MCP jarak jauhMCP connector
    Rekayasa prompt
    IkhtisarPraktik terbaik promptingAlat prompting Console
    Uji dan evaluasi
    Tentukan kesuksesan dan bangun evaluasiMenggunakan Alat Evaluasi di ConsoleMengurangi latensi
    Perkuat guardrail
    Kurangi halusinasiTingkatkan konsistensi outputMitigasi jailbreakKurangi kebocoran prompt
    Sumber daya
    Glosarium
    Catatan rilis
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Bekerja dengan file

    Dukungan PDF

    Proses PDF dengan Claude. Ekstrak teks, analisis bagan, dan pahami konten visual dari dokumen Anda.

    Was this page helpful?

    • Sebelum Anda memulai
    • Periksa persyaratan PDF
    • Platform dan model yang didukung
    • Dukungan PDF Amazon Bedrock
    • Proses PDF dengan Claude
    • Kirim permintaan PDF pertama Anda
    • Cara kerja dukungan PDF
    • Perkirakan biaya Anda
    • Optimalkan pemrosesan PDF
    • Tingkatkan kinerja
    • Skalakan implementasi Anda
    • Langkah berikutnya

    This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

    Anda dapat bertanya kepada Claude tentang teks, gambar, bagan, dan tabel apa pun dalam PDF yang Anda berikan. Beberapa contoh kasus penggunaan:

    • Menganalisis laporan keuangan dan memahami bagan/tabel
    • Mengekstrak informasi kunci dari dokumen hukum
    • Bantuan terjemahan untuk dokumen
    • Mengonversi informasi dokumen ke format terstruktur

    Sebelum Anda memulai

    Periksa persyaratan PDF

    Claude bekerja dengan PDF standar apa pun. Pastikan ukuran permintaan Anda memenuhi persyaratan berikut:

    PersyaratanBatas
    Ukuran permintaan maksimal32 MB (bervariasi menurut platform)
    Halaman maksimal per permintaan600 (100 untuk model dengan jendela konteks token 200k)
    FormatPDF Standar (tanpa kata sandi/enkripsi)

    Kedua batas berada pada seluruh muatan permintaan, termasuk konten lain apa pun yang dikirim bersama PDF. Untuk PDF besar, pertimbangkan untuk mengunggah dengan Files API dan mereferensikan dengan file_id untuk menjaga muatan permintaan tetap kecil.

    PDF padat (banyak halaman font kecil, tabel kompleks, atau grafis berat) dapat mengisi jendela konteks sebelum mencapai batas halaman. Permintaan dengan PDF besar juga dapat gagal sebelum mencapai batas halaman, bahkan saat menggunakan Files API. Coba bagi dokumen menjadi bagian-bagian; untuk file besar, karena setiap halaman diproses sebagai gambar, downsampling gambar tertanam juga dapat membantu.

    Karena dukungan PDF bergantung pada kemampuan visi Claude, dukungan ini tunduk pada batasan dan pertimbangan yang sama seperti tugas visi lainnya.

    Platform dan model yang didukung

    Dukungan PDF saat ini didukung melalui akses API langsung dan Google Vertex AI. Semua model aktif mendukung pemrosesan PDF.

    Dukungan PDF sekarang tersedia di Amazon Bedrock dengan pertimbangan berikut:

    Dukungan PDF Amazon Bedrock

    Saat menggunakan dukungan PDF melalui Converse API Amazon Bedrock, ada dua mode pemrosesan dokumen yang berbeda:

    Penting: Untuk mengakses kemampuan pemahaman PDF visual penuh Claude di Converse API, Anda harus mengaktifkan kutipan. Tanpa kutipan yang diaktifkan, API kembali ke ekstraksi teks dasar saja. Pelajari lebih lanjut tentang bekerja dengan kutipan.

    Mode Pemrosesan Dokumen

    1. Converse Document Chat (Mode asli - Ekstraksi teks saja)

      • Menyediakan ekstraksi teks dasar dari PDF
      • Tidak dapat menganalisis gambar, bagan, atau tata letak visual dalam PDF
      • Menggunakan sekitar 1.000 token untuk PDF 3 halaman
      • Digunakan secara otomatis saat kutipan tidak diaktifkan
    2. Claude PDF Chat (Mode baru - Pemahaman visual penuh)

      • Menyediakan analisis visual lengkap PDF
      • Dapat memahami dan menganalisis bagan, grafik, gambar, dan tata letak visual
      • Memproses setiap halaman sebagai teks dan gambar untuk pemahaman komprehensif
      • Menggunakan sekitar 7.000 token untuk PDF 3 halaman

    Batasan Utama

    • Converse API: Analisis PDF visual memerlukan kutipan untuk diaktifkan. Saat ini tidak ada opsi untuk menggunakan analisis visual tanpa kutipan (tidak seperti InvokeModel API).
    • InvokeModel API: Menyediakan kontrol penuh atas pemrosesan PDF tanpa kutipan paksa.

    Masalah Umum

    Jika pelanggan melaporkan bahwa Claude tidak melihat gambar atau bagan dalam PDF mereka saat menggunakan Converse API, mereka mungkin perlu mengaktifkan flag kutipan. Tanpa itu, Converse kembali ke ekstraksi teks dasar saja.

    Ini adalah batasan yang diketahui dengan Converse API. Untuk aplikasi yang memerlukan analisis PDF visual tanpa kutipan, pertimbangkan untuk menggunakan InvokeModel API sebagai gantinya.

    Untuk file non-PDF seperti file .csv, .xlsx, .docx, .md, atau .txt, lihat Bekerja dengan format file lain.


    Proses PDF dengan Claude

    Kirim permintaan PDF pertama Anda

    Mari kita mulai dengan contoh sederhana menggunakan Messages API. Anda dapat memberikan PDF kepada Claude dengan tiga cara:

    1. Sebagai referensi URL ke PDF yang dihosting online
    2. Sebagai PDF yang dikodekan base64 dalam blok konten document
    3. Dengan file_id dari Files API

    Opsi 1: Dokumen PDF berbasis URL

    Pendekatan paling sederhana adalah mereferensikan PDF langsung dari URL:

    Opsi 2: Dokumen PDF yang dikodekan base64

    Jika Anda perlu mengirim PDF dari sistem lokal Anda atau saat URL tidak tersedia:

    Opsi 3: Files API

    Untuk PDF yang akan Anda gunakan berulang kali, atau saat Anda ingin menghindari overhead pengkodean, gunakan Files API:

    Cara kerja dukungan PDF

    Saat Anda mengirim PDF ke Claude, langkah-langkah berikut terjadi:

    1. 1

      Sistem mengekstrak konten dokumen.

      • Sistem mengonversi setiap halaman dokumen menjadi gambar.
      • Teks dari setiap halaman diekstrak dan disediakan bersama gambar setiap halaman.
    2. 2

      Claude menganalisis teks dan gambar untuk lebih memahami dokumen.

      • Dokumen disediakan sebagai kombinasi teks dan gambar untuk analisis.
      • Ini memungkinkan pengguna untuk meminta wawasan tentang elemen visual PDF, seperti bagan, diagram, dan konten non-tekstual lainnya.
    3. 3

      Claude merespons, mereferensikan konten PDF jika relevan.

      Claude dapat mereferensikan konten tekstual dan visual saat merespons. Anda dapat lebih meningkatkan kinerja dengan mengintegrasikan dukungan PDF dengan:

      • Prompt caching: Untuk meningkatkan kinerja untuk analisis berulang.
      • Batch processing: Untuk pemrosesan dokumen volume tinggi.
      • Tool use: Untuk mengekstrak informasi spesifik dari dokumen untuk digunakan sebagai input alat.

    Perkirakan biaya Anda

    Jumlah token dari file PDF tergantung pada total teks yang diekstrak dari dokumen serta jumlah halaman:

    • Biaya token teks: Setiap halaman biasanya menggunakan 1.500-3.000 token per halaman tergantung pada kepadatan konten. Harga API standar berlaku tanpa biaya PDF tambahan.
    • Biaya token gambar: Karena setiap halaman dikonversi menjadi gambar, perhitungan biaya berbasis gambar yang sama diterapkan.

    Anda dapat menggunakan token counting untuk memperkirakan biaya untuk PDF spesifik Anda.


    Optimalkan pemrosesan PDF

    Tingkatkan kinerja

    Ikuti praktik terbaik ini untuk hasil optimal:

    • Tempatkan PDF sebelum teks dalam permintaan Anda
    • Gunakan font standar
    • Pastikan teks jelas dan mudah dibaca
    • Putar halaman ke orientasi tegak yang tepat
    • Gunakan nomor halaman logis (dari penampil PDF) dalam prompt
    • Bagi PDF besar menjadi potongan saat diperlukan
    • Aktifkan prompt caching untuk analisis berulang

    Skalakan implementasi Anda

    Untuk pemrosesan volume tinggi, pertimbangkan pendekatan berikut:

    Gunakan prompt caching

    Cache PDF untuk meningkatkan performa pada kueri berulang:

    Proses batch dokumen

    Gunakan Message Batches API untuk alur kerja volume tinggi:

    Langkah berikutnya

    Coba contoh PDF

    Jelajahi contoh praktis pemrosesan PDF dalam resep cookbook.

  1. Memerlukan kutipan untuk diaktifkan di Converse API
  2. client = anthropic.Anthropic()
    message = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {
                            "type": "url",
                            "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                        },
                    },
                    {"type": "text", "text": "What are the key findings in this document?"},
                ],
            }
        ],
    )
    
    print(message.content)
    import base64
    import httpx
    
    # First, load and encode the PDF
    pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
    pdf_data = base64.standard_b64encode(httpx.get(pdf_url).content).decode("utf-8")
    
    # Alternative: Load from a local file
    # with open("document.pdf", "rb") as f:
    #     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")
    
    # Send to Claude using base64 encoding
    client = anthropic.Anthropic()
    message = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {
                            "type": "base64",
                            "media_type": "application/pdf",
                            "data": pdf_data,
                        },
                    },
                    {"type": "text", "text": "What are the key findings in this document?"},
                ],
            }
        ],
    )
    
    print(message.content)
    client = anthropic.Anthropic()
    
    # Upload the PDF file
    with open("document.pdf", "rb") as f:
        file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))
    
    # Use the uploaded file in a message
    message = client.beta.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        betas=["files-api-2025-04-14"],
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {"type": "file", "file_id": file_upload.id},
                    },
                    {"type": "text", "text": "What are the key findings in this document?"},
                ],
            }
        ],
    )
    
    print(message.content)
    client = anthropic.Anthropic()
    # ...
    message = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {
                            "type": "base64",
                            "media_type": "application/pdf",
                            "data": pdf_data,
                        },
                        "cache_control": {"type": "ephemeral"},
                    },
                    {"type": "text", "text": "Analyze this document."},
                ],
            }
        ],
    )
    client = anthropic.Anthropic()
    # ...
    message_batch = client.messages.batches.create(
        requests=[
            {
                "custom_id": "doc1",
                "params": {
                    "model": "claude-opus-4-7",
                    "max_tokens": 1024,
                    "messages": [
                        {
                            "role": "user",
                            "content": [
                                {
                                    "type": "document",
                                    "source": {
                                        "type": "base64",
                                        "media_type": "application/pdf",
                                        "data": pdf_data,
                                    },
                                },
                                {"type": "text", "text": "Summarize this document."},
                            ],
                        }
                    ],
                },
            }
        ]
    )
    Lihat referensi API

    Lihat dokumentasi API lengkap untuk dukungan PDF.