MessagesBekerja dengan file

Dukungan PDF

Proses PDF dengan Claude. Ekstrak teks, analisis grafik, dan pahami konten visual dari dokumen Anda.

Fitur ini memenuhi syarat untuk Zero Data Retention (ZDR). Ketika organisasi Anda memiliki pengaturan ZDR, data yang dikirim melalui fitur ini tidak disimpan setelah respons API dikembalikan.

Anda dapat bertanya kepada Claude tentang teks, gambar, grafik, dan tabel apa pun dalam PDF yang Anda berikan. Beberapa contoh kasus penggunaan:

Menganalisis laporan keuangan dan memahami grafik/tabel
Mengekstrak informasi penting dari dokumen hukum
Bantuan penerjemahan untuk dokumen
Mengonversi informasi dokumen ke dalam format terstruktur

Sebelum Anda mulai

Periksa persyaratan PDF

Claude bekerja dengan PDF standar apa pun. Pastikan ukuran permintaan Anda memenuhi persyaratan berikut:

Persyaratan	Batas
Ukuran permintaan maksimum	32 MB (bervariasi berdasarkan platform)
Halaman maksimum per permintaan	600 (100 untuk model dengan jendela konteks 200k token)
Format	PDF standar (tanpa kata sandi/enkripsi)

Kedua batas tersebut berlaku untuk seluruh payload permintaan, termasuk konten lain yang dikirim bersama PDF. Untuk PDF berukuran besar, pertimbangkan untuk mengunggah dengan Files API dan mereferensikannya melalui file_id agar payload permintaan tetap kecil.

PDF yang padat (banyak halaman dengan font kecil, tabel kompleks, atau grafik berat) dapat memenuhi jendela konteks sebelum mencapai batas halaman. Permintaan dengan PDF besar juga dapat gagal sebelum mencapai batas halaman, bahkan saat menggunakan Files API. Cobalah membagi dokumen menjadi beberapa bagian; untuk file besar, karena setiap halaman diproses sebagai gambar, menurunkan resolusi (downsampling) gambar yang disematkan juga dapat membantu.

Karena dukungan PDF bergantung pada kemampuan visi Claude, dukungan ini tunduk pada batasan dan pertimbangan yang sama seperti tugas visi lainnya.

Platform dan model yang didukung

Dukungan PDF tersedia di Claude API, Claude Platform di AWS, Amazon Bedrock (lihat Dukungan PDF Amazon Bedrock), Google Cloud, dan Microsoft Foundry. Semua model aktif mendukung pemrosesan PDF.

Dukungan PDF Amazon Bedrock

Saat menggunakan dukungan PDF melalui Converse API dari Bedrock, terdapat dua mode pemrosesan dokumen yang berbeda:

Penting: Untuk mengakses kemampuan pemahaman PDF visual penuh dari Claude di Converse API, Anda harus mengaktifkan sitasi. Tanpa sitasi diaktifkan, API akan kembali ke ekstraksi teks dasar saja. Pelajari lebih lanjut tentang bekerja dengan sitasi.

Mode pemrosesan dokumen

Converse Document Chat (Mode asli - Hanya ekstraksi teks)
- Menyediakan ekstraksi teks dasar dari PDF
- Tidak dapat menganalisis gambar, grafik, atau tata letak visual dalam PDF
- Menggunakan sekitar 1.000 token untuk PDF 3 halaman
- Digunakan secara otomatis ketika sitasi tidak diaktifkan
Claude PDF Chat (Mode baru - Pemahaman visual penuh)
- Menyediakan analisis visual lengkap dari PDF
- Dapat memahami dan menganalisis grafik, diagram, gambar, dan tata letak visual
- Memproses setiap halaman sebagai teks dan gambar untuk pemahaman yang komprehensif
- Menggunakan sekitar 7.000 token untuk PDF 3 halaman
- Memerlukan sitasi diaktifkan di Converse API

Batasan utama

Converse API: Analisis PDF visual memerlukan sitasi diaktifkan. Saat ini tidak ada opsi untuk menggunakan analisis visual tanpa sitasi (tidak seperti InvokeModel API).
InvokeModel API: Memberikan kontrol penuh atas pemrosesan PDF tanpa sitasi yang dipaksakan.

Masalah umum

Jika Claude tidak melihat gambar atau grafik dalam PDF Anda saat menggunakan Converse API, kemungkinan Anda perlu mengaktifkan flag sitasi. Tanpa itu, Converse kembali ke ekstraksi teks dasar saja.

Ini adalah kendala yang diketahui pada Converse API. Untuk aplikasi yang memerlukan analisis PDF visual tanpa sitasi, pertimbangkan untuk menggunakan InvokeModel API sebagai gantinya.

Untuk file non-PDF seperti file .csv, .xlsx, .docx, .md, atau .txt, lihat Bekerja dengan format file lain.

Memproses PDF dengan Claude

Kirim permintaan PDF pertama Anda

Mari kita mulai dengan contoh sederhana menggunakan Messages API. Anda dapat memberikan PDF kepada Claude dengan tiga cara:

Sebagai referensi URL ke PDF yang di-hosting secara online
Sebagai PDF yang dienkode base64 dalam blok konten document
Melalui file_id dari Files API

Di Amazon Bedrock dan Google Cloud, saat ini hanya sumber yang dienkode base64 yang tersedia.

Opsi 1: Dokumen PDF berbasis URL

Pendekatan paling sederhana adalah mereferensikan PDF langsung dari URL:

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "url",
                        "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opsi 2: Dokumen PDF yang dienkode base64

Jika Anda perlu mengirim PDF dari sistem lokal Anda atau ketika URL tidak tersedia:

import base64
import httpx

# Pertama, muat dan enkode PDF
pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
pdf_data = base64.standard_b64encode(
    httpx.get(pdf_url, follow_redirects=True).content
).decode("utf-8")

# Alternatif: Muat dari file lokal
# with open("document.pdf", "rb") as f:
#     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")

# Kirim ke Claude menggunakan enkode base64
client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opsi 3: Files API

Untuk PDF yang akan Anda gunakan berulang kali, atau ketika Anda ingin menghindari overhead encoding, gunakan Files API:

client = anthropic.Anthropic()

# Unggah file PDF
with open("/path/to/document.pdf", "rb") as f:
    file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))

# Gunakan file yang diunggah dalam pesan
message = client.beta.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    betas=["files-api-2025-04-14"],
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {"type": "file", "file_id": file_upload.id},
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Cara kerja dukungan PDF

Ketika Anda mengirim PDF ke Claude, langkah-langkah berikut terjadi:

Sistem mengekstrak konten dokumen.
- Sistem mengonversi setiap halaman dokumen menjadi gambar.
- Teks dari setiap halaman diekstrak dan disediakan bersama gambar setiap halaman.
Claude menganalisis teks dan gambar untuk lebih memahami dokumen.
- Dokumen disediakan sebagai kombinasi teks dan gambar untuk dianalisis.
- Ini memungkinkan pengguna untuk meminta wawasan tentang elemen visual dari PDF, seperti grafik, diagram, dan konten non-tekstual lainnya.
Claude merespons, mereferensikan konten PDF jika relevan.
Claude dapat mereferensikan konten tekstual dan visual saat merespons. Anda dapat lebih meningkatkan kinerja dengan mengintegrasikan dukungan PDF dengan:
- Caching prompt: Untuk meningkatkan kinerja pada analisis berulang.
- Pemrosesan batch: Untuk pemrosesan dokumen bervolume tinggi.
- Penggunaan alat: Untuk mengekstrak informasi spesifik dari dokumen untuk digunakan sebagai input alat.

Perkirakan biaya Anda

Jumlah token dari file PDF bergantung pada total teks yang diekstrak dari dokumen serta jumlah halaman:

Biaya token teks: Setiap halaman biasanya menggunakan 1.500-3.000 token per halaman tergantung pada kepadatan konten. Harga API standar berlaku tanpa biaya PDF tambahan.
Biaya token gambar: Karena setiap halaman dikonversi menjadi gambar, perhitungan biaya berbasis gambar yang sama diterapkan.

Anda dapat menggunakan penghitungan token untuk memperkirakan biaya untuk PDF spesifik Anda.

Optimalkan pemrosesan PDF

Tingkatkan kinerja

Ikuti praktik terbaik berikut untuk hasil optimal:

Tempatkan PDF sebelum teks dalam permintaan Anda
Gunakan font standar
Pastikan teks jelas dan mudah dibaca
Putar halaman ke orientasi tegak yang benar
Gunakan nomor halaman logis (dari penampil PDF) dalam prompt
Bagi PDF besar menjadi beberapa bagian jika diperlukan
Aktifkan caching prompt untuk analisis berulang

Skalakan implementasi Anda

Untuk pemrosesan bervolume tinggi, pertimbangkan pendekatan berikut:

Gunakan caching prompt

Cache PDF untuk meningkatkan kinerja pada kueri berulang:

client = anthropic.Anthropic()
# ...
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                    "cache_control": {"type": "ephemeral"},
                },
                {"type": "text", "text": "Analyze this document."},
            ],
        }
    ],
)

Proses batch dokumen

Gunakan Message Batches API untuk alur kerja bervolume tinggi:

client = anthropic.Anthropic()
# ...
message_batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": "doc1",
            "params": {
                "model": "claude-opus-4-8",
                "max_tokens": 1024,
                "messages": [
                    {
                        "role": "user",
                        "content": [
                            {
                                "type": "document",
                                "source": {
                                    "type": "base64",
                                    "media_type": "application/pdf",
                                    "data": pdf_data,
                                },
                            },
                            {"type": "text", "text": "Summarize this document."},
                        ],
                    }
                ],
            },
        }
    ]
)

Langkah selanjutnya

Coba contoh PDF

Jelajahi contoh praktis pemrosesan PDF dalam resep cookbook.

Lihat referensi API

Lihat dokumentasi API lengkap untuk dukungan PDF.

Was this page helpful?

MessagesBekerja dengan file

Dukungan PDF

Proses PDF dengan Claude. Ekstrak teks, analisis grafik, dan pahami konten visual dari dokumen Anda.

Fitur ini memenuhi syarat untuk Zero Data Retention (ZDR). Ketika organisasi Anda memiliki pengaturan ZDR, data yang dikirim melalui fitur ini tidak disimpan setelah respons API dikembalikan.

Anda dapat bertanya kepada Claude tentang teks, gambar, grafik, dan tabel apa pun dalam PDF yang Anda berikan. Beberapa contoh kasus penggunaan:

Menganalisis laporan keuangan dan memahami grafik/tabel
Mengekstrak informasi penting dari dokumen hukum
Bantuan penerjemahan untuk dokumen
Mengonversi informasi dokumen ke dalam format terstruktur

Sebelum Anda mulai

Periksa persyaratan PDF

Claude bekerja dengan PDF standar apa pun. Pastikan ukuran permintaan Anda memenuhi persyaratan berikut:

Persyaratan	Batas
Ukuran permintaan maksimum	32 MB (bervariasi berdasarkan platform)
Halaman maksimum per permintaan	600 (100 untuk model dengan jendela konteks 200k token)
Format	PDF standar (tanpa kata sandi/enkripsi)

Karena dukungan PDF bergantung pada kemampuan visi Claude, dukungan ini tunduk pada batasan dan pertimbangan yang sama seperti tugas visi lainnya.

Platform dan model yang didukung

Dukungan PDF tersedia di Claude API, Claude Platform di AWS, Amazon Bedrock (lihat Dukungan PDF Amazon Bedrock), Google Cloud, dan Microsoft Foundry. Semua model aktif mendukung pemrosesan PDF.

Dukungan PDF Amazon Bedrock

Saat menggunakan dukungan PDF melalui Converse API dari Bedrock, terdapat dua mode pemrosesan dokumen yang berbeda:

Mode pemrosesan dokumen

Converse Document Chat (Mode asli - Hanya ekstraksi teks)
- Menyediakan ekstraksi teks dasar dari PDF
- Tidak dapat menganalisis gambar, grafik, atau tata letak visual dalam PDF
- Menggunakan sekitar 1.000 token untuk PDF 3 halaman
- Digunakan secara otomatis ketika sitasi tidak diaktifkan
Claude PDF Chat (Mode baru - Pemahaman visual penuh)
- Menyediakan analisis visual lengkap dari PDF
- Dapat memahami dan menganalisis grafik, diagram, gambar, dan tata letak visual
- Memproses setiap halaman sebagai teks dan gambar untuk pemahaman yang komprehensif
- Menggunakan sekitar 7.000 token untuk PDF 3 halaman
- Memerlukan sitasi diaktifkan di Converse API

Batasan utama

Converse API: Analisis PDF visual memerlukan sitasi diaktifkan. Saat ini tidak ada opsi untuk menggunakan analisis visual tanpa sitasi (tidak seperti InvokeModel API).
InvokeModel API: Memberikan kontrol penuh atas pemrosesan PDF tanpa sitasi yang dipaksakan.

Masalah umum

Jika Claude tidak melihat gambar atau grafik dalam PDF Anda saat menggunakan Converse API, kemungkinan Anda perlu mengaktifkan flag sitasi. Tanpa itu, Converse kembali ke ekstraksi teks dasar saja.

Ini adalah kendala yang diketahui pada Converse API. Untuk aplikasi yang memerlukan analisis PDF visual tanpa sitasi, pertimbangkan untuk menggunakan InvokeModel API sebagai gantinya.

Untuk file non-PDF seperti file .csv, .xlsx, .docx, .md, atau .txt, lihat Bekerja dengan format file lain.

Memproses PDF dengan Claude

Kirim permintaan PDF pertama Anda

Mari kita mulai dengan contoh sederhana menggunakan Messages API. Anda dapat memberikan PDF kepada Claude dengan tiga cara:

Sebagai referensi URL ke PDF yang di-hosting secara online
Sebagai PDF yang dienkode base64 dalam blok konten document
Melalui file_id dari Files API

Di Amazon Bedrock dan Google Cloud, saat ini hanya sumber yang dienkode base64 yang tersedia.

Opsi 1: Dokumen PDF berbasis URL

Pendekatan paling sederhana adalah mereferensikan PDF langsung dari URL:

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "url",
                        "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opsi 2: Dokumen PDF yang dienkode base64

Jika Anda perlu mengirim PDF dari sistem lokal Anda atau ketika URL tidak tersedia:

import base64
import httpx

# Pertama, muat dan enkode PDF
pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
pdf_data = base64.standard_b64encode(
    httpx.get(pdf_url, follow_redirects=True).content
).decode("utf-8")

# Alternatif: Muat dari file lokal
# with open("document.pdf", "rb") as f:
#     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")

# Kirim ke Claude menggunakan enkode base64
client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opsi 3: Files API

Untuk PDF yang akan Anda gunakan berulang kali, atau ketika Anda ingin menghindari overhead encoding, gunakan Files API:

client = anthropic.Anthropic()

# Unggah file PDF
with open("/path/to/document.pdf", "rb") as f:
    file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))

# Gunakan file yang diunggah dalam pesan
message = client.beta.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    betas=["files-api-2025-04-14"],
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {"type": "file", "file_id": file_upload.id},
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Cara kerja dukungan PDF

Ketika Anda mengirim PDF ke Claude, langkah-langkah berikut terjadi:

Sistem mengekstrak konten dokumen.
- Sistem mengonversi setiap halaman dokumen menjadi gambar.
- Teks dari setiap halaman diekstrak dan disediakan bersama gambar setiap halaman.
Claude menganalisis teks dan gambar untuk lebih memahami dokumen.
- Dokumen disediakan sebagai kombinasi teks dan gambar untuk dianalisis.
- Ini memungkinkan pengguna untuk meminta wawasan tentang elemen visual dari PDF, seperti grafik, diagram, dan konten non-tekstual lainnya.
Claude merespons, mereferensikan konten PDF jika relevan.
Claude dapat mereferensikan konten tekstual dan visual saat merespons. Anda dapat lebih meningkatkan kinerja dengan mengintegrasikan dukungan PDF dengan:
- Caching prompt: Untuk meningkatkan kinerja pada analisis berulang.
- Pemrosesan batch: Untuk pemrosesan dokumen bervolume tinggi.
- Penggunaan alat: Untuk mengekstrak informasi spesifik dari dokumen untuk digunakan sebagai input alat.

Perkirakan biaya Anda

Jumlah token dari file PDF bergantung pada total teks yang diekstrak dari dokumen serta jumlah halaman:

Biaya token teks: Setiap halaman biasanya menggunakan 1.500-3.000 token per halaman tergantung pada kepadatan konten. Harga API standar berlaku tanpa biaya PDF tambahan.
Biaya token gambar: Karena setiap halaman dikonversi menjadi gambar, perhitungan biaya berbasis gambar yang sama diterapkan.

Anda dapat menggunakan penghitungan token untuk memperkirakan biaya untuk PDF spesifik Anda.

Optimalkan pemrosesan PDF

Tingkatkan kinerja

Ikuti praktik terbaik berikut untuk hasil optimal:

Tempatkan PDF sebelum teks dalam permintaan Anda
Gunakan font standar
Pastikan teks jelas dan mudah dibaca
Putar halaman ke orientasi tegak yang benar
Gunakan nomor halaman logis (dari penampil PDF) dalam prompt
Bagi PDF besar menjadi beberapa bagian jika diperlukan
Aktifkan caching prompt untuk analisis berulang

Skalakan implementasi Anda

Untuk pemrosesan bervolume tinggi, pertimbangkan pendekatan berikut:

Gunakan caching prompt

Cache PDF untuk meningkatkan kinerja pada kueri berulang:

client = anthropic.Anthropic()
# ...
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                    "cache_control": {"type": "ephemeral"},
                },
                {"type": "text", "text": "Analyze this document."},
            ],
        }
    ],
)

Proses batch dokumen

Gunakan Message Batches API untuk alur kerja bervolume tinggi:

client = anthropic.Anthropic()
# ...
message_batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": "doc1",
            "params": {
                "model": "claude-opus-4-8",
                "max_tokens": 1024,
                "messages": [
                    {
                        "role": "user",
                        "content": [
                            {
                                "type": "document",
                                "source": {
                                    "type": "base64",
                                    "media_type": "application/pdf",
                                    "data": pdf_data,
                                },
                            },
                            {"type": "text", "text": "Summarize this document."},
                        ],
                    }
                ],
            },
        }
    ]
)

Langkah selanjutnya

Coba contoh PDF

Jelajahi contoh praktis pemrosesan PDF dalam resep cookbook.

Lihat referensi API

Lihat dokumentasi API lengkap untuk dukungan PDF.

Was this page helpful?

Sebelum Anda mulai

Periksa persyaratan PDF

Platform dan model yang didukung

Dukungan PDF Amazon Bedrock

Mode pemrosesan dokumen

Batasan utama

Masalah umum

Memproses PDF dengan Claude

Kirim permintaan PDF pertama Anda

Opsi 1: Dokumen PDF berbasis URL

Opsi 2: Dokumen PDF yang dienkode base64

Opsi 3: Files API

Cara kerja dukungan PDF

Perkirakan biaya Anda

Optimalkan pemrosesan PDF

Tingkatkan kinerja

Skalakan implementasi Anda

Gunakan caching prompt

Proses batch dokumen

Langkah selanjutnya

Sebelum Anda mulai

Periksa persyaratan PDF

Platform dan model yang didukung

Dukungan PDF Amazon Bedrock

Mode pemrosesan dokumen

Batasan utama

Masalah umum

Memproses PDF dengan Claude

Kirim permintaan PDF pertama Anda

Opsi 1: Dokumen PDF berbasis URL

Opsi 2: Dokumen PDF yang dienkode base64

Opsi 3: Files API

Cara kerja dukungan PDF

Perkirakan biaya Anda

Optimalkan pemrosesan PDF

Tingkatkan kinerja

Skalakan implementasi Anda

Gunakan caching prompt

Proses batch dokumen

Langkah selanjutnya

Sebelum Anda mulai

Periksa persyaratan PDF

Platform dan model yang didukung

Dukungan PDF Amazon Bedrock

Mode pemrosesan dokumen

Batasan utama

Masalah umum

Memproses PDF dengan Claude

Kirim permintaan PDF pertama Anda

Opsi 1: Dokumen PDF berbasis URL

Opsi 2: Dokumen PDF yang dienkode base64

Opsi 3: Files API

Cara kerja dukungan PDF

Perkirakan biaya Anda

Optimalkan pemrosesan PDF

Tingkatkan kinerja

Skalakan implementasi Anda

Gunakan caching prompt

Proses batch dokumen

Langkah selanjutnya

Sebelum Anda mulai

Periksa persyaratan PDF

Platform dan model yang didukung

Dukungan PDF Amazon Bedrock

Mode pemrosesan dokumen

Batasan utama

Masalah umum

Memproses PDF dengan Claude

Kirim permintaan PDF pertama Anda

Opsi 1: Dokumen PDF berbasis URL

Opsi 2: Dokumen PDF yang dienkode base64

Opsi 3: Files API

Cara kerja dukungan PDF

Perkirakan biaya Anda

Optimalkan pemrosesan PDF

Tingkatkan kinerja

Skalakan implementasi Anda

Gunakan caching prompt

Proses batch dokumen

Langkah selanjutnya