Fitur ini memenuhi syarat untuk Zero Data Retention (ZDR). Ketika organisasi Anda memiliki pengaturan ZDR, data yang dikirim melalui fitur ini tidak disimpan setelah respons API dikembalikan.
Claude dapat memberikan kutipan terperinci saat menjawab pertanyaan tentang dokumen, membantu Anda melacak dan memverifikasi sumber di balik setiap respons.
Semua model aktif mendukung kutipan, dengan pengecualian Claude Haiku 3.
Bagikan masukan dan saran Anda tentang fitur kutipan menggunakan formulir masukan kutipan.
Contoh berikut menunjukkan cara mengaktifkan kutipan pada dokumen teks biasa dengan Messages API:
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
messages=[
{
"role": "user",
"content": [
{
"type": "document",
"source": {
"type": "text",
"media_type": "text/plain",
"data": "The grass is green. The sky is blue.",
},
"title": "My Document",
"context": "This is a trustworthy document.",
"citations": {"enabled": True},
},
{"type": "text", "text": "What color is the grass and sky?"},
],
}
],
)
print(response)Perbandingan dengan pendekatan berbasis prompt
Dibandingkan dengan meminta Claude untuk mengutip sumber melalui prompt, fitur kutipan menawarkan keuntungan berikut:
cited_text tidak dihitung terhadap token output Anda.cited_text secara langsung, kutipan dijamin berisi penunjuk yang valid ke dokumen yang disediakan.Integrasikan kutipan dengan Claude dalam langkah-langkah berikut:
Sediakan dokumen dan aktifkan kutipan
citations.enabled=true pada setiap dokumen Anda. Saat ini, kutipan harus diaktifkan pada semua dokumen atau tidak sama sekali dalam satu permintaan.Dokumen diproses
Claude memberikan respons dengan kutipan
Pemecahan otomatis vs konten kustom
Secara default, dokumen teks biasa dan PDF secara otomatis dipecah menjadi kalimat. Jika Anda memerlukan kontrol lebih atas granularitas kutipan (misalnya, untuk poin-poin atau transkrip), gunakan dokumen konten kustom sebagai gantinya. Lihat Jenis dokumen untuk detail lebih lanjut.
Misalnya, jika Anda ingin Claude dapat mengutip kalimat spesifik dari potongan RAG Anda, Anda harus menempatkan setiap potongan RAG ke dalam dokumen teks biasa. Sebaliknya, jika Anda tidak ingin pemecahan lebih lanjut dilakukan, atau jika Anda ingin menyesuaikan pemecahan tambahan apa pun, Anda dapat menempatkan potongan RAG ke dalam dokumen konten kustom.
source dokumen dapat dikutip.title dan context adalah field opsional yang diteruskan ke model tetapi tidak digunakan sebagai konten yang dikutip.title memiliki batasan panjang, sehingga field context berguna untuk menyimpan metadata dokumen sebagai teks atau JSON yang di-stringify.content yang disediakan dalam dokumen konten kustom.cited_text disediakan untuk kemudahan dan tidak dihitung terhadap token output.cited_text juga tidak dihitung terhadap token input.Kutipan bekerja bersama dengan fitur API lainnya termasuk caching prompt, penghitungan token, dan pemrosesan batch.
Kutipan dan output terstruktur tidak kompatibel
Kutipan tidak dapat digunakan bersama dengan output terstruktur. Jika Anda mengaktifkan kutipan pada dokumen yang disediakan pengguna (blok document atau blok search_result) dan juga menyertakan parameter output_config.format (atau parameter output_format yang sudah tidak digunakan lagi), API mengembalikan error 400.
Ini karena kutipan memerlukan penyisipan blok kutipan di antara output teks, yang tidak kompatibel dengan batasan skema JSON yang ketat dari output terstruktur.
Kutipan dan caching prompt dapat digunakan bersama secara efektif.
Blok kutipan yang dihasilkan dalam respons tidak dapat di-cache secara langsung, tetapi dokumen sumber yang dirujuknya dapat di-cache. Untuk mengoptimalkan kinerja, terapkan cache_control pada blok konten dokumen tingkat atas Anda.
client = anthropic.Anthropic()
# Konten dokumen panjang (misalnya, dokumentasi teknis)
long_document = (
"This is a very long document with thousands of words..." + " ... " * 1000
) # Minimum cacheable length
response = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
messages=[
{
"role": "user",
"content": [
{
"type": "document",
"source": {
"type": "text",
"media_type": "text/plain",
"data": long_document,
},
"citations": {"enabled": True},
"cache_control": {
"type": "ephemeral"
}, # Cache the document content
},
{
"type": "text",
"text": "What does this document say about API features?",
},
],
}
],
)
print(response)Dalam contoh ini:
cache_control pada blok dokumen.Tiga jenis dokumen didukung untuk kutipan. Dokumen dapat disediakan langsung dalam pesan (base64, teks, atau URL) atau diunggah melalui Files API dan direferensikan dengan file_id:
| Jenis | Paling cocok untuk | Pemecahan | Format kutipan |
|---|---|---|---|
| Teks biasa | Dokumen teks sederhana, prosa | Kalimat | Indeks karakter (berindeks 0) |
| File PDF dengan konten teks | Kalimat | Nomor halaman (berindeks 1) | |
| Konten kustom | Daftar, transkrip, pemformatan khusus, kutipan yang lebih granular | Tidak ada pemecahan tambahan | Indeks blok (berindeks 0) |
File .csv, .xlsx, .docx, .md, dan .txt tidak didukung sebagai blok dokumen. Konversikan file-file ini ke teks biasa dan sertakan langsung dalam konten pesan. Lihat Bekerja dengan format file lainnya.
Dokumen teks biasa secara otomatis dipecah menjadi kalimat. Anda dapat menyediakannya secara inline atau dengan referensi menggunakan file_id:
Dokumen PDF dapat disediakan sebagai data yang dienkode base64, URL, atau dengan file_id. Teks PDF diekstrak dan dipecah menjadi kalimat. Karena kutipan gambar belum didukung, PDF yang merupakan hasil pemindaian dokumen dan tidak berisi teks yang dapat diekstrak tidak akan dapat dikutip.
Dokumen konten kustom memberi Anda kontrol atas granularitas kutipan. Tidak ada pemecahan tambahan yang dilakukan dan potongan disediakan ke model sesuai dengan blok konten yang disediakan.
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
messages=[
{
"role": "user",
"content": [
{
"type": "document",
"source": {
"type": "content",
"content": [
{"type": "text", "text": "First chunk"},
{"type": "text", "text": "Second chunk"},
],
},
"title": "Document Title",
"context": "Context about the document that will not be cited from",
"citations": {"enabled": True},
},
{"type": "text", "text": "Summarize this document."},
],
}
],
)
print(response)Ketika kutipan diaktifkan, respons mencakup beberapa blok teks dengan kutipan:
{
"content": [
{"type": "text", "text": "According to the document, "},
{
"type": "text",
"text": "the grass is green",
"citations": [
{
"type": "char_location",
"cited_text": "The grass is green.",
"document_index": 0,
"document_title": "Example Document",
"start_char_index": 0,
"end_char_index": 20,
}
],
},
{"type": "text", "text": " and "},
{
"type": "text",
"text": "the sky is blue",
"citations": [
{
"type": "char_location",
"cited_text": "The sky is blue.",
"document_index": 0,
"document_title": "Example Document",
"start_char_index": 20,
"end_char_index": 36,
}
],
},
{
"type": "text",
"text": ". Information from page 5 states that ",
},
{
"type": "text",
"text": "water is essential",
"citations": [
{
"type": "page_location",
"cited_text": "Water is essential for life.",
"document_index": 1,
"document_title": "PDF Document",
"start_page_number": 5,
"end_page_number": 6,
}
],
},
{
"type": "text",
"text": ". The custom document mentions ",
},
{
"type": "text",
"text": "important findings",
"citations": [
{
"type": "content_block_location",
"cited_text": "These are important findings.",
"document_index": 2,
"document_title": "Custom Content Document",
"start_block_index": 0,
"end_block_index": 1,
}
],
},
]
}Untuk respons streaming, kutipan tiba sebagai tipe delta citations_delta di dalam event content_block_delta. Setiap delta berisi satu kutipan untuk ditambahkan ke daftar citations pada blok konten text saat ini.
Tangani tipe delta citations_delta bersama dengan delta teks untuk merender respons yang dikutip saat di-stream.
Teruskan hasil pencarian dari pipeline RAG Anda sebagai blok konten kelas satu dengan dukungan kutipan bawaan.
Pelajari bagaimana Claude mengekstrak teks dari PDF dan bagaimana kutipan berbasis halaman dipetakan kembali ke file sumber Anda.
Unggah dokumen sekali dan referensikan dengan file_id di beberapa permintaan kutipan.
Was this page helpful?