此功能符合零数据保留(ZDR)的条件。当您的组织签订了 ZDR 协议时,通过此功能发送的数据在 API 响应返回后不会被存储。
Claude 能够在回答有关文档的问题时提供详细的引用,帮助您追踪和验证响应中的信息来源。
所有当前可用的模型均支持引用功能,Haiku 3 除外。
请使用此表单分享您对引用功能的反馈和建议。
以下是如何在 Messages API 中使用引用的示例:
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
messages=[
{
"role": "user",
"content": [
{
"type": "document",
"source": {
"type": "text",
"media_type": "text/plain",
"data": "The grass is green. The sky is blue.",
},
"title": "My Document",
"context": "This is a trustworthy document.",
"citations": {"enabled": True},
},
{"type": "text", "text": "What color is the grass and sky?"},
],
}
],
)
print(response)与基于提示的方法的比较
与基于提示的引用解决方案相比,引用功能具有以下优势:
cited_text 不计入您的输出令牌,您可能会看到成本节省。cited_text 是被提取出来的,因此可以保证引用包含指向所提供文档的有效指针。按照以下步骤将引用与 Claude 集成:
提供文档并启用引用
文档被处理
Claude 提供带引用的响应
自动分块与自定义内容
默认情况下,纯文本和 PDF 文档会自动分块为句子。如果您需要对引用粒度进行更多控制(例如,对于项目符号列表或转录文本),请改用自定义内容文档。有关更多详细信息,请参阅文档类型。
例如,如果您希望 Claude 能够引用 RAG 块中的特定句子,则应将每个 RAG 块放入一个纯文本文档中。否则,如果您不希望进行任何进一步的分块,或者希望自定义任何额外的分块,则可以将 RAG 块放入自定义内容文档中。
source 内容中的文本可以被引用。title 和 context 是可选字段,它们将被传递给模型,但不会用作被引用的内容。title 的长度有限,因此您可能会发现 context 字段对于以文本或字符串化 JSON 的形式存储任何文档元数据非常有用。content 列表从 0 开始索引,结束索引为不包含。cited_text 字段是为方便起见而提供的,不计入输出令牌。cited_text 也不计入输入令牌。引用可与其他 API 功能结合使用,包括提示缓存、令牌计数和批处理。
引用与结构化输出不兼容
引用不能与结构化输出一起使用。如果您在任何用户提供的文档(Document 块或 RequestSearchResultBlock)上启用引用,同时又包含 output_config.format 参数(或已弃用的 output_format 参数),API 将返回 400 错误。
这是因为引用需要将引用块与文本输出交错排列,这与结构化输出的严格 JSON schema 约束不兼容。
引用和提示缓存可以有效地结合使用。
响应中生成的引用块无法直接缓存,但它们引用的源文档可以被缓存。为了优化性能,请将 cache_control 应用于您的顶层文档内容块。
client = anthropic.Anthropic()
# 长文档内容(例如技术文档)
long_document = (
"This is a very long document with thousands of words..." + " ... " * 1000
) # Minimum cacheable length
response = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
messages=[
{
"role": "user",
"content": [
{
"type": "document",
"source": {
"type": "text",
"media_type": "text/plain",
"data": long_document,
},
"citations": {"enabled": True},
"cache_control": {
"type": "ephemeral"
}, # Cache the document content
},
{
"type": "text",
"text": "What does this document say about API features?",
},
],
}
],
)
print(response)在此示例中:
cache_control 来缓存文档内容引用支持三种文档类型。文档可以直接在消息中提供(base64、文本或 URL),也可以通过 Files API 上传并通过 file_id 引用:
| 类型 | 最适用于 | 分块方式 | 引用格式 |
|---|---|---|---|
| 纯文本 | 简单文本文档、散文 | 句子 | 字符索引(从 0 开始索引) |
| 包含文本内容的 PDF 文件 | 句子 | 页码(从 1 开始索引) | |
| 自定义内容 | 列表、转录文本、特殊格式、更细粒度的引用 | 无额外分块 | 块索引(从 0 开始索引) |
.csv、.xlsx、.docx、.md 和 .txt 文件不支持作为文档块。请将这些文件转换为纯文本并直接包含在消息内容中。请参阅处理其他文件格式。
纯文本文档会自动分块为句子。您可以内联提供它们,或通过其 file_id 引用:
PDF 文档可以作为 base64 编码的数据、URL 或通过 file_id 提供。PDF 文本会被提取并分块为句子。由于尚不支持图像引用,因此作为文档扫描件且不包含可提取文本的 PDF 将无法被引用。
自定义内容文档让您可以控制引用粒度。不会进行额外的分块,块会根据提供的内容块传递给模型。
{
"type": "document",
"source": {
"type": "content",
"content": [
{"type": "text", "text": "First chunk"},
{"type": "text", "text": "Second chunk"},
],
},
"title": "Document Title", # optional
"context": "Context about the document that will not be cited from", # optional
"citations": {"enabled": True},
}启用引用后,响应会包含多个带引用的文本块:
{
"content": [
{"type": "text", "text": "According to the document, "},
{
"type": "text",
"text": "the grass is green",
"citations": [
{
"type": "char_location",
"cited_text": "The grass is green.",
"document_index": 0,
"document_title": "Example Document",
"start_char_index": 0,
"end_char_index": 20,
}
],
},
{"type": "text", "text": " and "},
{
"type": "text",
"text": "the sky is blue",
"citations": [
{
"type": "char_location",
"cited_text": "The sky is blue.",
"document_index": 0,
"document_title": "Example Document",
"start_char_index": 20,
"end_char_index": 36,
}
],
},
{
"type": "text",
"text": ". Information from page 5 states that ",
},
{
"type": "text",
"text": "water is essential",
"citations": [
{
"type": "page_location",
"cited_text": "Water is essential for life.",
"document_index": 1,
"document_title": "PDF Document",
"start_page_number": 5,
"end_page_number": 6,
}
],
},
{
"type": "text",
"text": ". The custom document mentions ",
},
{
"type": "text",
"text": "important findings",
"citations": [
{
"type": "content_block_location",
"cited_text": "These are important findings.",
"document_index": 2,
"document_title": "Custom Content Document",
"start_block_index": 0,
"end_block_index": 1,
}
],
},
]
}对于流式传输响应,包含了一个 citations_delta 类型,其中包含一个要添加到当前 text 内容块的 citations 列表中的单个引用。
Was this page helpful?