您现在可以向 Claude 询问您提供的 PDF 中的任何文本、图片、图表和表格。一些示例用例:
Claude 可以处理任何标准 PDF。但是,在使用 PDF 支持时,您应确保您的请求大小满足以下要求:
| 要求 | 限制 |
|---|---|
| 最大请求大小 | 32MB |
| 每个请求的最大页数 | 100 |
| 格式 | 标准 PDF(无密码/加密) |
请注意,这两个限制都适用于整个请求负载,包括与 PDF 一起发送的任何其他内容。
由于 PDF 支持依赖于 Claude 的视觉能力,它受到与其他视觉任务相同的限制和注意事项。
PDF 支持目前通过直接 API 访问和 Google Vertex AI 支持。所有活跃模型都支持 PDF 处理。
PDF 支持现在在 Amazon Bedrock 上可用,具有以下注意事项:
通过 Amazon Bedrock 的 Converse API 使用 PDF 支持时,有两种不同的文档处理模式:
重要:要在 Converse API 中访问 Claude 的完整视觉 PDF 理解能力,您必须启用引用。如果没有启用引用,API 会回退到仅基本文本提取。了解更多关于使用引用的信息。
Converse 文档聊天(原始模式 - 仅文本提取)
Claude PDF 聊天(新模式 - 完整视觉理解)
如果客户报告在使用 Converse API 时 Claude 看不到 PDF 中的图像或图表,他们可能需要启用引用标志。没有它,Converse 会回退到仅基本文本提取。
这是 Converse API 的已知约束,我们正在努力解决。对于需要无引用视觉 PDF 分析的应用程序,请考虑使用 InvokeModel API。
对于非 PDF 文件,如 .csv、.xlsx、.docx、.md 或 .txt 文件,请参阅使用其他文件格式。
让我们从使用 Messages API 的简单示例开始。您可以通过三种方式向 Claude 提供 PDF:
document 内容块中的 base64 编码 PDFfile_id最简单的方法是直接从 URL 引用 PDF:
curl https://api.anthropic.com/v1/messages \
-H "content-type: application/json" \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [{
"role": "user",
"content": [{
"type": "document",
"source": {
"type": "url",
"url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
}
},
{
"type": "text",
"text": "What are the key findings in this document?"
}]
}]
}'如果您需要从本地系统发送 PDF 或当 URL 不可用时:
# 方法 1:获取并编码远程 PDF
curl -s "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf" | base64 | tr -d '\n' > pdf_base64.txt
# 方法 2:编码本地 PDF 文件
# base64 document.pdf | tr -d '\n' > pdf_base64.txt
# 使用 pdf_base64.txt 内容创建 JSON 请求文件
jq -n --rawfile PDF_BASE64 pdf_base64.txt '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [{
"role": "user",
"content": [{
"type": "document",
"source": {
"type": "base64",
"media_type": "application/pdf",
"data": $PDF_BASE64
}
},
{
"type": "text",
"text": "What are the key findings in this document?"
}]
}]
}' > request.json
# 使用 JSON 文件发送 API 请求
curl https://api.anthropic.com/v1/messages \
-H "content-type: application/json" \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-d @request.json对于您将重复使用的 PDF,或当您想要避免编码开销时,使用Files API:
# 首先,将您的 PDF 上传到 Files API
curl -X POST https://api.anthropic.com/v1/files \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: files-api-2025-04-14" \
-F "[email protected]"
# 然后在您的消息中使用返回的 file_id
curl https://api.anthropic.com/v1/messages \
-H "content-type: application/json" \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: files-api-2025-04-14" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [{
"role": "user",
"content": [{
"type": "document",
"source": {
"type": "file",
"file_id": "file_abc123"
}
},
{
"type": "text",
"text": "What are the key findings in this document?"
}]
}]
}'当您向 Claude 发送 PDF 时,会发生以下步骤:
系统提取文档的内容。
Claude 分析文本和图像以更好地理解文档。
Claude 响应,如果相关则引用 PDF 的内容。
Claude 在响应时可以引用文本和视觉内容。您可以通过将 PDF 支持与以下功能集成来进一步提高性能:
PDF 文件的令牌计数取决于从文档中提取的总文本以及页数:
您可以使用令牌计数来估算特定 PDF 的成本。
遵循这些最佳实践以获得最佳结果:
对于大量处理,请考虑以下方法:
缓存 PDF 以提高重复查询的性能:
# 使用 pdf_base64.txt 内容创建 JSON 请求文件
jq -n --rawfile PDF_BASE64 pdf_base64.txt '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [{
"role": "user",
"content": [{
"type": "document",
"source": {
"type": "base64",
"media_type": "application/pdf",
"data": $PDF_BASE64
},
"cache_control": {
"type": "ephemeral"
}
},
{
"type": "text",
"text": "Which model has the highest human preference win rates across each use-case?"
}]
}]
}' > request.json
# 然后使用 JSON 文件进行 API 调用
curl https://api.anthropic.com/v1/messages \
-H "content-type: application/json" \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-d @request.json使用 Message Batches API 进行大量工作流程:
# 使用 pdf_base64.txt 内容创建 JSON 请求文件
jq -n --rawfile PDF_BASE64 pdf_base64.txt '
{
"requests": [
{
"custom_id": "my-first-request",
"params": {
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "document",
"source": {
"type": "base64",
"media_type": "application/pdf",
"data": $PDF_BASE64
}
},
{
"type": "text",
"text": "Which model has the highest human preference win rates across each use-case?"
}
]
}
]
}
},
{
"custom_id": "my-second-request",
"params": {
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "document",
"source": {
"type": "base64",
"media_type": "application/pdf",
"data": $PDF_BASE64
}
},
{
"type": "text",
"text": "Extract 5 key insights from this document."
}
]
}
]
}
}
]
}
' > request.json
# 然后使用 JSON 文件进行 API 调用
curl https://api.anthropic.com/v1/messages/batches \
-H "content-type: application/json" \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-d @request.json