이 기능은 Zero Data Retention (ZDR)의 적용 대상입니다. 조직에 ZDR 계약이 체결되어 있는 경우, 이 기능을 통해 전송된 데이터는 API 응답이 반환된 후 저장되지 않습니다.
제공하는 PDF의 텍스트, 그림, 차트, 표에 대해 Claude에게 질문할 수 있습니다. 몇 가지 사용 사례 예시는 다음과 같습니다:
Claude는 모든 표준 PDF와 함께 작동합니다. 요청 크기가 다음 요구 사항을 충족하는지 확인하세요:
| 요구 사항 | 제한 |
|---|---|
| 최대 요청 크기 | 32 MB (플랫폼에 따라 다름) |
| 요청당 최대 페이지 수 | 600 (200k 토큰 컨텍스트 윈도우를 가진 모델의 경우 100) |
| 형식 | 표준 PDF (비밀번호/암호화 없음) |
두 제한 모두 PDF와 함께 전송되는 다른 콘텐츠를 포함한 전체 요청 페이로드에 적용됩니다. 대용량 PDF의 경우, Files API로 업로드하고 file_id로 참조하여 요청 페이로드를 작게 유지하는 것을 고려하세요.
밀도가 높은 PDF(작은 글꼴의 많은 페이지, 복잡한 표, 또는 많은 그래픽)는 페이지 제한에 도달하기 전에 컨텍스트 윈도우를 채울 수 있습니다. 대용량 PDF가 포함된 요청은 Files API를 사용하더라도 페이지 제한에 도달하기 전에 실패할 수 있습니다. 문서를 여러 섹션으로 분할해 보세요. 대용량 파일의 경우 각 페이지가 이미지로 처리되므로 포함된 이미지를 다운샘플링하는 것도 도움이 될 수 있습니다.
PDF 지원은 Claude의 비전 기능에 의존하므로 다른 비전 작업과 동일한 제한 사항 및 고려 사항이 적용됩니다.
PDF 지원은 Claude API, Claude Platform on AWS, Amazon Bedrock (Amazon Bedrock PDF 지원 참조), Vertex AI, Microsoft Foundry에서 사용할 수 있습니다. 모든 활성 모델이 PDF 처리를 지원합니다.
Bedrock의 Converse API를 통해 PDF 지원을 사용할 때는 두 가지 별개의 문서 처리 모드가 있습니다:
중요: Converse API에서 Claude의 완전한 시각적 PDF 이해 기능에 접근하려면 인용(citations)을 활성화해야 합니다. 인용이 활성화되지 않으면 API는 기본 텍스트 추출로만 대체됩니다. 인용 작업에 대해 자세히 알아보세요.
Converse Document Chat (기존 모드 - 텍스트 추출만)
Claude PDF Chat (새 모드 - 완전한 시각적 이해)
Converse API를 사용할 때 Claude가 PDF의 이미지나 차트를 보지 못하는 경우, 인용 플래그를 활성화해야 할 가능성이 높습니다. 이 플래그가 없으면 Converse는 기본 텍스트 추출로만 대체됩니다.
이는 Converse API의 알려진 제약 사항입니다. 인용 없이 시각적 PDF 분석이 필요한 애플리케이션의 경우 InvokeModel API를 대신 사용하는 것을 고려하세요.
.csv, .xlsx, .docx, .md 또는 .txt 파일과 같은 PDF가 아닌 파일의 경우 다른 파일 형식 작업을 참조하세요.
Messages API를 사용한 간단한 예제부터 시작해 보겠습니다. Claude에 PDF를 제공하는 방법은 세 가지가 있습니다:
document 콘텐츠 블록에 base64로 인코딩된 PDF로file_id로Amazon Bedrock 및 Vertex AI에서는 현재 base64로 인코딩된 소스만 사용할 수 있습니다.
가장 간단한 방법은 URL에서 직접 PDF를 참조하는 것입니다:
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
messages=[
{
"role": "user",
"content": [
{
"type": "document",
"source": {
"type": "url",
"url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
},
},
{"type": "text", "text": "What are the key findings in this document?"},
],
}
],
)
print(message.content)로컬 시스템에서 PDF를 보내야 하거나 URL을 사용할 수 없는 경우:
import base64
import httpx
# 먼저 PDF를 로드하고 인코딩합니다
pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
pdf_data = base64.standard_b64encode(httpx.get(pdf_url).content).decode("utf-8")
# 대안: 로컬 파일에서 로드
# with open("document.pdf", "rb") as f:
# pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")
# base64 인코딩을 사용하여 Claude에 전송합니다
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
messages=[
{
"role": "user",
"content": [
{
"type": "document",
"source": {
"type": "base64",
"media_type": "application/pdf",
"data": pdf_data,
},
},
{"type": "text", "text": "What are the key findings in this document?"},
],
}
],
)
print(message.content)반복적으로 사용할 PDF의 경우 또는 인코딩 오버헤드를 피하고 싶은 경우 Files API를 사용하세요:
client = anthropic.Anthropic()
# PDF 파일 업로드
with open("document.pdf", "rb") as f:
file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))
# 업로드된 파일을 메시지에서 사용
message = client.beta.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
betas=["files-api-2025-04-14"],
messages=[
{
"role": "user",
"content": [
{
"type": "document",
"source": {"type": "file", "file_id": file_upload.id},
},
{"type": "text", "text": "What are the key findings in this document?"},
],
}
],
)
print(message.content)Claude에 PDF를 보내면 다음 단계가 수행됩니다:
시스템이 문서의 내용을 추출합니다.
Claude는 문서를 더 잘 이해하기 위해 텍스트와 이미지를 모두 분석합니다.
Claude는 관련이 있는 경우 PDF의 내용을 참조하여 응답합니다.
Claude는 응답할 때 텍스트 및 시각적 콘텐츠를 모두 참조할 수 있습니다. PDF 지원을 다음과 통합하여 성능을 더욱 향상시킬 수 있습니다:
PDF 파일의 토큰 수는 문서에서 추출된 전체 텍스트와 페이지 수에 따라 달라집니다:
토큰 계산을 사용하여 특정 PDF의 비용을 추정할 수 있습니다.
최적의 결과를 위해 다음 모범 사례를 따르세요:
대량 처리의 경우 다음 접근 방식을 고려하세요:
반복 쿼리의 성능을 향상시키기 위해 PDF를 캐시하세요:
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
messages=[
{
"role": "user",
"content": [
{
"type": "document",
"source": {
"type": "base64",
"media_type": "application/pdf",
"data": pdf_data,
},
"cache_control": {"type": "ephemeral"},
},
{"type": "text", "text": "Analyze this document."},
],
}
],
)대량 워크플로우를 위해 Message Batches API를 사용하세요:
client = anthropic.Anthropic()
message_batch = client.messages.batches.create(
requests=[
{
"custom_id": "doc1",
"params": {
"model": "claude-opus-4-8",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "document",
"source": {
"type": "base64",
"media_type": "application/pdf",
"data": pdf_data,
},
},
{"type": "text", "text": "Summarize this document."},
],
}
],
},
}
]
)Was this page helpful?