Loading...
    • 빌드
    • 관리
    • 모델 및 가격
    • 클라이언트 SDK
    • API 참조
    Search...
    ⌘K
    첫 단계
    Claude 소개빠른 시작
    Claude로 빌드하기
    기능 개요Messages API 사용Claude API 스킬중지 이유 처리
    모델 기능
    Extended thinkingAdaptive thinking노력작업 예산 (베타)빠른 모드 (베타: 연구 미리보기)구조화된 출력인용메시지 스트리밍배치 처리검색 결과거부 스트리밍다국어 지원임베딩
    도구
    개요도구 사용 방식웹 검색 도구웹 가져오기 도구코드 실행 도구어드바이저 도구메모리 도구Bash 도구컴퓨터 사용 도구텍스트 편집기 도구
    도구 인프라
    도구 참조도구 검색프로그래밍 방식 도구 호출세분화된 도구 스트리밍
    컨텍스트 관리
    컨텍스트 윈도우압축컨텍스트 편집프롬프트 캐싱토큰 계산
    파일 작업
    Files APIPDF 지원이미지 및 비전
    스킬
    개요빠른 시작모범 사례엔터프라이즈용 스킬API의 스킬
    MCP
    원격 MCP 서버MCP 커넥터
    프롬프트 엔지니어링
    개요프롬프팅 모범 사례Console 프롬프팅 도구
    테스트 및 평가
    성공 정의 및 평가 구축Console에서 평가 도구 사용지연 시간 감소
    보안 강화
    환각 감소출력 일관성 증가탈옥 완화프롬프트 유출 감소
    리소스
    용어집
    릴리스 노트
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    파일 작업

    PDF 지원

    Claude로 PDF를 처리합니다. 문서에서 텍스트를 추출하고, 차트를 분석하고, 시각적 콘텐츠를 이해합니다.

    This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

    제공하는 PDF의 모든 텍스트, 사진, 차트 및 표에 대해 Claude에게 질문할 수 있습니다. 몇 가지 샘플 사용 사례:

    • 재무 보고서 분석 및 차트/표 이해
    • 법률 문서에서 핵심 정보 추출
    • 문서 번역 지원
    • 문서 정보를 구조화된 형식으로 변환

    시작하기 전에

    PDF 요구사항 확인

    Claude는 모든 표준 PDF에서 작동합니다. 요청 크기가 다음 요구사항을 충족하는지 확인하세요:

    요구사항제한
    최대 요청 크기32 MB (플랫폼별로 다름)
    요청당 최대 페이지 수600 (200k 토큰 컨텍스트 윈도우가 있는 모델의 경우 100)
    형식표준 PDF (암호/암호화 없음)

    두 제한 모두 PDF와 함께 전송되는 다른 콘텐츠를 포함한 전체 요청 페이로드에 적용됩니다. 큰 PDF의 경우 Files API로 업로드하고 file_id로 참조하여 요청 페이로드를 작게 유지하는 것을 고려하세요.

    밀도가 높은 PDF(많은 작은 글꼴 페이지, 복잡한 표 또는 무거운 그래픽)는 페이지 제한에 도달하기 전에 컨텍스트 윈도우를 채울 수 있습니다. 큰 PDF가 있는 요청은 Files API를 사용하는 경우에도 페이지 제한에 도달하기 전에 실패할 수 있습니다. 문서를 섹션으로 분할해 보세요. 큰 파일의 경우 각 페이지가 이미지로 처리되므로 포함된 이미지를 다운샘플링하면 도움이 될 수 있습니다.

    PDF 지원은 Claude의 비전 기능에 의존하므로 다른 비전 작업과 동일한 제한 및 고려사항의 적용을 받습니다.

    지원되는 플랫폼 및 모델

    PDF 지원은 현재 직접 API 액세스 및 Google Vertex AI를 통해 지원됩니다. 모든 활성 모델은 PDF 처리를 지원합니다.

    PDF 지원은 이제 Amazon Bedrock에서 다음 고려사항과 함께 사용 가능합니다:

    Amazon Bedrock PDF 지원

    Amazon Bedrock의 Converse API를 통해 PDF 지원을 사용할 때 두 가지 고유한 문서 처리 모드가 있습니다:

    중요: Converse API에서 Claude의 전체 시각적 PDF 이해 기능에 액세스하려면 인용을 활성화해야 합니다. 인용이 활성화되지 않으면 API는 기본 텍스트 추출만으로 폴백됩니다. 인용 작업에 대해 자세히 알아보세요.

    문서 처리 모드

    1. Converse Document Chat (원본 모드 - 텍스트 추출만)

      • PDF에서 기본 텍스트 추출 제공
      • PDF 내의 이미지, 차트 또는 시각적 레이아웃을 분석할 수 없음
      • 3페이지 PDF에 약 1,000개의 토큰 사용
      • 인용이 활성화되지 않을 때 자동으로 사용됨
    2. Claude PDF Chat (새 모드 - 전체 시각적 이해)

      • PDF의 완전한 시각적 분석 제공
      • 차트, 그래프, 이미지 및 시각적 레이아웃을 이해하고 분석할 수 있음
      • 포괄적인 이해를 위해 각 페이지를 텍스트와 이미지로 처리
      • 3페이지 PDF에 약 7,000개의 토큰 사용
      • Converse API에서 인용이 활성화되어야 함

    주요 제한사항

    • Converse API: 시각적 PDF 분석을 위해서는 인용이 활성화되어야 합니다. 현재 인용 없이 시각적 분석을 사용할 수 있는 옵션이 없습니다(InvokeModel API와 달리).
    • InvokeModel API: 강제 인용 없이 PDF 처리에 대한 완전한 제어를 제공합니다.

    일반적인 문제

    고객이 Converse API를 사용할 때 Claude가 PDF의 이미지나 차트를 보지 못한다고 보고하면 인용 플래그를 활성화해야 할 가능성이 높습니다. 이것이 없으면 Converse는 기본 텍스트 추출만으로 폴백됩니다.

    이것은 Converse API의 알려진 제약입니다. 인용 없이 시각적 PDF 분석이 필요한 애플리케이션의 경우 대신 InvokeModel API를 사용하는 것을 고려하세요.

    .csv, .xlsx, .docx, .md 또는 .txt 파일과 같은 PDF가 아닌 파일의 경우 다른 파일 형식 작업을 참조하세요.


    Claude로 PDF 처리

    첫 번째 PDF 요청 보내기

    Messages API를 사용한 간단한 예제로 시작하겠습니다. Claude에 PDF를 제공하는 방법은 세 가지입니다:

    1. 온라인에서 호스팅되는 PDF에 대한 URL 참조
    2. document 콘텐츠 블록의 base64 인코딩 PDF
    3. Files API의 file_id

    옵션 1: URL 기반 PDF 문서

    가장 간단한 방법은 URL에서 직접 PDF를 참조하는 것입니다:

    client = anthropic.Anthropic()
    message = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {
                            "type": "url",
                            "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                        },
                    },
                    {"type": "text", "text": "What are the key findings in this document?"},
                ],
            }
        ],
    )
    
    print(message.content)

    옵션 2: Base64 인코딩 PDF 문서

    로컬 시스템에서 PDF를 보내야 하거나 URL을 사용할 수 없을 때:

    import base64
    import httpx
    
    # First, load and encode the PDF
    pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
    pdf_data = base64.standard_b64encode(httpx.get(pdf_url).content).decode("utf-8")
    
    # Alternative: Load from a local file
    # with open("document.pdf", "rb") as f:
    #     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")
    
    # Send to Claude using base64 encoding
    client = anthropic.Anthropic()
    message = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {
                            "type": "base64",
                            "media_type": "application/pdf",
                            "data": pdf_data,
                        },
                    },
                    {"type": "text", "text": "What are the key findings in this document?"},
                ],
            }
        ],
    )
    
    print(message.content)

    옵션 3: Files API

    반복적으로 사용할 PDF의 경우 또는 인코딩 오버헤드를 피하려는 경우 Files API를 사용하세요:

    client = anthropic.Anthropic()
    
    # Upload the PDF file
    with open("document.pdf", "rb") as f:
        file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))
    
    # Use the uploaded file in a message
    message = client.beta.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        betas=["files-api-2025-04-14"],
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {"type": "file", "file_id": file_upload.id},
                    },
                    {"type": "text", "text": "What are the key findings in this document?"},
                ],
            }
        ],
    )
    
    print(message.content)

    PDF 지원 작동 방식

    Claude에 PDF를 보낼 때 다음 단계가 발생합니다:

    1. 1

      시스템이 문서의 내용을 추출합니다.

      • 시스템은 문서의 각 페이지를 이미지로 변환합니다.
      • 각 페이지의 텍스트가 추출되어 각 페이지의 이미지와 함께 제공됩니다.
    2. 2

      Claude는 텍스트와 이미지를 모두 분석하여 문서를 더 잘 이해합니다.

      • 문서는 분석을 위해 텍스트와 이미지의 조합으로 제공됩니다.
      • 이를 통해 사용자는 차트, 다이어그램 및 기타 비텍스트 콘텐츠와 같은 PDF의 시각적 요소에 대한 통찰력을 요청할 수 있습니다.
    3. 3

      Claude가 응답하며 필요한 경우 PDF의 내용을 참조합니다.

      Claude는 응답할 때 텍스트 및 시각적 콘텐츠를 모두 참조할 수 있습니다. 다음을 통해 성능을 더욱 향상시킬 수 있습니다:

      • 프롬프트 캐싱: 반복된 분석의 성능을 향상시키기 위해.
      • 배치 처리: 대량의 문서 처리를 위해.
      • 도구 사용: 문서에서 특정 정보를 추출하여 도구 입력으로 사용하기 위해.

    비용 추정

    PDF 파일의 토큰 수는 문서에서 추출된 총 텍스트와 페이지 수에 따라 달라집니다:

    • 텍스트 토큰 비용: 각 페이지는 일반적으로 콘텐츠 밀도에 따라 페이지당 1,500-3,000개의 토큰을 사용합니다. 표준 API 가격이 적용되며 추가 PDF 수수료는 없습니다.
    • 이미지 토큰 비용: 각 페이지가 이미지로 변환되므로 동일한 이미지 기반 비용 계산이 적용됩니다.

    토큰 계산을 사용하여 특정 PDF의 비용을 추정할 수 있습니다.


    PDF 처리 최적화

    성능 개선

    최적의 결과를 위해 다음 모범 사례를 따르세요:

    • 요청에서 PDF를 텍스트 앞에 배치
    • 표준 글꼴 사용
    • 텍스트가 명확하고 읽기 쉬운지 확인
    • 페이지를 올바른 직립 방향으로 회전
    • 프롬프트에서 논리적 페이지 번호(PDF 뷰어에서) 사용
    • 필요할 때 큰 PDF를 청크로 분할
    • 반복된 분석을 위해 프롬프트 캐싱 활성화

    구현 확장

    대용량 처리의 경우 다음 접근 방식을 고려하세요:

    프롬프트 캐싱 사용

    반복되는 쿼리의 성능을 개선하기 위해 PDF를 캐시합니다:

    client = anthropic.Anthropic()
    # ...
    message = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {
                            "type": "base64",
                            "media_type": "application/pdf",
                            "data": pdf_data,
                        },
                        "cache_control": {"type": "ephemeral"},
                    },
                    {"type": "text", "text": "Analyze this document."},
                ],
            }
        ],
    )

    문서 배치 처리

    대용량 워크플로우를 위해 Message Batches API를 사용합니다:

    client = anthropic.Anthropic()
    # ...
    message_batch = client.messages.batches.create(
        requests=[
            {
                "custom_id": "doc1",
                "params": {
                    "model": "claude-opus-4-7",
                    "max_tokens": 1024,
                    "messages": [
                        {
                            "role": "user",
                            "content": [
                                {
                                    "type": "document",
                                    "source": {
                                        "type": "base64",
                                        "media_type": "application/pdf",
                                        "data": pdf_data,
                                    },
                                },
                                {"type": "text", "text": "Summarize this document."},
                            ],
                        }
                    ],
                },
            }
        ]
    )

    다음 단계

    PDF 예제 시도

    쿠킹북 레시피에서 PDF 처리의 실용적인 예제를 살펴봅니다.

    API 참조 보기

    PDF 지원에 대한 완전한 API 문서를 참조합니다.

    Was this page helpful?

    • PDF 요구사항 확인
    • Amazon Bedrock PDF 지원
    • Claude로 PDF 처리
    • 첫 번째 PDF 요청 보내기
    • PDF 지원 작동 방식
    • PDF 처리 최적화