Loading...
  • Construir
  • Admin
  • Modelos e preços
  • SDKs do cliente
  • Referência da API
Search...
⌘K
Log in
Suporte a PDF
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Construir/Trabalhando com arquivos

Suporte a PDF

Processe PDFs com Claude. Extraia texto, analise gráficos e compreenda conteúdo visual de seus documentos.

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

Você pode fazer perguntas ao Claude sobre qualquer texto, imagens, gráficos e tabelas em PDFs que você forneça. Alguns casos de uso de exemplo:

  • Analisar relatórios financeiros e compreender gráficos/tabelas
  • Extrair informações-chave de documentos legais
  • Assistência de tradução para documentos
  • Converter informações de documentos em formatos estruturados

Antes de começar

Verificar requisitos de PDF

Claude funciona com qualquer PDF padrão. Certifique-se de que seu tamanho de solicitação atenda a estes requisitos:

RequisitoLimite
Tamanho máximo de solicitação32 MB (varia por plataforma)
Máximo de páginas por solicitação600 (100 para modelos com janela de contexto de 200k tokens)
FormatoPDF padrão (sem senhas/criptografia)

Ambos os limites estão na carga útil de solicitação inteira, incluindo qualquer outro conteúdo enviado junto com PDFs. Para PDFs grandes, considere fazer upload com a Files API e referenciar por file_id para manter cargas úteis de solicitação pequenas.

PDFs densos (muitas páginas com fonte pequena, tabelas complexas ou gráficos pesados) podem preencher a janela de contexto antes de atingir o limite de páginas. Solicitações com PDFs grandes também podem falhar antes de atingir o limite de páginas, mesmo ao usar a Files API. Tente dividir o documento em seções; para arquivos grandes, como cada página é processada como uma imagem, reduzir a resolução de imagens incorporadas também pode ajudar.

Como o suporte a PDF depende das capacidades de visão do Claude, está sujeito às mesmas limitações e considerações que outras tarefas de visão.

Plataformas e modelos suportados

O suporte a PDF é atualmente suportado via acesso direto à API e Google Vertex AI. Todos os modelos ativos suportam processamento de PDF.

O suporte a PDF agora está disponível no Amazon Bedrock com as seguintes considerações:

Suporte a PDF do Amazon Bedrock

Ao usar suporte a PDF através da API Converse do Amazon Bedrock, existem dois modos distintos de processamento de documentos:

Importante: Para acessar as capacidades completas de compreensão visual de PDF do Claude na API Converse, você deve habilitar citações. Sem citações habilitadas, a API volta para extração de texto básica apenas. Saiba mais sobre trabalhar com citações.

Modos de Processamento de Documentos

  1. Converse Document Chat (Modo original - Extração de texto apenas)

    • Fornece extração de texto básica de PDFs
    • Não pode analisar imagens, gráficos ou layouts visuais dentro de PDFs
    • Usa aproximadamente 1.000 tokens para um PDF de 3 páginas
    • Usado automaticamente quando citações não estão habilitadas
  2. Claude PDF Chat (Novo modo - Compreensão visual completa)

    • Fornece análise visual completa de PDFs
    • Pode compreender e analisar gráficos, diagramas, imagens e layouts visuais
    • Processa cada página como texto e imagem para compreensão abrangente
    • Usa aproximadamente 7.000 tokens para um PDF de 3 páginas
    • Requer que citações sejam habilitadas na API Converse

Limitações Principais

  • API Converse: A análise visual de PDF requer que citações sejam habilitadas. Atualmente não há opção para usar análise visual sem citações (diferentemente da API InvokeModel).
  • API InvokeModel: Fornece controle total sobre processamento de PDF sem citações forçadas.

Problemas Comuns

Se clientes relatarem que Claude não está vendo imagens ou gráficos em seus PDFs ao usar a API Converse, eles provavelmente precisam habilitar a flag de citações. Sem ela, Converse volta para extração de texto básica apenas.

Esta é uma restrição conhecida com a API Converse. Para aplicações que requerem análise visual de PDF sem citações, considere usar a API InvokeModel em vez disso.

Para arquivos não-PDF como .csv, .xlsx, .docx, .md ou .txt, veja Trabalhando com outros formatos de arquivo.


Processar PDFs com Claude

Enviar sua primeira solicitação de PDF

Vamos começar com um exemplo simples usando a Messages API. Você pode fornecer PDFs ao Claude de três maneiras:

  1. Como uma referência de URL para um PDF hospedado online
  2. Como um PDF codificado em base64 em blocos de conteúdo document
  3. Por um file_id da Files API

Opção 1: Documento PDF baseado em URL

A abordagem mais simples é referenciar um PDF diretamente de uma URL:

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "url",
                        "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opção 2: Documento PDF codificado em base64

Se você precisar enviar PDFs do seu sistema local ou quando uma URL não estiver disponível:

import base64
import httpx

# First, load and encode the PDF
pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
pdf_data = base64.standard_b64encode(httpx.get(pdf_url).content).decode("utf-8")

# Alternative: Load from a local file
# with open("document.pdf", "rb") as f:
#     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")

# Send to Claude using base64 encoding
client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opção 3: Files API

Para PDFs que você usará repetidamente, ou quando quiser evitar overhead de codificação, use a Files API:

client = anthropic.Anthropic()

# Upload the PDF file
with open("document.pdf", "rb") as f:
    file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))

# Use the uploaded file in a message
message = client.beta.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    betas=["files-api-2025-04-14"],
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {"type": "file", "file_id": file_upload.id},
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Como funciona o suporte a PDF

Quando você envia um PDF ao Claude, ocorrem as seguintes etapas:

  1. 1

    O sistema extrai o conteúdo do documento.

    • O sistema converte cada página do documento em uma imagem.
    • O texto de cada página é extraído e fornecido junto com a imagem de cada página.
  2. 2

    Claude analisa tanto o texto quanto as imagens para compreender melhor o documento.

    • Os documentos são fornecidos como uma combinação de texto e imagens para análise.
    • Isso permite que os usuários peçam insights sobre elementos visuais de um PDF, como gráficos, diagramas e outro conteúdo não textual.
  3. 3

    Claude responde, referenciando o conteúdo do PDF se relevante.

    Claude pode referenciar conteúdo textual e visual ao responder. Você pode melhorar ainda mais o desempenho integrando suporte a PDF com:

    • Prompt caching: Para melhorar o desempenho para análise repetida.
    • Batch processing: Para processamento de documentos em alto volume.
    • Tool use: Para extrair informações específicas de documentos para uso como entradas de ferramentas.

Estimar seus custos

A contagem de tokens de um arquivo PDF depende do texto total extraído do documento, bem como do número de páginas:

  • Custos de token de texto: Cada página normalmente usa 1.500-3.000 tokens por página dependendo da densidade de conteúdo. O preço padrão da API se aplica sem taxas adicionais de PDF.
  • Custos de token de imagem: Como cada página é convertida em uma imagem, os mesmos cálculos de custo baseados em imagem são aplicados.

Você pode usar contagem de tokens para estimar custos para seus PDFs específicos.


Otimizar processamento de PDF

Melhorar o desempenho

Siga estas melhores práticas para resultados ideais:

  • Coloque PDFs antes de texto em suas solicitações
  • Use fontes padrão
  • Certifique-se de que o texto é claro e legível
  • Gire páginas para orientação vertical adequada
  • Use números de página lógicos (do visualizador de PDF) em prompts
  • Divida PDFs grandes em pedaços quando necessário
  • Habilite prompt caching para análise repetida

Dimensione sua implementação

Para processamento de alto volume, considere estas abordagens:

Use cache de prompt

Armazene em cache PDFs para melhorar o desempenho em consultas repetidas:

client = anthropic.Anthropic()
# ...
message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                    "cache_control": {"type": "ephemeral"},
                },
                {"type": "text", "text": "Analyze this document."},
            ],
        }
    ],
)

Processe lotes de documentos

Use a API de Lotes de Mensagens para fluxos de trabalho de alto volume:

client = anthropic.Anthropic()
# ...
message_batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": "doc1",
            "params": {
                "model": "claude-opus-4-7",
                "max_tokens": 1024,
                "messages": [
                    {
                        "role": "user",
                        "content": [
                            {
                                "type": "document",
                                "source": {
                                    "type": "base64",
                                    "media_type": "application/pdf",
                                    "data": pdf_data,
                                },
                            },
                            {"type": "text", "text": "Summarize this document."},
                        ],
                    }
                ],
            },
        }
    ]
)

Próximas etapas

Experimente exemplos de PDF

Explore exemplos práticos de processamento de PDF na receita do cookbook.

Visualize a referência da API

Veja a documentação completa da API para suporte a PDF.

Was this page helpful?

  • Antes de começar
  • Verificar requisitos de PDF
  • Plataformas e modelos suportados
  • Suporte a PDF do Amazon Bedrock
  • Processar PDFs com Claude
  • Enviar sua primeira solicitação de PDF
  • Como funciona o suporte a PDF
  • Estimar seus custos
  • Otimizar processamento de PDF
  • Melhorar o desempenho
  • Dimensione sua implementação
  • Próximas etapas