• Mensagens
  • Agentes Gerenciados
  • Administração

Search...
⌘K
Primeiros passos
Introdução ao ClaudeInício rápido
Desenvolvendo com o Claude
Visão geral dos recursosUsando a API de MensagensMotivos de parada e fallbackRecusas e fallbackCrédito de fallback
Capacidades do modelo
Pensamento estendidoPensamento adaptativoEsforçoOrçamentos de tarefas (beta)Modo rápido (prévia de pesquisa)Saídas estruturadasCitaçõesStreaming de MensagensProcessamento em loteResultados de pesquisaStreaming de recusasSuporte multilíngueEmbeddings
Ferramentas
Visão geralComo funciona o uso de ferramentasTutorial: Crie um agente que usa ferramentasDefinir ferramentasLidar com chamadas de ferramentasUso de ferramentas em paraleloTool Runner (SDK)Uso de ferramentas estritoUso de ferramentas com cache de promptFerramentas de servidorSolução de problemasFerramenta de pesquisa na webFerramenta de busca na webFerramenta de execução de códigoFerramenta de consultorFerramenta de memóriaFerramenta BashFerramenta de uso de computadorFerramenta de editor de texto
Infraestrutura de ferramentas
Referência de ferramentasGerenciar contexto de ferramentasCombinações de ferramentasPesquisa de ferramentasChamada programática de ferramentasStreaming refinado de ferramentas
Gerenciamento de contexto
Janelas de contextoCompactaçãoEdição de contextoCache de promptMensagens de sistema no meio da conversaCriar um modo de orquestraçãoDiagnóstico de cache (beta)Contagem de tokens
Trabalhando com arquivos
API de ArquivosSuporte a PDFImagens e visão
Habilidades
Visão geralInício rápidoPráticas recomendadasHabilidades para empresasHabilidades na API
MCP
Servidores MCP remotosConector MCP
Claude em plataformas de nuvem
Amazon BedrockAmazon Bedrock (legado)Claude Platform na AWSMicrosoft FoundryVertex AI

Log in
Suporte a PDF
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Mensagens/Trabalhando com arquivos

Suporte a PDF

Processe PDFs com Claude. Extraia texto, analise gráficos e compreenda conteúdo visual dos seus documentos.


Este recurso é elegível para Zero Data Retention (ZDR). Quando sua organização possui um acordo de ZDR, os dados enviados por meio deste recurso não são armazenados após a resposta da API ser retornada.

Você pode perguntar ao Claude sobre qualquer texto, imagens, gráficos e tabelas em PDFs que você fornecer. Alguns exemplos de casos de uso:

  • Analisar relatórios financeiros e compreender gráficos/tabelas
  • Extrair informações importantes de documentos jurídicos
  • Assistência de tradução para documentos
  • Converter informações de documentos em formatos estruturados

Antes de começar

Verifique os requisitos de PDF

Claude funciona com qualquer PDF padrão. Certifique-se de que o tamanho da sua requisição atenda a estes requisitos:

RequisitoLimite
Tamanho máximo da requisição32 MB (varia por plataforma)
Máximo de páginas por requisição600 (100 para modelos com uma janela de contexto de 200k tokens)
FormatoPDF padrão (sem senhas/criptografia)

Ambos os limites se aplicam a todo o payload da requisição, incluindo qualquer outro conteúdo enviado junto com os PDFs. Para PDFs grandes, considere fazer upload com a Files API e referenciar por file_id para manter os payloads de requisição pequenos.



PDFs densos (muitas páginas com fonte pequena, tabelas complexas ou gráficos pesados) podem preencher a janela de contexto antes de atingir o limite de páginas. Requisições com PDFs grandes também podem falhar antes de atingir o limite de páginas, mesmo ao usar a Files API. Tente dividir o documento em seções; para arquivos grandes, como cada página é processada como uma imagem, reduzir a resolução das imagens incorporadas também pode ajudar.

Como o suporte a PDF depende das capacidades de visão do Claude, ele está sujeito às mesmas limitações e considerações que outras tarefas de visão.

Plataformas e modelos suportados

O suporte a PDF está disponível na Claude API, Claude Platform on AWS, Amazon Bedrock (consulte Suporte a PDF no Amazon Bedrock), Vertex AI e Microsoft Foundry. Todos os modelos ativos suportam processamento de PDF.

Suporte a PDF no Amazon Bedrock

Ao usar o suporte a PDF através da Converse API do Bedrock, existem dois modos distintos de processamento de documentos:



Importante: Para acessar as capacidades completas de compreensão visual de PDF do Claude na Converse API, você deve habilitar citações. Sem citações habilitadas, a API recorre apenas à extração básica de texto. Saiba mais sobre como trabalhar com citações.

Modos de processamento de documentos

  1. Converse Document Chat (Modo original - Apenas extração de texto)

    • Fornece extração básica de texto de PDFs
    • Não consegue analisar imagens, gráficos ou layouts visuais dentro de PDFs
    • Usa aproximadamente 1.000 tokens para um PDF de 3 páginas
    • Usado automaticamente quando citações não estão habilitadas
  2. Claude PDF Chat (Novo modo - Compreensão visual completa)

    • Fornece análise visual completa de PDFs
    • Pode compreender e analisar gráficos, diagramas, imagens e layouts visuais
    • Processa cada página como texto e imagem para compreensão abrangente
    • Usa aproximadamente 7.000 tokens para um PDF de 3 páginas
    • Requer que citações estejam habilitadas na Converse API

Principais limitações

  • Converse API: A análise visual de PDF requer que citações estejam habilitadas. Atualmente não há opção para usar análise visual sem citações (diferentemente da InvokeModel API).
  • InvokeModel API: Fornece controle total sobre o processamento de PDF sem citações forçadas.

Problemas comuns

Se o Claude não estiver vendo imagens ou gráficos em seus PDFs ao usar a Converse API, você provavelmente precisa habilitar a flag de citações. Sem ela, a Converse recorre apenas à extração básica de texto.



Esta é uma restrição conhecida da Converse API. Para aplicações que requerem análise visual de PDF sem citações, considere usar a InvokeModel API em vez disso.



Para arquivos que não são PDF, como arquivos .csv, .xlsx, .docx, .md ou .txt, consulte Trabalhando com outros formatos de arquivo.


Processe PDFs com Claude

Envie sua primeira requisição de PDF

Vamos começar com um exemplo simples usando a Messages API. Você pode fornecer PDFs ao Claude de três maneiras:

  1. Como uma referência de URL para um PDF hospedado online
  2. Como um PDF codificado em base64 em blocos de conteúdo document
  3. Por um file_id da Files API


No Amazon Bedrock e Vertex AI, apenas fontes codificadas em base64 estão disponíveis atualmente.

Opção 1: Documento PDF baseado em URL

A abordagem mais simples é referenciar um PDF diretamente de uma URL:

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "url",
                        "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opção 2: Documento PDF codificado em base64

Se você precisar enviar PDFs do seu sistema local ou quando uma URL não estiver disponível:

import base64
import httpx

# Primeiro, carregue e codifique o PDF
pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
pdf_data = base64.standard_b64encode(httpx.get(pdf_url).content).decode("utf-8")

# Alternativa: carregar de um arquivo local
# with open("document.pdf", "rb") as f:
#     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")

# Envie para o Claude usando codificação base64
client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opção 3: Files API

Para PDFs que você usará repetidamente, ou quando quiser evitar a sobrecarga de codificação, use a Files API:

client = anthropic.Anthropic()

# Faça upload do arquivo PDF
with open("document.pdf", "rb") as f:
    file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))

# Use o arquivo enviado em uma mensagem
message = client.beta.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    betas=["files-api-2025-04-14"],
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {"type": "file", "file_id": file_upload.id},
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Como funciona o suporte a PDF

Quando você envia um PDF para o Claude, as seguintes etapas ocorrem:

  1. 1

    O sistema extrai o conteúdo do documento.

    • O sistema converte cada página do documento em uma imagem.
    • O texto de cada página é extraído e fornecido junto com a imagem de cada página.
  2. 2

    Claude analisa tanto o texto quanto as imagens para compreender melhor o documento.

    • Os documentos são fornecidos como uma combinação de texto e imagens para análise.
    • Isso permite que os usuários solicitem insights sobre elementos visuais de um PDF, como gráficos, diagramas e outros conteúdos não textuais.
  3. 3

    Claude responde, referenciando o conteúdo do PDF se relevante.

    Claude pode referenciar tanto conteúdo textual quanto visual ao responder. Você pode melhorar ainda mais o desempenho integrando o suporte a PDF com:

    • Cache de prompt: Para melhorar o desempenho em análises repetidas.
    • Processamento em lote: Para processamento de documentos em alto volume.
    • Uso de ferramentas: Para extrair informações específicas de documentos para uso como entradas de ferramentas.

Estime seus custos

A contagem de tokens de um arquivo PDF depende do total de texto extraído do documento, bem como do número de páginas:

  • Custos de tokens de texto: Cada página normalmente usa de 1.500 a 3.000 tokens por página, dependendo da densidade do conteúdo. A precificação padrão da API se aplica sem taxas adicionais de PDF.
  • Custos de tokens de imagem: Como cada página é convertida em uma imagem, os mesmos cálculos de custo baseados em imagem são aplicados.

Você pode usar a contagem de tokens para estimar custos para seus PDFs específicos.


Otimize o processamento de PDF

Melhore o desempenho

Siga estas práticas recomendadas para obter resultados ideais:

  • Coloque PDFs antes do texto em suas requisições
  • Use fontes padrão
  • Certifique-se de que o texto esteja claro e legível
  • Rotacione as páginas para a orientação vertical correta
  • Use números de página lógicos (do visualizador de PDF) nos prompts
  • Divida PDFs grandes em partes quando necessário
  • Habilite o cache de prompt para análises repetidas

Escale sua implementação

Para processamento de alto volume, considere estas abordagens:

Use cache de prompt

Armazene PDFs em cache para melhorar o desempenho em consultas repetidas:

client = anthropic.Anthropic()
# ...
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                    "cache_control": {"type": "ephemeral"},
                },
                {"type": "text", "text": "Analyze this document."},
            ],
        }
    ],
)

Processe lotes de documentos

Use a Message Batches API para fluxos de trabalho de alto volume:

client = anthropic.Anthropic()
# ...
message_batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": "doc1",
            "params": {
                "model": "claude-opus-4-8",
                "max_tokens": 1024,
                "messages": [
                    {
                        "role": "user",
                        "content": [
                            {
                                "type": "document",
                                "source": {
                                    "type": "base64",
                                    "media_type": "application/pdf",
                                    "data": pdf_data,
                                },
                            },
                            {"type": "text", "text": "Summarize this document."},
                        ],
                    }
                ],
            },
        }
    ]
)

Próximos passos


Experimente exemplos de PDF


Explore exemplos práticos de processamento de PDF na receita do cookbook.


Veja a referência da API

Consulte a documentação completa da API para suporte a PDF.

Was this page helpful?

  • Antes de começar
  • Verifique os requisitos de PDF
  • Plataformas e modelos suportados
  • Suporte a PDF no Amazon Bedrock
  • Processe PDFs com Claude
  • Envie sua primeira requisição de PDF
  • Como funciona o suporte a PDF
  • Estime seus custos
  • Otimize o processamento de PDF
  • Melhore o desempenho
  • Escale sua implementação
  • Próximos passos