MensagensTrabalhando com arquivos

Suporte a PDF

Processe PDFs com Claude. Extraia texto, analise gráficos e compreenda conteúdo visual dos seus documentos.

Este recurso é elegível para Zero Data Retention (ZDR). Quando sua organização possui um acordo de ZDR, os dados enviados por meio deste recurso não são armazenados após a resposta da API ser retornada.

Você pode perguntar ao Claude sobre qualquer texto, imagens, gráficos e tabelas em PDFs que você fornecer. Alguns exemplos de casos de uso:

Analisar relatórios financeiros e compreender gráficos/tabelas
Extrair informações importantes de documentos jurídicos
Assistência de tradução para documentos
Converter informações de documentos em formatos estruturados

Antes de começar

Verifique os requisitos de PDF

Claude funciona com qualquer PDF padrão. Certifique-se de que o tamanho da sua requisição atenda a estes requisitos:

Requisito	Limite
Tamanho máximo da requisição	32 MB (varia por plataforma)
Máximo de páginas por requisição	600 (100 para modelos com uma janela de contexto de 200k tokens)
Formato	PDF padrão (sem senhas/criptografia)

Ambos os limites se aplicam a todo o payload da requisição, incluindo qualquer outro conteúdo enviado junto com os PDFs. Para PDFs grandes, considere fazer upload com a Files API e referenciar por file_id para manter os payloads de requisição pequenos.

PDFs densos (muitas páginas com fonte pequena, tabelas complexas ou gráficos pesados) podem preencher a "context window" (janela de contexto) antes de atingir o limite de páginas. Requisições com PDFs grandes também podem falhar antes de atingir o limite de páginas, mesmo ao usar a Files API. Tente dividir o documento em seções; para arquivos grandes, como cada página é processada como uma imagem, reduzir a resolução das imagens incorporadas também pode ajudar.

Como o suporte a PDF depende das capacidades de visão do Claude, ele está sujeito às mesmas limitações e considerações que outras tarefas de visão.

Plataformas e modelos suportados

O suporte a PDF está disponível na Claude API, Claude Platform na AWS, Amazon Bedrock (consulte Suporte a PDF no Amazon Bedrock), Google Cloud e Microsoft Foundry. Todos os modelos ativos suportam processamento de PDF.

Suporte a PDF no Amazon Bedrock

Ao usar o suporte a PDF através da Converse API do Bedrock, existem dois modos distintos de processamento de documentos:

Importante: Para acessar as capacidades completas de compreensão visual de PDF do Claude na Converse API, você deve habilitar citações. Sem citações habilitadas, a API recorre apenas à extração básica de texto. Saiba mais sobre como trabalhar com citações.

Modos de processamento de documentos

Converse Document Chat (Modo original - Apenas extração de texto)
- Fornece extração básica de texto de PDFs
- Não consegue analisar imagens, gráficos ou layouts visuais dentro de PDFs
- Usa aproximadamente 1.000 tokens para um PDF de 3 páginas
- Usado automaticamente quando citações não estão habilitadas
Claude PDF Chat (Novo modo - Compreensão visual completa)
- Fornece análise visual completa de PDFs
- Consegue compreender e analisar gráficos, diagramas, imagens e layouts visuais
- Processa cada página como texto e imagem para compreensão abrangente
- Usa aproximadamente 7.000 tokens para um PDF de 3 páginas
- Requer que citações estejam habilitadas na Converse API

Limitações principais

Converse API: A análise visual de PDF requer que citações estejam habilitadas. Atualmente não há opção para usar análise visual sem citações (diferente da InvokeModel API).
InvokeModel API: Fornece controle total sobre o processamento de PDF sem citações forçadas.

Problemas comuns

Se o Claude não estiver vendo imagens ou gráficos em seus PDFs ao usar a Converse API, você provavelmente precisa habilitar a flag de citações. Sem ela, a Converse recorre apenas à extração básica de texto.

Esta é uma restrição conhecida da Converse API. Para aplicações que requerem análise visual de PDF sem citações, considere usar a InvokeModel API em vez disso.

Para arquivos que não são PDF, como arquivos .csv, .xlsx, .docx, .md ou .txt, consulte Trabalhando com outros formatos de arquivo.

Processe PDFs com Claude

Envie sua primeira requisição de PDF

Vamos começar com um exemplo simples usando a Messages API. Você pode fornecer PDFs ao Claude de três maneiras:

Como uma referência de URL para um PDF hospedado online
Como um PDF codificado em base64 em blocos de conteúdo document
Por um file_id da Files API

No Amazon Bedrock e Google Cloud, apenas fontes codificadas em base64 estão disponíveis atualmente.

Opção 1: Documento PDF baseado em URL

A abordagem mais simples é referenciar um PDF diretamente de uma URL:

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "url",
                        "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opção 2: Documento PDF codificado em base64

Se você precisar enviar PDFs do seu sistema local ou quando uma URL não estiver disponível:

import base64
import httpx

# Primeiro, carregue e codifique o PDF
pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
pdf_data = base64.standard_b64encode(
    httpx.get(pdf_url, follow_redirects=True).content
).decode("utf-8")

# Alternativa: carregar de um arquivo local
# with open("document.pdf", "rb") as f:
#     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")

# Envie para o Claude usando codificação base64
client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opção 3: Files API

Para PDFs que você usará repetidamente, ou quando quiser evitar a sobrecarga de codificação, use a Files API:

client = anthropic.Anthropic()

# Faça upload do arquivo PDF
with open("/path/to/document.pdf", "rb") as f:
    file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))

# Use o arquivo enviado em uma mensagem
message = client.beta.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    betas=["files-api-2025-04-14"],
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {"type": "file", "file_id": file_upload.id},
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Como funciona o suporte a PDF

Quando você envia um PDF para o Claude, as seguintes etapas ocorrem:

O sistema extrai o conteúdo do documento.
- O sistema converte cada página do documento em uma imagem.
- O texto de cada página é extraído e fornecido junto com a imagem de cada página.
Claude analisa tanto o texto quanto as imagens para compreender melhor o documento.
- Documentos são fornecidos como uma combinação de texto e imagens para análise.
- Isso permite que os usuários solicitem insights sobre elementos visuais de um PDF, como gráficos, diagramas e outros conteúdos não textuais.
Claude responde, referenciando o conteúdo do PDF se relevante.
Claude pode referenciar tanto conteúdo textual quanto visual ao responder. Você pode melhorar ainda mais o desempenho integrando o suporte a PDF com:
- Cache de prompt: Para melhorar o desempenho em análises repetidas.
- Processamento em lote: Para processamento de documentos em alto volume.
- Uso de ferramentas: Para extrair informações específicas de documentos para uso como entradas de ferramentas.

Estime seus custos

A contagem de tokens de um arquivo PDF depende do total de texto extraído do documento, bem como do número de páginas:

Custos de tokens de texto: Cada página normalmente usa de 1.500 a 3.000 tokens por página, dependendo da densidade do conteúdo. A precificação padrão da API se aplica sem taxas adicionais de PDF.
Custos de tokens de imagem: Como cada página é convertida em uma imagem, os mesmos cálculos de custo baseados em imagem são aplicados.

Você pode usar a contagem de tokens para estimar custos para seus PDFs específicos.

Otimize o processamento de PDF

Melhore o desempenho

Siga estas práticas recomendadas para obter resultados ideais:

Coloque PDFs antes do texto em suas requisições
Use fontes padrão
Certifique-se de que o texto esteja claro e legível
Rotacione as páginas para a orientação vertical correta
Use números de página lógicos (do visualizador de PDF) nos prompts
Divida PDFs grandes em partes quando necessário
Habilite o cache de prompt para análises repetidas

Escale sua implementação

Para processamento de alto volume, considere estas abordagens:

Use cache de prompt

Armazene PDFs em cache para melhorar o desempenho em consultas repetidas:

client = anthropic.Anthropic()
# ...
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                    "cache_control": {"type": "ephemeral"},
                },
                {"type": "text", "text": "Analyze this document."},
            ],
        }
    ],
)

Processe lotes de documentos

Use a Message Batches API para fluxos de trabalho de alto volume:

client = anthropic.Anthropic()
# ...
message_batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": "doc1",
            "params": {
                "model": "claude-opus-4-8",
                "max_tokens": 1024,
                "messages": [
                    {
                        "role": "user",
                        "content": [
                            {
                                "type": "document",
                                "source": {
                                    "type": "base64",
                                    "media_type": "application/pdf",
                                    "data": pdf_data,
                                },
                            },
                            {"type": "text", "text": "Summarize this document."},
                        ],
                    }
                ],
            },
        }
    ]
)

Próximos passos

Experimente exemplos de PDF

Explore exemplos práticos de processamento de PDF na receita do cookbook.

Ver referência da API

Veja a documentação completa da API para suporte a PDF.

Was this page helpful?

MensagensTrabalhando com arquivos

Suporte a PDF

Processe PDFs com Claude. Extraia texto, analise gráficos e compreenda conteúdo visual dos seus documentos.

Você pode perguntar ao Claude sobre qualquer texto, imagens, gráficos e tabelas em PDFs que você fornecer. Alguns exemplos de casos de uso:

Analisar relatórios financeiros e compreender gráficos/tabelas
Extrair informações importantes de documentos jurídicos
Assistência de tradução para documentos
Converter informações de documentos em formatos estruturados

Antes de começar

Verifique os requisitos de PDF

Claude funciona com qualquer PDF padrão. Certifique-se de que o tamanho da sua requisição atenda a estes requisitos:

Requisito	Limite
Tamanho máximo da requisição	32 MB (varia por plataforma)
Máximo de páginas por requisição	600 (100 para modelos com uma janela de contexto de 200k tokens)
Formato	PDF padrão (sem senhas/criptografia)

Como o suporte a PDF depende das capacidades de visão do Claude, ele está sujeito às mesmas limitações e considerações que outras tarefas de visão.

Plataformas e modelos suportados

Suporte a PDF no Amazon Bedrock

Ao usar o suporte a PDF através da Converse API do Bedrock, existem dois modos distintos de processamento de documentos:

Modos de processamento de documentos

Converse Document Chat (Modo original - Apenas extração de texto)
- Fornece extração básica de texto de PDFs
- Não consegue analisar imagens, gráficos ou layouts visuais dentro de PDFs
- Usa aproximadamente 1.000 tokens para um PDF de 3 páginas
- Usado automaticamente quando citações não estão habilitadas
Claude PDF Chat (Novo modo - Compreensão visual completa)
- Fornece análise visual completa de PDFs
- Consegue compreender e analisar gráficos, diagramas, imagens e layouts visuais
- Processa cada página como texto e imagem para compreensão abrangente
- Usa aproximadamente 7.000 tokens para um PDF de 3 páginas
- Requer que citações estejam habilitadas na Converse API

Limitações principais

Converse API: A análise visual de PDF requer que citações estejam habilitadas. Atualmente não há opção para usar análise visual sem citações (diferente da InvokeModel API).
InvokeModel API: Fornece controle total sobre o processamento de PDF sem citações forçadas.

Problemas comuns

Esta é uma restrição conhecida da Converse API. Para aplicações que requerem análise visual de PDF sem citações, considere usar a InvokeModel API em vez disso.

Para arquivos que não são PDF, como arquivos .csv, .xlsx, .docx, .md ou .txt, consulte Trabalhando com outros formatos de arquivo.

Processe PDFs com Claude

Envie sua primeira requisição de PDF

Vamos começar com um exemplo simples usando a Messages API. Você pode fornecer PDFs ao Claude de três maneiras:

Como uma referência de URL para um PDF hospedado online
Como um PDF codificado em base64 em blocos de conteúdo document
Por um file_id da Files API

No Amazon Bedrock e Google Cloud, apenas fontes codificadas em base64 estão disponíveis atualmente.

Opção 1: Documento PDF baseado em URL

A abordagem mais simples é referenciar um PDF diretamente de uma URL:

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "url",
                        "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opção 2: Documento PDF codificado em base64

Se você precisar enviar PDFs do seu sistema local ou quando uma URL não estiver disponível:

import base64
import httpx

# Primeiro, carregue e codifique o PDF
pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
pdf_data = base64.standard_b64encode(
    httpx.get(pdf_url, follow_redirects=True).content
).decode("utf-8")

# Alternativa: carregar de um arquivo local
# with open("document.pdf", "rb") as f:
#     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")

# Envie para o Claude usando codificação base64
client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opção 3: Files API

Para PDFs que você usará repetidamente, ou quando quiser evitar a sobrecarga de codificação, use a Files API:

client = anthropic.Anthropic()

# Faça upload do arquivo PDF
with open("/path/to/document.pdf", "rb") as f:
    file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))

# Use o arquivo enviado em uma mensagem
message = client.beta.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    betas=["files-api-2025-04-14"],
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {"type": "file", "file_id": file_upload.id},
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Como funciona o suporte a PDF

Quando você envia um PDF para o Claude, as seguintes etapas ocorrem:

O sistema extrai o conteúdo do documento.
- O sistema converte cada página do documento em uma imagem.
- O texto de cada página é extraído e fornecido junto com a imagem de cada página.
Claude analisa tanto o texto quanto as imagens para compreender melhor o documento.
- Documentos são fornecidos como uma combinação de texto e imagens para análise.
- Isso permite que os usuários solicitem insights sobre elementos visuais de um PDF, como gráficos, diagramas e outros conteúdos não textuais.
Claude responde, referenciando o conteúdo do PDF se relevante.
Claude pode referenciar tanto conteúdo textual quanto visual ao responder. Você pode melhorar ainda mais o desempenho integrando o suporte a PDF com:
- Cache de prompt: Para melhorar o desempenho em análises repetidas.
- Processamento em lote: Para processamento de documentos em alto volume.
- Uso de ferramentas: Para extrair informações específicas de documentos para uso como entradas de ferramentas.

Estime seus custos

A contagem de tokens de um arquivo PDF depende do total de texto extraído do documento, bem como do número de páginas:

Custos de tokens de texto: Cada página normalmente usa de 1.500 a 3.000 tokens por página, dependendo da densidade do conteúdo. A precificação padrão da API se aplica sem taxas adicionais de PDF.
Custos de tokens de imagem: Como cada página é convertida em uma imagem, os mesmos cálculos de custo baseados em imagem são aplicados.

Você pode usar a contagem de tokens para estimar custos para seus PDFs específicos.

Otimize o processamento de PDF

Melhore o desempenho

Siga estas práticas recomendadas para obter resultados ideais:

Coloque PDFs antes do texto em suas requisições
Use fontes padrão
Certifique-se de que o texto esteja claro e legível
Rotacione as páginas para a orientação vertical correta
Use números de página lógicos (do visualizador de PDF) nos prompts
Divida PDFs grandes em partes quando necessário
Habilite o cache de prompt para análises repetidas

Escale sua implementação

Para processamento de alto volume, considere estas abordagens:

Use cache de prompt

Armazene PDFs em cache para melhorar o desempenho em consultas repetidas:

client = anthropic.Anthropic()
# ...
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                    "cache_control": {"type": "ephemeral"},
                },
                {"type": "text", "text": "Analyze this document."},
            ],
        }
    ],
)

Processe lotes de documentos

Use a Message Batches API para fluxos de trabalho de alto volume:

client = anthropic.Anthropic()
# ...
message_batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": "doc1",
            "params": {
                "model": "claude-opus-4-8",
                "max_tokens": 1024,
                "messages": [
                    {
                        "role": "user",
                        "content": [
                            {
                                "type": "document",
                                "source": {
                                    "type": "base64",
                                    "media_type": "application/pdf",
                                    "data": pdf_data,
                                },
                            },
                            {"type": "text", "text": "Summarize this document."},
                        ],
                    }
                ],
            },
        }
    ]
)

Próximos passos

Experimente exemplos de PDF

Explore exemplos práticos de processamento de PDF na receita do cookbook.

Ver referência da API

Veja a documentação completa da API para suporte a PDF.

Was this page helpful?

Antes de começar

Verifique os requisitos de PDF

Plataformas e modelos suportados

Suporte a PDF no Amazon Bedrock

Modos de processamento de documentos

Limitações principais

Problemas comuns

Processe PDFs com Claude

Envie sua primeira requisição de PDF

Opção 1: Documento PDF baseado em URL

Opção 2: Documento PDF codificado em base64

Opção 3: Files API

Como funciona o suporte a PDF

Estime seus custos

Otimize o processamento de PDF

Melhore o desempenho

Escale sua implementação

Use cache de prompt

Processe lotes de documentos

Próximos passos

Antes de começar

Verifique os requisitos de PDF

Plataformas e modelos suportados

Suporte a PDF no Amazon Bedrock

Modos de processamento de documentos

Limitações principais

Problemas comuns

Processe PDFs com Claude

Envie sua primeira requisição de PDF

Opção 1: Documento PDF baseado em URL

Opção 2: Documento PDF codificado em base64

Opção 3: Files API

Como funciona o suporte a PDF

Estime seus custos

Otimize o processamento de PDF

Melhore o desempenho

Escale sua implementação

Use cache de prompt

Processe lotes de documentos

Próximos passos

Antes de começar

Verifique os requisitos de PDF

Plataformas e modelos suportados

Suporte a PDF no Amazon Bedrock

Modos de processamento de documentos

Limitações principais

Problemas comuns

Processe PDFs com Claude

Envie sua primeira requisição de PDF

Opção 1: Documento PDF baseado em URL

Opção 2: Documento PDF codificado em base64

Opção 3: Files API

Como funciona o suporte a PDF

Estime seus custos

Otimize o processamento de PDF

Melhore o desempenho

Escale sua implementação

Use cache de prompt

Processe lotes de documentos

Próximos passos

Antes de começar

Verifique os requisitos de PDF

Plataformas e modelos suportados

Suporte a PDF no Amazon Bedrock

Modos de processamento de documentos

Limitações principais

Problemas comuns

Processe PDFs com Claude

Envie sua primeira requisição de PDF

Opção 1: Documento PDF baseado em URL

Opção 2: Documento PDF codificado em base64

Opção 3: Files API

Como funciona o suporte a PDF

Estime seus custos

Otimize o processamento de PDF

Melhore o desempenho

Escale sua implementação

Use cache de prompt

Processe lotes de documentos

Próximos passos