MensajesTrabajar con archivos

Soporte para PDF

Procesa archivos PDF con Claude. Extrae texto, analiza gráficos y comprende el contenido visual de tus documentos.

Esta función es elegible para Zero Data Retention (ZDR). Cuando tu organización tiene un acuerdo de ZDR, los datos enviados a través de esta función no se almacenan después de que se devuelve la respuesta de la API.

Puedes preguntarle a Claude sobre cualquier texto, imagen, gráfico y tabla en los PDF que proporciones. Algunos casos de uso de ejemplo:

Analizar informes financieros y comprender gráficos/tablas
Extraer información clave de documentos legales
Asistencia de traducción para documentos
Convertir información de documentos en formatos estructurados

Antes de comenzar

Verifica los requisitos de PDF

Claude funciona con cualquier PDF estándar. Asegúrate de que el tamaño de tu solicitud cumpla con estos requisitos:

Requisito	Límite
Tamaño máximo de solicitud	32 MB (varía según la plataforma)
Máximo de páginas por solicitud	600 (100 para modelos con una ventana de contexto de 200k tokens)
Formato	PDF estándar (sin contraseñas/cifrado)

Ambos límites aplican a toda la carga útil de la solicitud, incluido cualquier otro contenido enviado junto con los PDF. Para PDF grandes, considera subirlos con la Files API y referenciarlos mediante file_id para mantener las cargas útiles de las solicitudes pequeñas.

Los PDF densos (muchas páginas con fuente pequeña, tablas complejas o gráficos pesados) pueden llenar la "context window" (ventana de contexto) antes de alcanzar el límite de páginas. Las solicitudes con PDF grandes también pueden fallar antes de alcanzar el límite de páginas, incluso al usar la Files API. Intenta dividir el documento en secciones; para archivos grandes, dado que cada página se procesa como una imagen, reducir la resolución de las imágenes incrustadas también puede ayudar.

Dado que el soporte para PDF depende de las capacidades de visión de Claude, está sujeto a las mismas limitaciones y consideraciones que otras tareas de visión.

Plataformas y modelos compatibles

El soporte para PDF está disponible en la API de Claude, Claude Platform en AWS, Amazon Bedrock (consulta Soporte para PDF en Amazon Bedrock), Google Cloud y Microsoft Foundry. Todos los modelos activos admiten el procesamiento de PDF.

Soporte para PDF en Amazon Bedrock

Al usar el soporte para PDF a través de la Converse API de Bedrock, existen dos modos distintos de procesamiento de documentos:

Importante: Para acceder a las capacidades completas de comprensión visual de PDF de Claude en la Converse API, debes habilitar las citas. Sin las citas habilitadas, la API recurre únicamente a la extracción básica de texto. Obtén más información sobre cómo trabajar con citas.

Modos de procesamiento de documentos

Converse Document Chat (Modo original - Solo extracción de texto)
- Proporciona extracción básica de texto de los PDF
- No puede analizar imágenes, gráficos ni diseños visuales dentro de los PDF
- Usa aproximadamente 1,000 tokens para un PDF de 3 páginas
- Se usa automáticamente cuando las citas no están habilitadas
Claude PDF Chat (Modo nuevo - Comprensión visual completa)
- Proporciona análisis visual completo de los PDF
- Puede comprender y analizar gráficos, diagramas, imágenes y diseños visuales
- Procesa cada página como texto e imagen para una comprensión integral
- Usa aproximadamente 7,000 tokens para un PDF de 3 páginas
- Requiere que las citas estén habilitadas en la Converse API

Limitaciones clave

Converse API: El análisis visual de PDF requiere que las citas estén habilitadas. Actualmente no hay opción para usar el análisis visual sin citas (a diferencia de la InvokeModel API).
InvokeModel API: Proporciona control total sobre el procesamiento de PDF sin citas forzadas.

Problemas comunes

Si Claude no está viendo imágenes o gráficos en tus PDF al usar la Converse API, probablemente necesites habilitar el indicador de citas. Sin él, Converse recurre únicamente a la extracción básica de texto.

Esta es una restricción conocida de la Converse API. Para aplicaciones que requieren análisis visual de PDF sin citas, considera usar la InvokeModel API en su lugar.

Para archivos que no son PDF, como archivos .csv, .xlsx, .docx, .md o .txt, consulta Trabajar con otros formatos de archivo.

Procesa PDF con Claude

Envía tu primera solicitud de PDF

Comencemos con un ejemplo simple usando la Messages API. Puedes proporcionar PDF a Claude de tres maneras:

Como una referencia URL a un PDF alojado en línea
Como un PDF codificado en base64 en bloques de contenido document
Mediante un file_id de la Files API

En Amazon Bedrock y Google Cloud, actualmente solo están disponibles las fuentes codificadas en base64.

Opción 1: Documento PDF basado en URL

El enfoque más simple es referenciar un PDF directamente desde una URL:

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "url",
                        "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opción 2: Documento PDF codificado en base64

Si necesitas enviar PDF desde tu sistema local o cuando no hay una URL disponible:

import base64
import httpx

# Primero, carga y codifica el PDF
pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
pdf_data = base64.standard_b64encode(
    httpx.get(pdf_url, follow_redirects=True).content
).decode("utf-8")

# Alternativa: cargar desde un archivo local
# with open("document.pdf", "rb") as f:
#     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")

# Envía a Claude usando codificación base64
client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opción 3: Files API

Para PDF que usarás repetidamente, o cuando quieras evitar la sobrecarga de codificación, usa la Files API:

client = anthropic.Anthropic()

# Sube el archivo PDF
with open("/path/to/document.pdf", "rb") as f:
    file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))

# Usa el archivo subido en un mensaje
message = client.beta.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    betas=["files-api-2025-04-14"],
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {"type": "file", "file_id": file_upload.id},
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Cómo funciona el soporte para PDF

Cuando envías un PDF a Claude, ocurren los siguientes pasos:

El sistema extrae el contenido del documento.
- El sistema convierte cada página del documento en una imagen.
- El texto de cada página se extrae y se proporciona junto con la imagen de cada página.
Claude analiza tanto el texto como las imágenes para comprender mejor el documento.
- Los documentos se proporcionan como una combinación de texto e imágenes para su análisis.
- Esto permite a los usuarios solicitar información sobre elementos visuales de un PDF, como gráficos, diagramas y otro contenido no textual.
Claude responde, haciendo referencia al contenido del PDF si es relevante.
Claude puede hacer referencia tanto al contenido textual como visual cuando responde. Puedes mejorar aún más el rendimiento integrando el soporte para PDF con:
- Almacenamiento en caché de prompts: Para mejorar el rendimiento en análisis repetidos.
- Procesamiento por lotes: Para procesamiento de documentos de alto volumen.
- Uso de herramientas: Para extraer información específica de documentos y usarla como entradas de herramientas.

Estima tus costos

El recuento de tokens de un archivo PDF depende del texto total extraído del documento, así como del número de páginas:

Costos de tokens de texto: Cada página generalmente usa entre 1,500 y 3,000 tokens por página dependiendo de la densidad del contenido. Se aplican los precios estándar de la API sin tarifas adicionales por PDF.
Costos de tokens de imagen: Dado que cada página se convierte en una imagen, se aplican los mismos cálculos de costos basados en imágenes.

Puedes usar el conteo de tokens para estimar los costos de tus PDF específicos.

Optimiza el procesamiento de PDF

Mejora el rendimiento

Sigue estas mejores prácticas para obtener resultados óptimos:

Coloca los PDF antes del texto en tus solicitudes
Usa fuentes estándar
Asegúrate de que el texto sea claro y legible
Rota las páginas a la orientación vertical correcta
Usa números de página lógicos (del visor de PDF) en los prompts
Divide los PDF grandes en fragmentos cuando sea necesario
Habilita el almacenamiento en caché de prompts para análisis repetidos

Escala tu implementación

Para procesamiento de alto volumen, considera estos enfoques:

Usa el almacenamiento en caché de prompts

Almacena en caché los PDF para mejorar el rendimiento en consultas repetidas:

client = anthropic.Anthropic()
# ...
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                    "cache_control": {"type": "ephemeral"},
                },
                {"type": "text", "text": "Analyze this document."},
            ],
        }
    ],
)

Procesa lotes de documentos

Usa la Message Batches API para flujos de trabajo de alto volumen:

client = anthropic.Anthropic()
# ...
message_batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": "doc1",
            "params": {
                "model": "claude-opus-4-8",
                "max_tokens": 1024,
                "messages": [
                    {
                        "role": "user",
                        "content": [
                            {
                                "type": "document",
                                "source": {
                                    "type": "base64",
                                    "media_type": "application/pdf",
                                    "data": pdf_data,
                                },
                            },
                            {"type": "text", "text": "Summarize this document."},
                        ],
                    }
                ],
            },
        }
    ]
)

Próximos pasos

Prueba ejemplos de PDF

Explora ejemplos prácticos de procesamiento de PDF en la receta del cookbook.

Ver referencia de la API

Consulta la documentación completa de la API para el soporte de PDF.

Was this page helpful?

MensajesTrabajar con archivos

Soporte para PDF

Procesa archivos PDF con Claude. Extrae texto, analiza gráficos y comprende el contenido visual de tus documentos.

Puedes preguntarle a Claude sobre cualquier texto, imagen, gráfico y tabla en los PDF que proporciones. Algunos casos de uso de ejemplo:

Analizar informes financieros y comprender gráficos/tablas
Extraer información clave de documentos legales
Asistencia de traducción para documentos
Convertir información de documentos en formatos estructurados

Antes de comenzar

Verifica los requisitos de PDF

Claude funciona con cualquier PDF estándar. Asegúrate de que el tamaño de tu solicitud cumpla con estos requisitos:

Requisito	Límite
Tamaño máximo de solicitud	32 MB (varía según la plataforma)
Máximo de páginas por solicitud	600 (100 para modelos con una ventana de contexto de 200k tokens)
Formato	PDF estándar (sin contraseñas/cifrado)

Dado que el soporte para PDF depende de las capacidades de visión de Claude, está sujeto a las mismas limitaciones y consideraciones que otras tareas de visión.

Plataformas y modelos compatibles

Soporte para PDF en Amazon Bedrock

Al usar el soporte para PDF a través de la Converse API de Bedrock, existen dos modos distintos de procesamiento de documentos:

Modos de procesamiento de documentos

Converse Document Chat (Modo original - Solo extracción de texto)
- Proporciona extracción básica de texto de los PDF
- No puede analizar imágenes, gráficos ni diseños visuales dentro de los PDF
- Usa aproximadamente 1,000 tokens para un PDF de 3 páginas
- Se usa automáticamente cuando las citas no están habilitadas
Claude PDF Chat (Modo nuevo - Comprensión visual completa)
- Proporciona análisis visual completo de los PDF
- Puede comprender y analizar gráficos, diagramas, imágenes y diseños visuales
- Procesa cada página como texto e imagen para una comprensión integral
- Usa aproximadamente 7,000 tokens para un PDF de 3 páginas
- Requiere que las citas estén habilitadas en la Converse API

Limitaciones clave

Converse API: El análisis visual de PDF requiere que las citas estén habilitadas. Actualmente no hay opción para usar el análisis visual sin citas (a diferencia de la InvokeModel API).
InvokeModel API: Proporciona control total sobre el procesamiento de PDF sin citas forzadas.

Problemas comunes

Esta es una restricción conocida de la Converse API. Para aplicaciones que requieren análisis visual de PDF sin citas, considera usar la InvokeModel API en su lugar.

Para archivos que no son PDF, como archivos .csv, .xlsx, .docx, .md o .txt, consulta Trabajar con otros formatos de archivo.

Procesa PDF con Claude

Envía tu primera solicitud de PDF

Comencemos con un ejemplo simple usando la Messages API. Puedes proporcionar PDF a Claude de tres maneras:

Como una referencia URL a un PDF alojado en línea
Como un PDF codificado en base64 en bloques de contenido document
Mediante un file_id de la Files API

En Amazon Bedrock y Google Cloud, actualmente solo están disponibles las fuentes codificadas en base64.

Opción 1: Documento PDF basado en URL

El enfoque más simple es referenciar un PDF directamente desde una URL:

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "url",
                        "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opción 2: Documento PDF codificado en base64

Si necesitas enviar PDF desde tu sistema local o cuando no hay una URL disponible:

import base64
import httpx

# Primero, carga y codifica el PDF
pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
pdf_data = base64.standard_b64encode(
    httpx.get(pdf_url, follow_redirects=True).content
).decode("utf-8")

# Alternativa: cargar desde un archivo local
# with open("document.pdf", "rb") as f:
#     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")

# Envía a Claude usando codificación base64
client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opción 3: Files API

Para PDF que usarás repetidamente, o cuando quieras evitar la sobrecarga de codificación, usa la Files API:

client = anthropic.Anthropic()

# Sube el archivo PDF
with open("/path/to/document.pdf", "rb") as f:
    file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))

# Usa el archivo subido en un mensaje
message = client.beta.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    betas=["files-api-2025-04-14"],
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {"type": "file", "file_id": file_upload.id},
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Cómo funciona el soporte para PDF

Cuando envías un PDF a Claude, ocurren los siguientes pasos:

El sistema extrae el contenido del documento.
- El sistema convierte cada página del documento en una imagen.
- El texto de cada página se extrae y se proporciona junto con la imagen de cada página.
Claude analiza tanto el texto como las imágenes para comprender mejor el documento.
- Los documentos se proporcionan como una combinación de texto e imágenes para su análisis.
- Esto permite a los usuarios solicitar información sobre elementos visuales de un PDF, como gráficos, diagramas y otro contenido no textual.
Claude responde, haciendo referencia al contenido del PDF si es relevante.
Claude puede hacer referencia tanto al contenido textual como visual cuando responde. Puedes mejorar aún más el rendimiento integrando el soporte para PDF con:
- Almacenamiento en caché de prompts: Para mejorar el rendimiento en análisis repetidos.
- Procesamiento por lotes: Para procesamiento de documentos de alto volumen.
- Uso de herramientas: Para extraer información específica de documentos y usarla como entradas de herramientas.

Estima tus costos

El recuento de tokens de un archivo PDF depende del texto total extraído del documento, así como del número de páginas:

Costos de tokens de texto: Cada página generalmente usa entre 1,500 y 3,000 tokens por página dependiendo de la densidad del contenido. Se aplican los precios estándar de la API sin tarifas adicionales por PDF.
Costos de tokens de imagen: Dado que cada página se convierte en una imagen, se aplican los mismos cálculos de costos basados en imágenes.

Puedes usar el conteo de tokens para estimar los costos de tus PDF específicos.

Optimiza el procesamiento de PDF

Mejora el rendimiento

Sigue estas mejores prácticas para obtener resultados óptimos:

Coloca los PDF antes del texto en tus solicitudes
Usa fuentes estándar
Asegúrate de que el texto sea claro y legible
Rota las páginas a la orientación vertical correcta
Usa números de página lógicos (del visor de PDF) en los prompts
Divide los PDF grandes en fragmentos cuando sea necesario
Habilita el almacenamiento en caché de prompts para análisis repetidos

Escala tu implementación

Para procesamiento de alto volumen, considera estos enfoques:

Usa el almacenamiento en caché de prompts

Almacena en caché los PDF para mejorar el rendimiento en consultas repetidas:

client = anthropic.Anthropic()
# ...
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                    "cache_control": {"type": "ephemeral"},
                },
                {"type": "text", "text": "Analyze this document."},
            ],
        }
    ],
)

Procesa lotes de documentos

Usa la Message Batches API para flujos de trabajo de alto volumen:

client = anthropic.Anthropic()
# ...
message_batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": "doc1",
            "params": {
                "model": "claude-opus-4-8",
                "max_tokens": 1024,
                "messages": [
                    {
                        "role": "user",
                        "content": [
                            {
                                "type": "document",
                                "source": {
                                    "type": "base64",
                                    "media_type": "application/pdf",
                                    "data": pdf_data,
                                },
                            },
                            {"type": "text", "text": "Summarize this document."},
                        ],
                    }
                ],
            },
        }
    ]
)

Próximos pasos

Prueba ejemplos de PDF

Explora ejemplos prácticos de procesamiento de PDF en la receta del cookbook.

Ver referencia de la API

Consulta la documentación completa de la API para el soporte de PDF.

Was this page helpful?

Antes de comenzar

Verifica los requisitos de PDF

Plataformas y modelos compatibles

Soporte para PDF en Amazon Bedrock

Modos de procesamiento de documentos

Limitaciones clave

Problemas comunes

Procesa PDF con Claude

Envía tu primera solicitud de PDF

Opción 1: Documento PDF basado en URL

Opción 2: Documento PDF codificado en base64

Opción 3: Files API

Cómo funciona el soporte para PDF

Estima tus costos

Optimiza el procesamiento de PDF

Mejora el rendimiento

Escala tu implementación

Usa el almacenamiento en caché de prompts

Procesa lotes de documentos

Próximos pasos

Antes de comenzar

Verifica los requisitos de PDF

Plataformas y modelos compatibles

Soporte para PDF en Amazon Bedrock

Modos de procesamiento de documentos

Limitaciones clave

Problemas comunes

Procesa PDF con Claude

Envía tu primera solicitud de PDF

Opción 1: Documento PDF basado en URL

Opción 2: Documento PDF codificado en base64

Opción 3: Files API

Cómo funciona el soporte para PDF

Estima tus costos

Optimiza el procesamiento de PDF

Mejora el rendimiento

Escala tu implementación

Usa el almacenamiento en caché de prompts

Procesa lotes de documentos

Próximos pasos

Antes de comenzar

Verifica los requisitos de PDF

Plataformas y modelos compatibles

Soporte para PDF en Amazon Bedrock

Modos de procesamiento de documentos

Limitaciones clave

Problemas comunes

Procesa PDF con Claude

Envía tu primera solicitud de PDF

Opción 1: Documento PDF basado en URL

Opción 2: Documento PDF codificado en base64

Opción 3: Files API

Cómo funciona el soporte para PDF

Estima tus costos

Optimiza el procesamiento de PDF

Mejora el rendimiento

Escala tu implementación

Usa el almacenamiento en caché de prompts

Procesa lotes de documentos

Próximos pasos

Antes de comenzar

Verifica los requisitos de PDF

Plataformas y modelos compatibles

Soporte para PDF en Amazon Bedrock

Modos de procesamiento de documentos

Limitaciones clave

Problemas comunes

Procesa PDF con Claude

Envía tu primera solicitud de PDF

Opción 1: Documento PDF basado en URL

Opción 2: Documento PDF codificado en base64

Opción 3: Files API

Cómo funciona el soporte para PDF

Estima tus costos

Optimiza el procesamiento de PDF

Mejora el rendimiento

Escala tu implementación

Usa el almacenamiento en caché de prompts

Procesa lotes de documentos

Próximos pasos