Loading...
  • Construir
  • Administración
  • Modelos y precios
  • SDKs de cliente
  • Referencia de API
Search...
⌘K
Log in
Soporte de PDF
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Construir/Trabajar con archivos

Compatibilidad con PDF

Procesa PDFs con Claude. Extrae texto, analiza gráficos y comprende contenido visual de tus documentos.

Was this page helpful?

  • Antes de comenzar
  • Verificar requisitos de PDF
  • Plataformas y modelos compatibles
  • Compatibilidad con PDF en Amazon Bedrock
  • Procesa PDFs con Claude
  • Envía tu primera solicitud de PDF
  • Cómo funciona la compatibilidad con PDF
  • Estima tus costos
  • Optimiza el procesamiento de PDF
  • Mejora el rendimiento
  • Escala tu implementación
  • Próximos pasos

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

Puedes preguntarle a Claude sobre cualquier texto, imágenes, gráficos y tablas en los PDFs que proporciones. Algunos casos de uso de ejemplo:

  • Analizar informes financieros y comprender gráficos/tablas
  • Extraer información clave de documentos legales
  • Asistencia de traducción para documentos
  • Convertir información de documentos en formatos estructurados

Antes de comenzar

Verificar requisitos de PDF

Claude funciona con cualquier PDF estándar. Asegúrate de que el tamaño de tu solicitud cumpla con estos requisitos:

RequisitoLímite
Tamaño máximo de solicitud32 MB (varía según la plataforma)
Máximo de páginas por solicitud600 (100 para modelos con una ventana de contexto de 200k tokens)
FormatoPDF estándar (sin contraseñas/cifrado)

Ambos límites se aplican a toda la carga útil de la solicitud, incluido cualquier otro contenido enviado junto con los PDFs. Para PDFs grandes, considera cargar con la API de Archivos y hacer referencia por file_id para mantener las cargas útiles de solicitud pequeñas.

Los PDFs densos (muchas páginas con fuente pequeña, tablas complejas o gráficos pesados) pueden llenar la ventana de contexto antes de alcanzar el límite de páginas. Las solicitudes con PDFs grandes también pueden fallar antes de alcanzar el límite de páginas, incluso cuando se usa la API de Archivos. Intenta dividir el documento en secciones; para archivos grandes, ya que cada página se procesa como una imagen, la reducción de resolución de imágenes incrustadas también puede ayudar.

Dado que la compatibilidad con PDF se basa en las capacidades de visión de Claude, está sujeta a las mismas limitaciones y consideraciones que otras tareas de visión.

Plataformas y modelos compatibles

La compatibilidad con PDF actualmente se admite a través del acceso directo a la API y Google Vertex AI. Todos los modelos activos admiten procesamiento de PDF.

La compatibilidad con PDF ahora está disponible en Amazon Bedrock con las siguientes consideraciones:

Compatibilidad con PDF en Amazon Bedrock

Al usar la compatibilidad con PDF a través de la API Converse de Amazon Bedrock, hay dos modos distintos de procesamiento de documentos:

Importante: Para acceder a las capacidades completas de comprensión visual de PDF de Claude en la API Converse, debes habilitar las citas. Sin citas habilitadas, la API vuelve a la extracción de texto básica solamente. Obtén más información sobre trabajar con citas.

Modos de procesamiento de documentos

  1. Converse Document Chat (Modo original - Solo extracción de texto)

    • Proporciona extracción de texto básica de PDFs
    • No puede analizar imágenes, gráficos o diseños visuales dentro de PDFs
    • Utiliza aproximadamente 1,000 tokens para un PDF de 3 páginas
    • Se utiliza automáticamente cuando las citas no están habilitadas
  2. Claude PDF Chat (Nuevo modo - Comprensión visual completa)

    • Proporciona análisis visual completo de PDFs
    • Puede entender y analizar gráficos, gráficas, imágenes y diseños visuales
    • Procesa cada página como texto e imagen para una comprensión integral
    • Utiliza aproximadamente 7,000 tokens para un PDF de 3 páginas

Limitaciones clave

  • API Converse: El análisis visual de PDF requiere que las citas estén habilitadas. Actualmente no hay opción para usar análisis visual sin citas (a diferencia de la API InvokeModel).
  • API InvokeModel: Proporciona control total sobre el procesamiento de PDF sin citas forzadas.

Problemas comunes

Si los clientes reportan que Claude no ve imágenes o gráficos en sus PDFs al usar la API Converse, probablemente necesiten habilitar la bandera de citas. Sin ella, Converse vuelve a la extracción de texto básica solamente.

Esta es una restricción conocida con la API Converse. Para aplicaciones que requieren análisis visual de PDF sin citas, considera usar la API InvokeModel en su lugar.

Para archivos que no sean PDF como .csv, .xlsx, .docx, .md o .txt, consulta Trabajar con otros formatos de archivo.


Procesa PDFs con Claude

Envía tu primera solicitud de PDF

Comencemos con un ejemplo simple usando la API de Mensajes. Puedes proporcionar PDFs a Claude de tres formas:

  1. Como referencia de URL a un PDF alojado en línea
  2. Como PDF codificado en base64 en bloques de contenido document
  3. Por un file_id de la API de Archivos

Opción 1: Documento PDF basado en URL

El enfoque más simple es hacer referencia a un PDF directamente desde una URL:

Opción 2: Documento PDF codificado en base64

Si necesitas enviar PDFs desde tu sistema local o cuando una URL no está disponible:

Opción 3: API de Archivos

Para PDFs que usarás repetidamente, o cuando quieras evitar la sobrecarga de codificación, usa la API de Archivos:

Cómo funciona la compatibilidad con PDF

Cuando envías un PDF a Claude, ocurren los siguientes pasos:

  1. 1

    El sistema extrae el contenido del documento.

    • El sistema convierte cada página del documento en una imagen.
    • El texto de cada página se extrae y se proporciona junto con la imagen de cada página.
  2. 2

    Claude analiza tanto el texto como las imágenes para comprender mejor el documento.

    • Los documentos se proporcionan como una combinación de texto e imágenes para análisis.
    • Esto permite a los usuarios solicitar información sobre elementos visuales de un PDF, como gráficos, diagramas y otro contenido no textual.
  3. 3

    Claude responde, haciendo referencia al contenido del PDF si es relevante.

    Claude puede hacer referencia tanto a contenido textual como visual cuando responde. Puedes mejorar aún más el rendimiento integrando la compatibilidad con PDF con:

    • Almacenamiento en caché de indicaciones: Para mejorar el rendimiento del análisis repetido.
    • Procesamiento por lotes: Para procesamiento de documentos de alto volumen.
    • Uso de herramientas: Para extraer información específica de documentos para usar como entradas de herramientas.

Estima tus costos

El recuento de tokens de un archivo PDF depende del texto total extraído del documento así como del número de páginas:

  • Costos de tokens de texto: Cada página típicamente usa 1,500-3,000 tokens por página dependiendo de la densidad del contenido. Se aplica el precio de API estándar sin tarifas adicionales de PDF.
  • Costos de tokens de imagen: Dado que cada página se convierte en una imagen, se aplican los mismos cálculos de costo basados en imágenes.

Puedes usar conteo de tokens para estimar costos para tus PDFs específicos.


Optimiza el procesamiento de PDF

Mejora el rendimiento

Sigue estas mejores prácticas para obtener resultados óptimos:

  • Coloca PDFs antes del texto en tus solicitudes
  • Usa fuentes estándar
  • Asegúrate de que el texto sea claro y legible
  • Rota las páginas a la orientación vertical correcta
  • Usa números de página lógicos (del visor de PDF) en indicaciones
  • Divide PDFs grandes en fragmentos cuando sea necesario
  • Habilita el almacenamiento en caché de indicaciones para análisis repetido

Escala tu implementación

Para procesamiento de alto volumen, considera estos enfoques:

Usa almacenamiento en caché de prompts

Almacena en caché PDFs para mejorar el rendimiento en consultas repetidas:

Procesa lotes de documentos

Usa la API de Message Batches para flujos de trabajo de alto volumen:

Próximos pasos

Prueba ejemplos de PDF

Explora ejemplos prácticos de procesamiento de PDF en la receta del cookbook.

  • Requiere que las citas estén habilitadas en la API Converse
  • client = anthropic.Anthropic()
    message = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {
                            "type": "url",
                            "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                        },
                    },
                    {"type": "text", "text": "What are the key findings in this document?"},
                ],
            }
        ],
    )
    
    print(message.content)
    import base64
    import httpx
    
    # First, load and encode the PDF
    pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
    pdf_data = base64.standard_b64encode(httpx.get(pdf_url).content).decode("utf-8")
    
    # Alternative: Load from a local file
    # with open("document.pdf", "rb") as f:
    #     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")
    
    # Send to Claude using base64 encoding
    client = anthropic.Anthropic()
    message = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {
                            "type": "base64",
                            "media_type": "application/pdf",
                            "data": pdf_data,
                        },
                    },
                    {"type": "text", "text": "What are the key findings in this document?"},
                ],
            }
        ],
    )
    
    print(message.content)
    client = anthropic.Anthropic()
    
    # Upload the PDF file
    with open("document.pdf", "rb") as f:
        file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))
    
    # Use the uploaded file in a message
    message = client.beta.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        betas=["files-api-2025-04-14"],
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {"type": "file", "file_id": file_upload.id},
                    },
                    {"type": "text", "text": "What are the key findings in this document?"},
                ],
            }
        ],
    )
    
    print(message.content)
    client = anthropic.Anthropic()
    # ...
    message = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "document",
                        "source": {
                            "type": "base64",
                            "media_type": "application/pdf",
                            "data": pdf_data,
                        },
                        "cache_control": {"type": "ephemeral"},
                    },
                    {"type": "text", "text": "Analyze this document."},
                ],
            }
        ],
    )
    client = anthropic.Anthropic()
    # ...
    message_batch = client.messages.batches.create(
        requests=[
            {
                "custom_id": "doc1",
                "params": {
                    "model": "claude-opus-4-7",
                    "max_tokens": 1024,
                    "messages": [
                        {
                            "role": "user",
                            "content": [
                                {
                                    "type": "document",
                                    "source": {
                                        "type": "base64",
                                        "media_type": "application/pdf",
                                        "data": pdf_data,
                                    },
                                },
                                {"type": "text", "text": "Summarize this document."},
                            ],
                        }
                    ],
                },
            }
        ]
    )
    Ver referencia de API

    Consulta la documentación completa de la API para soporte de PDF.