• Mensajes
  • Agentes gestionados
  • Administración
Search...
⌘K
Primeros pasos
Introducción a ClaudeInicio rápido
Desarrollar con Claude
Descripción general de funcionesUso de la API de MensajesMotivos de detención y respaldoRechazos y respaldoCrédito de respaldo
Capacidades del modelo
Pensamiento extendidoPensamiento adaptativoEsfuerzoPresupuestos de tareas (beta)Modo rápido (vista previa de investigación)Salidas estructuradasCitasStreaming de mensajesProcesamiento por lotesResultados de búsquedaStreaming de rechazosSoporte multilingüeEmbeddings
Herramientas
Descripción generalCómo funciona el uso de herramientasTutorial: Crear un agente que usa herramientasDefinir herramientasGestionar llamadas a herramientasUso de herramientas en paraleloTool Runner (SDK)Uso de herramientas estrictoUso de herramientas con almacenamiento en caché de promptsHerramientas de servidorSolución de problemasHerramienta de búsqueda webHerramienta de obtención webHerramienta de ejecución de códigoHerramienta de asesorHerramienta de memoriaHerramienta BashHerramienta de uso de computadoraHerramienta de editor de texto
Infraestructura de herramientas
Referencia de herramientasGestionar contexto de herramientasCombinaciones de herramientasBúsqueda de herramientasLlamadas programáticas a herramientasStreaming detallado de herramientas
Gestión de contexto
Ventanas de contextoCompactaciónEdición de contextoAlmacenamiento en caché de promptsMensajes del sistema a mitad de conversaciónCrear un modo de orquestaciónDiagnóstico de caché (beta)Conteo de tokens
Trabajar con archivos
API de archivosCompatibilidad con PDFImágenes y visión
Habilidades
Descripción generalInicio rápidoMejores prácticasHabilidades para empresasHabilidades en la API
MCP
Servidores MCP remotosConector MCP
Claude en plataformas en la nube
Amazon BedrockAmazon Bedrock (heredado)Claude Platform en AWSMicrosoft FoundryVertex AI
Log in
Compatibilidad con PDF
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Mensajes/Trabajar con archivos

Soporte para PDF

Procesa archivos PDF con Claude. Extrae texto, analiza gráficos y comprende el contenido visual de tus documentos.

Esta función es elegible para Zero Data Retention (ZDR). Cuando tu organización tiene un acuerdo de ZDR, los datos enviados a través de esta función no se almacenan después de que se devuelve la respuesta de la API.

Puedes preguntarle a Claude sobre cualquier texto, imagen, gráfico y tabla en los PDF que proporciones. Algunos casos de uso de ejemplo:

  • Analizar informes financieros y comprender gráficos/tablas
  • Extraer información clave de documentos legales
  • Asistencia de traducción para documentos
  • Convertir información de documentos en formatos estructurados

Antes de comenzar

Verifica los requisitos de PDF

Claude funciona con cualquier PDF estándar. Asegúrate de que el tamaño de tu solicitud cumpla con estos requisitos:

RequisitoLímite
Tamaño máximo de solicitud32 MB (varía según la plataforma)
Máximo de páginas por solicitud600 (100 para modelos con una ventana de contexto de 200k tokens)
FormatoPDF estándar (sin contraseñas/cifrado)

Ambos límites aplican a toda la carga útil de la solicitud, incluido cualquier otro contenido enviado junto con los PDF. Para PDF grandes, considera cargarlos con la Files API y referenciarlos mediante file_id para mantener pequeñas las cargas útiles de las solicitudes.

Los PDF densos (muchas páginas con fuente pequeña, tablas complejas o gráficos pesados) pueden llenar la "context window" (ventana de contexto) antes de alcanzar el límite de páginas. Las solicitudes con PDF grandes también pueden fallar antes de alcanzar el límite de páginas, incluso al usar la Files API. Intenta dividir el documento en secciones; para archivos grandes, dado que cada página se procesa como una imagen, reducir la resolución de las imágenes incrustadas también puede ayudar.

Dado que el soporte para PDF depende de las capacidades de visión de Claude, está sujeto a las mismas limitaciones y consideraciones que otras tareas de visión.

Plataformas y modelos compatibles

El soporte para PDF está disponible en la API de Claude, Claude Platform en AWS, Amazon Bedrock (consulta Soporte para PDF en Amazon Bedrock), Vertex AI y Microsoft Foundry. Todos los modelos activos admiten el procesamiento de PDF.

Soporte para PDF en Amazon Bedrock

Al usar el soporte para PDF a través de la Converse API de Bedrock, existen dos modos distintos de procesamiento de documentos:

Importante: Para acceder a las capacidades completas de comprensión visual de PDF de Claude en la Converse API, debes habilitar las citas. Sin las citas habilitadas, la API recurre únicamente a la extracción básica de texto. Obtén más información sobre cómo trabajar con citas.

Modos de procesamiento de documentos

  1. Converse Document Chat (Modo original - Solo extracción de texto)

    • Proporciona extracción básica de texto de los PDF
    • No puede analizar imágenes, gráficos ni diseños visuales dentro de los PDF
    • Usa aproximadamente 1,000 tokens para un PDF de 3 páginas
    • Se usa automáticamente cuando las citas no están habilitadas
  2. Claude PDF Chat (Modo nuevo - Comprensión visual completa)

    • Proporciona análisis visual completo de los PDF
    • Puede comprender y analizar gráficos, diagramas, imágenes y diseños visuales
    • Procesa cada página como texto e imagen para una comprensión integral
    • Usa aproximadamente 7,000 tokens para un PDF de 3 páginas
    • Requiere que las citas estén habilitadas en la Converse API

Limitaciones clave

  • Converse API: El análisis visual de PDF requiere que las citas estén habilitadas. Actualmente no hay opción para usar el análisis visual sin citas (a diferencia de la InvokeModel API).
  • InvokeModel API: Proporciona control total sobre el procesamiento de PDF sin citas forzadas.

Problemas comunes

Si Claude no está viendo imágenes o gráficos en tus PDF al usar la Converse API, probablemente necesites habilitar el indicador de citas. Sin él, Converse recurre únicamente a la extracción básica de texto.

Esta es una restricción conocida de la Converse API. Para aplicaciones que requieren análisis visual de PDF sin citas, considera usar la InvokeModel API en su lugar.

Para archivos que no son PDF, como archivos .csv, .xlsx, .docx, .md o .txt, consulta Trabajar con otros formatos de archivo.


Procesa PDF con Claude

Envía tu primera solicitud de PDF

Comencemos con un ejemplo simple usando la Messages API. Puedes proporcionar PDF a Claude de tres maneras:

  1. Como una referencia URL a un PDF alojado en línea
  2. Como un PDF codificado en base64 en bloques de contenido document
  3. Mediante un file_id de la Files API

En Amazon Bedrock y Vertex AI, actualmente solo están disponibles las fuentes codificadas en base64.

Opción 1: Documento PDF basado en URL

El enfoque más simple es referenciar un PDF directamente desde una URL:

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "url",
                        "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opción 2: Documento PDF codificado en base64

Si necesitas enviar PDF desde tu sistema local o cuando no hay una URL disponible:

import base64
import httpx

# Primero, carga y codifica el PDF
pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
pdf_data = base64.standard_b64encode(httpx.get(pdf_url).content).decode("utf-8")

# Alternativa: cargar desde un archivo local
# with open("document.pdf", "rb") as f:
#     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")

# Envíalo a Claude usando codificación base64
client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opción 3: Files API

Para PDF que usarás repetidamente, o cuando quieras evitar la sobrecarga de codificación, usa la Files API:

client = anthropic.Anthropic()

# Sube el archivo PDF
with open("document.pdf", "rb") as f:
    file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))

# Usa el archivo subido en un mensaje
message = client.beta.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    betas=["files-api-2025-04-14"],
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {"type": "file", "file_id": file_upload.id},
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Cómo funciona el soporte para PDF

Cuando envías un PDF a Claude, ocurren los siguientes pasos:

  1. 1

    El sistema extrae el contenido del documento.

    • El sistema convierte cada página del documento en una imagen.
    • El texto de cada página se extrae y se proporciona junto con la imagen de cada página.
  2. 2

    Claude analiza tanto el texto como las imágenes para comprender mejor el documento.

    • Los documentos se proporcionan como una combinación de texto e imágenes para su análisis.
    • Esto permite a los usuarios solicitar información sobre elementos visuales de un PDF, como gráficos, diagramas y otro contenido no textual.
  3. 3

    Claude responde, haciendo referencia al contenido del PDF si es relevante.

    Claude puede hacer referencia tanto al contenido textual como visual cuando responde. Puedes mejorar aún más el rendimiento integrando el soporte para PDF con:

    • Almacenamiento en caché de prompts: Para mejorar el rendimiento en análisis repetidos.
    • Procesamiento por lotes: Para procesamiento de documentos de alto volumen.
    • Uso de herramientas: Para extraer información específica de documentos y usarla como entradas de herramientas.

Estima tus costos

El recuento de tokens de un archivo PDF depende del texto total extraído del documento, así como del número de páginas:

  • Costos de tokens de texto: Cada página generalmente usa entre 1,500 y 3,000 tokens por página, dependiendo de la densidad del contenido. Se aplican los precios estándar de la API sin tarifas adicionales por PDF.
  • Costos de tokens de imagen: Dado que cada página se convierte en una imagen, se aplican los mismos cálculos de costos basados en imágenes.

Puedes usar el conteo de tokens para estimar los costos de tus PDF específicos.


Optimiza el procesamiento de PDF

Mejora el rendimiento

Sigue estas mejores prácticas para obtener resultados óptimos:

  • Coloca los PDF antes del texto en tus solicitudes
  • Usa fuentes estándar
  • Asegúrate de que el texto sea claro y legible
  • Rota las páginas a la orientación vertical correcta
  • Usa números de página lógicos (del visor de PDF) en los prompts
  • Divide los PDF grandes en fragmentos cuando sea necesario
  • Habilita el almacenamiento en caché de prompts para análisis repetidos

Escala tu implementación

Para procesamiento de alto volumen, considera estos enfoques:

Usa el almacenamiento en caché de prompts

Almacena en caché los PDF para mejorar el rendimiento en consultas repetidas:

client = anthropic.Anthropic()
# ...
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                    "cache_control": {"type": "ephemeral"},
                },
                {"type": "text", "text": "Analyze this document."},
            ],
        }
    ],
)

Procesa lotes de documentos

Usa la Message Batches API para flujos de trabajo de alto volumen:

client = anthropic.Anthropic()
# ...
message_batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": "doc1",
            "params": {
                "model": "claude-opus-4-8",
                "max_tokens": 1024,
                "messages": [
                    {
                        "role": "user",
                        "content": [
                            {
                                "type": "document",
                                "source": {
                                    "type": "base64",
                                    "media_type": "application/pdf",
                                    "data": pdf_data,
                                },
                            },
                            {"type": "text", "text": "Summarize this document."},
                        ],
                    }
                ],
            },
        }
    ]
)

Próximos pasos

Prueba ejemplos de PDF

Explora ejemplos prácticos de procesamiento de PDF en la receta del cookbook.

Ver referencia de la API

Consulta la documentación completa de la API para el soporte de PDF.

Was this page helpful?

  • Antes de comenzar
  • Verifica los requisitos de PDF
  • Plataformas y modelos compatibles
  • Soporte para PDF en Amazon Bedrock
  • Procesa PDF con Claude
  • Envía tu primera solicitud de PDF
  • Cómo funciona el soporte para PDF
  • Estima tus costos
  • Optimiza el procesamiento de PDF
  • Mejora el rendimiento
  • Escala tu implementación
  • Próximos pasos