Loading...
    • Guía para desarrolladores
    • Referencia de API
    • MCP
    • Recursos
    • Notas de la versión
    Search...
    ⌘K
    Primeros pasos
    Introducción a ClaudeInicio rápido
    Modelos y precios
    Descripción general de modelosElegir un modeloNovedades en Claude 4.6Guía de migraciónModelos deprecadosPrecios
    Crear con Claude
    Descripción general de característicasUsar la API de MessagesManejar razones de paradaMejores prácticas de prompting
    Gestión de contexto
    Ventanas de contextoCompactaciónEdición de contexto
    Capacidades
    Almacenamiento en caché de promptsPensamiento extendidoPensamiento adaptativoEsfuerzoStreaming de MessagesProcesamiento por lotesCitasSoporte multilingüeConteo de tokensEmbeddingsVisiónSoporte de PDFAPI de FilesResultados de búsquedaSalidas estructuradas
    Herramientas
    Descripción generalCómo implementar el uso de herramientasStreaming de herramientas de grano finoHerramienta BashHerramienta de ejecución de códigoLlamada de herramientas programáticaHerramienta de uso de computadoraHerramienta de editor de textoHerramienta de búsqueda webHerramienta de búsqueda webHerramienta de memoriaHerramienta de búsqueda de herramientas
    Agent Skills
    Descripción generalInicio rápidoMejores prácticasSkills para empresasUsar Skills con la API
    Agent SDK
    Descripción generalInicio rápidoSDK de TypeScriptTypeScript V2 (vista previa)SDK de PythonGuía de migración
    MCP en la API
    Conector MCPServidores MCP remotos
    Claude en plataformas de terceros
    Amazon BedrockMicrosoft FoundryVertex AI
    Ingeniería de prompts
    Descripción generalGenerador de promptsUsar plantillas de promptsMejorador de promptsSer claro y directoUsar ejemplos (prompting multishot)Dejar que Claude piense (CoT)Usar etiquetas XMLDar a Claude un rol (prompts del sistema)Encadenar prompts complejosConsejos de contexto largoConsejos de pensamiento extendido
    Probar y evaluar
    Definir criterios de éxitoDesarrollar casos de pruebaUsar la herramienta de evaluaciónReducir latencia
    Fortalecer protecciones
    Reducir alucinacionesAumentar consistencia de salidaMitigar ataques de jailbreakRechazos de streamingReducir fuga de promptsMantener a Claude en personaje
    Administración y monitoreo
    Descripción general de Admin APIResidencia de datosEspacios de trabajoAPI de uso y costosAPI de Claude Code AnalyticsRetención de datos cero
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Capacidades

    Compatibilidad con PDF

    Procesa PDFs con Claude. Extrae texto, analiza gráficos y comprende contenido visual de tus documentos.

    Ahora puedes preguntarle a Claude sobre cualquier texto, imágenes, gráficos y tablas en los PDFs que proporciones. Algunos casos de uso de ejemplo:

    • Analizar informes financieros y comprender gráficos/tablas
    • Extraer información clave de documentos legales
    • Asistencia de traducción para documentos
    • Convertir información de documentos en formatos estructurados

    Antes de comenzar

    Verifica los requisitos de PDF

    Claude funciona con cualquier PDF estándar. Sin embargo, debes asegurar que el tamaño de tu solicitud cumpla con estos requisitos al usar compatibilidad con PDF:

    RequisitoLímite
    Tamaño máximo de solicitud32MB
    Páginas máximas por solicitud100
    FormatoPDF estándar (sin contraseñas/cifrado)

    Ten en cuenta que ambos límites se aplican a toda la carga útil de la solicitud, incluido cualquier otro contenido enviado junto con los PDFs.

    Dado que la compatibilidad con PDF se basa en las capacidades de visión de Claude, está sujeta a las mismas limitaciones y consideraciones que otras tareas de visión.

    Plataformas y modelos compatibles

    La compatibilidad con PDF actualmente se admite a través del acceso directo a la API y Google Vertex AI. Todos los modelos activos admiten procesamiento de PDF.

    La compatibilidad con PDF ahora está disponible en Amazon Bedrock con las siguientes consideraciones:

    Compatibilidad con PDF en Amazon Bedrock

    Al usar compatibilidad con PDF a través de la API Converse de Amazon Bedrock, hay dos modos distintos de procesamiento de documentos:

    Importante: Para acceder a las capacidades completas de comprensión visual de PDF de Claude en la API Converse, debes habilitar citas. Sin citas habilitadas, la API vuelve a la extracción de texto básica solamente. Obtén más información sobre trabajar con citas.

    Modos de procesamiento de documentos

    1. Converse Document Chat (Modo original - Solo extracción de texto)

      • Proporciona extracción de texto básica de PDFs
      • No puede analizar imágenes, gráficos o diseños visuales dentro de PDFs
      • Utiliza aproximadamente 1,000 tokens para un PDF de 3 páginas
      • Se utiliza automáticamente cuando las citas no están habilitadas
    2. Claude PDF Chat (Nuevo modo - Comprensión visual completa)

      • Proporciona análisis visual completo de PDFs
      • Puede entender y analizar gráficos, diagramas, imágenes y diseños visuales
      • Procesa cada página como texto e imagen para una comprensión integral
      • Utiliza aproximadamente 7,000 tokens para un PDF de 3 páginas
      • Requiere que las citas estén habilitadas en la API Converse

    Limitaciones clave

    • API Converse: El análisis visual de PDF requiere que las citas estén habilitadas. Actualmente no hay opción para usar análisis visual sin citas (a diferencia de la API InvokeModel).
    • API InvokeModel: Proporciona control total sobre el procesamiento de PDF sin citas forzadas.

    Problemas comunes

    Si los clientes reportan que Claude no ve imágenes o gráficos en sus PDFs al usar la API Converse, probablemente necesiten habilitar la bandera de citas. Sin ella, Converse vuelve a la extracción de texto básica solamente.

    Esta es una limitación conocida de la API Converse que estamos trabajando para resolver. Para aplicaciones que requieren análisis visual de PDF sin citas, considera usar la API InvokeModel en su lugar.

    Para archivos que no sean PDF como .csv, .xlsx, .docx, .md o .txt, consulta Trabajar con otros formatos de archivo.


    Procesa PDFs con Claude

    Envía tu primera solicitud de PDF

    Comencemos con un ejemplo simple usando la API de Mensajes. Puedes proporcionar PDFs a Claude de tres formas:

    1. Como referencia de URL a un PDF alojado en línea
    2. Como PDF codificado en base64 en bloques de contenido document
    3. Por un file_id de la API de Archivos

    Opción 1: Documento PDF basado en URL

    El enfoque más simple es hacer referencia a un PDF directamente desde una URL:

     curl https://api.anthropic.com/v1/messages \
       -H "content-type: application/json" \
       -H "x-api-key: $ANTHROPIC_API_KEY" \
       -H "anthropic-version: 2023-06-01" \
       -d '{
         "model": "claude-opus-4-6",
         "max_tokens": 1024,
         "messages": [{
             "role": "user",
             "content": [{
                 "type": "document",
                 "source": {
                     "type": "url",
                     "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
                 }
             },
             {
                 "type": "text",
                 "text": "What are the key findings in this document?"
             }]
         }]
     }'

    Opción 2: Documento PDF codificado en base64

    Si necesitas enviar PDFs desde tu sistema local o cuando una URL no está disponible:

    # Método 1: Obtener y codificar un PDF remoto
    curl -s "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf" | base64 | tr -d '\n' > pdf_base64.txt
    
    # Método 2: Codificar un archivo PDF local
    # base64 document.pdf | tr -d '\n' > pdf_base64.txt
    
    # Crear un archivo de solicitud JSON usando el contenido de pdf_base64.txt
    jq -n --rawfile PDF_BASE64 pdf_base64.txt '{
        "model": "claude-opus-4-6",
        "max_tokens": 1024,
        "messages": [{
            "role": "user",
            "content": [{
                "type": "document",
                "source": {
                    "type": "base64",
                    "media_type": "application/pdf",
                    "data": $PDF_BASE64
                }
            },
            {
                "type": "text",
                "text": "What are the key findings in this document?"
            }]
        }]
    }' > request.json
    
    # Enviar la solicitud de API usando el archivo JSON
    curl https://api.anthropic.com/v1/messages \
      -H "content-type: application/json" \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -d @request.json

    Opción 3: API de Archivos

    Para PDFs que usarás repetidamente, o cuando quieras evitar la sobrecarga de codificación, usa la API de Archivos:

    # Primero, carga tu PDF a la API de Archivos
    curl -X POST https://api.anthropic.com/v1/files \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "anthropic-beta: files-api-2025-04-14" \
      -F "[email protected]"
    
    # Luego usa el file_id devuelto en tu mensaje
    curl https://api.anthropic.com/v1/messages \
      -H "content-type: application/json" \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "anthropic-beta: files-api-2025-04-14" \
      -d '{
        "model": "claude-opus-4-6", 
        "max_tokens": 1024,
        "messages": [{
          "role": "user",
          "content": [{
            "type": "document",
            "source": {
              "type": "file",
              "file_id": "file_abc123"
            }
          },
          {
            "type": "text",
            "text": "What are the key findings in this document?"
          }]
        }]
      }'

    Cómo funciona la compatibilidad con PDF

    Cuando envías un PDF a Claude, ocurren los siguientes pasos:

    1. 1

      El sistema extrae el contenido del documento.

      • El sistema convierte cada página del documento en una imagen.
      • El texto de cada página se extrae y se proporciona junto con la imagen de cada página.
    2. 2

      Claude analiza tanto el texto como las imágenes para comprender mejor el documento.

      • Los documentos se proporcionan como una combinación de texto e imágenes para análisis.
      • Esto permite a los usuarios solicitar información sobre elementos visuales de un PDF, como gráficos, diagramas y otro contenido no textual.
    3. 3

      Claude responde, haciendo referencia al contenido del PDF si es relevante.

      Claude puede hacer referencia tanto a contenido textual como visual cuando responde. Puedes mejorar aún más el rendimiento integrando compatibilidad con PDF con:

      • Almacenamiento en caché de indicaciones: Para mejorar el rendimiento para análisis repetidos.
      • Procesamiento por lotes: Para procesamiento de documentos de alto volumen.
      • Uso de herramientas: Para extraer información específica de documentos para usar como entradas de herramientas.

    Estima tus costos

    El recuento de tokens de un archivo PDF depende del texto total extraído del documento así como del número de páginas:

    • Costos de tokens de texto: Cada página típicamente usa 1,500-3,000 tokens por página dependiendo de la densidad de contenido. Se aplica el precio estándar de la API sin tarifas adicionales de PDF.
    • Costos de tokens de imagen: Dado que cada página se convierte en una imagen, se aplican los mismos cálculos de costo basados en imagen.

    Puedes usar conteo de tokens para estimar costos para tus PDFs específicos.


    Optimiza el procesamiento de PDF

    Mejora el rendimiento

    Sigue estas mejores prácticas para obtener resultados óptimos:

    • Coloca PDFs antes del texto en tus solicitudes
    • Usa fuentes estándar
    • Asegúrate de que el texto sea claro y legible
    • Rota las páginas a la orientación vertical adecuada
    • Usa números de página lógicos (del visor de PDF) en indicaciones
    • Divide PDFs grandes en fragmentos cuando sea necesario
    • Habilita almacenamiento en caché de indicaciones para análisis repetidos

    Escala tu implementación

    Para el procesamiento de alto volumen, considera estos enfoques:

    Usa almacenamiento en caché de prompts

    Almacena en caché los PDFs para mejorar el rendimiento en consultas repetidas:

    # Crea un archivo de solicitud JSON usando el contenido de pdf_base64.txt
    jq -n --rawfile PDF_BASE64 pdf_base64.txt '{
        "model": "claude-opus-4-6",
        "max_tokens": 1024,
        "messages": [{
            "role": "user",
            "content": [{
                "type": "document",
                "source": {
                    "type": "base64",
                    "media_type": "application/pdf",
                    "data": $PDF_BASE64
                },
                "cache_control": {
                  "type": "ephemeral"
                }
            },
            {
                "type": "text",
                "text": "Which model has the highest human preference win rates across each use-case?"
            }]
        }]
    }' > request.json
    
    # Luego realiza la llamada a la API usando el archivo JSON
    curl https://api.anthropic.com/v1/messages \
      -H "content-type: application/json" \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -d @request.json

    Procesa lotes de documentos

    Usa la API de Message Batches para flujos de trabajo de alto volumen:

    # Crea un archivo de solicitud JSON usando el contenido de pdf_base64.txt
    jq -n --rawfile PDF_BASE64 pdf_base64.txt '
    {
      "requests": [
          {
              "custom_id": "my-first-request",
              "params": {
                  "model": "claude-opus-4-6",
                  "max_tokens": 1024,
                  "messages": [
                    {
                        "role": "user",
                        "content": [
                            {
                                "type": "document",
                                "source": {
                                    "type": "base64",
                                    "media_type": "application/pdf",
                                    "data": $PDF_BASE64
                                }
                            },
                            {
                                "type": "text",
                                "text": "Which model has the highest human preference win rates across each use-case?"
                            }
                        ]
                    }
                  ]
              }
          },
          {
              "custom_id": "my-second-request",
              "params": {
                  "model": "claude-opus-4-6",
                  "max_tokens": 1024,
                  "messages": [
                    {
                        "role": "user",
                        "content": [
                            {
                                "type": "document",
                                "source": {
                                    "type": "base64",
                                    "media_type": "application/pdf",
                                    "data": $PDF_BASE64
                                }
                            },
                            {
                                "type": "text",
                                "text": "Extract 5 key insights from this document."
                            }
                        ]
                    }
                  ]
              }
          }
      ]
    }
    ' > request.json
    
    # Luego realiza la llamada a la API usando el archivo JSON
    curl https://api.anthropic.com/v1/messages/batches \
      -H "content-type: application/json" \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -d @request.json

    Próximos pasos

    Prueba ejemplos de PDF

    Explora ejemplos prácticos de procesamiento de PDF en nuestra receta de cookbook.

    Ver referencia de API

    Consulta la documentación completa de la API para soporte de PDF.

    Was this page helpful?

    • Antes de comenzar
    • Verifica los requisitos de PDF
    • Plataformas y modelos compatibles
    • Compatibilidad con PDF en Amazon Bedrock
    • Procesa PDFs con Claude
    • Envía tu primera solicitud de PDF
    • Cómo funciona la compatibilidad con PDF
    • Estima tus costos
    • Optimiza el procesamiento de PDF
    • Mejora el rendimiento
    • Escala tu implementación
    • Próximos pasos