Loading...
    • Guía para desarrolladores
    • Referencia de API
    • MCP
    • Recursos
    • Notas de la versión
    Search...
    ⌘K
    Primeros pasos
    Introducción a ClaudeInicio rápido
    Modelos y precios
    Descripción general de modelosElegir un modeloNovedades en Claude 4.6Guía de migraciónModelos deprecadosPrecios
    Crear con Claude
    Descripción general de característicasUsar la API de MessagesManejar razones de paradaMejores prácticas de prompting
    Capacidades del modelo
    Extended thinkingAdaptive thinkingEsfuerzoModo rápido (vista previa de investigación)Salidas estructuradasCitasStreaming de MessagesProcesamiento por lotesSoporte de PDFResultados de búsquedaSoporte multilingüeEmbeddingsVisión
    Herramientas
    Descripción generalCómo implementar el uso de herramientasHerramienta de búsqueda webHerramienta de obtención webHerramienta de ejecución de códigoHerramienta de memoriaHerramienta BashHerramienta de uso de computadoraHerramienta de editor de texto
    Infraestructura de herramientas
    Búsqueda de herramientasLlamada de herramientas programáticaStreaming de herramientas de grano fino
    Gestión de contexto
    Ventanas de contextoCompactaciónEdición de contextoAlmacenamiento en caché de promptsConteo de tokens
    Archivos y activos
    API de archivos
    Agent Skills
    Descripción generalInicio rápidoMejores prácticasSkills para empresasUsar Skills con la API
    Agent SDK
    Descripción generalInicio rápidoTypeScript SDKTypeScript V2 (vista previa)Python SDKGuía de migración
    MCP en la API
    Conector MCPServidores MCP remotos
    Claude en plataformas de terceros
    Amazon BedrockMicrosoft FoundryVertex AI
    Ingeniería de prompts
    Descripción generalGenerador de promptsUsar plantillas de promptsMejorador de promptsSer claro y directoUsar ejemplos (prompting multishot)Dejar que Claude piense (CoT)Usar etiquetas XMLDar a Claude un rol (prompts del sistema)Encadenar prompts complejosConsejos de contexto largoConsejos de extended thinking
    Probar y evaluar
    Definir criterios de éxitoDesarrollar casos de pruebaUsar la herramienta de evaluaciónReducir latencia
    Fortalecer guardarraíles
    Reducir alucinacionesAumentar consistencia de salidaMitigar jailbreaksRechazos de streamingReducir fuga de promptsMantener a Claude en personaje
    Administración y monitoreo
    Descripción general de Admin APIResidencia de datosEspacios de trabajoAPI de uso y costosAPI de análisis de Claude CodeRetención de datos cero
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Herramientas

    Herramienta de obtención web

    La herramienta de obtención web permite a Claude recuperar contenido completo de páginas web y documentos PDF especificados.

    Was this page helpful?

    • Modelos compatibles
    • Cómo funciona la obtención web
    • Filtrado dinámico con Opus 4.6 y Sonnet 4.6
    • Cómo usar la obtención web
    • Definición de herramienta
    • Respuesta
    • Validación de URL
    • Búsqueda y obtención combinadas
    • Almacenamiento en caché de prompts
    • Transmisión
    • Solicitudes por lotes
    • Uso y precios

    La herramienta de obtención web permite a Claude recuperar contenido completo de páginas web y documentos PDF especificados.

    La última versión de la herramienta de obtención web (web_fetch_20260209) admite filtrado dinámico con Claude Opus 4.6 y Sonnet 4.6. Claude puede escribir y ejecutar código para filtrar el contenido obtenido antes de que llegue a la ventana de contexto, manteniendo solo la información relevante y descartando el resto. Esto reduce el consumo de tokens mientras se mantiene la calidad de la respuesta. La versión anterior de la herramienta (web_fetch_20250910) sigue disponible sin filtrado dinámico.

    Por favor, utiliza este formulario para proporcionar comentarios sobre la calidad de las respuestas del modelo, la API en sí o la calidad de la documentación.

    This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

    Habilitar la herramienta de obtención web en entornos donde Claude procesa entrada no confiable junto con datos sensibles presenta riesgos de exfiltración de datos. Recomendamos usar esta herramienta solo en entornos confiables o cuando se manejan datos no sensibles.

    Para minimizar los riesgos de exfiltración, Claude no puede construir dinámicamente URLs. Claude solo puede obtener URLs que hayan sido proporcionadas explícitamente por el usuario o que provengan de resultados anteriores de búsqueda web u obtención web. Sin embargo, todavía existe un riesgo residual que debe considerarse cuidadosamente al usar esta herramienta.

    Si la exfiltración de datos es una preocupación, considera:

    • Deshabilitar completamente la herramienta de obtención web
    • Usar el parámetro max_uses para limitar el número de solicitudes
    • Usar el parámetro allowed_domains para restringir a dominios seguros conocidos

    Modelos compatibles

    La obtención web está disponible en:

    • Claude Opus 4.6 (claude-opus-4-6)
    • Claude Opus 4.5 (claude-opus-4-5-20251101)
    • Claude Opus 4.1 (claude-opus-4-1-20250805)
    • Claude Opus 4 (claude-opus-4-20250514)
    • Claude Sonnet 4.6 (claude-sonnet-4-6)
    • Claude Sonnet 4.5 (claude-sonnet-4-5-20250929)
    • Claude Sonnet 4 (claude-sonnet-4-20250514)
    • Claude Sonnet 3.7 (deprecated) (claude-3-7-sonnet-20250219)

    Cómo funciona la obtención web

    Cuando añades la herramienta de obtención web a tu solicitud de API:

    1. Claude decide cuándo obtener contenido basándose en el prompt y las URLs disponibles.
    2. La API recupera el contenido de texto completo de la URL especificada.
    3. Para PDFs, se realiza extracción automática de texto.
    4. Claude analiza el contenido obtenido y proporciona una respuesta con citas opcionales.

    La herramienta de obtención web actualmente no admite sitios web renderizados dinámicamente a través de Javascript.

    Filtrado dinámico con Opus 4.6 y Sonnet 4.6

    Obtener páginas web y PDFs completos puede consumir rápidamente tokens, especialmente cuando solo se necesita información específica de documentos grandes. Con la versión de herramienta web_fetch_20260209, Claude puede escribir y ejecutar código para filtrar el contenido obtenido antes de cargarlo en contexto.

    Este filtrado dinámico es particularmente útil para:

    • Extraer secciones específicas de documentos largos
    • Procesar datos estructurados de páginas web
    • Filtrar información relevante de PDFs
    • Reducir costos de tokens al trabajar con documentos grandes

    El filtrado dinámico requiere que la herramienta de ejecución de código esté habilitada. La herramienta de obtención web (con y sin filtrado dinámico) está disponible en la API de Claude y Microsoft Azure.

    Para habilitar el filtrado dinámico, usa la versión de herramienta web_fetch_20260209 con el encabezado beta code-execution-web-tools-2026-02-09:

    Cómo usar la obtención web

    Proporciona la herramienta de obtención web en tu solicitud de API:

    Definición de herramienta

    La herramienta de obtención web admite los siguientes parámetros:

    JSON
    {
      "type": "web_fetch_20250910",
      "name": "web_fetch",
    
      // Opcional: Limitar el número de obtenciones por solicitud
      "max_uses": 10,
    
      // Opcional: Solo obtener de estos dominios
      "allowed_domains": ["example.com", "docs.example.com"],
    
      // Opcional: Nunca obtener de estos dominios
      "blocked_domains": ["private.example.com"],
    
      // Opcional: Habilitar citas para contenido obtenido
      "citations": {
        "enabled": true
      },
    
      // Opcional: Longitud máxima de contenido en tokens
      "max_content_tokens": 100000
    }

    Máximo de usos

    El parámetro max_uses limita el número de obtenciones web realizadas. Si Claude intenta más obtenciones de las permitidas, el web_fetch_tool_result será un error con el código de error max_uses_exceeded. Actualmente no hay límite predeterminado.

    Filtrado de dominios

    Al usar filtros de dominio:

    • Los dominios no deben incluir el esquema HTTP/HTTPS (usa example.com en lugar de https://example.com)
    • Los subdominios se incluyen automáticamente (example.com cubre docs.example.com)
    • Se admiten subrutas (example.com/blog)
    • Puedes usar allowed_domains o blocked_domains, pero no ambos en la misma solicitud.

    Ten en cuenta que los caracteres Unicode en nombres de dominio pueden crear vulnerabilidades de seguridad a través de ataques de homografía, donde caracteres visualmente similares de diferentes scripts pueden eludir filtros de dominio. Por ejemplo, аmazon.com (usando la 'а' cirílica) puede parecer idéntico a amazon.com pero representa un dominio diferente.

    Al configurar listas de permitidos/bloqueados de dominios:

    • Usa nombres de dominio solo ASCII cuando sea posible
    • Ten en cuenta que los analizadores de URL pueden manejar la normalización Unicode de manera diferente
    • Prueba tus filtros de dominio con variaciones potenciales de homografía
    • Audita regularmente tus configuraciones de dominio para caracteres Unicode sospechosos

    Límites de contenido

    El parámetro max_content_tokens limita la cantidad de contenido que se incluirá en el contexto. Si el contenido obtenido excede este límite, se truncará. Esto ayuda a controlar el uso de tokens al obtener documentos grandes.

    El límite del parámetro max_content_tokens es aproximado. El número real de tokens de entrada utilizados puede variar ligeramente.

    Citas

    A diferencia de la búsqueda web donde las citas siempre están habilitadas, las citas son opcionales para la obtención web. Establece "citations": {"enabled": true} para permitir que Claude cite pasajes específicos de documentos obtenidos.

    Al mostrar salidas de API directamente a usuarios finales, las citas deben incluirse a la fuente original. Si realizas modificaciones en las salidas de API, incluyendo reprocesamiento y/o combinación con tu propio material antes de mostrarlas a usuarios finales, muestra citas según corresponda basándote en consulta con tu equipo legal.

    Respuesta

    Aquí hay una estructura de respuesta de ejemplo:

    {
      "role": "assistant",
      "content": [
        // 1. Decisión de Claude de obtener
        {
          "type": "text",
          "text": "I'll fetch the content from the article to analyze it."
        },
        // 2. La solicitud de obtención
        {
          "type": "server_tool_use",
          "id": "srvtoolu_01234567890abcdef",
          "name": "web_fetch",
          "input": {
            "url": "https://example.com/article"
          }
        },
        // 3. Resultados de obtención
        {
          "type": "web_fetch_tool_result",
          "tool_use_id": "srvtoolu_01234567890abcdef",
          "content": {
            "type": "web_fetch_result",
            "url": "https://example.com/article",
            "content": {
              "type": "document",
              "source": {
                "type": "text",
                "media_type": "text/plain",
                "data": "Full text content of the article..."
              },
              "title": "Article Title",
              "citations": {"enabled": true}
            },
            "retrieved_at": "2025-08-25T10:30:00Z"
          }
        },
        // 4. Análisis de Claude con citas (si está habilitado)
        {
          "text": "Based on the article, ",
          "type": "text"
        },
        {
          "text": "the main argument presented is that artificial intelligence will transform healthcare",
          "type": "text",
          "citations": [
            {
              "type": "char_location",
              "document_index": 0,
              "document_title": "Article Title",
              "start_char_index": 1234,
              "end_char_index": 1456,
              "cited_text": "Artificial intelligence is poised to revolutionize healthcare delivery..."
            }
          ]
        }
      ],
      "id": "msg_a930390d3a",
      "usage": {
        "input_tokens": 25039,
        "output_tokens": 931,
        "server_tool_use": {
          "web_fetch_requests": 1
        }
      },
      "stop_reason": "end_turn"
    }

    Resultados de obtención

    Los resultados de obtención incluyen:

    • url: La URL que fue obtenida
    • content: Un bloque de documento que contiene el contenido obtenido
    • retrieved_at: Marca de tiempo de cuándo se recuperó el contenido

    La herramienta de obtención web almacena en caché los resultados para mejorar el rendimiento y reducir solicitudes redundantes. Esto significa que el contenido devuelto puede no ser siempre la versión más reciente disponible en la URL. El comportamiento del caché se gestiona automáticamente y puede cambiar con el tiempo para optimizar diferentes tipos de contenido y patrones de uso.

    Para documentos PDF, el contenido se devolverá como datos codificados en base64:

    {
      "type": "web_fetch_tool_result",
      "tool_use_id": "srvtoolu_02",
      "content": {
        "type": "web_fetch_result",
        "url": "https://example.com/paper.pdf",
        "content": {
          "type": "document",
          "source": {
            "type": "base64",
            "media_type": "application/pdf",
            "data": "JVBERi0xLjQKJcOkw7zDtsOfCjIgMCBvYmo..."
          },
          "citations": {"enabled": true}
        },
        "retrieved_at": "2025-08-25T10:30:02Z"
      }
    }

    Errores

    Cuando la herramienta de obtención web encuentra un error, la API de Claude devuelve una respuesta 200 (éxito) con el error representado en el cuerpo de la respuesta:

    {
      "type": "web_fetch_tool_result",
      "tool_use_id": "srvtoolu_a93jad",
      "content": {
        "type": "web_fetch_tool_error",
        "error_code": "url_not_accessible"
      }
    }

    Estos son los códigos de error posibles:

    • invalid_input: Formato de URL inválido
    • url_too_long: La URL excede la longitud máxima (250 caracteres)
    • url_not_allowed: URL bloqueada por reglas de filtrado de dominio y restricciones del modelo
    • url_not_accessible: Error al obtener contenido (error HTTP)
    • too_many_requests: Límite de velocidad excedido
    • unsupported_content_type: Tipo de contenido no admitido (solo texto y PDF)
    • max_uses_exceeded: Máximo de usos de herramienta de obtención web excedido
    • unavailable: Ocurrió un error interno

    Validación de URL

    Por razones de seguridad, la herramienta de obtención web solo puede obtener URLs que hayan aparecido previamente en el contexto de la conversación. Esto incluye:

    • URLs en mensajes de usuario
    • URLs en resultados de herramientas del lado del cliente
    • URLs de resultados anteriores de búsqueda web u obtención web

    La herramienta no puede obtener URLs arbitrarias que Claude genere o URLs de herramientas de servidor basadas en contenedor (Ejecución de Código, Bash, etc.).

    Búsqueda y obtención combinadas

    La obtención web funciona sin problemas con la búsqueda web para recopilación de información integral:

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=4096,
        messages=[
            {
                "role": "user",
                "content": "Find recent articles about quantum computing and analyze the most relevant one in detail",
            }
        ],
        tools=[
            {"type": "web_search_20250305", "name": "web_search", "max_uses": 3},
            {
                "type": "web_fetch_20250910",
                "name": "web_fetch",
                "max_uses": 5,
                "citations": {"enabled": True},
            },
        ],
    )

    En este flujo de trabajo, Claude:

    1. Usará búsqueda web para encontrar artículos relevantes
    2. Seleccionará los resultados más prometedores
    3. Usará obtención web para recuperar contenido completo
    4. Proporcionará análisis detallado con citas

    Almacenamiento en caché de prompts

    La obtención web funciona con almacenamiento en caché de prompts. Para habilitar el almacenamiento en caché de prompts, añade puntos de ruptura cache_control en tu solicitud. Los resultados de obtención en caché pueden reutilizarse en turnos de conversación.

    import anthropic
    
    client = anthropic.Anthropic()
    
    # Primera solicitud con obtención web
    messages = [
        {
            "role": "user",
            "content": "Analyze this research paper: https://arxiv.org/abs/2024.12345",
        }
    ]
    
    response1 = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=1024,
        messages=messages,
        tools=[{"type": "web_fetch_20250910", "name": "web_fetch"}],
    )
    
    # Añadir respuesta de Claude a la conversación
    messages.append({"role": "assistant", "content": response1.content})
    
    # Segunda solicitud con punto de ruptura de caché
    messages.append(
        {
            "role": "user",
            "content": "What methodology does the paper use?",
            "cache_control": {"type": "ephemeral"},
        }
    )
    
    response2 = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=1024,
        messages=messages,
        tools=[{"type": "web_fetch_20250910", "name": "web_fetch"}],
    )
    
    # La segunda respuesta se beneficia de los resultados de obtención en caché
    print(f"Cache read tokens: {response2.usage.get('cache_read_input_tokens', 0)}")

    Transmisión

    Con la transmisión habilitada, los eventos de obtención son parte de la transmisión con una pausa durante la recuperación de contenido:

    event: message_start
    data: {"type": "message_start", "message": {"id": "msg_abc123", "type": "message"}}
    
    event: content_block_start
    data: {"type": "content_block_start", "index": 0, "content_block": {"type": "text", "text": ""}}
    
    // Decisión de Claude de obtener
    
    event: content_block_start
    data: {"type": "content_block_start", "index": 1, "content_block": {"type": "server_tool_use", "id": "srvtoolu_xyz789", "name": "web_fetch"}}
    
    // URL de obtención transmitida
    event: content_block_delta
    data: {"type": "content_block_delta", "index": 1, "delta": {"type": "input_json_delta", "partial_json": "{\"url\":\"https://example.com/article\"}"}}
    
    // Pausa mientras se ejecuta la obtención
    
    // Resultados de obtención transmitidos
    event: content_block_start
    data: {"type": "content_block_start", "index": 2, "content_block": {"type": "web_fetch_tool_result", "tool_use_id": "srvtoolu_xyz789", "content": {"type": "web_fetch_result", "url": "https://example.com/article", "content": {"type": "document", "source": {"type": "text", "media_type": "text/plain", "data": "Article content..."}}}}}
    
    // La respuesta de Claude continúa...

    Solicitudes por lotes

    Puedes incluir la herramienta de obtención web en la API de Lotes de Mensajes. Las llamadas de herramienta de obtención web a través de la API de Lotes de Mensajes se cotizan igual que las solicitudes de API de Mensajes regulares.

    Uso y precios

    Web fetch usage has no additional charges beyond standard token costs:

    "usage": {
      "input_tokens": 25039,
      "output_tokens": 931,
      "cache_read_input_tokens": 0,
      "cache_creation_input_tokens": 0,
      "server_tool_use": {
        "web_fetch_requests": 1
      }
    }

    The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.

    To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.

    Example token usage for typical content:

    • Average web page (10 kB): ~2,500 tokens
    • Large documentation page (100 kB): ~25,000 tokens
    • Research paper PDF (500 kB): ~125,000 tokens
  1. Claude Haiku 4.5 (claude-haiku-4-5-20251001)
  2. Claude Haiku 3.5 (deprecated) (claude-3-5-haiku-latest)
  3. curl https://api.anthropic.com/v1/messages \
        --header "x-api-key: $ANTHROPIC_API_KEY" \
        --header "anthropic-version: 2023-06-01" \
        --header "anthropic-beta: code-execution-web-tools-2026-02-09" \
        --header "content-type: application/json" \
        --data '{
            "model": "claude-opus-4-6",
            "max_tokens": 4096,
            "messages": [
                {
                    "role": "user",
                    "content": "Fetch the content at https://example.com/research-paper and extract the key findings."
                }
            ],
            "tools": [{
                "type": "web_fetch_20260209",
                "name": "web_fetch"
            }]
        }'
    curl https://api.anthropic.com/v1/messages \
        --header "x-api-key: $ANTHROPIC_API_KEY" \
        --header "anthropic-version: 2023-06-01" \
        --header "content-type: application/json" \
        --data '{
            "model": "claude-opus-4-6",
            "max_tokens": 1024,
            "messages": [
                {
                    "role": "user",
                    "content": "Please analyze the content at https://example.com/article"
                }
            ],
            "tools": [{
                "type": "web_fetch_20250910",
                "name": "web_fetch",
                "max_uses": 5
            }]
        }'