La herramienta de búsqueda web proporciona a Claude acceso directo a contenido web en tiempo real, permitiéndole responder preguntas con información actualizada más allá de su fecha de corte de conocimiento. Claude cita automáticamente las fuentes de los resultados de búsqueda como parte de su respuesta.
La última versión de la herramienta de búsqueda web (web_search_20260209) admite filtrado dinámico con Claude Opus 4.6 y Sonnet 4.6. Claude puede escribir y ejecutar código para filtrar los resultados de búsqueda antes de que lleguen a la ventana de contexto, manteniendo solo la información relevante y descartando el resto. Esto conduce a respuestas más precisas mientras se reduce el consumo de tokens. La versión anterior de la herramienta (web_search_20250305) sigue disponible sin filtrado dinámico.
This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
La búsqueda web está disponible en:
claude-opus-4-6)claude-opus-4-5-20251101)claude-opus-4-1-20250805)claude-opus-4-20250514)claude-sonnet-4-6)claude-sonnet-4-5-20250929)claude-sonnet-4-20250514)claude-3-7-sonnet-20250219)claude-haiku-4-5-20251001)claude-3-5-haiku-latest)Cuando añades la herramienta de búsqueda web a tu solicitud de API:
La búsqueda web es una tarea que consume muchos tokens. Con la búsqueda web básica, Claude necesita extraer los resultados de búsqueda al contexto, obtener HTML completo de múltiples sitios web y razonar sobre todo antes de llegar a una respuesta. A menudo, gran parte de este contenido es irrelevante, lo que puede degradar la calidad de la respuesta.
Con la versión de herramienta web_search_20260209, Claude puede escribir y ejecutar código para post-procesar los resultados de consulta. En lugar de razonar sobre archivos HTML completos, Claude filtra dinámicamente los resultados de búsqueda antes de cargarlos en el contexto, manteniendo solo lo relevante y descartando el resto.
El filtrado dinámico es particularmente efectivo para:
El filtrado dinámico requiere que la herramienta de ejecución de código esté habilitada. La herramienta de búsqueda web mejorada está disponible en la API de Claude y Microsoft Azure. En Google Vertex AI, la herramienta de búsqueda web básica (sin filtrado dinámico) está disponible.
Para habilitar el filtrado dinámico, usa la versión de herramienta web_search_20260209 con el encabezado beta code-execution-web-tools-2026-02-09:
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "anthropic-beta: code-execution-web-tools-2026-02-09" \
--header "content-type: application/json" \
--data '{
"model": "claude-opus-4-6",
"max_tokens": 4096,
"messages": [
{
"role": "user",
"content": "Search for the current prices of AAPL and GOOGL, then calculate which has a better P/E ratio."
}
],
"tools": [{
"type": "web_search_20260209",
"name": "web_search"
}]
}'El administrador de tu organización debe habilitar la búsqueda web en Console.
Proporciona la herramienta de búsqueda web en tu solicitud de API:
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-opus-4-6",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": "What is the weather in NYC?"
}
],
"tools": [{
"type": "web_search_20250305",
"name": "web_search",
"max_uses": 5
}]
}'La herramienta de búsqueda web admite los siguientes parámetros:
{
"type": "web_search_20250305",
"name": "web_search",
// Opcional: Limita el número de búsquedas por solicitud
"max_uses": 5,
// Opcional: Solo incluye resultados de estos dominios
"allowed_domains": ["example.com", "trusteddomain.org"],
// Opcional: Nunca incluyas resultados de estos dominios
"blocked_domains": ["untrustedsource.com"],
// Opcional: Localiza los resultados de búsqueda
"user_location": {
"type": "approximate",
"city": "San Francisco",
"region": "California",
"country": "US",
"timezone": "America/Los_Angeles"
}
}El parámetro max_uses limita el número de búsquedas realizadas. Si Claude intenta más búsquedas de las permitidas, el web_search_tool_result será un error con el código de error max_uses_exceeded.
Cuando uses filtros de dominio:
example.com en lugar de https://example.com)example.com cubre docs.example.com)docs.example.com devuelve solo resultados de ese subdominio, no de example.com o api.example.com)example.com/blog coincide con example.com/blog/post-1)allowed_domains o blocked_domains, pero no ambos en la misma solicitud.Soporte de comodín:
*) por entrada de dominio, y debe aparecer después de la parte del dominio (en la ruta)example.com/*, example.com/*/articles*.example.com, ex*.com, example.com/*/news/*Los formatos de dominio inválidos devolverán un error de herramienta invalid_tool_input.
Las restricciones de dominio a nivel de solicitud deben ser compatibles con las restricciones de dominio a nivel de organización configuradas en la Console. Los dominios a nivel de solicitud solo pueden restringir aún más los dominios, no anular ni expandir más allá de la lista a nivel de organización. Si tu solicitud incluye dominios que entran en conflicto con la configuración de la organización, la API devolverá un error de validación.
El parámetro user_location te permite localizar los resultados de búsqueda según la ubicación del usuario.
type: El tipo de ubicación (debe ser approximate)city: El nombre de la ciudadregion: La región o estadocountry: El paístimezone: El ID de zona horaria IANA.Aquí hay una estructura de respuesta de ejemplo:
{
"role": "assistant",
"content": [
// 1. Decisión de Claude de buscar
{
"type": "text",
"text": "I'll search for when Claude Shannon was born."
},
// 2. La consulta de búsqueda utilizada
{
"type": "server_tool_use",
"id": "srvtoolu_01WYG3ziw53XMcoyKL4XcZmE",
"name": "web_search",
"input": {
"query": "claude shannon birth date"
}
},
// 3. Resultados de búsqueda
{
"type": "web_search_tool_result",
"tool_use_id": "srvtoolu_01WYG3ziw53XMcoyKL4XcZmE",
"content": [
{
"type": "web_search_result",
"url": "https://en.wikipedia.org/wiki/Claude_Shannon",
"title": "Claude Shannon - Wikipedia",
"encrypted_content": "EqgfCioIARgBIiQ3YTAwMjY1Mi1mZjM5LTQ1NGUtODgxNC1kNjNjNTk1ZWI3Y...",
"page_age": "April 30, 2025"
}
]
},
{
"text": "Based on the search results, ",
"type": "text"
},
// 4. Respuesta de Claude con citas
{
"text": "Claude Shannon was born on April 30, 1916, in Petoskey, Michigan",
"type": "text",
"citations": [
{
"type": "web_search_result_location",
"url": "https://en.wikipedia.org/wiki/Claude_Shannon",
"title": "Claude Shannon - Wikipedia",
"encrypted_index": "Eo8BCioIAhgBIiQyYjQ0OWJmZi1lNm..",
"cited_text": "Claude Elwood Shannon (April 30, 1916 – February 24, 2001) was an American mathematician, electrical engineer, computer scientist, cryptographer and i..."
}
]
}
],
"id": "msg_a930390d3a",
"usage": {
"input_tokens": 6039,
"output_tokens": 931,
"server_tool_use": {
"web_search_requests": 1
}
},
"stop_reason": "end_turn"
}Los resultados de búsqueda incluyen:
url: La URL de la página de origentitle: El título de la página de origenpage_age: Cuándo se actualizó el sitio por última vezencrypted_content: Contenido cifrado que debe pasarse nuevamente en conversaciones de múltiples turnos para citasLas citas siempre están habilitadas para la búsqueda web, y cada web_search_result_location incluye:
url: La URL de la fuente citadatitle: El título de la fuente citadaencrypted_index: Una referencia que debe pasarse nuevamente para conversaciones de múltiples turnos.cited_text: Hasta 150 caracteres del contenido citadoLos campos de cita de búsqueda web cited_text, title y url no cuentan hacia el uso de tokens de entrada o salida.
Cuando muestres salidas de API directamente a usuarios finales, las citas deben incluirse a la fuente original. Si realizas modificaciones en las salidas de API, incluyendo reprocesamiento y/o combinación con tu propio material antes de mostrarlas a usuarios finales, muestra citas según corresponda basándote en consulta con tu equipo legal.
Cuando la herramienta de búsqueda web encuentra un error (como alcanzar límites de velocidad), la API de Claude aún devuelve una respuesta 200 (éxito). El error se representa dentro del cuerpo de la respuesta usando la siguiente estructura:
{
"type": "web_search_tool_result",
"tool_use_id": "servertoolu_a93jad",
"content": {
"type": "web_search_tool_result_error",
"error_code": "max_uses_exceeded"
}
}Estos son los posibles códigos de error:
too_many_requests: Límite de velocidad excedidoinvalid_input: Parámetro de consulta de búsqueda inválidomax_uses_exceeded: Máximo de usos de herramienta de búsqueda web excedidoquery_too_long: La consulta excede la longitud máximaunavailable: Ocurrió un error internopause_turnLa respuesta puede incluir una razón de parada pause_turn, que indica que la API pausó un turno de larga duración. Puedes proporcionar la respuesta tal como está en una solicitud posterior para permitir que Claude continúe su turno, o modificar el contenido si deseas interrumpir la conversación.
La búsqueda web funciona con almacenamiento en caché de mensajes. Para habilitar el almacenamiento en caché de mensajes, añade al menos un punto de interrupción cache_control en tu solicitud. El sistema almacenará automáticamente en caché hasta el último bloque web_search_tool_result al ejecutar la herramienta.
Para conversaciones de múltiples turnos, establece un punto de interrupción cache_control en o después del último bloque web_search_tool_result para reutilizar el contenido almacenado en caché.
Por ejemplo, para usar almacenamiento en caché de mensajes con búsqueda web para una conversación de múltiples turnos:
import anthropic
client = anthropic.Anthropic()
# Primera solicitud con búsqueda web y punto de interrupción de caché
messages = [
{"role": "user", "content": "What's the current weather in San Francisco today?"}
]
response1 = client.messages.create(
model="claude-opus-4-6",
max_tokens=1024,
messages=messages,
tools=[
{
"type": "web_search_20250305",
"name": "web_search",
"user_location": {
"type": "approximate",
"city": "San Francisco",
"region": "California",
"country": "US",
"timezone": "America/Los_Angeles",
},
}
],
)
# Añade la respuesta de Claude a la conversación
messages.append({"role": "assistant", "content": response1.content})
# Segunda solicitud con punto de interrupción de caché después de los resultados de búsqueda
messages.append(
{
"role": "user",
"content": "Should I expect rain later this week?",
"cache_control": {"type": "ephemeral"}, # Cache up to this point
}
)
response2 = client.messages.create(
model="claude-opus-4-6",
max_tokens=1024,
messages=messages,
tools=[
{
"type": "web_search_20250305",
"name": "web_search",
"user_location": {
"type": "approximate",
"city": "San Francisco",
"region": "California",
"country": "US",
"timezone": "America/Los_Angeles",
},
}
],
)
# La segunda respuesta se beneficiará de los resultados de búsqueda almacenados en caché
# mientras aún puede realizar nuevas búsquedas si es necesario
print(f"Cache read tokens: {response2.usage.get('cache_read_input_tokens', 0)}")Con la transmisión en directo habilitada, recibirás eventos de búsqueda como parte de la transmisión. Habrá una pausa mientras se ejecuta la búsqueda:
event: message_start
data: {"type": "message_start", "message": {"id": "msg_abc123", "type": "message"}}
event: content_block_start
data: {"type": "content_block_start", "index": 0, "content_block": {"type": "text", "text": ""}}
// Decisión de Claude de buscar
event: content_block_start
data: {"type": "content_block_start", "index": 1, "content_block": {"type": "server_tool_use", "id": "srvtoolu_xyz789", "name": "web_search"}}
// Consulta de búsqueda transmitida
event: content_block_delta
data: {"type": "content_block_delta", "index": 1, "delta": {"type": "input_json_delta", "partial_json": "{\"query\":\"latest quantum computing breakthroughs 2025\"}"}}
// Pausa mientras se ejecuta la búsqueda
// Resultados de búsqueda transmitidos
event: content_block_start
data: {"type": "content_block_start", "index": 2, "content_block": {"type": "web_search_tool_result", "tool_use_id": "srvtoolu_xyz789", "content": [{"type": "web_search_result", "title": "Quantum Computing Breakthroughs in 2025", "url": "https://example.com"}]}}
// Respuesta de Claude con citas (omitida en este ejemplo)Puedes incluir la herramienta de búsqueda web en la API de Lotes de Mensajes. Las llamadas de herramienta de búsqueda web a través de la API de Lotes de Mensajes se cotizan igual que las de las solicitudes regulares de la API de Mensajes.
Web search usage is charged in addition to token usage:
"usage": {
"input_tokens": 105,
"output_tokens": 6039,
"cache_read_input_tokens": 7123,
"cache_creation_input_tokens": 7345,
"server_tool_use": {
"web_search_requests": 1
}
}Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.
Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.
Was this page helpful?