Loading...
    • Construir
    • Administración
    • Modelos y precios
    • SDKs de cliente
    • Referencia de API
    Search...
    ⌘K
    Primeros pasos
    Introducción a ClaudeInicio rápido
    Construir con Claude
    Descripción general de funcionesUsar la API de mensajesHabilidad de Claude APIGestionar razones de parada
    Capacidades del modelo
    Pensamiento extendidoPensamiento adaptativoEsfuerzoPresupuestos de tareas (beta)Modo rápido (beta: vista previa de investigación)Salidas estructuradasCitasMensajes en streamingProcesamiento por lotesResultados de búsquedaRechazos en streamingSoporte multilingüeEmbeddings
    Herramientas
    Descripción generalCómo funciona el uso de herramientasTutorial: Construir un agente con herramientasDefinir herramientasGestionar llamadas a herramientasUso paralelo de herramientasTool Runner (SDK)Uso estricto de herramientasUso de herramientas con caché de promptsHerramientas del servidorSolución de problemasHerramienta de búsqueda webHerramienta de obtención webHerramienta de ejecución de códigoHerramienta de asesorHerramienta de memoriaHerramienta BashHerramienta de uso del ordenadorHerramienta de editor de texto
    Infraestructura de herramientas
    Referencia de herramientasGestionar contexto de herramientasCombinaciones de herramientasBúsqueda de herramientasLlamadas programáticas a herramientasStreaming detallado de herramientas
    Gestión de contexto
    Ventanas de contextoCompactaciónEdición de contextoCaché de promptsConteo de tokens
    Trabajar con archivos
    Files APISoporte de PDFImágenes y visión
    Habilidades
    Descripción generalInicio rápidoMejores prácticasHabilidades para empresasHabilidades en la API
    MCP
    Servidores MCP remotosConector MCP
    Ingeniería de prompts
    Descripción generalMejores prácticas de promptsHerramientas de prompts en Console
    Probar y evaluar
    Definir el éxito y construir evaluacionesUsar la herramienta de evaluación en ConsoleReducir la latencia
    Reforzar salvaguardas
    Reducir alucinacionesAumentar la consistencia de salidaMitigar jailbreaksReducir filtración de prompts
    Recursos
    Glosario
    Notas de versión
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Infraestructura de herramientas

    Gestionar el contexto de herramientas

    Elige entre búsqueda de herramientas, llamadas de herramientas programáticas, almacenamiento en caché de indicaciones y edición de contexto para gestionar la inflación de contexto.

    Was this page helpful?

    • Los cuatro enfoques
    • Búsqueda de herramientas
    • Llamadas de herramientas programáticas
    • Almacenamiento en caché de indicaciones
    • Edición de contexto
    • Combinación de enfoques
    • Próximos pasos

    Las definiciones de herramientas y los bloques tool_result acumulados consumen tu ventana de contexto. Los agentes de larga duración con muchas herramientas o muchos turnos pueden agotar el contexto disponible antes de que se complete la tarea. Cuatro enfoques abordan esto en diferentes puntos del pipeline.

    Los cuatro enfoques

    Cada enfoque se dirige a una fuente diferente de presión de contexto. Elige el que coincida con dónde van tus tokens.

    EnfoqueLo que reduceCuándo se ajustaMás información
    Búsqueda de herramientasDefiniciones de herramientas cargadas por adelantadoConjuntos de herramientas grandes (20+ herramientas) donde la mayoría de herramientas no se necesitan cada turnoHerramienta de búsqueda de herramientas
    Llamadas de herramientas programáticasViajes de ida y vuelta de tool_resultCadenas de llamadas de herramientas que pueden ejecutarse como un único scriptLlamadas de herramientas programáticas
    Almacenamiento en caché de indicacionesCosto de token de definiciones de herramientas repetidasConjuntos de herramientas estables en muchas solicitudesUso de herramientas con almacenamiento en caché de indicaciones
    Edición de contextoBloques tool_result antiguos en el historialConversaciones largas donde los resultados anteriores ya no son relevantesEdición de contexto

    Búsqueda de herramientas

    La búsqueda de herramientas mantiene las definiciones de herramientas fuera de la ventana de contexto hasta que Claude las solicita. En lugar de enviar 50 esquemas de herramientas por adelantado, envías una única herramienta tool_search y dejas que Claude descubra el resto bajo demanda. Esto intercambia una pequeña cantidad de latencia (un turno adicional para buscar una herramienta) por una gran reducción en el uso de contexto de línea base.

    Llamadas de herramientas programáticas

    Las llamadas de herramientas programáticas colapsan una secuencia de llamadas de herramientas en un único bloque de código que Claude escribe y la sandbox de ejecución de código de Anthropic ejecuta. En lugar de cinco viajes de ida y vuelta de tool_use y tool_result, Claude emite un script que llama a las cinco funciones desde dentro de la sandbox. Los resultados intermedios nunca entran en el historial de conversación.

    Almacenamiento en caché de indicaciones

    El almacenamiento en caché de indicaciones no reduce el número de tokens en contexto, pero reduce lo que pagas por ellos en solicitudes posteriores. Si tus definiciones de herramientas son estables, almacénalas en caché una vez y reutiliza el prefijo en caché en miles de solicitudes. Esta es la opción correcta cuando el conjunto de herramientas es grande pero fijo.

    Edición de contexto

    La edición de contexto elimina bloques tool_result antiguos del historial de conversación una vez que han cumplido su propósito. Un bucle de agente largo podría producir cientos de resultados intermedios que fueron útiles en su momento pero que ahora son peso muerto. La edición de contexto te permite recortarlos sin reiniciar la conversación.

    Combinación de enfoques

    Estos enfoques se componen. Un agente de larga duración podría usar búsqueda de herramientas para mantener el conjunto de herramientas ágil, almacenamiento en caché de indicaciones para amortizar el costo de las definiciones restantes y edición de contexto para recortar resultados obsoletos a medida que crece la conversación. Cada uno resuelve una parte diferente del problema, por lo que no hay conflicto en usarlos juntos.

    Un punto de partida razonable para un agente de alto volumen:

    1. Habilita el almacenamiento en caché de indicaciones en tus definiciones de herramientas desde el primer día. Las escrituras en caché llevan un margen del 25% sobre los precios de entrada base, que se recuperan en la segunda solicitud que accede al caché.
    2. Agrega búsqueda de herramientas una vez que tu conjunto de herramientas crece más allá de aproximadamente 20 herramientas o tu uso de contexto de línea base se vuelve notable.
    3. Agrega edición de contexto una vez que las conversaciones individuales comienzan a ejecutarse el tiempo suficiente para que los resultados anteriores se vuelvan irrelevantes.
    4. Considera llamadas de herramientas programáticas si notas cadenas repetitivas de pequeñas llamadas de herramientas que podrían ejecutarse como un único lote.

    Próximos pasos

    Herramienta de búsqueda de herramientas

    Carga definiciones de herramientas bajo demanda en lugar de por adelantado.

    Llamadas de herramientas programáticas

    Colapsa cadenas de llamadas de herramientas en un único script ejecutable.

    Uso de herramientas con almacenamiento en caché de indicaciones

    Almacena en caché definiciones de herramientas en solicitudes para reducir costos de tokens.

    Edición de contexto

    Recorta resultados de herramientas obsoletos de conversaciones de larga duración.