Loading...
  • Construir
  • Administración
  • Modelos y precios
  • SDKs de cliente
  • Referencia de API
Search...
⌘K
Log in
Uso de herramientas con caché de prompts
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Construir/Herramientas

Uso de herramientas con almacenamiento en caché de indicaciones

Almacena en caché las definiciones de herramientas entre turnos y comprende qué invalida tu caché.

Esta página cubre el almacenamiento en caché de indicaciones para definiciones de herramientas: dónde colocar puntos de interrupción cache_control, cómo defer_loading preserva tu caché y qué lo invalida. Para el almacenamiento en caché general de indicaciones, consulta Almacenamiento en caché de indicaciones.

cache_control en definiciones de herramientas

Coloca cache_control: {"type": "ephemeral"} en la última herramienta de tu array tools. Esto almacena en caché todo el prefijo de definiciones de herramientas, desde la primera herramienta hasta el punto de interrupción marcado:

{
  "tools": [
    {
      "name": "get_weather",
      "description": "Get the current weather in a given location",
      "input_schema": {
        "type": "object",
        "properties": {
          "location": { "type": "string" }
        },
        "required": ["location"]
      }
    },
    {
      "name": "get_time",
      "description": "Get the current time in a given time zone",
      "input_schema": {
        "type": "object",
        "properties": {
          "timezone": { "type": "string" }
        },
        "required": ["timezone"]
      },
      "cache_control": { "type": "ephemeral" }
    }
  ]
}

Para mcp_toolset, el punto de interrupción cache_control se coloca en la última herramienta del conjunto. No controlas el orden de las herramientas dentro de un conjunto de herramientas MCP, así que coloca el punto de interrupción en la entrada mcp_toolset en sí y la API lo aplica a la herramienta final expandida.

defer_loading y preservación del caché

Las herramientas diferidas no se incluyen en el prefijo del indicador del sistema. Cuando el modelo descubre una herramienta diferida a través de búsqueda de herramientas, la definición se añade en línea como un bloque tool_reference en el historial de conversación. El prefijo permanece intacto, por lo que el almacenamiento en caché de indicaciones se preserva.

Esto significa que agregar herramientas dinámicamente a través de la búsqueda de herramientas no rompe tu caché. Puedes comenzar una conversación con un pequeño conjunto de herramientas siempre cargadas (almacenadas en caché), permitir que el modelo descubra herramientas adicionales según sea necesario, y mantener el mismo acierto de caché en cada turno.

defer_loading también actúa independientemente de la construcción de gramática para modo estricto. La gramática se construye a partir del conjunto completo de herramientas independientemente de cuáles estén diferidas, por lo que el almacenamiento en caché de indicaciones y el almacenamiento en caché de gramática se preservan cuando las herramientas se cargan dinámicamente.

Qué invalida tu caché

El caché sigue una jerarquía de prefijos (tools → system → messages), por lo que un cambio en un nivel invalida ese nivel y todo lo que viene después:

CambioInvalida
Modificar definiciones de herramientasCaché completo (tools, system, messages)
Alternar búsqueda web o citasCachés de system y messages
Cambiar tool_choiceCaché de messages
Cambiar disable_parallel_tool_useCaché de messages
Alternar presencia/ausencia de imágenesCaché de messages
Cambiar parámetros de pensamientoCaché de messages

Si necesitas variar tool_choice a mitad de la conversación, considera colocar puntos de interrupción de caché antes del punto de variación.

Tabla de interacción por herramienta

HerramientaConsideraciones de almacenamiento en caché
Búsqueda webHabilitar o deshabilitar invalida los cachés de system y messages
Obtención webHabilitar o deshabilitar invalida los cachés de system y messages
Ejecución de códigoEl estado del contenedor es independiente del caché de indicaciones
Búsqueda de herramientasLas herramientas descubiertas se cargan como bloques tool_reference, preservando el caché de prefijo
Uso de computadoraLa presencia de captura de pantalla afecta el caché de messages
Editor de textoHerramienta de cliente estándar, sin interacción de almacenamiento en caché especial
BashHerramienta de cliente estándar, sin interacción de almacenamiento en caché especial
MemoriaHerramienta de cliente estándar, sin interacción de almacenamiento en caché especial

Próximos pasos

Almacenamiento en caché de indicaciones

Aprende el modelo completo de almacenamiento en caché de indicaciones, incluyendo TTLs y precios.

Búsqueda de herramientas

Carga herramientas bajo demanda sin romper tu caché.

Referencia de herramientas

Explora todas las herramientas disponibles y sus parámetros.

Was this page helpful?

  • cache_control en definiciones de herramientas
  • defer_loading y preservación del caché
  • Qué invalida tu caché
  • Tabla de interacción por herramienta
  • Próximos pasos