L'outil de recherche d'outils permet à Claude de travailler avec des centaines ou des milliers d'outils en découvrant et chargeant dynamiquement les outils à la demande. Au lieu de charger toutes les définitions d'outils dans la fenêtre de contexte dès le départ, Claude recherche votre catalogue d'outils (y compris les noms d'outils, les descriptions, les noms d'arguments et les descriptions d'arguments) et charge uniquement les outils dont il a besoin.
Cette approche résout deux problèmes qui s'aggravent rapidement à mesure que les bibliothèques d'outils se développent :
Pour plus d'informations sur les défis d'évolutivité que la recherche d'outils résout, consultez Advanced tool use. Le chargement à la demande de la recherche d'outils est également une instance du principe plus large de récupération juste-à-temps décrit dans Effective context engineering.
Bien que cela soit fourni comme un outil côté serveur, vous pouvez également implémenter votre propre fonctionnalité de recherche d'outils côté client. Consultez Custom tool search implementation pour plus de détails.
Partagez vos commentaires sur cette fonctionnalité via le formulaire de commentaires.
This feature qualifies for Zero Data Retention (ZDR) with limited technical retention. See the Data retention section for details on what is retained and why.
Sur Amazon Bedrock, la recherche d'outils côté serveur est disponible uniquement via l'API invoke, pas l'API converse.
Vous pouvez également implémenter la recherche d'outils côté client en renvoyant des blocs tool_reference de votre propre implémentation de recherche.
Il existe deux variantes de recherche d'outils :
tool_search_tool_regex_20251119) : Claude construit des motifs regex pour rechercher des outilstool_search_tool_bm25_20251119) : Claude utilise des requêtes en langage naturel pour rechercher des outilsLorsque vous activez l'outil de recherche d'outils :
tool_search_tool_regex_20251119 ou tool_search_tool_bm25_20251119) dans votre liste d'outilsdefer_loading: true pour les outils qui ne doivent pas être chargés immédiatementtool_reference les plus pertinentsCela maintient votre fenêtre de contexte efficace tout en maintenant une haute précision de sélection d'outils.
Voici un exemple simple avec des outils différés :
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=2048,
messages=[{"role": "user", "content": "What is the weather in San Francisco?"}],
tools=[
{"type": "tool_search_tool_regex_20251119", "name": "tool_search_tool_regex"},
{
"name": "get_weather",
"description": "Get the weather at a specific location",
"input_schema": {
"type": "object",
"properties": {
"location": {"type": "string"},
"unit": {"type": "string", "enum": ["celsius", "fahrenheit"]},
},
"required": ["location"],
},
"defer_loading": True,
},
{
"name": "search_files",
"description": "Search through files in the workspace",
"input_schema": {
"type": "object",
"properties": {
"query": {"type": "string"},
"file_types": {"type": "array", "items": {"type": "string"}},
},
"required": ["query"],
},
"defer_loading": True,
},
],
)
print(response)L'outil de recherche d'outils a deux variantes :
{
"type": "tool_search_tool_regex_20251119",
"name": "tool_search_tool_regex"
}{
"type": "tool_search_tool_bm25_20251119",
"name": "tool_search_tool_bm25"
}Format de requête de variante Regex : Expression régulière Python, PAS langage naturel
Lors de l'utilisation de tool_search_tool_regex_20251119, Claude construit des motifs regex en utilisant la syntaxe re.search() de Python, pas des requêtes en langage naturel. Motifs courants :
"weather" - correspond aux noms/descriptions d'outils contenant "weather""get_.*_data" - correspond aux outils comme get_user_data, get_weather_data"database.*query|query.*database" - motifs OU pour plus de flexibilité"(?i)slack" - recherche insensible à la casseLongueur maximale de requête : 200 caractères
Format de requête de variante BM25 : Langage naturel
Lors de l'utilisation de tool_search_tool_bm25_20251119, Claude utilise des requêtes en langage naturel pour rechercher des outils.
Marquez les outils pour un chargement à la demande en ajoutant defer_loading: true :
{
"name": "get_weather",
"description": "Get current weather for a location",
"input_schema": {
"type": "object",
"properties": {
"location": { "type": "string" },
"unit": { "type": "string", "enum": ["celsius", "fahrenheit"] }
},
"required": ["location"]
},
"defer_loading": true
}Points clés :
defer_loading sont chargés dans le contexte immédiatementdefer_loading: true ne sont chargés que lorsque Claude les découvre via la recherchedefer_loading: trueLes deux variantes de recherche d'outils (regex et bm25) recherchent les noms d'outils, les descriptions, les noms d'arguments et les descriptions d'arguments.
Comment fonctionne le report en interne : Les outils différés ne sont pas inclus dans le préfixe du message système. Lorsque le modèle découvre un outil différé via la recherche d'outils, la définition de l'outil est ajoutée en ligne sous forme de bloc tool_reference dans la conversation. Le préfixe reste inchangé, donc la mise en cache des messages est préservée. La grammaire pour le mode strict se construit à partir de l'ensemble complet des outils, donc defer_loading et le mode strict se composent sans recompilation de grammaire.
Lorsque Claude utilise l'outil de recherche d'outils, la réponse inclut de nouveaux types de blocs :
{
"role": "assistant",
"content": [
{
"type": "text",
"text": "I'll search for tools to help with the weather information."
},
{
"type": "server_tool_use",
"id": "srvtoolu_01ABC123",
"name": "tool_search_tool_regex",
"input": {
"query": "weather"
}
},
{
"type": "tool_search_tool_result",
"tool_use_id": "srvtoolu_01ABC123",
"content": {
"type": "tool_search_tool_search_result",
"tool_references": [{ "type": "tool_reference", "tool_name": "get_weather" }]
}
},
{
"type": "text",
"text": "I found a weather tool. Let me get the weather for San Francisco."
},
{
"type": "tool_use",
"id": "toolu_01XYZ789",
"name": "get_weather",
"input": { "location": "San Francisco", "unit": "fahrenheit" }
}
],
"stop_reason": "tool_use"
}server_tool_use : Indique que Claude invoque l'outil de recherche d'outilstool_search_tool_result : Contient les résultats de recherche avec un objet tool_search_tool_search_result imbriquétool_references : Tableau d'objets tool_reference pointant vers les outils découvertstool_use : Claude invoquant l'outil découvertLes blocs tool_reference sont automatiquement développés en définitions d'outils complètes avant d'être affichés à Claude. Vous n'avez pas besoin de gérer cette expansion vous-même. Cela se fait automatiquement dans l'API tant que vous fournissez toutes les définitions d'outils correspondantes dans le paramètre tools.
Pour configurer mcp_toolset avec defer_loading, consultez MCP connector.
Vous pouvez implémenter votre propre logique de recherche d'outils (par exemple, en utilisant des embeddings ou une recherche sémantique) en renvoyant des blocs tool_reference à partir d'un outil personnalisé. Lorsque Claude appelle votre outil de recherche personnalisé, renvoyez un tool_result standard avec des blocs tool_reference dans le tableau de contenu :
{
"type": "tool_result",
"tool_use_id": "toolu_your_tool_id",
"content": [{ "type": "tool_reference", "tool_name": "discovered_tool_name" }]
}Chaque outil référencé doit avoir une définition d'outil correspondante dans le paramètre tools de niveau supérieur avec defer_loading: true. Cette approche vous permet d'utiliser des algorithmes de recherche plus sophistiqués tout en maintenant la compatibilité avec le système de recherche d'outils.
Le format tool_search_tool_result montré dans la section Response format est le format côté serveur utilisé en interne par la recherche d'outils intégrée d'Anthropic. Pour les implémentations personnalisées côté client, utilisez toujours le format tool_result standard avec des blocs de contenu tool_reference comme montré ci-dessus.
Pour un exemple complet utilisant des embeddings, consultez le cookbook de recherche d'outils avec embeddings.
L'outil de recherche d'outils n'est pas compatible avec les exemples d'utilisation d'outils. Si vous devez fournir des exemples d'utilisation d'outils, utilisez l'appel d'outils standard sans recherche d'outils.
Ces erreurs empêchent le traitement de la demande :
Tous les outils différés :
{
"type": "error",
"error": {
"type": "invalid_request_error",
"message": "All tools have defer_loading set. At least one tool must be non-deferred."
}
}Définition d'outil manquante :
{
"type": "error",
"error": {
"type": "invalid_request_error",
"message": "Tool reference 'unknown_tool' has no corresponding tool definition"
}
}Les erreurs lors de l'exécution d'outils retournent une réponse 200 avec les informations d'erreur dans le corps :
{
"type": "tool_result",
"tool_use_id": "srvtoolu_01ABC123",
"content": {
"type": "tool_search_tool_result_error",
"error_code": "invalid_pattern"
}
}Codes d'erreur :
too_many_requests : Limite de débit dépassée pour les opérations de recherche d'outilsinvalid_pattern : Motif regex mal formépattern_too_long : Le motif dépasse la limite de 200 caractèresunavailable : Service de recherche d'outils temporairement indisponiblePour savoir comment defer_loading préserve la mise en cache des messages, consultez Tool use with prompt caching.
Le système développe automatiquement les blocs tool_reference dans tout l'historique de conversation, afin que Claude puisse réutiliser les outils découverts dans les tours suivants sans faire de recherche à nouveau.
Avec le streaming activé, vous recevrez les événements de recherche d'outils dans le flux :
event: content_block_start
data: {"type": "content_block_start", "index": 1, "content_block": {"type": "server_tool_use", "id": "srvtoolu_xyz789", "name": "tool_search_tool_regex"}}
// Search query streamed
event: content_block_delta
data: {"type": "content_block_delta", "index": 1, "delta": {"type": "input_json_delta", "partial_json": "{\"query\":\"weather\"}"}}
// Pause while search executes
// Search results streamed
event: content_block_start
data: {"type": "content_block_start", "index": 2, "content_block": {"type": "tool_search_tool_result", "tool_use_id": "srvtoolu_xyz789", "content": {"type": "tool_search_tool_search_result", "tool_references": [{"type": "tool_reference", "tool_name": "get_weather"}]}}}
// Claude continues with discovered toolsVous pouvez inclure l'outil de recherche d'outils dans l'API Messages Batches. Les opérations de recherche d'outils via l'API Messages Batches sont facturées de la même manière que celles dans les demandes d'API Messages régulières.
La recherche d'outils côté serveur (outil tool_search) indexe et stocke les données du catalogue d'outils (noms d'outils, descriptions et métadonnées d'arguments) au-delà de la réponse API immédiate ; ces données de catalogue sont conservées conformément à la politique de conservation standard d'Anthropic. Les implémentations personnalisées de recherche d'outils côté client qui utilisent l'API Messages standard sont entièrement éligibles à ZDR.
Pour l'éligibilité ZDR sur toutes les fonctionnalités, consultez API and data retention.
Bons cas d'usage :
Quand l'appel d'outils traditionnel pourrait être meilleur :
github_, slack_) afin que les requêtes de recherche fassent naturellement surface au bon groupe d'outilsL'utilisation de l'outil de recherche d'outils est suivie dans l'objet d'utilisation de la réponse :
{
"usage": {
"input_tokens": 1024,
"output_tokens": 256,
"server_tool_use": {
"tool_search_requests": 2
}
}
}Catalogue d'outils complet avec compatibilité de modèle et paramètres.
Configurez les ensembles d'outils MCP avec chargement différé.
Combinez la recherche d'outils avec les définitions d'outils en cache.
Guide étape par étape pour définir les outils.
Was this page helpful?