Ab Claude Sonnet 3.7 ist Claude in der Lage, Werkzeuge auf token-effiziente Weise aufzurufen. Anfragen sparen durchschnittlich 14% an Ausgabe-Tokens, bis zu 70%, was auch die Latenz reduziert. Die genaue Token-Reduktion und Latenz-Verbesserungen hängen von der Gesamtform und Größe der Antwort ab.
Token-effiziente Werkzeugnutzung ist eine Beta-Funktion, die nur mit Claude 3.7 Sonnet funktioniert. Um diese Beta-Funktion zu nutzen, fügen Sie den Beta-Header token-efficient-tools-2025-02-19 zu einer Werkzeugnutzungsanfrage hinzu. Dieser Header hat keine Auswirkung auf andere Claude-Modelle.
Alle Claude 4 Modelle unterstützen token-effiziente Werkzeugnutzung standardmäßig. Es ist kein Beta-Header erforderlich.
Token-effiziente Werkzeugnutzung funktioniert derzeit nicht mit disable_parallel_tool_use.
Hier ist ein Beispiel für die Verwendung von token-effizienten Werkzeugen mit der API in Claude Sonnet 3.7:
curl https://api.anthropic.com/v1/messages \
-H "content-type: application/json" \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: token-efficient-tools-2025-02-19" \
-d '{
"model": "claude-3-7-sonnet-20250219",
"max_tokens": 1024,
"tools": [
{
"name": "get_weather",
"description": "Get the current weather in a given location",
"input_schema": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "The city and state, e.g. San Francisco, CA"
}
},
"required": [
"location"
]
}
}
],
"messages": [
{
"role": "user",
"content": "Tell me the weather in San Francisco."
}
]
}' | jq '.usage'Die obige Anfrage sollte durchschnittlich weniger Input- und Output-Tokens verwenden als eine normale Anfrage. Um dies zu bestätigen, versuchen Sie, die gleiche Anfrage zu stellen, aber entfernen Sie token-efficient-tools-2025-02-19 aus der Liste der Beta-Header.
Um die Vorteile des Prompt-Cachings zu behalten, verwenden Sie den Beta-Header konsistent für Anfragen, die Sie zwischenspeichern möchten. Wenn Sie ihn selektiv verwenden, schlägt das Prompt-Caching fehl.