Was this page helpful?
Wir empfehlen die Verwendung des neuesten Claude Opus (4.6) Modells für komplexe Tools und mehrdeutige Anfragen; es verarbeitet mehrere Tools besser und sucht bei Bedarf nach Klarstellung.
Verwenden Sie Claude Haiku Modelle für unkomplizierte Tools, aber beachten Sie, dass sie möglicherweise fehlende Parameter ableiten.
Wenn Sie Claude mit Tool-Nutzung und erweitertem Denken verwenden, lesen Sie den Leitfaden zum erweiterten Denken für weitere Informationen.
Client-Tools (sowohl von Anthropic definiert als auch benutzerdefiniert) werden im Parameter tools auf oberster Ebene der API-Anfrage angegeben. Jede Tool-Definition enthält:
| Parameter | Beschreibung |
|---|---|
name | Der Name des Tools. Muss dem Regex ^[a-zA-Z0-9_-]{1,64}$ entsprechen. |
description | Eine detaillierte Klartextbeschreibung, was das Tool tut, wann es verwendet werden sollte und wie es sich verhält. |
input_schema | Ein JSON Schema Objekt, das die erwarteten Parameter für das Tool definiert. |
input_examples | (Optional) Ein Array von Beispiel-Eingabeobjekten, um Claude zu helfen, das Tool besser zu nutzen. Siehe Bereitstellung von Tool-Nutzungsbeispielen. |
Wenn Sie die Claude API mit dem Parameter tools aufrufen, erstellen wir eine spezielle Systemaufforderung aus den Tool-Definitionen, der Tool-Konfiguration und einer beliebigen benutzerdefinierten Systemaufforderung. Die konstruierte Aufforderung ist so konzipiert, dass sie das Modell anweist, die angegebenen Tools zu verwenden und den notwendigen Kontext für den ordnungsgemäßen Betrieb des Tools bereitzustellen:
In this environment you have access to a set of tools you can use to answer the user's question.
{{ FORMATTING INSTRUCTIONS }}
String and scalar parameters should be specified as is, while lists and objects should use JSON format. Note that spaces for string values are not stripped. The output is not expected to be valid XML and is parsed with regular expressions.
Here are the functions available in JSONSchema format:
{{ TOOL DEFINITIONS IN JSON SCHEMA }}
{{ USER SYSTEM PROMPT }}
{{ TOOL CONFIGURATION }}Um die beste Leistung von Claude bei der Verwendung von Tools zu erhalten, befolgen Sie diese Richtlinien:
input_examples für komplexe Tools. Klare Beschreibungen sind am wichtigsten, aber für Tools mit komplexen Eingaben, verschachtelten Objekten oder formatempfindlichen Parametern können Sie das Feld input_examples verwenden, um schemavalidierte Beispiele bereitzustellen. Siehe Bereitstellung von Tool-Nutzungsbeispielen für Details.Die gute Beschreibung erklärt klar, was das Tool tut, wann es verwendet werden sollte, welche Daten es zurückgibt und was der Parameter ticker bedeutet. Die schlechte Beschreibung ist zu kurz und lässt Claude mit vielen offenen Fragen zum Verhalten und zur Verwendung des Tools zurück.
Sie können konkrete Beispiele gültiger Tool-Eingaben bereitstellen, um Claude zu helfen, Ihre Tools effektiver zu nutzen. Dies ist besonders nützlich für komplexe Tools mit verschachtelten Objekten, optionalen Parametern oder formatempfindlichen Eingaben.
Fügen Sie ein optionales Feld input_examples zu Ihrer Tool-Definition mit einem Array von Beispiel-Eingabeobjekten hinzu. Jedes Beispiel muss gemäß dem input_schema des Tools gültig sein:
Beispiele sind in der Aufforderung neben Ihrem Tool-Schema enthalten und zeigen Claude konkrete Muster für wohlgeformte Tool-Aufrufe. Dies hilft Claude zu verstehen, wann optionale Parameter einzubeziehen sind, welche Formate zu verwenden sind und wie komplexe Eingaben strukturiert werden.
input_schema des Tools gültig sein. Ungültige Beispiele geben einen 400-Fehler zurückDer Tool Runner bietet eine sofort einsatzbereite Lösung für die Ausführung von Tools mit Claude. Anstatt Tool-Aufrufe, Tool-Ergebnisse und Gesprächsverwaltung manuell zu verarbeiten, führt der Tool Runner automatisch:
Wir empfehlen, dass Sie den Tool Runner für die meisten Tool-Nutzungsimplementierungen verwenden.
Der Tool Runner ist derzeit in Beta und verfügbar in den Python, TypeScript und Ruby SDKs.
Automatische Kontextverwaltung mit Komprimierung
Der Tool Runner unterstützt automatische Komprimierung, die Zusammenfassungen generiert, wenn die Token-Nutzung einen Schwellenwert überschreitet. Dies ermöglicht es langfristigen agentengesteuerten Aufgaben, über Kontextfenster-Grenzen hinaus fortzufahren.
Definieren Sie Tools mit den SDK-Helfern und verwenden Sie dann den Tool Runner, um sie auszuführen.
Die Tool-Funktion muss einen Content Block oder ein Content Block Array zurückgeben, einschließlich Text, Bilder oder Dokument-Blöcke. Dies ermöglicht Tools, umfangreiche, multimodale Antworten zurückzugeben. Zurückgegebene Zeichenketten werden in einen Text-Content Block konvertiert. Wenn Sie ein strukturiertes JSON-Objekt an Claude zurückgeben möchten, kodieren Sie es vor der Rückgabe als JSON-Zeichenkette. Zahlen, Boolesche Werte oder andere nicht-String-Primitive müssen ebenfalls in Zeichenketten konvertiert werden.
Der Tool Runner ist ein Iterable, das Nachrichten von Claude liefert. Dies wird oft als "Tool-Call-Schleife" bezeichnet. Bei jeder Iteration prüft der Runner, ob Claude eine Tool-Nutzung angefordert hat. Wenn ja, ruft er das Tool auf und sendet das Ergebnis automatisch an Claude zurück, dann liefert er die nächste Nachricht von Claude, um Ihre Schleife fortzusetzen.
Sie können die Schleife bei jeder Iteration mit einer break-Anweisung beenden. Der Runner wird in einer Schleife ausgeführt, bis Claude eine Nachricht ohne Tool-Nutzung zurückgibt.
Wenn Sie keine Zwischennachrichten benötigen, können Sie die endgültige Nachricht direkt abrufen:
Innerhalb der Schleife können Sie die nächste Anfrage des Tool Runners an die Messages API vollständig anpassen. Der Runner hängt automatisch Tool-Ergebnisse an die Nachrichtenhistorie an, sodass Sie diese nicht manuell verwalten müssen. Sie können das Tool-Ergebnis optional für Protokollierung oder Debugging inspizieren und die Request-Parameter vor dem nächsten API-Aufruf ändern.
Wenn ein Tool eine Ausnahme auslöst, fängt der Tool Runner sie ab und gibt den Fehler an Claude als Tool-Ergebnis mit is_error: true zurück. Standardmäßig ist nur die Ausnahmemeldung enthalten, nicht die vollständige Stack-Spur.
Um vollständige Stack-Spuren und Debug-Informationen anzuzeigen, setzen Sie die Umgebungsvariable ANTHROPIC_LOG:
# View info-level logs including tool errors
export ANTHROPIC_LOG=info
# View debug-level logs for more verbose output
export ANTHROPIC_LOG=debugWenn aktiviert, protokolliert das SDK vollständige Ausnahmeergebnisse (mit Pythons logging Modul, der Konsole in TypeScript oder Rubys Logger), einschließlich der vollständigen Stack-Spur, wenn ein Tool fehlschlägt.
Standardmäßig werden Tool-Fehler an Claude zurückgegeben, das dann angemessen antworten kann. Sie möchten jedoch möglicherweise Fehler erkennen und anders verarbeiten – zum Beispiel, um die Ausführung früh zu beenden oder benutzerdefinierte Fehlerbehandlung zu implementieren.
Verwenden Sie die Tool-Response-Methode, um Tool-Ergebnisse abzufangen und auf Fehler zu prüfen, bevor sie an Claude gesendet werden:
Sie können Tool-Ergebnisse ändern, bevor sie an Claude zurückgesendet werden. Dies ist nützlich, um Metadaten wie cache_control hinzuzufügen, um Prompt-Caching auf Tool-Ergebnisse zu aktivieren, oder um die Tool-Ausgabe zu transformieren.
Verwenden Sie die Tool-Response-Methode, um das Tool-Ergebnis zu erhalten, es zu ändern und dann Ihre geänderte Version zu den Nachrichten hinzuzufügen:
Das Hinzufügen von cache_control zu Tool-Ergebnissen ist besonders nützlich, wenn Tools große Datenmengen zurückgeben (wie Dokumentsuchergebnisse), die Sie für nachfolgende API-Aufrufe zwischenspeichern möchten. Siehe Prompt-Caching für weitere Details zu Caching-Strategien.
Aktivieren Sie Streaming, um Ereignisse zu empfangen, wenn sie ankommen. Jede Iteration liefert ein Stream-Objekt, das Sie für Ereignisse iterieren können.
Der SDK Tool Runner ist in Beta. Der Rest dieses Dokuments behandelt die manuelle Tool-Implementierung.
In einigen Fällen möchten Sie möglicherweise, dass Claude ein bestimmtes Tool verwendet, um die Frage des Benutzers zu beantworten, auch wenn Claude denkt, dass es eine Antwort ohne die Verwendung eines Tools geben kann. Sie können dies tun, indem Sie das Tool im Feld tool_choice wie folgt angeben:
tool_choice = {"type": "tool", "name": "get_weather"}Bei der Arbeit mit dem Parameter tool_choice haben wir vier mögliche Optionen:
auto ermöglicht Claude zu entscheiden, ob eines der bereitgestellten Tools aufgerufen werden soll oder nicht. Dies ist der Standardwert, wenn tools bereitgestellt werden.any teilt Claude mit, dass es eines der bereitgestellten Tools verwenden muss, erzwingt aber kein bestimmtes Tool.tool ermöglicht es uns, Claude zu zwingen, immer ein bestimmtes Tool zu verwenden.none verhindert, dass Claude Tools verwendet. Dies ist der Standardwert, wenn keine tools bereitgestellt werden.Bei Verwendung von Prompt-Caching werden Änderungen am Parameter tool_choice zwischengespeicherte Message-Blöcke ungültig machen. Tool-Definitionen und Systemaufforderungen bleiben zwischengespeichert, aber der Message-Inhalt muss erneut verarbeitet werden.
Dieses Diagramm zeigt, wie jede Option funktioniert:

Beachten Sie, dass wenn Sie tool_choice als any oder tool haben, wir die Assistant-Nachricht vorab ausfüllen, um zu erzwingen, dass ein Tool verwendet wird. Dies bedeutet, dass die Modelle keine natürlichsprachige Antwort oder Erklärung vor tool_use Content-Blöcken ausgeben, auch wenn explizit danach gefragt wird.
Bei Verwendung von erweitertem Denken mit Tool-Nutzung werden tool_choice: {"type": "any"} und tool_choice: {"type": "tool", "name": "..."} nicht unterstützt und führen zu einem Fehler. Nur tool_choice: {"type": "auto"} (der Standard) und tool_choice: {"type": "none"} sind mit erweitertem Denken kompatibel.
Unsere Tests haben gezeigt, dass dies die Leistung nicht beeinträchtigen sollte. Wenn Sie möchten, dass das Modell natürlichsprachigen Kontext oder Erklärungen bereitstellt, während Sie dennoch anfordern, dass das Modell ein bestimmtes Tool verwendet, können Sie {"type": "auto"} für tool_choice (der Standard) verwenden und explizite Anweisungen in einer user Nachricht hinzufügen. Zum Beispiel: What's the weather like in London? Use the get_weather tool in your response.
Garantierte Tool-Aufrufe mit strikten Tools
Kombinieren Sie tool_choice: {"type": "any"} mit strikter Tool-Nutzung, um zu garantieren, dass eines Ihrer Tools aufgerufen wird UND dass die Tool-Eingaben streng Ihrem Schema folgen. Setzen Sie strict: true auf Ihren Tool-Definitionen, um die Schema-Validierung zu aktivieren.
Tools müssen nicht unbedingt Client-Funktionen sein – Sie können Tools jederzeit verwenden, wenn Sie möchten, dass das Modell JSON-Ausgaben zurückgibt, die einem bereitgestellten Schema entsprechen. Beispielsweise könnten Sie ein record_summary-Tool mit einem bestimmten Schema verwenden. Siehe Tool-Verwendung mit Claude für ein vollständiges funktionierendes Beispiel.
Bei der Verwendung von Tools wird Claude häufig kommentieren, was es tut, oder natürlich auf den Benutzer reagieren, bevor es Tools aufruft.
Beispielsweise könnte Claude bei der Eingabeaufforderung „Wie ist das Wetter in San Francisco gerade, und wie spät ist es dort?" mit folgendem antworten:
{
"role": "assistant",
"content": [
{
"type": "text",
"text": "I'll help you check the current weather and time in San Francisco."
},
{
"type": "tool_use",
"id": "toolu_01A09q90qw90lq917835lq9",
"name": "get_weather",
"input": {"location": "San Francisco, CA"}
}
]
}Dieser natürliche Antwortstil hilft Benutzern zu verstehen, was Claude tut, und schafft eine konversativere Interaktion. Sie können den Stil und den Inhalt dieser Antworten durch Ihre System-Prompts und durch die Bereitstellung von <examples> in Ihren Prompts steuern.
Es ist wichtig zu beachten, dass Claude verschiedene Formulierungen und Ansätze verwenden kann, wenn es seine Aktionen erklärt. Ihr Code sollte diese Antworten wie jeden anderen vom Assistenten generierten Text behandeln und sich nicht auf spezifische Formatierungskonventionen verlassen.
Standardmäßig kann Claude mehrere Tools verwenden, um eine Benutzerabfrage zu beantworten. Sie können dieses Verhalten deaktivieren durch:
disable_parallel_tool_use=true, wenn der tool_choice-Typ auto ist, was sicherstellt, dass Claude höchstens ein Tool verwendetdisable_parallel_tool_use=true, wenn der tool_choice-Typ any oder tool ist, was sicherstellt, dass Claude genau ein Tool verwendetWährend Claude 4-Modelle standardmäßig hervorragende Funktionen zur parallelen Tool-Verwendung haben, können Sie die Wahrscheinlichkeit einer parallelen Tool-Ausführung über alle Modelle hinweg mit gezieltem Prompting erhöhen:
Parallele Tool-Verwendung mit Claude Sonnet 3.7
Claude Sonnet 3.7 kann weniger wahrscheinlich parallele Tool-Aufrufe in einer Antwort durchführen, auch wenn Sie disable_parallel_tool_use nicht gesetzt haben. Wir empfehlen ein Upgrade auf Claude 4-Modelle, die über integrierte Token-effiziente Tool-Verwendung und verbesserte parallele Tool-Aufrufe verfügen.
Wenn Sie Claude Sonnet 3.7 noch verwenden, können Sie den token-efficient-tools-2025-02-19 Beta-Header aktivieren, der Claude dazu ermutigt, parallele Tools zu verwenden. Sie können auch ein „Batch-Tool" einführen, das als Meta-Tool fungiert, um Aufrufe zu anderen Tools gleichzeitig zu umhüllen.
Siehe dieses Beispiel in unserem Cookbook, um zu erfahren, wie Sie diese Problemumgehung verwenden.
Einfacher mit Tool Runner: Die manuelle Tool-Behandlung, die in diesem Abschnitt beschrieben wird, wird automatisch von Tool Runner verwaltet. Verwenden Sie diesen Abschnitt, wenn Sie benutzerdefinierte Kontrolle über die Tool-Ausführung benötigen.
Claudes Antwort unterscheidet sich je nachdem, ob es ein Client-Tool oder ein Server-Tool verwendet.
Die Antwort hat einen stop_reason von tool_use und einen oder mehrere tool_use Content-Blöcke, die Folgendes enthalten:
id: Ein eindeutiger Bezeichner für diesen bestimmten Tool-Use-Block. Dies wird später verwendet, um die Tool-Ergebnisse abzugleichen.name: Der Name des verwendeten Tools.input: Ein Objekt, das die an das Tool übergebene Eingabe enthält und dem input_schema des Tools entspricht.Wenn Sie eine Tool-Use-Antwort für ein Client-Tool erhalten, sollten Sie:
name, id und input aus dem tool_use-Block.input.role von user und einem content-Block mit dem tool_result-Typ und den folgenden Informationen senden:
tool_use_id: Die id der Tool-Use-Anfrage, für die dies ein Ergebnis ist.content: Das Ergebnis des Tools als String (z. B. ), eine Liste verschachtelter Content-Blöcke (z. B. ) oder eine Liste von Dokument-Blöcken (z. B. ). Diese Content-Blöcke können die Typen , oder verwenden.Wichtige Formatierungsanforderungen:
Beispielsweise wird dies einen 400-Fehler verursachen:
{"role": "user", "content": [
{"type": "text", "text": "Here are the results:"}, // ❌ Text before tool_result
{"type": "tool_result", "tool_use_id": "toolu_01", ...}
]}Nach Erhalt des Tool-Ergebnisses wird Claude diese Informationen verwenden, um die Antwort auf die ursprüngliche Benutzer-Eingabeaufforderung fortzusetzen.
Claude führt das Tool intern aus und integriert die Ergebnisse direkt in seine Antwort, ohne dass zusätzliche Benutzerinteraktion erforderlich ist.
Unterschiede zu anderen APIs
Im Gegensatz zu APIs, die Tool-Verwendung trennen oder spezielle Rollen wie tool oder function verwenden, integriert die Claude-API Tools direkt in die user- und assistant-Nachrichtenstruktur.
Nachrichten enthalten Arrays von text-, image-, tool_use- und tool_result-Blöcken. user-Nachrichten enthalten Client-Inhalte und tool_result, während assistant-Nachrichten KI-generierte Inhalte und tool_use enthalten.
max_tokens Stop-GrundesWenn Claudes Antwort aufgrund des Erreichens des max_tokens-Limits abgeschnitten wird und die abgeschnittene Antwort einen unvollständigen Tool-Use-Block enthält, müssen Sie die Anfrage mit einem höheren max_tokens-Wert erneut versuchen, um die vollständige Tool-Verwendung zu erhalten.
pause_turn Stop-GrundesBei der Verwendung von Server-Tools wie Web Search kann die API einen pause_turn Stop-Grund zurückgeben, was anzeigt, dass die API einen langen Durchgang unterbrochen hat.
So behandeln Sie den pause_turn Stop-Grund:
Bei der Behandlung von pause_turn:
Integrierte Fehlerbehandlung: Tool Runner bietet automatische Fehlerbehandlung für die meisten häufigen Szenarien. Dieser Abschnitt behandelt manuelle Fehlerbehandlung für fortgeschrittene Anwendungsfälle.
Es gibt verschiedene Arten von Fehlern, die bei der Verwendung von Tools mit Claude auftreten können:
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=1024,
tools=[
{
"name": "get_weather",
"description": "Get the current weather in a given location",
"input_schema": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "The city and state, e.g. San Francisco, CA",
},
"unit": {
"type": "string",
"enum": ["celsius", "fahrenheit"],
"description": "The unit of temperature",
},
},
"required": ["location"],
},
"input_examples": [
{"location": "San Francisco, CA", "unit": "fahrenheit"},
{"location": "Tokyo, Japan", "unit": "celsius"},
{
"location": "New York, NY" # 'unit' is optional
},
],
}
],
messages=[{"role": "user", "content": "What's the weather like in San Francisco?"}],
)"content": "15 degrees""content": [{"type": "text", "text": "15 degrees"}]"content": ["type": "document", "source": {"type": "text", "media_type": "text/plain", "data": "15 degrees"}]textimagedocumentis_error (optional): Setzen Sie auf true, wenn die Tool-Ausführung zu einem Fehler führte.Dies ist korrekt:
{"role": "user", "content": [
{"type": "tool_result", "tool_use_id": "toolu_01", ...},
{"type": "text", "text": "What should I do next?"} // ✅ Text after tool_result
]}Wenn Sie einen Fehler wie „tool_use ids were found without tool_result blocks immediately after" erhalten, überprüfen Sie, dass Ihre Tool-Ergebnisse richtig formatiert sind.
# Check if response was truncated during tool use
if response.stop_reason == "max_tokens":
# Check if the last content block is an incomplete tool_use
last_block = response.content[-1]
if last_block.type == "tool_use":
# Send the request with higher max_tokens
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=4096, # Increased limit
messages=messages,
tools=tools,
)import anthropic
client = anthropic.Anthropic()
# Initial request with web search
response = client.messages.create(
model="claude-3-7-sonnet-latest",
max_tokens=1024,
messages=[
{
"role": "user",
"content": "Search for comprehensive information about quantum computing breakthroughs in 2025",
}
],
tools=[{"type": "web_search_20250305", "name": "web_search", "max_uses": 10}],
)
# Check if the response has pause_turn stop reason
if response.stop_reason == "pause_turn":
# Continue the conversation with the paused content
messages = [
{
"role": "user",
"content": "Search for comprehensive information about quantum computing breakthroughs in 2025",
},
{"role": "assistant", "content": response.content},
]
# Send the continuation request
continuation = client.messages.create(
model="claude-3-7-sonnet-latest",
max_tokens=1024,
messages=messages,
tools=[{"type": "web_search_20250305", "name": "web_search", "max_uses": 10}],
)
print(continuation)
else:
print(response)