Loading...
    • Entwicklerleitfaden
    • API-Referenz
    • MCP
    • Ressourcen
    • Versionshinweise
    Search...
    ⌘K
    Erste Schritte
    Einführung in ClaudeSchnelleinstieg
    Modelle & Preise
    ModellübersichtModell auswählenNeuerungen in Claude 4.6MigrationsleitfadenModellabschreibungenPreise
    Mit Claude entwickeln
    FunktionsübersichtMessages API verwendenStop-Gründe verarbeitenBest Practices für Prompts
    Modellfähigkeiten
    Extended ThinkingAdaptive ThinkingAufwandFast Mode (Research Preview)Strukturierte AusgabenZitateStreaming MessagesBatch-VerarbeitungPDF-UnterstützungSuchergebnisseMehrsprachige UnterstützungEmbeddingsVision
    Tools
    ÜbersichtTool-Nutzung implementierenWeb-Such-ToolWeb-Abruf-ToolCode-Ausführungs-ToolMemory-ToolBash-ToolComputer-Use-ToolText-Editor-Tool
    Tool-Infrastruktur
    Tool-SucheProgrammgesteuerte Tool-AufrufeFeingranulares Tool-Streaming
    Kontextverwaltung
    KontextfensterKomprimierungKontextbearbeitungPrompt CachingToken-Zählung
    Dateien & Assets
    Files API
    Agent Skills
    ÜbersichtSchnelleinstiegBest PracticesSkills für UnternehmenSkills mit der API verwenden
    Agent SDK
    ÜbersichtSchnelleinstiegTypeScript SDKTypeScript V2 (Preview)Python SDKMigrationsleitfaden
    MCP in der API
    MCP-ConnectorRemote MCP-Server
    Claude auf Plattformen von Drittanbietern
    Amazon BedrockMicrosoft FoundryVertex AI
    Prompt Engineering
    ÜbersichtPrompt-GeneratorPrompt-Vorlagen verwendenPrompt-VerbessererKlar und direkt seinBeispiele verwenden (Multishot Prompting)Claude denken lassen (CoT)XML-Tags verwendenClaude eine Rolle geben (System Prompts)Komplexe Prompts verkettenTipps für lange KontexteTipps für Extended Thinking
    Testen & Evaluieren
    Erfolgskriterien definierenTestfälle entwickelnEvaluierungstool verwendenLatenz reduzieren
    Schutzmaßnahmen verstärken
    Halluzinationen reduzierenAusgabekonsistenz erhöhenJailbreaks abschwächenStreaming-AblehnungenPrompt-Lecks reduzierenClaude im Charakter halten
    Verwaltung und Überwachung
    Admin API ÜbersichtDatenspeicherortArbeitsbereicheUsage and Cost APIClaude Code Analytics APIZero Data Retention
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Tool-Infrastruktur

    Tool-Suchwerkzeug

    Ermöglichen Sie Claude, mit Hunderten oder Tausenden von Werkzeugen zu arbeiten, indem Sie diese dynamisch ermitteln und bei Bedarf laden.

    Das Tool-Suchwerkzeug ermöglicht Claude, mit Hunderten oder Tausenden von Werkzeugen zu arbeiten, indem diese dynamisch ermittelt und bei Bedarf geladen werden. Anstatt alle Werkzeugdefinitionen vorab in das Kontextfenster zu laden, durchsucht Claude Ihren Werkzeugkatalog – einschließlich Werkzeugnamen, Beschreibungen, Argumentnamen und Argumentbeschreibungen – und lädt nur die Werkzeuge, die er benötigt.

    Dieser Ansatz löst zwei kritische Herausforderungen bei der Skalierung von Werkzeugbibliotheken:

    • Kontexteffizienz: Werkzeugdefinitionen können massive Teile Ihres Kontextfensters verbrauchen (50 Werkzeuge ≈ 10-20K Token), was weniger Platz für tatsächliche Arbeit lässt
    • Genauigkeit der Werkzeugauswahl: Claudes Fähigkeit, Werkzeuge korrekt auszuwählen, verschlechtert sich erheblich bei mehr als 30-50 konventionell verfügbaren Werkzeugen

    Obwohl dies als serverseitiges Werkzeug bereitgestellt wird, können Sie auch Ihre eigene clientseitige Tool-Suchfunktionalität implementieren. Weitere Informationen finden Sie unter Benutzerdefinierte Tool-Suchimplementierung.

    Bitte teilen Sie Ihr Feedback zu dieser Funktion über unser Feedback-Formular mit.

    Die serverseitige Tool-Suche ist nicht durch Zero Data Retention (ZDR)-Vereinbarungen abgedeckt. Daten werden gemäß der Standard-Aufbewahrungsrichtlinie der Funktion beibehalten. Benutzerdefinierte clientseitige Tool-Suchimplementierungen verwenden die Standard-Messages-API und sind ZDR-berechtigt.

    Bei Amazon Bedrock ist die serverseitige Tool-Suche nur über die invoke API verfügbar, nicht über die converse API.

    Sie können auch clientseitige Tool-Suche implementieren, indem Sie tool_reference-Blöcke aus Ihrer eigenen Suchimplementierung zurückgeben.

    Funktionsweise der Tool-Suche

    Es gibt zwei Tool-Suchvarianten:

    • Regex (tool_search_tool_regex_20251119): Claude erstellt Regex-Muster zur Suche nach Werkzeugen
    • BM25 (tool_search_tool_bm25_20251119): Claude verwendet natürlichsprachliche Abfragen zur Suche nach Werkzeugen

    Wenn Sie das Tool-Suchwerkzeug aktivieren:

    1. Sie fügen ein Tool-Suchwerkzeug (z. B. tool_search_tool_regex_20251119 oder tool_search_tool_bm25_20251119) in Ihre Werkzeugliste ein
    2. Sie stellen alle Werkzeugdefinitionen mit defer_loading: true für Werkzeuge bereit, die nicht sofort geladen werden sollen
    3. Claude sieht zunächst nur das Tool-Suchwerkzeug und alle nicht aufgeschobenen Werkzeuge
    4. Wenn Claude zusätzliche Werkzeuge benötigt, sucht er mit einem Tool-Suchwerkzeug
    5. Die API gibt 3-5 relevanteste tool_reference-Blöcke zurück
    6. Diese Verweise werden automatisch in vollständige Werkzeugdefinitionen erweitert
    7. Claude wählt aus den entdeckten Werkzeugen aus und ruft diese auf

    Dies hält Ihr Kontextfenster effizient, während die hohe Genauigkeit der Werkzeugauswahl beibehalten wird.

    Schnellstart

    Hier ist ein einfaches Beispiel mit aufgeschobenen Werkzeugen:

    curl https://api.anthropic.com/v1/messages \
        --header "x-api-key: $ANTHROPIC_API_KEY" \
        --header "anthropic-version: 2023-06-01" \
        --header "content-type: application/json" \
        --data '{
            "model": "claude-opus-4-6",
            "max_tokens": 2048,
            "messages": [
                {
                    "role": "user",
                    "content": "What is the weather in San Francisco?"
                }
            ],
            "tools": [
                {
                    "type": "tool_search_tool_regex_20251119",
                    "name": "tool_search_tool_regex"
                },
                {
                    "name": "get_weather",
                    "description": "Get the weather at a specific location",
                    "input_schema": {
                        "type": "object",
                        "properties": {
                            "location": {"type": "string"},
                            "unit": {
                                "type": "string",
                                "enum": ["celsius", "fahrenheit"]
                            }
                        },
                        "required": ["location"]
                    },
                    "defer_loading": true
                },
                {
                    "name": "search_files",
                    "description": "Search through files in the workspace",
                    "input_schema": {
                        "type": "object",
                        "properties": {
                            "query": {"type": "string"},
                            "file_types": {
                                "type": "array",
                                "items": {"type": "string"}
                            }
                        },
                        "required": ["query"]
                    },
                    "defer_loading": true
                }
            ]
        }'

    Werkzeugdefinition

    Das Tool-Suchwerkzeug hat zwei Varianten:

    JSON
    {
      "type": "tool_search_tool_regex_20251119",
      "name": "tool_search_tool_regex"
    }
    JSON
    {
      "type": "tool_search_tool_bm25_20251119",
      "name": "tool_search_tool_bm25"
    }

    Regex-Varianten-Abfrageformat: Python-Regex, KEINE natürliche Sprache

    Bei Verwendung von tool_search_tool_regex_20251119 erstellt Claude Regex-Muster mit der Syntax von Pythons re.search(), nicht mit natürlichsprachlichen Abfragen. Häufige Muster:

    • "weather" - passt zu Werkzeugnamen/Beschreibungen, die "weather" enthalten
    • "get_.*_data" - passt zu Werkzeugen wie get_user_data, get_weather_data
    • "database.*query|query.*database" - ODER-Muster für Flexibilität
    • "(?i)slack" - Suche ohne Berücksichtigung der Groß-/Kleinschreibung

    Maximale Abfragelänge: 200 Zeichen

    BM25-Varianten-Abfrageformat: Natürliche Sprache

    Bei Verwendung von tool_search_tool_bm25_20251119 verwendet Claude natürlichsprachliche Abfragen zur Suche nach Werkzeugen.

    Aufgeschobenes Werkzeugladen

    Markieren Sie Werkzeuge für das Laden bei Bedarf, indem Sie defer_loading: true hinzufügen:

    JSON
    {
      "name": "get_weather",
      "description": "Get current weather for a location",
      "input_schema": {
        "type": "object",
        "properties": {
          "location": { "type": "string" },
          "unit": { "type": "string", "enum": ["celsius", "fahrenheit"] }
        },
        "required": ["location"]
      },
      "defer_loading": true
    }

    Wichtige Punkte:

    • Werkzeuge ohne defer_loading werden sofort in den Kontext geladen
    • Werkzeuge mit defer_loading: true werden nur geladen, wenn Claude sie durch Suche entdeckt
    • Das Tool-Suchwerkzeug selbst sollte niemals defer_loading: true haben
    • Behalten Sie Ihre 3-5 am häufigsten verwendeten Werkzeuge als nicht aufgeschoben für optimale Leistung

    Beide Tool-Suchvarianten (regex und bm25) durchsuchen Werkzeugnamen, Beschreibungen, Argumentnamen und Argumentbeschreibungen.

    Antwortformat

    Wenn Claude das Tool-Suchwerkzeug verwendet, enthält die Antwort neue Blocktypen:

    JSON
    {
      "role": "assistant",
      "content": [
        {
          "type": "text",
          "text": "I'll search for tools to help with the weather information."
        },
        {
          "type": "server_tool_use",
          "id": "srvtoolu_01ABC123",
          "name": "tool_search_tool_regex",
          "input": {
            "query": "weather"
          }
        },
        {
          "type": "tool_search_tool_result",
          "tool_use_id": "srvtoolu_01ABC123",
          "content": {
            "type": "tool_search_tool_search_result",
            "tool_references": [{ "type": "tool_reference", "tool_name": "get_weather" }]
          }
        },
        {
          "type": "text",
          "text": "I found a weather tool. Let me get the weather for San Francisco."
        },
        {
          "type": "tool_use",
          "id": "toolu_01XYZ789",
          "name": "get_weather",
          "input": { "location": "San Francisco", "unit": "fahrenheit" }
        }
      ],
      "stop_reason": "tool_use"
    }

    Verständnis der Antwort

    • server_tool_use: Zeigt an, dass Claude das Tool-Suchwerkzeug aufruft
    • tool_search_tool_result: Enthält die Suchergebnisse mit einem verschachtelten tool_search_tool_search_result-Objekt
    • tool_references: Array von tool_reference-Objekten, die auf entdeckte Werkzeuge verweisen
    • tool_use: Claude ruft das entdeckte Werkzeug auf

    Die tool_reference-Blöcke werden automatisch in vollständige Werkzeugdefinitionen erweitert, bevor sie Claude angezeigt werden. Sie müssen diese Erweiterung nicht selbst durchführen. Dies geschieht automatisch in der API, solange Sie alle übereinstimmenden Werkzeugdefinitionen im Parameter tools bereitstellen.

    MCP-Integration

    Das Tool-Suchwerkzeug funktioniert mit MCP-Servern. Fügen Sie den Beta-Header "mcp-client-2025-11-20" zu Ihrer API-Anfrage hinzu, und verwenden Sie dann mcp_toolset mit default_config, um das Laden von MCP-Werkzeugen aufzuschieben:

    curl https://api.anthropic.com/v1/messages \
      --header "x-api-key: $ANTHROPIC_API_KEY" \
      --header "anthropic-version: 2023-06-01" \
      --header "anthropic-beta: mcp-client-2025-11-20" \
      --header "content-type: application/json" \
      --data '{
        "model": "claude-opus-4-6",
        "max_tokens": 2048,
        "mcp_servers": [
          {
            "type": "url",
            "name": "database-server",
            "url": "https://mcp-db.example.com"
          }
        ],
        "tools": [
          {
            "type": "tool_search_tool_regex_20251119",
            "name": "tool_search_tool_regex"
          },
          {
            "type": "mcp_toolset",
            "mcp_server_name": "database-server",
            "default_config": {
              "defer_loading": true
            },
            "configs": {
              "search_events": {
                "defer_loading": false
              }
            }
          }
        ],
        "messages": [
          {
            "role": "user",
            "content": "What events are in my database?"
          }
        ]
      }'

    MCP-Konfigurationsoptionen:

    • default_config.defer_loading: Standard für alle Werkzeuge vom MCP-Server festlegen
    • configs: Standardwerte für bestimmte Werkzeuge nach Name überschreiben
    • Kombinieren Sie mehrere MCP-Server mit Tool-Suche für massive Werkzeugbibliotheken

    Benutzerdefinierte Tool-Suchimplementierung

    Sie können Ihre eigene Tool-Suchlogik implementieren (z. B. mit Embeddings oder semantischer Suche), indem Sie tool_reference-Blöcke aus einem benutzerdefinierten Werkzeug zurückgeben. Wenn Claude Ihr benutzerdefiniertes Suchwerkzeug aufruft, geben Sie ein Standard-tool_result mit tool_reference-Blöcken im Content-Array zurück:

    JSON
    {
      "type": "tool_result",
      "tool_use_id": "toolu_your_tool_id",
      "content": [
        { "type": "tool_reference", "tool_name": "discovered_tool_name" }
      ]
    }

    Jedes referenzierte Werkzeug muss eine entsprechende Werkzeugdefinition im Parameter tools der obersten Ebene mit defer_loading: true haben. Dieser Ansatz ermöglicht es Ihnen, anspruchsvollere Suchalgorithmen zu verwenden und gleichzeitig die Kompatibilität mit dem Tool-Suchsystem zu wahren.

    Das Format tool_search_tool_result, das im Abschnitt Antwortformat gezeigt wird, ist das serverseitige Format, das intern von Anthropics integrierter Tool-Suche verwendet wird. Verwenden Sie für benutzerdefinierte clientseitige Implementierungen immer das Standard-tool_result-Format mit tool_reference-Content-Blöcken wie oben gezeigt.

    Ein vollständiges Beispiel mit Embeddings finden Sie in unserem Tool-Suche mit Embeddings Cookbook.

    Fehlerbehandlung

    Das Tool-Suchwerkzeug ist nicht kompatibel mit Tool-Use-Beispielen. Wenn Sie Beispiele für die Werkzeugnutzung bereitstellen müssen, verwenden Sie Standard-Tool-Aufrufe ohne Tool-Suche.

    HTTP-Fehler (Status 400)

    Diese Fehler verhindern die Verarbeitung der Anfrage:

    Alle Werkzeuge aufgeschoben:

    {
      "type": "error",
      "error": {
        "type": "invalid_request_error",
        "message": "All tools have defer_loading set. At least one tool must be non-deferred."
      }
    }

    Fehlende Werkzeugdefinition:

    {
      "type": "error",
      "error": {
        "type": "invalid_request_error",
        "message": "Tool reference 'unknown_tool' has no corresponding tool definition"
      }
    }

    Tool-Ergebnis-Fehler (Status 200)

    Fehler während der Werkzeugausführung geben eine 200-Antwort mit Fehlerinformationen im Text zurück:

    JSON
    {
      "type": "tool_result",
      "tool_use_id": "srvtoolu_01ABC123",
      "content": {
        "type": "tool_search_tool_result_error",
        "error_code": "invalid_pattern"
      }
    }

    Fehlercodes:

    • too_many_requests: Ratenlimit für Tool-Suchvorgänge überschritten
    • invalid_pattern: Malformed Regex-Muster
    • pattern_too_long: Muster überschreitet Limit von 200 Zeichen
    • unavailable: Tool-Suchservice vorübergehend nicht verfügbar

    Häufige Fehler

    Prompt-Caching

    Die Tool-Suche funktioniert mit Prompt-Caching. Fügen Sie cache_control-Breakpoints hinzu, um mehrteilige Gespräche zu optimieren:

    Python
    import anthropic
    
    client = anthropic.Anthropic()
    
    # First request with tool search
    messages = [{"role": "user", "content": "What's the weather in Seattle?"}]
    
    response1 = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=2048,
        messages=messages,
        tools=[
            {"type": "tool_search_tool_regex_20251119", "name": "tool_search_tool_regex"},
            {
                "name": "get_weather",
                "description": "Get weather for a location",
                "input_schema": {
                    "type": "object",
                    "properties": {"location": {"type": "string"}},
                    "required": ["location"],
                },
                "defer_loading": True,
            },
        ],
    )
    
    # Add Claude's response to conversation
    messages.append({"role": "assistant", "content": response1.content})
    
    # Second request with cache breakpoint
    messages.append(
        {
            "role": "user",
            "content": "What about New York?",
            "cache_control": {"type": "ephemeral"},
        }
    )
    
    response2 = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=2048,
        messages=messages,
        tools=[
            {"type": "tool_search_tool_regex_20251119", "name": "tool_search_tool_regex"},
            {
                "name": "get_weather",
                "description": "Get weather for a location",
                "input_schema": {
                    "type": "object",
                    "properties": {"location": {"type": "string"}},
                    "required": ["location"],
                },
                "defer_loading": True,
            },
        ],
    )
    
    print(f"Cache read tokens: {response2.usage.get('cache_read_input_tokens', 0)}")

    Das System erweitert automatisch tool_reference-Blöcke in der gesamten Gesprächsverlauf, sodass Claude entdeckte Werkzeuge in nachfolgenden Durchläufen wiederverwenden kann, ohne erneut zu suchen.

    Streaming

    Mit aktiviertem Streaming erhalten Sie Tool-Suchereignisse als Teil des Streams:

    event: content_block_start
    data: {"type": "content_block_start", "index": 1, "content_block": {"type": "server_tool_use", "id": "srvtoolu_xyz789", "name": "tool_search_tool_regex"}}
    
    // Search query streamed
    event: content_block_delta
    data: {"type": "content_block_delta", "index": 1, "delta": {"type": "input_json_delta", "partial_json": "{\"query\":\"weather\"}"}}
    
    // Pause while search executes
    
    // Search results streamed
    event: content_block_start
    data: {"type": "content_block_start", "index": 2, "content_block": {"type": "tool_search_tool_result", "tool_use_id": "srvtoolu_xyz789", "content": {"type": "tool_search_tool_search_result", "tool_references": [{"type": "tool_reference", "tool_name": "get_weather"}]}}}
    
    // Claude continues with discovered tools

    Batch-Anfragen

    Sie können das Tool-Suchwerkzeug in die Messages Batches API einbeziehen. Tool-Suchvorgänge über die Messages Batches API werden genauso berechnet wie die in regulären Messages API-Anfragen.

    Limits und Best Practices

    Limits

    • Maximale Werkzeuge: 10.000 Werkzeuge in Ihrem Katalog
    • Suchergebnisse: Gibt 3-5 relevanteste Werkzeuge pro Suche zurück
    • Musterlänge: Maximale 200 Zeichen für Regex-Muster
    • Modellunterstützung: Nur Sonnet 4.0+, Opus 4.0+ (kein Haiku)

    Wann Tool-Suche verwendet werden sollte

    Gute Anwendungsfälle:

    • 10+ Werkzeuge in Ihrem System verfügbar
    • Werkzeugdefinitionen verbrauchen >10K Token
    • Probleme mit der Genauigkeit der Werkzeugauswahl bei großen Werkzeugsätzen
    • Aufbau von MCP-gestützten Systemen mit mehreren Servern (200+ Werkzeuge)
    • Werkzeugbibliothek wächst im Laufe der Zeit

    Wann traditionelle Tool-Aufrufe besser sein könnten:

    • Weniger als 10 Werkzeuge insgesamt
    • Alle Werkzeuge werden in jeder Anfrage häufig verwendet
    • Sehr kleine Werkzeugdefinitionen (<100 Token insgesamt)

    Optimierungstipps

    • Behalten Sie Ihre 3-5 am häufigsten verwendeten Werkzeuge als nicht aufgeschoben
    • Schreiben Sie klare, aussagekräftige Werkzeugnamen und Beschreibungen
    • Verwenden Sie semantische Schlüsselwörter in Beschreibungen, die damit übereinstimmen, wie Benutzer Aufgaben beschreiben
    • Fügen Sie einen Systemaufforderungsabschnitt hinzu, der verfügbare Werkzeugkategorien beschreibt: "Sie können nach Werkzeugen suchen, um mit Slack, GitHub und Jira zu interagieren"
    • Überwachen Sie, welche Werkzeuge Claude entdeckt, um Beschreibungen zu verfeinern

    Nutzung

    Die Nutzung des Tool-Suchwerkzeugs wird im Nutzungsobjekt der Antwort verfolgt:

    JSON
    {
      "usage": {
        "input_tokens": 1024,
        "output_tokens": 256,
        "server_tool_use": {
          "tool_search_requests": 2
        }
      }
    }

    Was this page helpful?

    • Funktionsweise der Tool-Suche
    • Schnellstart
    • Werkzeugdefinition
    • Aufgeschobenes Werkzeugladen
    • Antwortformat
    • Verständnis der Antwort
    • MCP-Integration
    • Benutzerdefinierte Tool-Suchimplementierung
    • Fehlerbehandlung
    • HTTP-Fehler (Status 400)
    • Tool-Ergebnis-Fehler (Status 200)
    • Häufige Fehler
    • Prompt-Caching
    • Streaming
    • Batch-Anfragen
    • Limits und Best Practices
    • Limits
    • Wann Tool-Suche verwendet werden sollte
    • Optimierungstipps
    • Nutzung