Kontextbearbeitung
Die Kontextbearbeitung befindet sich derzeit in der Beta-Phase mit Unterstützung für das Löschen von Tool-Ergebnissen. Um sie zu aktivieren, verwenden Sie den Beta-Header context-management-2025-06-27 in Ihren API-Anfragen. Zusätzliche Kontextbearbeitungsstrategien werden in zukünftigen Versionen hinzugefügt.
Bitte wenden Sie sich über unser Feedback-Formular an uns, um Ihr Feedback zu dieser Funktion zu teilen.
Wie es funktioniert
Die clear_tool_uses_20250919-Strategie löscht Tool-Ergebnisse, wenn der Gesprächskontext über Ihren konfigurierten Schwellenwert hinauswächst. Wenn aktiviert, löscht die API automatisch die ältesten Tool-Ergebnisse in chronologischer Reihenfolge und ersetzt sie durch Platzhaltertext, um Claude mitzuteilen, dass das Tool-Ergebnis entfernt wurde. Standardmäßig werden nur Tool-Ergebnisse gelöscht. Sie können optional sowohl Tool-Ergebnisse als auch Tool-Aufrufe (die Tool-Verwendungsparameter) löschen, indem Sie clear_tool_inputs auf true setzen.
Kontextbearbeitung erfolgt serverseitig
Die Kontextbearbeitung wird serverseitig angewendet, bevor der Prompt Claude erreicht. Ihre Client-Anwendung behält die vollständige, unveränderte Gesprächshistorie bei – Sie müssen Ihren Client-Status nicht mit der bearbeiteten Version synchronisieren. Verwalten Sie weiterhin Ihre vollständige Gesprächshistorie lokal wie gewohnt.
Kontextbearbeitung und Prompt-Caching
Die Kontextbearbeitung macht gecachte Prompt-Präfixe ungültig, da das Löschen von Inhalten die Prompt-Struktur verändert und die Übereinstimmungsanforderung für Cache-Treffer bricht. Um dies zu berücksichtigen, empfehlen wir, genügend Token zu löschen, um die Cache-Invalidierung lohnenswert zu machen. Verwenden Sie den clear_at_least-Parameter, um sicherzustellen, dass jedes Mal eine Mindestanzahl von Token gelöscht wird. Bei der Verwendung von Prompt-Caching mit Kontextbearbeitung entstehen Ihnen Cache-Schreibkosten jedes Mal, wenn Inhalte gelöscht werden, aber nachfolgende Anfragen können den neu gecachten Präfix wiederverwenden.
Unterstützte Modelle
Die Kontextbearbeitung ist verfügbar für:
- Claude Opus 4.1 (
claude-opus-4-1-20250805) - Claude Opus 4 (
claude-opus-4-20250514) - Claude Sonnet 4.5 (
claude-sonnet-4-5-20250929) - Claude Sonnet 4 (
claude-sonnet-4-20250514)
Grundlegende Verwendung
Der einfachste Weg, die Kontextbearbeitung zu aktivieren, ist nur den Strategietyp anzugeben, da alle anderen Konfigurationsoptionen ihre Standardwerte verwenden:
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--header "anthropic-beta: context-management-2025-06-27" \
--data '{
"model": "claude-sonnet-4-5",
"max_tokens": 4096,
"messages": [
{
"role": "user",
"content": "Suche nach aktuellen Entwicklungen in der KI"
}
],
"tools": [
{
"type": "web_search_20250305",
"name": "web_search"
}
],
"context_management": {
"edits": [
{"type": "clear_tool_uses_20250919"}
]
}
}'response = client.beta.messages.create(
model="claude-sonnet-4-5",
max_tokens=4096,
messages=[
{
"role": "user",
"content": "Suche nach aktuellen Entwicklungen in der KI"
}
],
tools=[
{
"type": "web_search_20250305",
"name": "web_search"
}
],
betas=["context-management-2025-06-27"],
context_management={
"edits": [
{"type": "clear_tool_uses_20250919"}
]
}
)import Anthropic from '@anthropic-ai/sdk';
const anthropic = new Anthropic({
apiKey: process.env.ANTHROPIC_API_KEY,
});
const response = await anthropic.beta.messages.create({
model: "claude-sonnet-4-5",
max_tokens: 4096,
messages: [
{
role: "user",
content: "Suche nach aktuellen Entwicklungen in der KI"
}
],
tools: [
{
type: "web_search_20250305",
name: "web_search"
}
],
context_management: {
edits: [
{ type: "clear_tool_uses_20250919" }
]
},
betas: ["context-management-2025-06-27"]
});Erweiterte Konfiguration
Sie können das Verhalten der Kontextbearbeitung mit zusätzlichen Parametern anpassen:
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--header "anthropic-beta: context-management-2025-06-27" \
--data '{
"model": "claude-sonnet-4-5",
"max_tokens": 4096,
"messages": [
{
"role": "user",
"content": "Erstelle eine einfache Kommandozeilen-Taschenrechner-App mit Python"
}
],
"tools": [
{
"type": "text_editor_20250728",
"name": "str_replace_based_edit_tool",
"max_characters": 10000
},
{
"type": "web_search_20250305",
"name": "web_search",
"max_uses": 3
}
],
"context_management": {
"edits": [
{
"type": "clear_tool_uses_20250919",
"trigger": {
"type": "input_tokens",
"value": 30000
},
"keep": {
"type": "tool_uses",
"value": 3
},
"clear_at_least": {
"type": "input_tokens",
"value": 5000
},
"exclude_tools": ["web_search"]
}
]
}
}'Konfigurationsoptionen
| Konfigurationsoption | Standard | Beschreibung |
|---|---|---|
trigger | 100.000 Input-Token | Definiert, wann die Kontextbearbeitungsstrategie aktiviert wird. Sobald der Prompt diesen Schwellenwert überschreitet, beginnt das Löschen. Sie können diesen Wert entweder in input_tokens oder tool_uses angeben. |
keep | 3 Tool-Verwendungen | Definiert, wie viele aktuelle Tool-Verwendungs-/Ergebnispaare nach dem Löschen behalten werden sollen. Die API entfernt zuerst die ältesten Tool-Interaktionen und bewahrt die neuesten auf. |
clear_at_least | Keine | Stellt sicher, dass jedes Mal eine Mindestanzahl von Token gelöscht wird, wenn die Strategie aktiviert wird. Wenn die API nicht mindestens die angegebene Menge löschen kann, wird die Strategie nicht angewendet. Dies hilft zu bestimmen, ob das Löschen des Kontexts es wert ist, Ihren Prompt-Cache zu brechen. |
exclude_tools | Keine | Liste von Tool-Namen, deren Tool-Verwendungen und -Ergebnisse niemals gelöscht werden sollen. Nützlich für die Bewahrung wichtiger Kontexte. |
clear_tool_inputs | false | Steuert, ob die Tool-Aufrufparameter zusammen mit den Tool-Ergebnissen gelöscht werden. Standardmäßig werden nur die Tool-Ergebnisse gelöscht, während Claudes ursprüngliche Tool-Aufrufe sichtbar bleiben. |
Antwortformat
Sie können sehen, welche Kontextbearbeitungen auf Ihre Anfrage angewendet wurden, indem Sie das context_management-Antwortfeld verwenden, zusammen mit hilfreichen Statistiken über den gelöschten Inhalt und die Input-Token.
{
"id": "msg_013Zva2CMHLNnXjNJJKqJ2EF",
"type": "message",
"role": "assistant",
"content": [...],
"usage": {...},
"context_management": {
"applied_edits": [
{
"type": "clear_tool_uses_20250919",
"cleared_tool_uses": 8,
"cleared_input_tokens": 50000
}
]
}
}Für Streaming-Antworten werden die Kontextbearbeitungen im finalen message_delta-Event enthalten sein:
{
"type": "message_delta",
"delta": {
"stop_reason": "end_turn",
"stop_sequence": null
},
"usage": {
"output_tokens": 1024
},
"context_management": {
"applied_edits": [...]
}
}Token-Zählung
Der Token-Zählungs-Endpunkt unterstützt Kontextverwaltung und ermöglicht es Ihnen, eine Vorschau darauf zu erhalten, wie viele Token Ihr Prompt nach der Anwendung der Kontextbearbeitung verwenden wird.
curl https://api.anthropic.com/v1/messages/count_tokens \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--header "anthropic-beta: context-management-2025-06-27" \
--data '{
"model": "claude-sonnet-4-5",
"messages": [
{
"role": "user",
"content": "Setze unser Gespräch fort..."
}
],
"tools": [...],
"context_management": {
"edits": [
{
"type": "clear_tool_uses_20250919",
"trigger": {
"type": "input_tokens",
"value": 30000
},
"keep": {
"type": "tool_uses",
"value": 5
}
}
]
}
}'{
"input_tokens": 25000,
"context_management": {
"original_input_tokens": 70000
}
}Die Antwort zeigt sowohl die finale Token-Anzahl nach der Anwendung der Kontextverwaltung (input_tokens) als auch die ursprüngliche Token-Anzahl vor dem Löschen (original_input_tokens).
Verwendung mit dem Memory Tool
Die Kontextbearbeitung kann mit dem Memory Tool kombiniert werden. Wenn Ihr Gesprächskontext sich dem konfigurierten Löschschwellenwert nähert, erhält Claude eine automatische Warnung, wichtige Informationen zu bewahren. Dies ermöglicht es Claude, Tool-Ergebnisse oder Kontext in seinen Memory-Dateien zu speichern, bevor sie aus der Gesprächshistorie gelöscht werden.
Diese Kombination ermöglicht es Ihnen:
- Wichtigen Kontext bewahren: Claude kann wesentliche Informationen aus Tool-Ergebnissen in Memory-Dateien schreiben, bevor diese Ergebnisse gelöscht werden
- Langanhaltende Workflows aufrechterhalten: Ermöglichen Sie agentische Workflows, die andernfalls die Kontextgrenzen überschreiten würden, indem Informationen in persistenten Speicher ausgelagert werden
- Informationen bei Bedarf abrufen: Claude kann zuvor gelöschte Informationen aus Memory-Dateien nachschlagen, wenn sie benötigt werden, anstatt alles im aktiven Kontextfenster zu behalten
Zum Beispiel kann Claude in einem Dateibearbeitungs-Workflow, bei dem Claude viele Operationen durchführt, abgeschlossene Änderungen in Memory-Dateien zusammenfassen, während der Kontext wächst. Wenn Tool-Ergebnisse gelöscht werden, behält Claude über sein Memory-System Zugang zu diesen Informationen und kann effektiv weiterarbeiten.
Um beide Funktionen zusammen zu verwenden, aktivieren Sie sie in Ihrer API-Anfrage:
response = client.beta.messages.create(
model="claude-sonnet-4-5",
max_tokens=4096,
messages=[...],
tools=[
{
"type": "memory_20250818",
"name": "memory"
},
# Ihre anderen Tools
],
betas=["context-management-2025-06-27"],
context_management={
"edits": [
{"type": "clear_tool_uses_20250919"}
]
}
)