Modifica del contesto

Approccio	Dove viene eseguito	Strategie	Come funziona
Lato server	API	Cancellazione dei risultati degli strumenti (`clear_tool_uses_20250919`) Cancellazione dei blocchi di pensiero (`clear_thinking_20251015`)	Applicato prima che il prompt raggiunga Claude. Cancella contenuti specifici dalla cronologia della conversazione. Ogni strategia può essere configurata indipendentemente.
Lato client	SDK	Compattazione	Disponibile in Python e TypeScript SDKs quando si utilizza `tool_runner`. Genera un riepilogo e sostituisce la cronologia completa della conversazione. Vedi Compattazione di seguito.

Approccio	Dove viene eseguito	Strategie	Come funziona
Lato server	API	Cancellazione dei risultati degli strumenti (`clear_tool_uses_20250919`) Cancellazione dei blocchi di pensiero (`clear_thinking_20251015`)	Applicato prima che il prompt raggiunga Claude. Cancella contenuti specifici dalla cronologia della conversazione. Ogni strategia può essere configurata indipendentemente.
Lato client	SDK	Compattazione	Disponibile in Python e TypeScript SDKs quando si utilizza `tool_runner`. Genera un riepilogo e sostituisce la cronologia completa della conversazione. Vedi Compattazione di seguito.

Approccio	Dove viene eseguito	Strategie	Come funziona
Lato server	API	Cancellazione dei risultati degli strumenti (`clear_tool_uses_20250919`) Cancellazione dei blocchi di pensiero (`clear_thinking_20251015`)	Applicato prima che il prompt raggiunga Claude. Cancella contenuti specifici dalla cronologia della conversazione. Ogni strategia può essere configurata indipendentemente.
Lato client	SDK	Compattazione	Disponibile in Python e TypeScript SDKs quando si utilizza `tool_runner`. Genera un riepilogo e sostituisce la cronologia completa della conversazione. Vedi Compattazione di seguito.

Approccio	Dove viene eseguito	Strategie	Come funziona
Lato server	API	Cancellazione dei risultati degli strumenti (`clear_tool_uses_20250919`) Cancellazione dei blocchi di pensiero (`clear_thinking_20251015`)	Applicato prima che il prompt raggiunga Claude. Cancella contenuti specifici dalla cronologia della conversazione. Ogni strategia può essere configurata indipendentemente.
Lato client	SDK	Compattazione	Disponibile in Python e TypeScript SDKs quando si utilizza `tool_runner`. Genera un riepilogo e sostituisce la cronologia completa della conversazione. Vedi Compattazione di seguito.

Approccio	Dove viene eseguito	Strategie	Come funziona
Lato server	API	Cancellazione dei risultati degli strumenti (`clear_tool_uses_20250919`) Cancellazione dei blocchi di pensiero (`clear_thinking_20251015`)	Applicato prima che il prompt raggiunga Claude. Cancella contenuti specifici dalla cronologia della conversazione. Ogni strategia può essere configurata indipendentemente.
Lato client	SDK	Compattazione	Disponibile in Python e TypeScript SDKs quando si utilizza `tool_runner`. Genera un riepilogo e sostituisce la cronologia completa della conversazione. Vedi Compattazione di seguito.

curl https://api.anthropic.com/v1/messages \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "anthropic-version: 2023-06-01" \
    --header "content-type: application/json" \
    --header "anthropic-beta: context-management-2025-06-27" \
    --data '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 4096,
        "messages": [
            {
                "role": "user",
                "content": "Search for recent developments in AI"
            }
        ],
        "tools": [
            {
                "type": "web_search_20250305",
                "name": "web_search"
            }
        ],
        "context_management": {
            "edits": [
                {"type": "clear_tool_uses_20250919"}
            ]
        }
    }'

Approccio	Dove viene eseguito	Strategie	Come funziona
Lato server	API	Cancellazione dei risultati degli strumenti (`clear_tool_uses_20250919`) Cancellazione dei blocchi di pensiero (`clear_thinking_20251015`)	Applicato prima che il prompt raggiunga Claude. Cancella contenuti specifici dalla cronologia della conversazione. Ogni strategia può essere configurata indipendentemente.
Lato client	SDK	Compattazione	Disponibile in Python e TypeScript SDKs quando si utilizza `tool_runner`. Genera un riepilogo e sostituisce la cronologia completa della conversazione. Vedi Compattazione di seguito.

curl https://api.anthropic.com/v1/messages \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "anthropic-version: 2023-06-01" \
    --header "content-type: application/json" \
    --header "anthropic-beta: context-management-2025-06-27" \
    --data '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 4096,
        "messages": [
            {
                "role": "user",
                "content": "Search for recent developments in AI"
            }
        ],
        "tools": [
            {
                "type": "web_search_20250305",
                "name": "web_search"
            }
        ],
        "context_management": {
            "edits": [
                {"type": "clear_tool_uses_20250919"}
            ]
        }
    }'

curl https://api.anthropic.com/v1/messages \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "anthropic-version: 2023-06-01" \
    --header "content-type: application/json" \
    --header "anthropic-beta: context-management-2025-06-27" \
    --data '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 4096,
        "messages": [
            {
                "role": "user",
                "content": "Create a simple command line calculator app using Python"
            }
        ],
        "tools": [
            {
                "type": "text_editor_20250728",
                "name": "str_replace_based_edit_tool",
                "max_characters": 10000
            },
            {
                "type": "web_search_20250305",
                "name": "web_search",
                "max_uses": 3
            }
        ],
        "context_management": {
            "edits": [
                {
                    "type": "clear_tool_uses_20250919",
                    "trigger": {
                        "type": "input_tokens",
                        "value": 30000
                    },
                    "keep": {
                        "type": "tool_uses",
                        "value": 3
                    },
                    "clear_at_least": {
                        "type": "input_tokens",
                        "value": 5000
                    },
                    "exclude_tools": ["web_search"]
                }
            ]
        }
    }'

Approccio	Dove viene eseguito	Strategie	Come funziona
Lato server	API	Cancellazione dei risultati degli strumenti (`clear_tool_uses_20250919`) Cancellazione dei blocchi di pensiero (`clear_thinking_20251015`)	Applicato prima che il prompt raggiunga Claude. Cancella contenuti specifici dalla cronologia della conversazione. Ogni strategia può essere configurata indipendentemente.
Lato client	SDK	Compattazione	Disponibile negli SDK Python e TypeScript quando si utilizza `tool_runner`. Genera un riepilogo e sostituisce la cronologia completa della conversazione. Vedi Compattazione di seguito.

curl https://api.anthropic.com/v1/messages \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "anthropic-version: 2023-06-01" \
    --header "content-type: application/json" \
    --header "anthropic-beta: context-management-2025-06-27" \
    --data '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 4096,
        "messages": [
            {
                "role": "user",
                "content": "Search for recent developments in AI"
            }
        ],
        "tools": [
            {
                "type": "web_search_20250305",
                "name": "web_search"
            }
        ],
        "context_management": {
            "edits": [
                {"type": "clear_tool_uses_20250919"}
            ]
        }
    }'

curl https://api.anthropic.com/v1/messages \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "anthropic-version: 2023-06-01" \
    --header "content-type: application/json" \
    --header "anthropic-beta: context-management-2025-06-27" \
    --data '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 4096,
        "messages": [
            {
                "role": "user",
                "content": "Create a simple command line calculator app using Python"
            }
        ],
        "tools": [
            {
                "type": "text_editor_20250728",
                "name": "str_replace_based_edit_tool",
                "max_characters": 10000
            },
            {
                "type": "web_search_20250305",
                "name": "web_search",
                "max_uses": 3
            }
        ],
        "context_management": {
            "edits": [
                {
                    "type": "clear_tool_uses_20250919",
                    "trigger": {
                        "type": "input_tokens",
                        "value": 30000
                    },
                    "keep": {
                        "type": "tool_uses",
                        "value": 3
                    },
                    "clear_at_least": {
                        "type": "input_tokens",
                        "value": 5000
                    },
                    "exclude_tools": ["web_search"]
                }
            ]
        }
    }'

curl https://api.anthropic.com/v1/messages \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "anthropic-version: 2023-06-01" \
    --header "content-type: application/json" \
    --header "anthropic-beta: context-management-2025-06-27" \
    --data '{
        "model": "claude-sonnet-4-5-20250929",
        "max_tokens": 1024,
        "messages": [...],
        "thinking": {
            "type": "enabled",
            "budget_tokens": 10000
        },
        "context_management": {
            "edits": [
                {
                    "type": "clear_thinking_20251015",
                    "keep": {
                        "type": "thinking_turns",
                        "value": 2
                    }
                }
            ]
        }
    }'

Opzione di configurazione	Predefinito	Descrizione
`keep`	`{type: "thinking_turns", value: 1}`	Definisce quanti turni recenti dell'assistente con blocchi di pensiero preservare. Utilizza `{type: "thinking_turns", value: N}` dove N deve essere > 0 per mantenere gli ultimi N turni, o `"all"` per mantenere tutti i blocchi di pensiero.

// Keep thinking blocks from the last 3 assistant turns
{
  "type": "clear_thinking_20251015",
  "keep": {
    "type": "thinking_turns",
    "value": 3
  }
}

// Keep all thinking blocks (maximizes cache hits)
{
  "type": "clear_thinking_20251015",
  "keep": "all"
}

Opzione di configurazione	Predefinito	Descrizione
`keep`	`{type: "thinking_turns", value: 1}`	Definisce quanti turni recenti dell'assistente con blocchi di pensiero preservare. Utilizza `{type: "thinking_turns", value: N}` dove N deve essere > 0 per mantenere gli ultimi N turni, o `"all"` per mantenere tutti i blocchi di pensiero.

// Keep thinking blocks from the last 3 assistant turns
{
  "type": "clear_thinking_20251015",
  "keep": {
    "type": "thinking_turns",
    "value": 3
  }
}

// Keep all thinking blocks (maximizes cache hits)
{
  "type": "clear_thinking_20251015",
  "keep": "all"
}

response = client.beta.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    messages=[...],
    thinking={
        "type": "enabled",
        "budget_tokens": 10000
    },
    tools=[...],
    betas=["context-management-2025-06-27"],
    context_management={
        "edits": [
            {
                "type": "clear_thinking_20251015",
                "keep": {
                    "type": "thinking_turns",
                    "value": 2
                }
            },
            {
                "type": "clear_tool_uses_20250919",
                "trigger": {
                    "type": "input_tokens",
                    "value": 50000
                },
                "keep": {
                    "type": "tool_uses",
                    "value": 5
                }
            }
        ]
    }
)

Opzione di configurazione	Predefinito	Descrizione
`keep`	`{type: "thinking_turns", value: 1}`	Definisce quanti turni recenti dell'assistente con blocchi di pensiero preservare. Utilizza `{type: "thinking_turns", value: N}` dove N deve essere > 0 per mantenere gli ultimi N turni, o `"all"` per mantenere tutti i blocchi di pensiero.

// Keep thinking blocks from the last 3 assistant turns
{
  "type": "clear_thinking_20251015",
  "keep": {
    "type": "thinking_turns",
    "value": 3
  }
}

// Keep all thinking blocks (maximizes cache hits)
{
  "type": "clear_thinking_20251015",
  "keep": "all"
}

response = client.beta.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    messages=[...],
    thinking={
        "type": "enabled",
        "budget_tokens": 10000
    },
    tools=[...],
    betas=["context-management-2025-06-27"],
    context_management={
        "edits": [
            {
                "type": "clear_thinking_20251015",
                "keep": {
                    "type": "thinking_turns",
                    "value": 2
                }
            },
            {
                "type": "clear_tool_uses_20250919",
                "trigger": {
                    "type": "input_tokens",
                    "value": 50000
                },
                "keep": {
                    "type": "tool_uses",
                    "value": 5
                }
            }
        ]
    }
)

Opzione di configurazione	Predefinito	Descrizione
`trigger`	100.000 token di input	Definisce quando la strategia di modifica del contesto si attiva. Una volta che il prompt supera questa soglia, la cancellazione inizierà. Puoi specificare questo valore in `input_tokens` o `tool_uses`.
`keep`	3 utilizzi di strumenti	Definisce quante coppie recenti di utilizzo/risultato dello strumento mantenere dopo che si verifica la cancellazione. L'API rimuove prima le interazioni degli strumenti più vecchie, preservando le più recenti.
`clear_at_least`	Nessuno	Garantisce che un numero minimo di token venga cancellato ogni volta che la strategia si attiva. Se l'API non riesce a cancellare almeno l'importo specificato, la strategia non verrà applicata. Questo aiuta a determinare se la cancellazione del contesto vale la pena di interrompere la cache del prompt.
`exclude_tools`	Nessuno	Elenco dei nomi degli strumenti i cui utilizzi e risultati non devono mai essere cancellati. Utile per preservare il contesto importante.
`clear_tool_inputs`	`false`	Controlla se i parametri della chiamata dello strumento vengono cancellati insieme ai risultati dello strumento. Per impostazione predefinita, vengono cancellati solo i risultati dello strumento mentre le chiamate dello strumento originali di Claude rimangono visibili.

Opzione di configurazione	Predefinito	Descrizione
`keep`	`{type: "thinking_turns", value: 1}`	Definisce quanti turni recenti dell'assistente con blocchi di pensiero preservare. Utilizza `{type: "thinking_turns", value: N}` dove N deve essere > 0 per mantenere gli ultimi N turni, o `"all"` per mantenere tutti i blocchi di pensiero.

// Keep thinking blocks from the last 3 assistant turns
{
  "type": "clear_thinking_20251015",
  "keep": {
    "type": "thinking_turns",
    "value": 3
  }
}

// Keep all thinking blocks (maximizes cache hits)
{
  "type": "clear_thinking_20251015",
  "keep": "all"
}

response = client.beta.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    messages=[...],
    thinking={
        "type": "enabled",
        "budget_tokens": 10000
    },
    tools=[...],
    betas=["context-management-2025-06-27"],
    context_management={
        "edits": [
            {
                "type": "clear_thinking_20251015",
                "keep": {
                    "type": "thinking_turns",
                    "value": 2
                }
            },
            {
                "type": "clear_tool_uses_20250919",
                "trigger": {
                    "type": "input_tokens",
                    "value": 50000
                },
                "keep": {
                    "type": "tool_uses",
                    "value": 5
                }
            }
        ]
    }
)

Opzione di configurazione	Predefinito	Descrizione
`trigger`	100.000 token di input	Definisce quando la strategia di modifica del contesto si attiva. Una volta che il prompt supera questa soglia, la cancellazione inizierà. Puoi specificare questo valore in `input_tokens` o `tool_uses`.
`keep`	3 utilizzi di strumenti	Definisce quante coppie recenti di utilizzo/risultato dello strumento mantenere dopo che si verifica la cancellazione. L'API rimuove prima le interazioni degli strumenti più vecchie, preservando le più recenti.
`clear_at_least`	Nessuno	Garantisce che un numero minimo di token venga cancellato ogni volta che la strategia si attiva. Se l'API non riesce a cancellare almeno l'importo specificato, la strategia non verrà applicata. Questo aiuta a determinare se la cancellazione del contesto vale la pena di interrompere la cache del prompt.
`exclude_tools`	Nessuno	Elenco dei nomi degli strumenti i cui utilizzi e risultati non devono mai essere cancellati. Utile per preservare il contesto importante.
`clear_tool_inputs`	`false`	Controlla se i parametri della chiamata dello strumento vengono cancellati insieme ai risultati dello strumento. Per impostazione predefinita, vengono cancellati solo i risultati dello strumento mentre le chiamate dello strumento originali di Claude rimangono visibili.

Response

{
    "id": "msg_013Zva2CMHLNnXjNJJKqJ2EF",
    "type": "message",
    "role": "assistant",
    "content": [...],
    "usage": {...},
    "context_management": {
        "applied_edits": [
            // When using `clear_thinking_20251015`
            {
                "type": "clear_thinking_20251015",
                "cleared_thinking_turns": 3,
                "cleared_input_tokens": 15000
            },
            // When using `clear_tool_uses_20250919`
            {
                "type": "clear_tool_uses_20250919",
                "cleared_tool_uses": 8,
                "cleared_input_tokens": 50000
            }
        ]
    }
}

Streaming Response

{
    "type": "message_delta",
    "delta": {
        "stop_reason": "end_turn",
        "stop_sequence": null
    },
    "usage": {
        "output_tokens": 1024
    },
    "context_management": {
        "applied_edits": [...]
    }
}

Opzione di configurazione	Predefinito	Descrizione
`keep`	`{type: "thinking_turns", value: 1}`	Definisce quanti turni recenti dell'assistente con blocchi di pensiero preservare. Usa `{type: "thinking_turns", value: N}` dove N deve essere > 0 per mantenere gli ultimi N turni, o `"all"` per mantenere tutti i blocchi di pensiero.

// Mantieni i blocchi di pensiero degli ultimi 3 turni dell'assistente
{
  "type": "clear_thinking_20251015",
  "keep": {
    "type": "thinking_turns",
    "value": 3
  }
}

// Mantieni tutti i blocchi di pensiero (massimizza i hit della cache)
{
  "type": "clear_thinking_20251015",
  "keep": "all"
}

response = client.beta.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    messages=[...],
    thinking={
        "type": "enabled",
        "budget_tokens": 10000
    },
    tools=[...],
    betas=["context-management-2025-06-27"],
    context_management={
        "edits": [
            {
                "type": "clear_thinking_20251015",
                "keep": {
                    "type": "thinking_turns",
                    "value": 2
                }
            },
            {
                "type": "clear_tool_uses_20250919",
                "trigger": {
                    "type": "input_tokens",
                    "value": 50000
                },
                "keep": {
                    "type": "tool_uses",
                    "value": 5
                }
            }
        ]
    }
)

Opzione di configurazione	Predefinito	Descrizione
`trigger`	100.000 token di input	Definisce quando la strategia di modifica del contesto si attiva. Una volta che il prompt supera questa soglia, la cancellazione avrà inizio. Puoi specificare questo valore in `input_tokens` o `tool_uses`.
`keep`	3 utilizzi di strumenti	Definisce quante coppie recenti di utilizzo/risultato dello strumento mantenere dopo che si verifica la cancellazione. L'API rimuove prima le interazioni degli strumenti più vecchie, preservando le più recenti.
`clear_at_least`	Nessuno	Garantisce che un numero minimo di token venga cancellato ogni volta che la strategia si attiva. Se l'API non riesce a cancellare almeno l'importo specificato, la strategia non verrà applicata. Questo aiuta a determinare se la cancellazione del contesto vale la pena di interrompere la cache del tuo prompt.
`exclude_tools`	Nessuno	Elenco dei nomi degli strumenti i cui utilizzi e risultati non devono mai essere cancellati. Utile per preservare il contesto importante.
`clear_tool_inputs`	`false`	Controlla se i parametri della chiamata dello strumento vengono cancellati insieme ai risultati dello strumento. Per impostazione predefinita, solo i risultati dello strumento vengono cancellati mentre le chiamate dello strumento originali di Claude rimangono visibili.

Response

{
    "id": "msg_013Zva2CMHLNnXjNJJKqJ2EF",
    "type": "message",
    "role": "assistant",
    "content": [...],
    "usage": {...},
    "context_management": {
        "applied_edits": [
            // Quando utilizzi `clear_thinking_20251015`
            {
                "type": "clear_thinking_20251015",
                "cleared_thinking_turns": 3,
                "cleared_input_tokens": 15000
            },
            // Quando utilizzi `clear_tool_uses_20250919`
            {
                "type": "clear_tool_uses_20250919",
                "cleared_tool_uses": 8,
                "cleared_input_tokens": 50000
            }
        ]
    }
}

Streaming Response

{
    "type": "message_delta",
    "delta": {
        "stop_reason": "end_turn",
        "stop_sequence": null
    },
    "usage": {
        "output_tokens": 1024
    },
    "context_management": {
        "applied_edits": [...]
    }
}

curl https://api.anthropic.com/v1/messages/count_tokens \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "anthropic-version: 2023-06-01" \
    --header "content-type: application/json" \
    --header "anthropic-beta: context-management-2025-06-27" \
    --data '{
        "model": "claude-sonnet-4-5",
        "messages": [
            {
                "role": "user",
                "content": "Continue our conversation..."
            }
        ],
        "tools": [...],
        "context_management": {
            "edits": [
                {
                    "type": "clear_tool_uses_20250919",
                    "trigger": {
                        "type": "input_tokens",
                        "value": 30000
                    },
                    "keep": {
                        "type": "tool_uses",
                        "value": 5
                    }
                }
            ]
        }
    }'

response = client.beta.messages.create(
    model="claude-sonnet-4-5",
    max_tokens=4096,
    messages=[...],
    tools=[
        {
            "type": "memory_20250818",
            "name": "memory"
        },
        # Your other tools
    ],
    betas=["context-management-2025-06-27"],
    context_management={
        "edits": [
            {"type": "clear_tool_uses_20250919"}
        ]
    }
)

import anthropic

client = anthropic.Anthropic()

runner = client.beta.messages.tool_runner(
    model="claude-sonnet-4-5",
    max_tokens=4096,
    tools=[...],
    messages=[
        {
            "role": "user",
            "content": "Analyze all the files in this directory and write a summary report."
        }
    ],
    compaction_control={
        "enabled": True,
        "context_token_threshold": 100000
    }
)

for message in runner:
    print(f"Tokens used: {message.usage.input_tokens}")

final = runner.until_done()

[
  { "role": "user", "content": "Analyze all files and write a report..." },
  { "role": "assistant", "content": "I'll help. Let me start by reading..." },
  { "role": "user", "content": [{ "type": "tool_result", "tool_use_id": "...", "content": "..." }] },
  { "role": "assistant", "content": "Based on file1.txt, I see..." },
  { "role": "user", "content": [{ "type": "tool_result", "tool_use_id": "...", "content": "..." }] },
  { "role": "assistant", "content": "After analyzing file2.txt..." },
  // ... 50 more exchanges like this ...
]

[
  {
    "role": "assistant",
    "content": "# Task Overview\nThe user requested analysis of directory files to produce a summary report...\n\n# Current State\nAnalyzed 52 files across 3 subdirectories. Key findings documented in report.md...\n\n# Important Discoveries\n- Configuration files use YAML format\n- Found 3 deprecated dependencies\n- Test coverage at 67%\n\n# Next Steps\n1. Analyze remaining files in /src/legacy\n2. Complete final report sections...\n\n# Context to Preserve\nUser prefers markdown format with executive summary first..."
  }
]

Parametro	Tipo	Obbligatorio	Predefinito	Descrizione
`enabled`	boolean	Sì	-	Se abilitare la compattazione automatica
`context_token_threshold`	number	No	100.000	Conteggio dei token a cui si attiva la compattazione
`model`	string	No	Stesso modello principale	Modello da utilizzare per generare i riassunti
`summary_prompt`	string	No	Vedi sotto	Prompt personalizzato per la generazione del riassunto

# More frequent compaction for memory-constrained scenarios
compaction_control={
    "enabled": True,
    "context_token_threshold": 50000
}

# Less frequent compaction when you need more context
compaction_control={
    "enabled": True,
    "context_token_threshold": 150000
}

compaction_control={
    "enabled": True,
    "context_token_threshold": 100000,
    "summary_prompt": """Summarize the research conducted so far, including:
- Sources consulted and key findings
- Questions answered and remaining unknowns
- Recommended next steps

Wrap your summary in <summary></summary> tags."""
}

response = client.beta.messages.create(
    model="claude-sonnet-4-5",
    max_tokens=4096,
    messages=[...],
    tools=[
        {
            "type": "memory_20250818",
            "name": "memory"
        },
        # Your other tools
    ],
    betas=["context-management-2025-06-27"],
    context_management={
        "edits": [
            {"type": "clear_tool_uses_20250919"}
        ]
    }
)

import anthropic

client = anthropic.Anthropic()

runner = client.beta.messages.tool_runner(
    model="claude-sonnet-4-5",
    max_tokens=4096,
    tools=[...],
    messages=[
        {
            "role": "user",
            "content": "Analyze all the files in this directory and write a summary report."
        }
    ],
    compaction_control={
        "enabled": True,
        "context_token_threshold": 100000
    }
)

for message in runner:
    print(f"Tokens used: {message.usage.input_tokens}")

final = runner.until_done()

[
  { "role": "user", "content": "Analyze all files and write a report..." },
  { "role": "assistant", "content": "I'll help. Let me start by reading..." },
  { "role": "user", "content": [{ "type": "tool_result", "tool_use_id": "...", "content": "..." }] },
  { "role": "assistant", "content": "Based on file1.txt, I see..." },
  { "role": "user", "content": [{ "type": "tool_result", "tool_use_id": "...", "content": "..." }] },
  { "role": "assistant", "content": "After analyzing file2.txt..." },
  // ... 50 more exchanges like this ...
]

[
  {
    "role": "assistant",
    "content": "# Task Overview\nThe user requested analysis of directory files to produce a summary report...\n\n# Current State\nAnalyzed 52 files across 3 subdirectories. Key findings documented in report.md...\n\n# Important Discoveries\n- Configuration files use YAML format\n- Found 3 deprecated dependencies\n- Test coverage at 67%\n\n# Next Steps\n1. Analyze remaining files in /src/legacy\n2. Complete final report sections...\n\n# Context to Preserve\nUser prefers markdown format with executive summary first..."
  }
]

Parametro	Tipo	Obbligatorio	Predefinito	Descrizione
`enabled`	boolean	Sì	-	Se abilitare la compattazione automatica
`context_token_threshold`	number	No	100,000	Conteggio dei token in cui viene attivata la compattazione
`model`	string	No	Stesso modello principale	Modello da utilizzare per generare i riassunti
`summary_prompt`	string	No	Vedi sotto	Prompt personalizzato per la generazione del riassunto

# More frequent compaction for memory-constrained scenarios
compaction_control={
    "enabled": True,
    "context_token_threshold": 50000
}

# Less frequent compaction when you need more context
compaction_control={
    "enabled": True,
    "context_token_threshold": 150000
}

compaction_control={
    "enabled": True,
    "context_token_threshold": 100000,
    "summary_prompt": """Summarize the research conducted so far, including:
- Sources consulted and key findings
- Questions answered and remaining unknowns
- Recommended next steps

Wrap your summary in <summary></summary> tags."""
}

import logging

logging.basicConfig(level=logging.INFO)
logging.getLogger("anthropic.lib.tools").setLevel(logging.INFO)

# Logs will show:
# INFO: Token usage 105000 has exceeded the threshold of 100000. Performing compaction.
# INFO: Compaction complete. New token usage: 2500

import logging

logging.basicConfig(level=logging.INFO)
logging.getLogger("anthropic.lib.tools").setLevel(logging.INFO)

# Logs will show:
# INFO: Token usage 105000 has exceeded the threshold of 100000. Performing compaction.
# INFO: Compaction complete. New token usage: 2500

Panoramica

Panoramica

Panoramica

Panoramica

Strategie lato server

Panoramica

Strategie lato server

Cancellazione dei risultati degli strumenti

Panoramica

Strategie lato server

Cancellazione dei risultati degli strumenti

Cancellazione dei blocchi di pensiero

Panoramica

Strategie lato server

Cancellazione dei risultati degli strumenti

Cancellazione dei blocchi di pensiero

Modelli supportati

Panoramica

Strategie lato server

Cancellazione dei risultati degli strumenti

Cancellazione dei blocchi di pensiero

Utilizzo della cancellazione dei risultati degli strumenti

Panoramica

Strategie lato server

Cancellazione dei risultati degli strumenti

Cancellazione dei blocchi di pensiero

Modelli supportati

Utilizzo della cancellazione dei risultati degli strumenti

Configurazione avanzata

Panoramica

Strategie lato server

Cancellazione dei risultati degli strumenti

Cancellazione dei blocchi di pensiero

Modelli supportati

Utilizzo della cancellazione dei risultati degli strumenti

Configurazione avanzata

Utilizzo della cancellazione dei blocchi di pensiero

Opzioni di configurazione per la cancellazione dei blocchi di pensiero

Opzioni di configurazione per la cancellazione dei blocchi di pensiero

Combinazione di strategie

Opzioni di configurazione per la cancellazione dei blocchi di pensiero

Combinazione di strategie

Opzioni di configurazione per la cancellazione dei risultati degli strumenti

Opzioni di configurazione per la cancellazione dei blocchi di pensiero

Combinazione di strategie

Opzioni di configurazione per la cancellazione dei risultati degli strumenti

Risposta della modifica del contesto

Opzioni di configurazione per la cancellazione dei blocchi di pensiero

Combinazione di strategie

Opzioni di configurazione per la cancellazione dei risultati degli strumenti

Risposta della modifica del contesto

Conteggio dei token

Utilizzo con lo strumento Memory

Compattazione lato client (SDK)

Come funziona la compattazione

Utilizzo della compattazione

Cosa accade durante la compattazione

Opzioni di configurazione

Scelta di una soglia di token

Utilizzo di un modello diverso per i riassunti

Prompt di riassunto personalizzati

Utilizzo con lo strumento Memory

Compattazione lato client (SDK)

Come funziona la compattazione

Utilizzo della compattazione

Cosa accade durante la compattazione

Opzioni di configurazione

Scelta di una soglia di token

Utilizzo di un modello diverso per i riassunti

Prompt di riassunto personalizzati

Prompt di riassunto predefinito

View full default prompt

Limitazioni

Strumenti lato server

Casi limite di utilizzo degli strumenti

Limitazioni

Strumenti lato server

Casi limite di utilizzo degli strumenti

Monitoraggio della compattazione

Limitazioni