Édition du contexte

curl https://api.anthropic.com/v1/messages \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "anthropic-version: 2023-06-01" \
    --header "content-type: application/json" \
    --header "anthropic-beta: context-management-2025-06-27" \
    --data '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 4096,
        "messages": [
            {
                "role": "user",
                "content": "Search for recent developments in AI"
            }
        ],
        "tools": [
            {
                "type": "web_search_20250305",
                "name": "web_search"
            }
        ],
        "context_management": {
            "edits": [
                {"type": "clear_tool_uses_20250919"}
            ]
        }
    }'

curl https://api.anthropic.com/v1/messages \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "anthropic-version: 2023-06-01" \
    --header "content-type: application/json" \
    --header "anthropic-beta: context-management-2025-06-27" \
    --data '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 4096,
        "messages": [
            {
                "role": "user",
                "content": "Create a simple command line calculator app using Python"
            }
        ],
        "tools": [
            {
                "type": "text_editor_20250728",
                "name": "str_replace_based_edit_tool",
                "max_characters": 10000
            },
            {
                "type": "web_search_20250305",
                "name": "web_search",
                "max_uses": 3
            }
        ],
        "context_management": {
            "edits": [
                {
                    "type": "clear_tool_uses_20250919",
                    "trigger": {
                        "type": "input_tokens",
                        "value": 30000
                    },
                    "keep": {
                        "type": "tool_uses",
                        "value": 3
                    },
                    "clear_at_least": {
                        "type": "input_tokens",
                        "value": 5000
                    },
                    "exclude_tools": ["web_search"]
                }
            ]
        }
    }'

Approche	Où elle s'exécute	Stratégies	Comment cela fonctionne
Côté serveur	API	Effacement des résultats d'outils (`clear_tool_uses_20250919`) Effacement des blocs de réflexion (`clear_thinking_20251015`)	Appliqué avant que l'invite n'atteigne Claude. Efface le contenu spécifique de l'historique de conversation. Chaque stratégie peut être configurée indépendamment.
Côté client	SDK	Compaction	Disponible dans les SDK Python et TypeScript lors de l'utilisation de `tool_runner`. Génère un résumé et remplace l'historique complet de la conversation. Voir Compaction ci-dessous.

curl https://api.anthropic.com/v1/messages \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "anthropic-version: 2023-06-01" \
    --header "content-type: application/json" \
    --header "anthropic-beta: context-management-2025-06-27" \
    --data '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 4096,
        "messages": [
            {
                "role": "user",
                "content": "Search for recent developments in AI"
            }
        ],
        "tools": [
            {
                "type": "web_search_20250305",
                "name": "web_search"
            }
        ],
        "context_management": {
            "edits": [
                {"type": "clear_tool_uses_20250919"}
            ]
        }
    }'

curl https://api.anthropic.com/v1/messages \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "anthropic-version: 2023-06-01" \
    --header "content-type: application/json" \
    --header "anthropic-beta: context-management-2025-06-27" \
    --data '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 4096,
        "messages": [
            {
                "role": "user",
                "content": "Create a simple command line calculator app using Python"
            }
        ],
        "tools": [
            {
                "type": "text_editor_20250728",
                "name": "str_replace_based_edit_tool",
                "max_characters": 10000
            },
            {
                "type": "web_search_20250305",
                "name": "web_search",
                "max_uses": 3
            }
        ],
        "context_management": {
            "edits": [
                {
                    "type": "clear_tool_uses_20250919",
                    "trigger": {
                        "type": "input_tokens",
                        "value": 30000
                    },
                    "keep": {
                        "type": "tool_uses",
                        "value": 3
                    },
                    "clear_at_least": {
                        "type": "input_tokens",
                        "value": 5000
                    },
                    "exclude_tools": ["web_search"]
                }
            ]
        }
    }'

curl https://api.anthropic.com/v1/messages \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "anthropic-version: 2023-06-01" \
    --header "content-type: application/json" \
    --header "anthropic-beta: context-management-2025-06-27" \
    --data '{
        "model": "claude-sonnet-4-5-20250929",
        "max_tokens": 1024,
        "messages": [...],
        "thinking": {
            "type": "enabled",
            "budget_tokens": 10000
        },
        "context_management": {
            "edits": [
                {
                    "type": "clear_thinking_20251015",
                    "keep": {
                        "type": "thinking_turns",
                        "value": 2
                    }
                }
            ]
        }
    }'

Option de configuration	Par défaut	Description
`keep`	`{type: "thinking_turns", value: 1}`	Définit le nombre de tours d'assistant récents avec blocs de réflexion à conserver. Utilisez `{type: "thinking_turns", value: N}` où N doit être > 0 pour conserver les N derniers tours, ou `"all"` pour conserver tous les blocs de réflexion.

// Conserver les blocs de réflexion des 3 derniers tours d'assistant
{
  "type": "clear_thinking_20251015",
  "keep": {
    "type": "thinking_turns",
    "value": 3
  }
}

// Conserver tous les blocs de réflexion (maximise les accès au cache)
{
  "type": "clear_thinking_20251015",
  "keep": "all"
}

Option de configuration	Par défaut	Description
`keep`	`{type: "thinking_turns", value: 1}`	Définit le nombre de tours d'assistant récents avec blocs de réflexion à conserver. Utilisez `{type: "thinking_turns", value: N}` où N doit être > 0 pour conserver les N derniers tours, ou `"all"` pour conserver tous les blocs de réflexion.

// Conserver les blocs de réflexion des 3 derniers tours d'assistant
{
  "type": "clear_thinking_20251015",
  "keep": {
    "type": "thinking_turns",
    "value": 3
  }
}

// Conserver tous les blocs de réflexion (maximise les accès au cache)
{
  "type": "clear_thinking_20251015",
  "keep": "all"
}

response = client.beta.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    messages=[...],
    thinking={
        "type": "enabled",
        "budget_tokens": 10000
    },
    tools=[...],
    betas=["context-management-2025-06-27"],
    context_management={
        "edits": [
            {
                "type": "clear_thinking_20251015",
                "keep": {
                    "type": "thinking_turns",
                    "value": 2
                }
            },
            {
                "type": "clear_tool_uses_20250919",
                "trigger": {
                    "type": "input_tokens",
                    "value": 50000
                },
                "keep": {
                    "type": "tool_uses",
                    "value": 5
                }
            }
        ]
    }
)

Option de configuration	Par défaut	Description
`keep`	`{type: "thinking_turns", value: 1}`	Définit le nombre de tours d'assistant récents avec blocs de réflexion à conserver. Utilisez `{type: "thinking_turns", value: N}` où N doit être > 0 pour conserver les N derniers tours, ou `"all"` pour conserver tous les blocs de réflexion.

// Conserver les blocs de réflexion des 3 derniers tours d'assistant
{
  "type": "clear_thinking_20251015",
  "keep": {
    "type": "thinking_turns",
    "value": 3
  }
}

// Conserver tous les blocs de réflexion (maximise les accès au cache)
{
  "type": "clear_thinking_20251015",
  "keep": "all"
}

response = client.beta.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    messages=[...],
    thinking={
        "type": "enabled",
        "budget_tokens": 10000
    },
    tools=[...],
    betas=["context-management-2025-06-27"],
    context_management={
        "edits": [
            {
                "type": "clear_thinking_20251015",
                "keep": {
                    "type": "thinking_turns",
                    "value": 2
                }
            },
            {
                "type": "clear_tool_uses_20250919",
                "trigger": {
                    "type": "input_tokens",
                    "value": 50000
                },
                "keep": {
                    "type": "tool_uses",
                    "value": 5
                }
            }
        ]
    }
)

Option de configuration	Par défaut	Description
`trigger`	100 000 jetons d'entrée	Définit quand la stratégie de modification du contexte s'active. Une fois que l'invite dépasse ce seuil, l'effacement commencera. Vous pouvez spécifier cette valeur en `input_tokens` ou `tool_uses`.
`keep`	3 utilisations d'outils	Définit le nombre de paires récentes d'utilisation/résultat d'outils à conserver après l'effacement. L'API supprime d'abord les interactions d'outils les plus anciennes, en préservant les plus récentes.
`clear_at_least`	Aucun	Garantit qu'un nombre minimum de jetons est effacé chaque fois que la stratégie s'active. Si l'API ne peut pas effacer au moins le montant spécifié, la stratégie ne sera pas appliquée. Cela aide à déterminer si l'effacement du contexte vaut la peine de casser votre cache d'invite.
`exclude_tools`	Aucun	Liste des noms d'outils dont les utilisations et résultats d'outils ne doivent jamais être effacés. Utile pour préserver le contexte important.
`clear_tool_inputs`	`false`	Contrôle si les paramètres d'appel d'outil sont effacés avec les résultats d'outils. Par défaut, seuls les résultats d'outils sont effacés tout en gardant les appels d'outils originaux de Claude visibles.

Option de configuration	Par défaut	Description
`keep`	`{type: "thinking_turns", value: 1}`	Définit le nombre de tours d'assistant récents avec blocs de réflexion à conserver. Utilisez `{type: "thinking_turns", value: N}` où N doit être > 0 pour conserver les N derniers tours, ou `"all"` pour conserver tous les blocs de réflexion.

// Conserver les blocs de réflexion des 3 derniers tours d'assistant
{
  "type": "clear_thinking_20251015",
  "keep": {
    "type": "thinking_turns",
    "value": 3
  }
}

// Conserver tous les blocs de réflexion (maximise les accès au cache)
{
  "type": "clear_thinking_20251015",
  "keep": "all"
}

response = client.beta.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    messages=[...],
    thinking={
        "type": "enabled",
        "budget_tokens": 10000
    },
    tools=[...],
    betas=["context-management-2025-06-27"],
    context_management={
        "edits": [
            {
                "type": "clear_thinking_20251015",
                "keep": {
                    "type": "thinking_turns",
                    "value": 2
                }
            },
            {
                "type": "clear_tool_uses_20250919",
                "trigger": {
                    "type": "input_tokens",
                    "value": 50000
                },
                "keep": {
                    "type": "tool_uses",
                    "value": 5
                }
            }
        ]
    }
)

Option de configuration	Par défaut	Description
`trigger`	100 000 jetons d'entrée	Définit quand la stratégie de modification du contexte s'active. Une fois que l'invite dépasse ce seuil, l'effacement commencera. Vous pouvez spécifier cette valeur en `input_tokens` ou `tool_uses`.
`keep`	3 utilisations d'outils	Définit le nombre de paires récentes d'utilisation/résultat d'outils à conserver après l'effacement. L'API supprime d'abord les interactions d'outils les plus anciennes, en préservant les plus récentes.
`clear_at_least`	Aucun	Garantit qu'un nombre minimum de jetons est effacé chaque fois que la stratégie s'active. Si l'API ne peut pas effacer au moins le montant spécifié, la stratégie ne sera pas appliquée. Cela aide à déterminer si l'effacement du contexte vaut la peine de casser votre cache d'invite.
`exclude_tools`	Aucun	Liste des noms d'outils dont les utilisations et résultats d'outils ne doivent jamais être effacés. Utile pour préserver le contexte important.
`clear_tool_inputs`	`false`	Contrôle si les paramètres d'appel d'outil sont effacés avec les résultats d'outils. Par défaut, seuls les résultats d'outils sont effacés tout en gardant les appels d'outils originaux de Claude visibles.

Response

{
    "id": "msg_013Zva2CMHLNnXjNJJKqJ2EF",
    "type": "message",
    "role": "assistant",
    "content": [...],
    "usage": {...},
    "context_management": {
        "applied_edits": [
            // When using `clear_thinking_20251015`
            {
                "type": "clear_thinking_20251015",
                "cleared_thinking_turns": 3,
                "cleared_input_tokens": 15000
            },
            // When using `clear_tool_uses_20250919`
            {
                "type": "clear_tool_uses_20250919",
                "cleared_tool_uses": 8,
                "cleared_input_tokens": 50000
            }
        ]
    }
}

Streaming Response

{
    "type": "message_delta",
    "delta": {
        "stop_reason": "end_turn",
        "stop_sequence": null
    },
    "usage": {
        "output_tokens": 1024
    },
    "context_management": {
        "applied_edits": [...]
    }
}

Option de configuration	Par défaut	Description
`keep`	`{type: "thinking_turns", value: 1}`	Définit le nombre de tours d'assistant récents avec des blocs de réflexion à conserver. Utilisez `{type: "thinking_turns", value: N}` où N doit être > 0 pour conserver les N derniers tours, ou `"all"` pour conserver tous les blocs de réflexion.

// Conserver les blocs de réflexion des 3 derniers tours d'assistant
{
  "type": "clear_thinking_20251015",
  "keep": {
    "type": "thinking_turns",
    "value": 3
  }
}

// Conserver tous les blocs de réflexion (maximise les accès au cache)
{
  "type": "clear_thinking_20251015",
  "keep": "all"
}

response = client.beta.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    messages=[...],
    thinking={
        "type": "enabled",
        "budget_tokens": 10000
    },
    tools=[...],
    betas=["context-management-2025-06-27"],
    context_management={
        "edits": [
            {
                "type": "clear_thinking_20251015",
                "keep": {
                    "type": "thinking_turns",
                    "value": 2
                }
            },
            {
                "type": "clear_tool_uses_20250919",
                "trigger": {
                    "type": "input_tokens",
                    "value": 50000
                },
                "keep": {
                    "type": "tool_uses",
                    "value": 5
                }
            }
        ]
    }
)

Option de configuration	Par défaut	Description
`trigger`	100 000 jetons d'entrée	Définit quand la stratégie d'édition de contexte s'active. Une fois que l'invite dépasse ce seuil, l'effacement commence. Vous pouvez spécifier cette valeur en `input_tokens` ou `tool_uses`.
`keep`	3 utilisations d'outils	Définit le nombre de paires récentes d'utilisation/résultat d'outils à conserver après l'effacement. L'API supprime d'abord les interactions d'outils les plus anciennes, en préservant les plus récentes.
`clear_at_least`	Aucun	Garantit qu'un nombre minimum de jetons est effacé chaque fois que la stratégie s'active. Si l'API ne peut pas effacer au moins le montant spécifié, la stratégie ne sera pas appliquée. Cela aide à déterminer si l'effacement de contexte vaut la peine de casser votre cache d'invite.
`exclude_tools`	Aucun	Liste des noms d'outils dont les utilisations et résultats d'outils ne doivent jamais être effacés. Utile pour préserver un contexte important.
`clear_tool_inputs`	`false`	Contrôle si les paramètres d'appel d'outil sont effacés avec les résultats d'outils. Par défaut, seuls les résultats d'outils sont effacés tandis que les appels d'outils originaux de Claude restent visibles.

Response

{
    "id": "msg_013Zva2CMHLNnXjNJJKqJ2EF",
    "type": "message",
    "role": "assistant",
    "content": [...],
    "usage": {...},
    "context_management": {
        "applied_edits": [
            // Lors de l'utilisation de `clear_thinking_20251015`
            {
                "type": "clear_thinking_20251015",
                "cleared_thinking_turns": 3,
                "cleared_input_tokens": 15000
            },
            // Lors de l'utilisation de `clear_tool_uses_20250919`
            {
                "type": "clear_tool_uses_20250919",
                "cleared_tool_uses": 8,
                "cleared_input_tokens": 50000
            }
        ]
    }
}

Streaming Response

{
    "type": "message_delta",
    "delta": {
        "stop_reason": "end_turn",
        "stop_sequence": null
    },
    "usage": {
        "output_tokens": 1024
    },
    "context_management": {
        "applied_edits": [...]
    }
}

curl https://api.anthropic.com/v1/messages/count_tokens \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "anthropic-version: 2023-06-01" \
    --header "content-type: application/json" \
    --header "anthropic-beta: context-management-2025-06-27" \
    --data '{
        "model": "claude-sonnet-4-5",
        "messages": [
            {
                "role": "user",
                "content": "Continue our conversation..."
            }
        ],
        "tools": [...],
        "context_management": {
            "edits": [
                {
                    "type": "clear_tool_uses_20250919",
                    "trigger": {
                        "type": "input_tokens",
                        "value": 30000
                    },
                    "keep": {
                        "type": "tool_uses",
                        "value": 5
                    }
                }
            ]
        }
    }'

response = client.beta.messages.create(
    model="claude-sonnet-4-5",
    max_tokens=4096,
    messages=[...],
    tools=[
        {
            "type": "memory_20250818",
            "name": "memory"
        },
        # Your other tools
    ],
    betas=["context-management-2025-06-27"],
    context_management={
        "edits": [
            {"type": "clear_tool_uses_20250919"}
        ]
    }
)

import anthropic

client = anthropic.Anthropic()

runner = client.beta.messages.tool_runner(
    model="claude-sonnet-4-5",
    max_tokens=4096,
    tools=[...],
    messages=[
        {
            "role": "user",
            "content": "Analyze all the files in this directory and write a summary report."
        }
    ],
    compaction_control={
        "enabled": True,
        "context_token_threshold": 100000
    }
)

for message in runner:
    print(f"Tokens used: {message.usage.input_tokens}")

final = runner.until_done()

[
  { "role": "user", "content": "Analyze all files and write a report..." },
  { "role": "assistant", "content": "I'll help. Let me start by reading..." },
  { "role": "user", "content": [{ "type": "tool_result", "tool_use_id": "...", "content": "..." }] },
  { "role": "assistant", "content": "Based on file1.txt, I see..." },
  { "role": "user", "content": [{ "type": "tool_result", "tool_use_id": "...", "content": "..." }] },
  { "role": "assistant", "content": "After analyzing file2.txt..." },
  // ... 50 more exchanges like this ...
]

[
  {
    "role": "assistant",
    "content": "# Task Overview\nThe user requested analysis of directory files to produce a summary report...\n\n# Current State\nAnalyzed 52 files across 3 subdirectories. Key findings documented in report.md...\n\n# Important Discoveries\n- Configuration files use YAML format\n- Found 3 deprecated dependencies\n- Test coverage at 67%\n\n# Next Steps\n1. Analyze remaining files in /src/legacy\n2. Complete final report sections...\n\n# Context to Preserve\nUser prefers markdown format with executive summary first..."
  }
]

Paramètre	Type	Requis	Par défaut	Description
`enabled`	booléen	Oui	-	Si la compaction automatique est activée
`context_token_threshold`	nombre	Non	100 000	Nombre de jetons auquel la compaction se déclenche
`model`	chaîne	Non	Même modèle que le modèle principal	Modèle à utiliser pour générer les résumés
`summary_prompt`	chaîne	Non	Voir ci-dessous	Invite personnalisée pour la génération de résumé

# Compaction plus fréquente pour les scénarios à mémoire limitée
compaction_control={
    "enabled": True,
    "context_token_threshold": 50000
}

# Compaction moins fréquente lorsque vous avez besoin de plus de contexte
compaction_control={
    "enabled": True,
    "context_token_threshold": 150000
}

compaction_control={
    "enabled": True,
    "context_token_threshold": 100000,
    "summary_prompt": """Summarize the research conducted so far, including:
- Sources consulted and key findings
- Questions answered and remaining unknowns
- Recommended next steps

Wrap your summary in <summary></summary> tags."""
}

response = client.beta.messages.create(
    model="claude-sonnet-4-5",
    max_tokens=4096,
    messages=[...],
    tools=[
        {
            "type": "memory_20250818",
            "name": "memory"
        },
        # Your other tools
    ],
    betas=["context-management-2025-06-27"],
    context_management={
        "edits": [
            {"type": "clear_tool_uses_20250919"}
        ]
    }
)

import anthropic

client = anthropic.Anthropic()

runner = client.beta.messages.tool_runner(
    model="claude-sonnet-4-5",
    max_tokens=4096,
    tools=[...],
    messages=[
        {
            "role": "user",
            "content": "Analyze all the files in this directory and write a summary report."
        }
    ],
    compaction_control={
        "enabled": True,
        "context_token_threshold": 100000
    }
)

for message in runner:
    print(f"Tokens used: {message.usage.input_tokens}")

final = runner.until_done()

[
  { "role": "user", "content": "Analyze all files and write a report..." },
  { "role": "assistant", "content": "I'll help. Let me start by reading..." },
  { "role": "user", "content": [{ "type": "tool_result", "tool_use_id": "...", "content": "..." }] },
  { "role": "assistant", "content": "Based on file1.txt, I see..." },
  { "role": "user", "content": [{ "type": "tool_result", "tool_use_id": "...", "content": "..." }] },
  { "role": "assistant", "content": "After analyzing file2.txt..." },
  // ... 50 more exchanges like this ...
]

[
  {
    "role": "assistant",
    "content": "# Task Overview\nThe user requested analysis of directory files to produce a summary report...\n\n# Current State\nAnalyzed 52 files across 3 subdirectories. Key findings documented in report.md...\n\n# Important Discoveries\n- Configuration files use YAML format\n- Found 3 deprecated dependencies\n- Test coverage at 67%\n\n# Next Steps\n1. Analyze remaining files in /src/legacy\n2. Complete final report sections...\n\n# Context to Preserve\nUser prefers markdown format with executive summary first..."
  }
]

Paramètre	Type	Requis	Défaut	Description
`enabled`	boolean	Oui	-	Activer ou non la compaction automatique
`context_token_threshold`	number	Non	100,000	Nombre de jetons auquel la compaction se déclenche
`model`	string	Non	Même que le modèle principal	Modèle à utiliser pour générer les résumés
`summary_prompt`	string	Non	Voir ci-dessous	Invite personnalisée pour la génération de résumé

# More frequent compaction for memory-constrained scenarios
compaction_control={
    "enabled": True,
    "context_token_threshold": 50000
}

# Less frequent compaction when you need more context
compaction_control={
    "enabled": True,
    "context_token_threshold": 150000
}

compaction_control={
    "enabled": True,
    "context_token_threshold": 100000,
    "summary_prompt": """Summarize the research conducted so far, including:
- Sources consulted and key findings
- Questions answered and remaining unknowns
- Recommended next steps

Wrap your summary in <summary></summary> tags."""
}

import logging

logging.basicConfig(level=logging.INFO)
logging.getLogger("anthropic.lib.tools").setLevel(logging.INFO)

# Logs will show:
# INFO: Token usage 105000 has exceeded the threshold of 100000. Performing compaction.
# INFO: Compaction complete. New token usage: 2500

import logging

logging.basicConfig(level=logging.INFO)
logging.getLogger("anthropic.lib.tools").setLevel(logging.INFO)

# Logs will show:
# INFO: Token usage 105000 has exceeded the threshold of 100000. Performing compaction.
# INFO: Compaction complete. New token usage: 2500

Aperçu

Stratégies côté serveur

Aperçu

Stratégies côté serveur

Effacement des résultats d'outils

Effacement des blocs de réflexion

Modèles pris en charge

Utilisation de l'effacement des résultats d'outils

Configuration avancée

Aperçu

Stratégies côté serveur

Effacement des résultats d'outils

Effacement des blocs de réflexion

Modèles pris en charge

Utilisation de l'effacement des résultats d'outils

Configuration avancée

Utilisation de l'effacement des blocs de réflexion

Options de configuration pour l'effacement des blocs de réflexion

Options de configuration pour l'effacement des blocs de réflexion

Combinaison de stratégies

Options de configuration pour l'effacement des blocs de réflexion

Combinaison de stratégies

Options de configuration pour l'effacement des résultats d'outils

Options de configuration pour l'effacement des blocs de réflexion

Combinaison de stratégies

Options de configuration pour l'effacement des résultats d'outils

Réponse de modification du contexte

Options de configuration pour l'effacement des blocs de réflexion

Combinaison de stratégies

Options de configuration pour l'effacement des résultats d'outils

Réponse d'édition de contexte

Comptage des jetons

Utilisation avec l'outil Mémoire

Compaction côté client (SDK)

Fonctionnement de la compaction

Utilisation de la compaction

Ce qui se passe pendant la compaction

Options de configuration

Choix d'un seuil de jetons

Utilisation d'un modèle différent pour les résumés

Invites de résumé personnalisées

Utilisation avec l'outil Memory

Compaction côté client (SDK)

Fonctionnement de la compaction

Utilisation de la compaction

Ce qui se passe pendant la compaction

Options de configuration

Choix d'un seuil de jetons

Utilisation d'un modèle différent pour les résumés

Invites de résumé personnalisées

Invite de résumé par défaut

Afficher l'invite par défaut complète

Limitations

Outils côté serveur

Cas limites d'utilisation des outils

Limitations

Outils côté serveur

Cas limites d'utilisation des outils

Surveillance de la compaction

Limitations

Outils côté serveur

Cas limites d'utilisation des outils

Surveillance de la compaction

Quand utiliser la compaction