Construire avec la réflexion étendue

claude-opus-4-20250514

{
  "content": [
    {
      "type": "thinking",
      "thinking": "Let me analyze this step by step...",
      "signature": "WaUjzkypQ2mUEVM36O2TxuC06KN8xyfbJwyem2dw3URve/op91XWHOEBLLqIOMfFG/UvLEczmEsUjavL...."
    },
    {
      "type": "text",
      "text": "Based on my analysis..."
    }
  ]
}

curl https://api.anthropic.com/v1/messages \
     --header "x-api-key: $ANTHROPIC_API_KEY" \
     --header "anthropic-version: 2023-06-01" \
     --header "content-type: application/json" \
     --data \
'{
    "model": "claude-sonnet-4-5",
    "max_tokens": 16000,
    "thinking": {
        "type": "enabled",
        "budget_tokens": 10000
    },
    "messages": [
        {
            "role": "user",
            "content": "Are there an infinite number of prime numbers such that n mod 4 == 3?"
        }
    ]
}'

curl https://api.anthropic.com/v1/messages \
     --header "x-api-key: $ANTHROPIC_API_KEY" \
     --header "anthropic-version: 2023-06-01" \
     --header "content-type: application/json" \
     --data \
'{
    "model": "claude-sonnet-4-5",
    "max_tokens": 16000,
    "stream": true,
    "thinking": {
        "type": "enabled",
        "budget_tokens": 10000
    },
    "messages": [
        {
            "role": "user",
            "content": "What is 27 * 453?"
        }
    ]
}'

event: message_start
data: {"type": "message_start", "message": {"id": "msg_01...", "type": "message", "role": "assistant", "content": [], "model": "claude-sonnet-4-5", "stop_reason": null, "stop_sequence": null}}

event: content_block_start
data: {"type": "content_block_start", "index": 0, "content_block": {"type": "thinking", "thinking": ""}}

event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "thinking_delta", "thinking": "Let me solve this step by step:\n\n1. First break down 27 * 453"}}

event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "thinking_delta", "thinking": "\n2. 453 = 400 + 50 + 3"}}

// Additional thinking deltas...

event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "signature_delta", "signature": "EqQBCgIYAhIM1gbcDa9GJwZA2b3hGgxBdjrkzLoky3dl1pkiMOYds..."}}

event: content_block_stop
data: {"type": "content_block_stop", "index": 0}

event: content_block_start
data: {"type": "content_block_start", "index": 1, "content_block": {"type": "text", "text": ""}}

event: content_block_delta
data: {"type": "content_block_delta", "index": 1, "delta": {"type": "text_delta", "text": "27 * 453 = 12,231"}}

// Additional text deltas...

event: content_block_stop
data: {"type": "content_block_stop", "index": 1}

event: message_delta
data: {"type": "message_delta", "delta": {"stop_reason": "end_turn", "stop_sequence": null}}

event: message_stop
data: {"type": "message_stop"}

Expected `thinking` or `redacted_thinking`, but found `tool_use`.
When `thinking` is enabled, a final `assistant` message must start
with a thinking block (preceding the lastmost set of `tool_use` and
`tool_result` blocks).

User: "What's the weather?"
Assistant: [tool_use] (thinking disabled)
User: [tool_result]
Assistant: [text: "It's sunny"] 
User: "What about tomorrow?" (thinking disabled)
Assistant: [thinking] + [text: "..."] (thinking enabled - new turn)

User: ["What's the weather in Paris?"],
Assistant: [thinking_block_1] + [tool_use block 1],
User: [tool_result_1, cache=True],
Assistant: [thinking_block_2] + [text block 2],
User: [Text response, cache=True]

{
  "content": [
    {
      "type": "thinking",
      "thinking": "Let me analyze this step by step...",
      "signature": "WaUjzkypQ2mUEVM36O2TxuC06KN8xyfbJwyem2dw3URve/op91XWHOEBLLqIOMfFG/UvLEczmEsUjavL...."
    },
    {
      "type": "redacted_thinking",
      "data": "EmwKAhgBEgy3va3pzix/LafPsn4aDFIT2Xlxh0L5L8rLVyIwxtE3rAFBa8cr3qpPkNRj2YfWXGmKDxH4mPnZ5sQ7vB9URj2pLmN3kF8/dW5hR7xJ0aP1oLs9yTcMnKVf2wRpEGjH9XZaBt4UvDcPrQ..."
    },
    {
      "type": "text",
      "text": "Based on my analysis..."
    }
  ]
}

Fonctionnalité	Claude Sonnet 3.7	Modèles Claude 4 (pré-Opus 4.5)	Claude Opus 4.5 et versions ultérieures
Sortie de réflexion	Retourne la sortie de réflexion complète	Retourne la réflexion résumée	Retourne la réflexion résumée
Réflexion entrelacée	Non supportée	Supportée avec l'en-tête bêta `interleaved-thinking-2025-05-14`	Supportée avec l'en-tête bêta `interleaved-thinking-2025-05-14`
Préservation du bloc de réflexion	Non préservée entre les tours	Non préservée entre les tours	Préservée par défaut (active l'optimisation du cache, économies de jetons)

Construire avec la réflexion étendue

Modèles pris en charge

Construire avec la réflexion étendue

Modèles pris en charge

Comment fonctionne la réflexion étendue

Comment utiliser la réflexion étendue

Réflexion résumée

Réflexion en continu

Réflexion étendue avec utilisation d'outils

Basculer les modes de réflexion dans les conversations

Scénarios d'erreur courants

Conseils pratiques

Préservation des blocs de réflexion

Pensée entrelacée

Pensée étendue avec mise en cache des invites

Comprendre le comportement de mise en cache des blocs de pensée

Jetons max et taille de la fenêtre de contexte avec pensée étendue

La fenêtre de contexte avec pensée étendue

La fenêtre de contexte avec pensée étendue et utilisation d'outils

Gestion des jetons avec pensée étendue

Chiffrement de la pensée

Rédaction de la réflexion

Différences de réflexion entre les versions de modèle

Préservation du bloc de réflexion dans Claude Opus 4.5

Tarification

Meilleures pratiques et considérations pour la réflexion étendue

Travailler avec les budgets de réflexion

Considérations de performance

Compatibilité des fonctionnalités

Directives d'utilisation

Étapes suivantes

Modèles pris en charge

Modèles pris en charge

Comment fonctionne la réflexion étendue

Comment utiliser la réflexion étendue

Réflexion résumée

Réflexion en continu

Réflexion étendue avec utilisation d'outils

Basculer les modes de réflexion dans les conversations

Scénarios d'erreur courants

Conseils pratiques

Exemple : Passage des blocs de réflexion avec les résultats des outils

Préservation des blocs de réflexion

Pensée entrelacée

Utilisation d'outils sans pensée entrelacée

Utilisation d'outils avec pensée entrelacée

Pensée étendue avec mise en cache des invites

Comprendre le comportement de mise en cache des blocs de pensée

Mise en cache de l'invite système (préservée lors des modifications de pensée)

Mise en cache des messages (invalidée lors des modifications de pensée)

Jetons max et taille de la fenêtre de contexte avec pensée étendue

La fenêtre de contexte avec pensée étendue

La fenêtre de contexte avec pensée étendue et utilisation d'outils

Gestion des jetons avec pensée étendue

Chiffrement de la pensée

Rédaction de la réflexion

Exemple : Travailler avec les blocs de réflexion réduits

Différences de réflexion entre les versions de modèle

Préservation du bloc de réflexion dans Claude Opus 4.5

Tarification

Meilleures pratiques et considérations pour la réflexion étendue

Travailler avec les budgets de réflexion

Considérations de performance

Compatibilité des fonctionnalités

Directives d'utilisation

Étapes suivantes