Claude Opus 4.6 est un remplacement quasi direct de Claude 4.5, avec quelques modifications importantes à connaître. Pour une liste complète des nouvelles fonctionnalités, consultez Nouveautés de Claude 4.6.
# Migration Opus
model = "claude-opus-4-5" # Avant
model = "claude-opus-4-6" # AprèsSuppression du prefill : Le prefill des messages d'assistant retourne une erreur 400 sur les modèles Claude 4.6. Utilisez plutôt les sorties structurées, les instructions du message système, ou output_config.format.
Guillemets des paramètres d'outils : Les modèles Claude 4.6 peuvent produire un échappement JSON légèrement différent des chaînes de caractères dans les arguments d'appels d'outils (par exemple, gestion différente des échappements Unicode ou des barres obliques). Si vous analysez l'input d'appel d'outil en tant que chaîne brute plutôt que d'utiliser un analyseur JSON, vérifiez votre logique d'analyse. Les analyseurs JSON standard (comme json.loads() ou JSON.parse()) gèrent ces différences automatiquement.
Ces modifications ne sont pas obligatoires mais amélioreront votre expérience :
Migrer vers la réflexion adaptative : thinking: {type: "enabled", budget_tokens: N} est déprécié sur les modèles Claude 4.6 et sera supprimé dans une future version du modèle. Passez à thinking: {type: "adaptive"} et utilisez le paramètre effort pour contrôler la profondeur de la réflexion. Consultez Réflexion adaptative.
response = client.beta.messages.create(
model="claude-opus-4-5",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 32000},
betas=["interleaved-thinking-2025-05-14"],
messages=[...],
)Notez que la migration passe également de client.beta.messages.create à client.messages.create. La réflexion adaptative et l'effort sont des fonctionnalités GA et ne nécessitent pas l'espace de noms SDK bêta ou d'en-têtes bêta.
Supprimez l'en-tête bêta d'effort : Le paramètre effort est maintenant GA. Supprimez betas=["effort-2025-11-24"] de vos requêtes.
Supprimez l'en-tête bêta de streaming d'outils à grain fin : Le streaming d'outils à grain fin est maintenant GA. Supprimez betas=["fine-grained-tool-streaming-2025-05-14"] de vos requêtes.
Supprimez l'en-tête bêta de réflexion entrelacée (Opus 4.6 uniquement) : La réflexion adaptative active automatiquement la réflexion entrelacée sur Opus 4.6. Supprimez betas=["interleaved-thinking-2025-05-14"] de vos requêtes Opus 4.6. Remarque : Sonnet 4.6 continue de supporter cet en-tête bêta avec la réflexion étendue manuelle.
Migrer vers output_config.format : Si vous utilisez les sorties structurées, mettez à jour output_format={...} vers output_config={"format": {...}}. L'ancien paramètre reste fonctionnel mais est déprécié et sera supprimé dans une future version du modèle.
Si vous migrez d'Opus 4.1, Sonnet 4, ou de modèles antérieurs directement vers Claude 4.6, appliquez les modifications importantes de Claude 4.6 ci-dessus plus les modifications supplémentaires de cette section.
# À partir d'Opus 4.1
model = "claude-opus-4-1-20250805" # Avant
model = "claude-opus-4-6" # Après
# À partir de Sonnet 4
model = "claude-sonnet-4-20250514" # Avant
model = "claude-opus-4-6" # Après
# À partir de Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Avant
model = "claude-opus-4-6" # AprèsMettez à jour les paramètres d'échantillonnage
Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.
Utilisez uniquement temperature OU top_p, pas les deux :
# Avant - Cela génèrera une erreur dans les modèles Claude 4+
response = client.messages.create(
model="claude-3-7-sonnet-20250219",
temperature=0.7,
top_p=0.9, # Impossible d'utiliser les deux
# ...
)
# Après
response = client.messages.create(
model="claude-opus-4-6",
temperature=0.7, # Utilisez temperature OU top_p, pas les deux
# ...
)Mettez à jour les versions d'outils
Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.
Mettez à jour vers les dernières versions d'outils. Supprimez tout code utilisant la commande undo_edit.
# Avant
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
# Après
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]text_editor_20250728 et str_replace_based_edit_tool. Consultez la documentation de l'outil éditeur de texte pour plus de détails.code_execution_20250825. Consultez la documentation de l'outil d'exécution de code pour les instructions de migration.Gérez la raison d'arrêt refusal
Mettez à jour votre application pour gérer les raisons d'arrêt refusal :
response = client.messages.create(...)
if response.stop_reason == "refusal":
# Gérez le refus de manière appropriée
passGérez la raison d'arrêt model_context_window_exceeded
Les modèles Claude 4.5+ retournent une raison d'arrêt model_context_window_exceeded lorsque la génération s'arrête en raison du dépassement de la limite de la fenêtre de contexte, plutôt que de la limite max_tokens demandée. Mettez à jour votre application pour gérer cette nouvelle raison d'arrêt :
response = client.messages.create(...)
if response.stop_reason == "model_context_window_exceeded":
# Gérez la limite de la fenêtre de contexte de manière appropriée
passVérifiez la gestion des paramètres d'outils (sauts de ligne de fin)
Les modèles Claude 4.5+ préservent les sauts de ligne de fin dans les paramètres de chaîne d'appel d'outil qui étaient précédemment supprimés. Si vos outils s'appuient sur une correspondance exacte des chaînes par rapport aux paramètres d'appel d'outil, vérifiez que votre logique gère correctement les sauts de ligne de fin.
Mettez à jour vos invites pour les changements de comportement
Les modèles Claude 4+ ont un style de communication plus concis et direct et nécessitent des directives explicites. Consultez les meilleures pratiques d'invite pour des conseils d'optimisation.
token-efficient-tools-2025-02-19 et output-128k-2025-02-19. Tous les modèles Claude 4+ ont l'utilisation d'outils efficace en tokens intégrée et ces en-têtes n'ont aucun effet.claude-opus-4-6output_config.formatthinking: {type: "enabled", budget_tokens: N} vers thinking: {type: "adaptive"} avec le paramètre effort (budget_tokens est déprécié et sera supprimé dans une future version)effort-2025-11-24 (effort est maintenant GA)fine-grained-tool-streaming-2025-05-14interleaved-thinking-2025-05-14 (Opus 4.6 uniquement ; Sonnet 4.6 le supporte toujours)output_format vers output_config.format (le cas échéant)temperature OU top_ptext_editor_20250728, code_execution_20250825)refusalmodel_context_window_exceededtoken-efficient-tools-2025-02-19, output-128k-2025-02-19)Claude Sonnet 4.6 combine une forte intelligence avec des performances rapides, offrant des capacités de recherche agentique améliorées et l'exécution de code gratuite lorsqu'elle est utilisée avec la recherche web ou la récupération web. Il est idéal pour les tâches quotidiennes de codage, d'analyse et de contenu.
Pour un aperçu complet des capacités, consultez l'aperçu des modèles.
La tarification de Sonnet 4.6 est de 3 $ par million de tokens d'entrée, 15 $ par million de tokens de sortie. Consultez la tarification Claude pour plus de détails.
Mettez à jour votre nom de modèle :
# À partir de Sonnet 4.5
model = "claude-sonnet-4-5" # Avant
model = "claude-sonnet-4-6" # Après
# À partir de Sonnet 4
model = "claude-sonnet-4-20250514" # Avant
model = "claude-sonnet-4-6" # AprèsLe prefill des messages d'assistant n'est plus supporté
Ceci est une modification importante lors de la migration à partir de Sonnet 4.5 ou antérieur.
Le prefill des messages d'assistant retourne une erreur 400 sur Sonnet 4.6. Utilisez les sorties structurées, les instructions du message système, ou output_config.format à la place.
Cas d'usage courants de prefill et migrations :
Contrôle du formatage de sortie (forcer la sortie JSON/YAML) : Utilisez les sorties structurées ou les outils avec des champs enum pour les tâches de classification.
Élimination des préambules (suppression des phrases "Voici...") : Ajoutez des instructions directes dans le message système : "Répondez directement sans préambule. Ne commencez pas par des phrases comme 'Voici...', 'Basé sur...', etc."
Éviter les mauvais refus : Claude est maintenant beaucoup mieux pour les refus appropriés. Une invite claire dans le message utilisateur sans prefill devrait être suffisante.
Continuations (reprise des réponses interrompues) : Déplacez la continuation vers le message utilisateur : "Votre réponse précédente a été interrompue et s'est terminée par [previous_response]. Continuez à partir de là où vous vous étiez arrêté."
Hydratation du contexte / cohérence des rôles (actualisation du contexte dans les longues conversations) : Injectez ce qui était auparavant des rappels d'assistant prefillés dans le tour utilisateur à la place.
L'échappement JSON des paramètres d'outils peut différer
Ceci est une modification importante lors de la migration à partir de Sonnet 4.5 ou antérieur.
L'échappement des chaînes JSON dans les paramètres d'outils peut différer des modèles précédents. Les analyseurs JSON standard gèrent cela automatiquement, mais l'analyse personnalisée basée sur des chaînes peut nécessiter des mises à jour.
Mettez à jour les paramètres d'échantillonnage
Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.
Utilisez uniquement temperature OU top_p, pas les deux.
Mettez à jour les versions d'outils
Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.
Mettez à jour vers les dernières versions d'outils (text_editor_20250728, code_execution_20250825). Supprimez tout code utilisant la commande undo_edit.
Gérez la raison d'arrêt refusal
Mettez à jour votre application pour gérer les raisons d'arrêt refusal.
Mettez à jour vos invites pour les changements de comportement
Les modèles Claude 4 ont un style de communication plus concis et direct. Consultez les meilleures pratiques d'invite pour des conseils d'optimisation.
fine-grained-tool-streaming-2025-05-14 — Le streaming d'outils à grain fin est maintenant GA sur Sonnet 4.6 et ne nécessite plus d'en-tête bêta.output_format vers output_config.format — Le paramètre output_format est déprécié. Utilisez output_config.format à la place.Nous vous encourageons vivement à migrer de Sonnet 4.5 vers Sonnet 4.6, qui offre plus d'intelligence au même prix.
Sonnet 4.6 utilise par défaut un niveau d'effort de high, contrairement à Sonnet 4.5 qui n'avait pas de paramètre d'effort. Nous recommandons d'ajuster le paramètre d'effort lors de votre migration de Sonnet 4.5 vers Sonnet 4.6. S'il n'est pas explicitement défini, vous pouvez expérimenter une latence plus élevée avec le niveau d'effort par défaut.
Si vous n'utilisez pas la réflexion étendue sur Sonnet 4.5, vous pouvez continuer sans elle sur Sonnet 4.6. Vous devez explicitement définir l'effort au niveau approprié pour votre cas d'usage. Avec un effort low et la réflexion désactivée, vous pouvez vous attendre à des performances similaires ou meilleures par rapport à Sonnet 4.5 sans réflexion étendue.
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
output_config={"effort": "low"},
messages=[{"role": "user", "content": "Your prompt here"}],
)Si vous utilisez la réflexion étendue sur Sonnet 4.5, elle continue d'être supportée sur Sonnet 4.6 sans modifications nécessaires à votre configuration de réflexion. Nous recommandons de maintenir un budget de réflexion autour de 16k tokens. En pratique, la plupart des tâches n'en utilisent pas autant, mais cela fournit une marge de manœuvre pour les problèmes plus difficiles sans risque d'utilisation de tokens incontrôlée.
Pour le codage agentique, la conception frontend, les flux de travail lourds en outils et les flux de travail d'entreprise complexes, nous recommandons de commencer avec un effort medium. Si vous trouvez que la latence est trop élevée, envisagez de réduire l'effort à low. Si vous avez besoin d'une intelligence plus élevée, envisagez d'augmenter l'effort à high ou de migrer vers Opus 4.6.
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=16384,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "medium"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)Pour le chat, la génération de contenu, la recherche, la classification et d'autres tâches non-codage, nous recommandons de commencer avec un effort low avec la réflexion étendue. Si vous avez besoin de plus de profondeur, augmentez l'effort à medium.
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "low"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)Les chemins de migration ci-dessus utilisent la réflexion étendue avec budget_tokens pour une utilisation prévisible des tokens. Si votre charge de travail correspond à l'un des modèles suivants, envisagez d'essayer plutôt la réflexion adaptative :
high. Si la latence ou l'utilisation des tokens est une préoccupation, réduisez à medium.Lors de l'utilisation de la réflexion adaptative, évaluez les efforts medium et high sur vos tâches. Le niveau approprié dépend du compromis de votre charge de travail entre la qualité, la latence et l'utilisation des tokens.
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"},
messages=[{"role": "user", "content": "Your prompt here"}],
)Si vous observez un comportement incohérent ou des régressions de qualité avec la réflexion adaptative, passez à la réflexion étendue avec budget_tokens. Cela fournit des résultats plus prévisibles avec un plafond sur les coûts de réflexion.
claude-sonnet-4-6output_config.formattext_editor_20250728, code_execution_20250825) ; les versions héritées ne sont pas supportées (si vous migrez à partir de 3.x)undo_edit (le cas échéant)temperature OU top_p, pas les deux (si vous migrez à partir de 3.x)refusal dans votre applicationfine-grained-tool-streaming-2025-05-14 (maintenant GA)output_format vers output_config.formatClaude Sonnet 4.5 combine une forte intelligence avec des performances rapides, ce qui le rend idéal pour les tâches quotidiennes de codage, d'analyse et de contenu.
Pour un aperçu complet des capacités, consultez l'aperçu des modèles.
La tarification de Sonnet 4.5 est de 3 $ par million de tokens d'entrée, 15 $ par million de tokens de sortie. Consultez la tarification Claude pour plus de détails.
Mettez à jour votre nom de modèle :
# À partir de Sonnet 4
model = "claude-sonnet-4-20250514" # Avant
model = "claude-sonnet-4-5-20250929" # Après
# À partir de Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Avant
model = "claude-sonnet-4-5-20250929" # AprèsCes modifications importantes s'appliquent lors de la migration à partir des modèles Claude 3.x Sonnet.
Mettez à jour les paramètres d'échantillonnage
Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.
Utilisez uniquement temperature OU top_p, pas les deux.
Mettez à jour les versions d'outils
Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.
Mettez à jour vers les dernières versions d'outils (text_editor_20250728, code_execution_20250825). Supprimez tout code utilisant la commande undo_edit.
Gérez la raison d'arrêt refusal
Mettez à jour votre application pour gérer les raisons d'arrêt refusal.
Mettez à jour vos invites pour les changements de comportement
Les modèles Claude 4 ont un style de communication plus concis et direct. Consultez les meilleures pratiques d'invite pour des conseils d'optimisation.
claude-sonnet-4-5-20250929text_editor_20250728, code_execution_20250825) ; les versions héritées ne sont pas supportées (si vous migrez à partir de 3.x)undo_edit (le cas échéant)temperature OU top_p, pas les deux (si vous migrez à partir de 3.x)refusal dans votre applicationClaude Haiku 4.5 est le modèle Haiku le plus rapide et le plus intelligent avec des performances quasi-frontière, offrant une qualité de modèle premium pour les applications interactives et le traitement à haut volume.
Pour un aperçu complet des capacités, consultez l'aperçu des modèles.
La tarification de Haiku 4.5 est de 1 $ par million de tokens d'entrée, 5 $ par million de tokens de sortie. Consultez la tarification Claude pour plus de détails.
Mettez à jour votre nom de modèle :
# À partir de Haiku 3.5
model = "claude-3-5-haiku-20241022" # Avant
model = "claude-haiku-4-5-20251001" # AprèsExaminez les nouvelles limites de débit : Haiku 4.5 a des limites de débit séparées de Haiku 3.5. Consultez la documentation des limites de débit pour plus de détails.
Pour des améliorations significatives des performances sur les tâches de codage et de raisonnement, envisagez d'activer la réflexion étendue avec thinking: {type: "enabled", budget_tokens: N}.
La réflexion étendue a un impact sur l'efficacité de la mise en cache des invites.
La réflexion étendue est dépréciée dans Claude 4.6 ou les modèles plus récents. Si vous utilisez des modèles plus récents, utilisez plutôt la réflexion adaptative.
Explorez les nouvelles capacités : Consultez l'aperçu des modèles pour plus de détails sur la sensibilisation au contexte, la capacité de sortie augmentée (64K tokens), l'intelligence plus élevée et la vitesse améliorée.
Ces modifications importantes s'appliquent lors de la migration à partir des modèles Claude 3.x Haiku.
Mettez à jour les paramètres d'échantillonnage
Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.
Utilisez uniquement temperature OU top_p, pas les deux.
Mettez à jour les versions d'outils
Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.
Mettez à jour vers les dernières versions d'outils (text_editor_20250728, code_execution_20250825). Supprimez tout code utilisant la commande undo_edit.
Gérez la raison d'arrêt refusal
Mettez à jour votre application pour gérer les raisons d'arrêt refusal.
Mettez à jour vos invites pour les changements de comportement
Les modèles Claude 4 ont un style de communication plus concis et direct. Consultez les meilleures pratiques d'invite pour des conseils d'optimisation.
claude-haiku-4-5-20251001text_editor_20250728, code_execution_20250825) ; les versions héritées ne sont pas supportéesundo_edit (le cas échéant)temperature OU top_p, pas les deuxrefusal dans votre applicationWas this page helpful?