Claude Opus 4.6 est un remplacement quasi direct de Claude 4.5, avec quelques changements cassants à connaître. Pour une liste complète des nouvelles fonctionnalités, consultez Nouveautés de Claude 4.6.
# Migration Opus
model="claude-opus-4-5" # Avant
model="claude-opus-4-6" # AprèsSuppression du prefill : Le prefill des messages d'assistant retourne une erreur 400 sur les modèles Claude 4.6. Utilisez plutôt les sorties structurées, les instructions du message système, ou output_config.format.
Guillemets des paramètres d'outils : Les modèles Claude 4.6 peuvent produire un échappement JSON légèrement différent des chaînes de caractères dans les arguments d'appel d'outil (par exemple, gestion différente des échappements Unicode ou des barres obliques). Si vous analysez l'input d'appel d'outil en tant que chaîne brute plutôt que d'utiliser un analyseur JSON, vérifiez votre logique d'analyse. Les analyseurs JSON standard (comme json.loads() ou JSON.parse()) gèrent automatiquement ces différences.
Ceux-ci ne sont pas obligatoires mais amélioreront votre expérience :
Migrer vers la réflexion adaptative : thinking: {type: "enabled", budget_tokens: N} est déprécié sur les modèles Claude 4.6 et sera supprimé dans une future version du modèle. Passez à thinking: {type: "adaptive"} et utilisez le paramètre effort pour contrôler la profondeur de réflexion. Consultez Réflexion adaptative.
response = client.beta.messages.create(
model="claude-opus-4-5",
max_tokens=16000,
thinking={
"type": "enabled",
"budget_tokens": 32000
},
betas=["interleaved-thinking-2025-05-14"],
messages=[...]
)Notez que la migration passe également de client.beta.messages.create à client.messages.create — la réflexion adaptative et l'effort sont des fonctionnalités GA et ne nécessitent pas l'espace de noms SDK bêta ou d'en-têtes bêta.
Supprimer l'en-tête bêta d'effort : Le paramètre effort est maintenant GA. Supprimez betas=["effort-2025-11-24"] de vos requêtes.
Supprimer l'en-tête bêta de streaming d'outils à granularité fine : Le streaming d'outils à granularité fine est maintenant GA. Supprimez betas=["fine-grained-tool-streaming-2025-05-14"] de vos requêtes.
Supprimer l'en-tête bêta de réflexion entrelacée : La réflexion adaptative active automatiquement la réflexion entrelacée. Supprimez betas=["interleaved-thinking-2025-05-14"] de vos requêtes.
Migrer vers output_config.format : Si vous utilisez des sorties structurées, mettez à jour output_format={...} vers output_config={"format": {...}}. L'ancien paramètre reste fonctionnel mais est déprécié et sera supprimé dans une future version du modèle.
Si vous migrez d'Opus 4.1, Sonnet 4 ou de modèles antérieurs directement vers Claude 4.6, appliquez les changements cassants de Claude 4.6 ci-dessus plus les changements supplémentaires de cette section.
# D'Opus 4.1
model="claude-opus-4-1-20250805" # Avant
model="claude-opus-4-6" # Après
# De Sonnet 4
model="claude-sonnet-4-20250514" # Avant
model="claude-opus-4-6" # Après
# De Sonnet 3.7
model="claude-3-7-sonnet-20250219" # Avant
model="claude-opus-4-6" # AprèsParamètres d'échantillonnage
Ceci est un changement cassant par rapport aux modèles Claude 3.x.
Utilisez uniquement temperature OU top_p, pas les deux :
# Avant - Cela générera une erreur dans les modèles Claude 4+
response = client.messages.create(
model="claude-3-7-sonnet-20250219",
temperature=0.7,
top_p=0.9, # Impossible d'utiliser les deux
...
)
# Après
response = client.messages.create(
model="claude-opus-4-6",
temperature=0.7, # Utilisez temperature OU top_p, pas les deux
...
)Versions d'outils
Ceci est un changement cassant par rapport aux modèles Claude 3.x.
Mettez à jour vers les dernières versions d'outils. Supprimez tout code utilisant la commande undo_edit.
# Avant
tools=[{"type": "text_editor_20250124", "name": "str_replace_editor"}]
# Après
tools=[{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]text_editor_20250728 et str_replace_based_edit_tool. Consultez la documentation de l'outil d'édition de texte pour plus de détails.code_execution_20250825. Consultez la documentation de l'outil d'exécution de code pour les instructions de migration.Gérer la raison d'arrêt refusal
Mettez à jour votre application pour gérer les raisons d'arrêt refusal :
response = client.messages.create(...)
if response.stop_reason == "refusal":
# Gérez le refus de manière appropriée
passGérer la raison d'arrêt model_context_window_exceeded
Les modèles Claude 4.5+ retournent une raison d'arrêt model_context_window_exceeded lorsque la génération s'arrête en raison du dépassement de la limite de la fenêtre de contexte, plutôt que de la limite max_tokens demandée. Mettez à jour votre application pour gérer cette nouvelle raison d'arrêt :
response = client.messages.create(...)
if response.stop_reason == "model_context_window_exceeded":
# Gérez la limite de la fenêtre de contexte de manière appropriée
passGestion des paramètres d'outils (sauts de ligne de fin)
Les modèles Claude 4.5+ conservent les sauts de ligne de fin dans les paramètres de chaîne d'appel d'outil qui ont été précédemment supprimés. Si vos outils dépendent d'une correspondance de chaîne exacte par rapport aux paramètres d'appel d'outil, vérifiez que votre logique gère correctement les sauts de ligne de fin.
Mettez à jour vos invites pour les changements de comportement
Les modèles Claude 4+ ont un style de communication plus concis et direct et nécessitent des directives explicites. Consultez les meilleures pratiques d'invite pour des conseils d'optimisation.
token-efficient-tools-2025-02-19 et output-128k-2025-02-19 — tous les modèles Claude 4+ ont l'utilisation d'outils efficace en jetons intégrée et ces en-têtes n'ont aucun effet.claude-opus-4-6output_config.formatthinking: {type: "enabled", budget_tokens: N} vers thinking: {type: "adaptive"} avec le paramètre effort (budget_tokens est déprécié et sera supprimé dans une future version)effort-2025-11-24 (l'effort est maintenant GA)fine-grained-tool-streaming-2025-05-14interleaved-thinking-2025-05-14output_format vers output_config.format (le cas échéant)temperature OU top_ptext_editor_20250728, code_execution_20250825)refusalmodel_context_window_exceededtoken-efficient-tools-2025-02-19, output-128k-2025-02-19)Claude Sonnet 4.5 combine une forte intelligence avec des performances rapides, ce qui le rend idéal pour les tâches quotidiennes de codage, d'analyse et de contenu.
Pour un aperçu complet des capacités, consultez l'aperçu des modèles.
La tarification de Sonnet 4.5 est de 3 $ par million de jetons d'entrée, 15 $ par million de jetons de sortie. Consultez la tarification de Claude pour plus de détails.
Mettez à jour votre nom de modèle :
# De Sonnet 4
model="claude-sonnet-4-20250514" # Avant
model="claude-sonnet-4-5-20250929" # Après
# De Sonnet 3.7
model="claude-3-7-sonnet-20250219" # Avant
model="claude-sonnet-4-5-20250929" # AprèsEnvisagez d'activer la réflexion étendue pour des améliorations significatives des performances sur les tâches de codage et de raisonnement (désactivée par défaut) :
response = client.messages.create(
model="claude-sonnet-4-5-20250929",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 10000},
messages=[...]
)Ces changements cassants s'appliquent lors de la migration à partir des modèles Claude 3.x Sonnet.
Paramètres d'échantillonnage
Ceci est un changement cassant par rapport aux modèles Claude 3.x.
Utilisez uniquement temperature OU top_p, pas les deux.
Versions d'outils
Ceci est un changement cassant par rapport aux modèles Claude 3.x.
Mettez à jour vers les dernières versions d'outils (text_editor_20250728, code_execution_20250825). Supprimez tout code utilisant la commande undo_edit.
Gérer la raison d'arrêt refusal
Mettez à jour votre application pour gérer les raisons d'arrêt refusal.
Mettez à jour vos invites pour les changements de comportement
Les modèles Claude 4 ont un style de communication plus concis et direct. Consultez les meilleures pratiques d'invite pour des conseils d'optimisation.
claude-sonnet-4-5-20250929text_editor_20250728, code_execution_20250825) — les versions héritées ne sont pas supportées (si migration à partir de 3.x)undo_edit (le cas échéant)temperature OU top_p, pas les deux (si migration à partir de 3.x)refusal dans votre applicationClaude Haiku 4.5 est notre modèle Haiku le plus rapide et le plus intelligent avec des performances proches de la frontière, offrant une qualité de modèle premium pour les applications interactives et le traitement à haut volume.
Pour un aperçu complet des capacités, consultez l'aperçu des modèles.
La tarification de Haiku 4.5 est de 1 $ par million de jetons d'entrée, 5 $ par million de jetons de sortie. Consultez la tarification de Claude pour plus de détails.
Mettez à jour votre nom de modèle :
# De Haiku 3.5
model="claude-3-5-haiku-20241022" # Avant
model="claude-haiku-4-5-20251001" # AprèsExaminez les nouvelles limites de débit : Haiku 4.5 a des limites de débit séparées de Haiku 3.5. Consultez la documentation des limites de débit pour plus de détails.
Envisagez d'activer la réflexion étendue pour des améliorations significatives des performances sur les tâches de codage et de raisonnement (désactivée par défaut) :
response = client.messages.create(
model="claude-haiku-4-5-20251001",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 5000},
messages=[...]
)La réflexion étendue impacte l'efficacité de la mise en cache des invites.
Explorez les nouvelles capacités : Consultez l'aperçu des modèles pour plus de détails sur la sensibilisation au contexte, la capacité de sortie accrue (64K jetons), l'intelligence supérieure et la vitesse améliorée.
Ces changements cassants s'appliquent lors de la migration à partir des modèles Claude 3.x Haiku.
Paramètres d'échantillonnage
Ceci est un changement cassant par rapport aux modèles Claude 3.x.
Utilisez uniquement temperature OU top_p, pas les deux.
Versions d'outils
Ceci est un changement cassant par rapport aux modèles Claude 3.x.
Mettez à jour vers les dernières versions d'outils (text_editor_20250728, code_execution_20250825). Supprimez tout code utilisant la commande undo_edit.
Gérer la raison d'arrêt refusal
Mettez à jour votre application pour gérer les raisons d'arrêt refusal.
Mettez à jour vos invites pour les changements de comportement
Les modèles Claude 4 ont un style de communication plus concis et direct. Consultez les meilleures pratiques d'invite pour des conseils d'optimisation.
claude-haiku-4-5-20251001text_editor_20250728, code_execution_20250825) — les versions héritées ne sont pas supportéesundo_edit (le cas échéant)temperature OU top_p, pas les deuxrefusal dans votre applicationWas this page helpful?