Modèles et tarification

Guide de migration

Guide pour migrer vers les modèles Claude 4.6 à partir des versions précédentes de Claude

Migration vers Claude 4.6

Claude Opus 4.6 est un remplacement quasi direct de Claude 4.5, avec quelques modifications importantes à connaître. Pour une liste complète des nouvelles fonctionnalités, consultez Nouveautés de Claude 4.6.

Mettez à jour votre nom de modèle

# Migration Opus
model = "claude-opus-4-5"  # Avant
model = "claude-opus-4-6"  # Après

Modifications importantes

Suppression du prefill : Le prefill des messages d'assistant retourne une erreur 400 sur les modèles Claude 4.6. Utilisez plutôt les sorties structurées, les instructions du message système, ou output_config.format.
Guillemets des paramètres d'outils : Les modèles Claude 4.6 peuvent produire un échappement JSON légèrement différent des chaînes de caractères dans les arguments d'appels d'outils (par exemple, gestion différente des échappements Unicode ou des barres obliques). Si vous analysez l'input d'appel d'outil en tant que chaîne brute plutôt que d'utiliser un analyseur JSON, vérifiez votre logique d'analyse. Les analyseurs JSON standard (comme json.loads() ou JSON.parse()) gèrent ces différences automatiquement.

Modifications recommandées

Ces modifications ne sont pas obligatoires mais amélioreront votre expérience :

Migrer vers la réflexion adaptative : thinking: {type: "enabled", budget_tokens: N} est déprécié sur les modèles Claude 4.6 et sera supprimé dans une future version du modèle. Passez à thinking: {type: "adaptive"} et utilisez le paramètre effort pour contrôler la profondeur de la réflexion. Consultez Réflexion adaptative.
```
response = client.beta.messages.create(
    model="claude-opus-4-5",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 32000},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[...],
)
```
Notez que la migration passe également de client.beta.messages.create à client.messages.create. La réflexion adaptative et l'effort sont des fonctionnalités GA et ne nécessitent pas l'espace de noms SDK bêta ou d'en-têtes bêta.
Supprimez l'en-tête bêta d'effort : Le paramètre effort est maintenant GA. Supprimez betas=["effort-2025-11-24"] de vos requêtes.
Supprimez l'en-tête bêta de streaming d'outils à grain fin : Le streaming d'outils à grain fin est maintenant GA. Supprimez betas=["fine-grained-tool-streaming-2025-05-14"] de vos requêtes.
Supprimez l'en-tête bêta de réflexion entrelacée (Opus 4.6 uniquement) : La réflexion adaptative active automatiquement la réflexion entrelacée sur Opus 4.6. Supprimez betas=["interleaved-thinking-2025-05-14"] de vos requêtes Opus 4.6. Remarque : Sonnet 4.6 continue de supporter cet en-tête bêta avec la réflexion étendue manuelle.
Migrer vers output_config.format : Si vous utilisez les sorties structurées, mettez à jour output_format={...} vers output_config={"format": {...}}. L'ancien paramètre reste fonctionnel mais est déprécié et sera supprimé dans une future version du modèle.

Migration de Claude 4.1 ou antérieur vers Claude 4.6

Si vous migrez d'Opus 4.1, Sonnet 4, ou de modèles antérieurs directement vers Claude 4.6, appliquez les modifications importantes de Claude 4.6 ci-dessus plus les modifications supplémentaires de cette section.

# À partir d'Opus 4.1
model = "claude-opus-4-1-20250805"  # Avant
model = "claude-opus-4-6"  # Après

# À partir de Sonnet 4
model = "claude-sonnet-4-20250514"  # Avant
model = "claude-opus-4-6"  # Après

# À partir de Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Avant
model = "claude-opus-4-6"  # Après

Modifications importantes supplémentaires

Mettez à jour les paramètres d'échantillonnage

Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.

Utilisez uniquement temperature OU top_p, pas les deux :

# Avant - Cela génèrera une erreur dans les modèles Claude 4+
response = client.messages.create(
    model="claude-3-7-sonnet-20250219",
    temperature=0.7,
    top_p=0.9,  # Impossible d'utiliser les deux
    # ...
)

# Après
response = client.messages.create(
    model="claude-opus-4-6",
    temperature=0.7,  # Utilisez temperature OU top_p, pas les deux
    # ...
)

Mettez à jour les versions d'outils

Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.

Mettez à jour vers les dernières versions d'outils. Supprimez tout code utilisant la commande undo_edit.
```
# Avant
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]

# Après
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]
```
- Éditeur de texte : Utilisez text_editor_20250728 et str_replace_based_edit_tool. Consultez la documentation de l'outil éditeur de texte pour plus de détails.
- Exécution de code : Mettez à niveau vers code_execution_20250825. Consultez la documentation de l'outil d'exécution de code pour les instructions de migration.

Gérez la raison d'arrêt refusal

Mettez à jour votre application pour gérer les raisons d'arrêt refusal :

response = client.messages.create(...)

if response.stop_reason == "refusal":
    # Gérez le refus de manière appropriée
    pass

Gérez la raison d'arrêt model_context_window_exceeded

Les modèles Claude 4.5+ retournent une raison d'arrêt model_context_window_exceeded lorsque la génération s'arrête en raison du dépassement de la limite de la fenêtre de contexte, plutôt que de la limite max_tokens demandée. Mettez à jour votre application pour gérer cette nouvelle raison d'arrêt :
```
response = client.messages.create(...)

if response.stop_reason == "model_context_window_exceeded":
    # Gérez la limite de la fenêtre de contexte de manière appropriée
    pass
```
Vérifiez la gestion des paramètres d'outils (sauts de ligne de fin)

Les modèles Claude 4.5+ préservent les sauts de ligne de fin dans les paramètres de chaîne d'appel d'outil qui étaient précédemment supprimés. Si vos outils s'appuient sur une correspondance exacte des chaînes par rapport aux paramètres d'appel d'outil, vérifiez que votre logique gère correctement les sauts de ligne de fin.
Mettez à jour vos invites pour les changements de comportement

Les modèles Claude 4+ ont un style de communication plus concis et direct et nécessitent des directives explicites. Consultez les meilleures pratiques d'invite pour des conseils d'optimisation.

Modifications recommandées supplémentaires

Supprimez les en-têtes bêta hérités : Supprimez token-efficient-tools-2025-02-19 et output-128k-2025-02-19. Tous les modèles Claude 4+ ont l'utilisation d'outils efficace en tokens intégrée et ces en-têtes n'ont aucun effet.

Liste de contrôle de migration Claude 4.6

Migration vers Claude Sonnet 4.6

Claude Sonnet 4.6 combine une forte intelligence avec des performances rapides, offrant des capacités de recherche agentique améliorées et l'exécution de code gratuite lorsqu'elle est utilisée avec la recherche web ou la récupération web. Il est idéal pour les tâches quotidiennes de codage, d'analyse et de contenu.

Pour un aperçu complet des capacités, consultez l'aperçu des modèles.

La tarification de Sonnet 4.6 est de 3 $ par million de tokens d'entrée, 15 $ par million de tokens de sortie. Consultez la tarification Claude pour plus de détails.

Mettez à jour votre nom de modèle :

# À partir de Sonnet 4.5
model = "claude-sonnet-4-5"  # Avant
model = "claude-sonnet-4-6"  # Après

# À partir de Sonnet 4
model = "claude-sonnet-4-20250514"  # Avant
model = "claude-sonnet-4-6"  # Après

Modifications importantes

Lors de la migration à partir de Sonnet 4.5

Le prefill des messages d'assistant n'est plus supporté

Ceci est une modification importante lors de la migration à partir de Sonnet 4.5 ou antérieur.

Le prefill des messages d'assistant retourne une erreur 400 sur Sonnet 4.6. Utilisez les sorties structurées, les instructions du message système, ou output_config.format à la place.

Cas d'usage courants de prefill et migrations :
- Contrôle du formatage de sortie (forcer la sortie JSON/YAML) : Utilisez les sorties structurées ou les outils avec des champs enum pour les tâches de classification.
- Élimination des préambules (suppression des phrases "Voici...") : Ajoutez des instructions directes dans le message système : "Répondez directement sans préambule. Ne commencez pas par des phrases comme 'Voici...', 'Basé sur...', etc."
- Éviter les mauvais refus : Claude est maintenant beaucoup mieux pour les refus appropriés. Une invite claire dans le message utilisateur sans prefill devrait être suffisante.
- Continuations (reprise des réponses interrompues) : Déplacez la continuation vers le message utilisateur : "Votre réponse précédente a été interrompue et s'est terminée par [previous_response]. Continuez à partir de là où vous vous étiez arrêté."
- Hydratation du contexte / cohérence des rôles (actualisation du contexte dans les longues conversations) : Injectez ce qui était auparavant des rappels d'assistant prefillés dans le tour utilisateur à la place.
L'échappement JSON des paramètres d'outils peut différer

Ceci est une modification importante lors de la migration à partir de Sonnet 4.5 ou antérieur.

L'échappement des chaînes JSON dans les paramètres d'outils peut différer des modèles précédents. Les analyseurs JSON standard gèrent cela automatiquement, mais l'analyse personnalisée basée sur des chaînes peut nécessiter des mises à jour.

Lors de la migration à partir de Claude 3.x

Mettez à jour les paramètres d'échantillonnage

Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.

Utilisez uniquement temperature OU top_p, pas les deux.
Mettez à jour les versions d'outils

Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.

Mettez à jour vers les dernières versions d'outils (text_editor_20250728, code_execution_20250825). Supprimez tout code utilisant la commande undo_edit.
Gérez la raison d'arrêt refusal

Mettez à jour votre application pour gérer les raisons d'arrêt refusal.
Mettez à jour vos invites pour les changements de comportement

Les modèles Claude 4 ont un style de communication plus concis et direct. Consultez les meilleures pratiques d'invite pour des conseils d'optimisation.

Modifications recommandées

Supprimez l'en-tête bêta fine-grained-tool-streaming-2025-05-14 — Le streaming d'outils à grain fin est maintenant GA sur Sonnet 4.6 et ne nécessite plus d'en-tête bêta.
Migrez output_format vers output_config.format — Le paramètre output_format est déprécié. Utilisez output_config.format à la place.

Migration à partir de Sonnet 4.5

Nous vous encourageons vivement à migrer de Sonnet 4.5 vers Sonnet 4.6, qui offre plus d'intelligence au même prix.

Sonnet 4.6 utilise par défaut un niveau d'effort de high, contrairement à Sonnet 4.5 qui n'avait pas de paramètre d'effort. Nous recommandons d'ajuster le paramètre d'effort lors de votre migration de Sonnet 4.5 vers Sonnet 4.6. S'il n'est pas explicitement défini, vous pouvez expérimenter une latence plus élevée avec le niveau d'effort par défaut.

Si vous n'utilisez pas la réflexion étendue

Si vous n'utilisez pas la réflexion étendue sur Sonnet 4.5, vous pouvez continuer sans elle sur Sonnet 4.6. Vous devez explicitement définir l'effort au niveau approprié pour votre cas d'usage. Avec un effort low et la réflexion désactivée, vous pouvez vous attendre à des performances similaires ou meilleures par rapport à Sonnet 4.5 sans réflexion étendue.

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Si vous utilisez la réflexion étendue

Si vous utilisez la réflexion étendue sur Sonnet 4.5, elle continue d'être supportée sur Sonnet 4.6 sans modifications nécessaires à votre configuration de réflexion. Nous recommandons de maintenir un budget de réflexion autour de 16k tokens. En pratique, la plupart des tâches n'en utilisent pas autant, mais cela fournit une marge de manœuvre pour les problèmes plus difficiles sans risque d'utilisation de tokens incontrôlée.

Cas d'usage de codage et agentique

Pour le codage agentique, la conception frontend, les flux de travail lourds en outils et les flux de travail d'entreprise complexes, nous recommandons de commencer avec un effort medium. Si vous trouvez que la latence est trop élevée, envisagez de réduire l'effort à low. Si vous avez besoin d'une intelligence plus élevée, envisagez d'augmenter l'effort à high ou de migrer vers Opus 4.6.

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16384,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "medium"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Cas d'usage de chat et non-codage

Pour le chat, la génération de contenu, la recherche, la classification et d'autres tâches non-codage, nous recommandons de commencer avec un effort low avec la réflexion étendue. Si vous avez besoin de plus de profondeur, augmentez l'effort à medium.

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "low"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Quand essayer la réflexion adaptative

Les chemins de migration ci-dessus utilisent la réflexion étendue avec budget_tokens pour une utilisation prévisible des tokens. Si votre charge de travail correspond à l'un des modèles suivants, envisagez d'essayer plutôt la réflexion adaptative :

Agents multi-étapes autonomes : agents de codage qui transforment les exigences en logiciels fonctionnels, pipelines d'analyse de données et recherche de bugs où le modèle s'exécute indépendamment sur plusieurs étapes. La réflexion adaptative permet au modèle d'étalonner son raisonnement par étape, restant sur la bonne voie sur des trajectoires plus longues. Pour ces charges de travail, commencez avec un effort high. Si la latence ou l'utilisation des tokens est une préoccupation, réduisez à medium.
Agents d'utilisation informatique : Sonnet 4.6 a atteint la meilleure précision de sa catégorie sur les évaluations d'utilisation informatique en utilisant le mode adaptatif.
Charges de travail bimodales : un mélange de tâches faciles et difficiles où la réflexion adaptative saute la réflexion sur les requêtes simples et raisonne profondément sur les requêtes complexes.

Lors de l'utilisation de la réflexion adaptative, évaluez les efforts medium et high sur vos tâches. Le niveau approprié dépend du compromis de votre charge de travail entre la qualité, la latence et l'utilisation des tokens.

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Si vous observez un comportement incohérent ou des régressions de qualité avec la réflexion adaptative, passez à la réflexion étendue avec budget_tokens. Cela fournit des résultats plus prévisibles avec un plafond sur les coûts de réflexion.

Liste de contrôle de migration Sonnet 4.6

Migration vers Claude Sonnet 4.5

Claude Sonnet 4.5 combine une forte intelligence avec des performances rapides, ce qui le rend idéal pour les tâches quotidiennes de codage, d'analyse et de contenu.

Pour un aperçu complet des capacités, consultez l'aperçu des modèles.

La tarification de Sonnet 4.5 est de 3 $ par million de tokens d'entrée, 15 $ par million de tokens de sortie. Consultez la tarification Claude pour plus de détails.

Mettez à jour votre nom de modèle :

# À partir de Sonnet 4
model = "claude-sonnet-4-20250514"  # Avant
model = "claude-sonnet-4-5-20250929"  # Après

# À partir de Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Avant
model = "claude-sonnet-4-5-20250929"  # Après

Modifications importantes

Ces modifications importantes s'appliquent lors de la migration à partir des modèles Claude 3.x Sonnet.

Mettez à jour les paramètres d'échantillonnage

Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.

Utilisez uniquement temperature OU top_p, pas les deux.
Mettez à jour les versions d'outils

Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.

Mettez à jour vers les dernières versions d'outils (text_editor_20250728, code_execution_20250825). Supprimez tout code utilisant la commande undo_edit.
Gérez la raison d'arrêt refusal

Mettez à jour votre application pour gérer les raisons d'arrêt refusal.
Mettez à jour vos invites pour les changements de comportement

Les modèles Claude 4 ont un style de communication plus concis et direct. Consultez les meilleures pratiques d'invite pour des conseils d'optimisation.

Liste de contrôle de migration Sonnet 4.5

Mettez à jour l'ID du modèle vers claude-sonnet-4-5-20250929
IMPORTANT : Mettez à jour les versions d'outils vers les dernières (text_editor_20250728, code_execution_20250825) ; les versions héritées ne sont pas supportées (si vous migrez à partir de 3.x)
IMPORTANT : Supprimez tout code utilisant la commande undo_edit (le cas échéant)
IMPORTANT : Mettez à jour les paramètres d'échantillonnage pour utiliser uniquement temperature OU top_p, pas les deux (si vous migrez à partir de 3.x)
Gérez la nouvelle raison d'arrêt refusal dans votre application
Examinez et mettez à jour les invites en suivant les meilleures pratiques d'invite
Envisagez d'activer la réflexion étendue pour les tâches de raisonnement complexe
Testez dans un environnement de développement avant le déploiement en production

Migration vers Claude Haiku 4.5

Claude Haiku 4.5 est le modèle Haiku le plus rapide et le plus intelligent avec des performances quasi-frontière, offrant une qualité de modèle premium pour les applications interactives et le traitement à haut volume.

Pour un aperçu complet des capacités, consultez l'aperçu des modèles.

La tarification de Haiku 4.5 est de 1 $ par million de tokens d'entrée, 5 $ par million de tokens de sortie. Consultez la tarification Claude pour plus de détails.

Mettez à jour votre nom de modèle :

# À partir de Haiku 3.5
model = "claude-3-5-haiku-20241022"  # Avant
model = "claude-haiku-4-5-20251001"  # Après

Examinez les nouvelles limites de débit : Haiku 4.5 a des limites de débit séparées de Haiku 3.5. Consultez la documentation des limites de débit pour plus de détails.

Pour des améliorations significatives des performances sur les tâches de codage et de raisonnement, envisagez d'activer la réflexion étendue avec thinking: {type: "enabled", budget_tokens: N}.

La réflexion étendue a un impact sur l'efficacité de la mise en cache des invites.

La réflexion étendue est dépréciée dans Claude 4.6 ou les modèles plus récents. Si vous utilisez des modèles plus récents, utilisez plutôt la réflexion adaptative.

Explorez les nouvelles capacités : Consultez l'aperçu des modèles pour plus de détails sur la sensibilisation au contexte, la capacité de sortie augmentée (64K tokens), l'intelligence plus élevée et la vitesse améliorée.

Modifications importantes

Ces modifications importantes s'appliquent lors de la migration à partir des modèles Claude 3.x Haiku.

Mettez à jour les paramètres d'échantillonnage

Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.

Utilisez uniquement temperature OU top_p, pas les deux.
Mettez à jour les versions d'outils

Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.

Mettez à jour vers les dernières versions d'outils (text_editor_20250728, code_execution_20250825). Supprimez tout code utilisant la commande undo_edit.
Gérez la raison d'arrêt refusal

Mettez à jour votre application pour gérer les raisons d'arrêt refusal.
Mettez à jour vos invites pour les changements de comportement

Les modèles Claude 4 ont un style de communication plus concis et direct. Consultez les meilleures pratiques d'invite pour des conseils d'optimisation.

Liste de contrôle de migration Haiku 4.5

Mettez à jour l'ID du modèle vers claude-haiku-4-5-20251001
IMPORTANT : Mettez à jour les versions d'outils vers les dernières (text_editor_20250728, code_execution_20250825) ; les versions héritées ne sont pas supportées
IMPORTANT : Supprimez tout code utilisant la commande undo_edit (le cas échéant)
IMPORTANT : Mettez à jour les paramètres d'échantillonnage pour utiliser uniquement temperature OU top_p, pas les deux
Gérez la nouvelle raison d'arrêt refusal dans votre application
Examinez et ajustez pour les nouvelles limites de débit (séparées de Haiku 3.5)
Examinez et mettez à jour les invites en suivant les meilleures pratiques d'invite
Envisagez d'activer la réflexion étendue pour les tâches de raisonnement complexe
Testez dans un environnement de développement avant le déploiement en production

Besoin d'aide ?

Consultez la documentation de l'API pour les spécifications détaillées
Examinez les capacités du modèle pour les comparaisons de performances
Examinez les notes de version de l'API pour les mises à jour de l'API
Contactez le support si vous rencontrez des problèmes lors de la migration

Was this page helpful?

Modèles et tarification

Guide de migration

Guide pour migrer vers les modèles Claude 4.6 à partir des versions précédentes de Claude

Migration vers Claude 4.6

Mettez à jour votre nom de modèle

# Migration Opus
model = "claude-opus-4-5"  # Avant
model = "claude-opus-4-6"  # Après

Modifications importantes

Suppression du prefill : Le prefill des messages d'assistant retourne une erreur 400 sur les modèles Claude 4.6. Utilisez plutôt les sorties structurées, les instructions du message système, ou output_config.format.
Guillemets des paramètres d'outils : Les modèles Claude 4.6 peuvent produire un échappement JSON légèrement différent des chaînes de caractères dans les arguments d'appels d'outils (par exemple, gestion différente des échappements Unicode ou des barres obliques). Si vous analysez l'input d'appel d'outil en tant que chaîne brute plutôt que d'utiliser un analyseur JSON, vérifiez votre logique d'analyse. Les analyseurs JSON standard (comme json.loads() ou JSON.parse()) gèrent ces différences automatiquement.

Modifications recommandées

Ces modifications ne sont pas obligatoires mais amélioreront votre expérience :

Migrer vers la réflexion adaptative : thinking: {type: "enabled", budget_tokens: N} est déprécié sur les modèles Claude 4.6 et sera supprimé dans une future version du modèle. Passez à thinking: {type: "adaptive"} et utilisez le paramètre effort pour contrôler la profondeur de la réflexion. Consultez Réflexion adaptative.
```
response = client.beta.messages.create(
    model="claude-opus-4-5",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 32000},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[...],
)
```
Notez que la migration passe également de client.beta.messages.create à client.messages.create. La réflexion adaptative et l'effort sont des fonctionnalités GA et ne nécessitent pas l'espace de noms SDK bêta ou d'en-têtes bêta.
Supprimez l'en-tête bêta d'effort : Le paramètre effort est maintenant GA. Supprimez betas=["effort-2025-11-24"] de vos requêtes.
Supprimez l'en-tête bêta de streaming d'outils à grain fin : Le streaming d'outils à grain fin est maintenant GA. Supprimez betas=["fine-grained-tool-streaming-2025-05-14"] de vos requêtes.
Supprimez l'en-tête bêta de réflexion entrelacée (Opus 4.6 uniquement) : La réflexion adaptative active automatiquement la réflexion entrelacée sur Opus 4.6. Supprimez betas=["interleaved-thinking-2025-05-14"] de vos requêtes Opus 4.6. Remarque : Sonnet 4.6 continue de supporter cet en-tête bêta avec la réflexion étendue manuelle.
Migrer vers output_config.format : Si vous utilisez les sorties structurées, mettez à jour output_format={...} vers output_config={"format": {...}}. L'ancien paramètre reste fonctionnel mais est déprécié et sera supprimé dans une future version du modèle.

Migration de Claude 4.1 ou antérieur vers Claude 4.6

# À partir d'Opus 4.1
model = "claude-opus-4-1-20250805"  # Avant
model = "claude-opus-4-6"  # Après

# À partir de Sonnet 4
model = "claude-sonnet-4-20250514"  # Avant
model = "claude-opus-4-6"  # Après

# À partir de Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Avant
model = "claude-opus-4-6"  # Après

Modifications importantes supplémentaires

Mettez à jour les paramètres d'échantillonnage

Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.

Utilisez uniquement temperature OU top_p, pas les deux :

# Avant - Cela génèrera une erreur dans les modèles Claude 4+
response = client.messages.create(
    model="claude-3-7-sonnet-20250219",
    temperature=0.7,
    top_p=0.9,  # Impossible d'utiliser les deux
    # ...
)

# Après
response = client.messages.create(
    model="claude-opus-4-6",
    temperature=0.7,  # Utilisez temperature OU top_p, pas les deux
    # ...
)

Mettez à jour les versions d'outils

Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.

Mettez à jour vers les dernières versions d'outils. Supprimez tout code utilisant la commande undo_edit.
```
# Avant
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]

# Après
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]
```
- Éditeur de texte : Utilisez text_editor_20250728 et str_replace_based_edit_tool. Consultez la documentation de l'outil éditeur de texte pour plus de détails.
- Exécution de code : Mettez à niveau vers code_execution_20250825. Consultez la documentation de l'outil d'exécution de code pour les instructions de migration.

Gérez la raison d'arrêt refusal

Mettez à jour votre application pour gérer les raisons d'arrêt refusal :

response = client.messages.create(...)

if response.stop_reason == "refusal":
    # Gérez le refus de manière appropriée
    pass

Gérez la raison d'arrêt model_context_window_exceeded

Les modèles Claude 4.5+ retournent une raison d'arrêt model_context_window_exceeded lorsque la génération s'arrête en raison du dépassement de la limite de la fenêtre de contexte, plutôt que de la limite max_tokens demandée. Mettez à jour votre application pour gérer cette nouvelle raison d'arrêt :
```
response = client.messages.create(...)

if response.stop_reason == "model_context_window_exceeded":
    # Gérez la limite de la fenêtre de contexte de manière appropriée
    pass
```
Vérifiez la gestion des paramètres d'outils (sauts de ligne de fin)

Les modèles Claude 4.5+ préservent les sauts de ligne de fin dans les paramètres de chaîne d'appel d'outil qui étaient précédemment supprimés. Si vos outils s'appuient sur une correspondance exacte des chaînes par rapport aux paramètres d'appel d'outil, vérifiez que votre logique gère correctement les sauts de ligne de fin.
Mettez à jour vos invites pour les changements de comportement

Les modèles Claude 4+ ont un style de communication plus concis et direct et nécessitent des directives explicites. Consultez les meilleures pratiques d'invite pour des conseils d'optimisation.

Modifications recommandées supplémentaires

Supprimez les en-têtes bêta hérités : Supprimez token-efficient-tools-2025-02-19 et output-128k-2025-02-19. Tous les modèles Claude 4+ ont l'utilisation d'outils efficace en tokens intégrée et ces en-têtes n'ont aucun effet.

Liste de contrôle de migration Claude 4.6

Migration vers Claude Sonnet 4.6

Pour un aperçu complet des capacités, consultez l'aperçu des modèles.

La tarification de Sonnet 4.6 est de 3 $ par million de tokens d'entrée, 15 $ par million de tokens de sortie. Consultez la tarification Claude pour plus de détails.

Mettez à jour votre nom de modèle :

# À partir de Sonnet 4.5
model = "claude-sonnet-4-5"  # Avant
model = "claude-sonnet-4-6"  # Après

# À partir de Sonnet 4
model = "claude-sonnet-4-20250514"  # Avant
model = "claude-sonnet-4-6"  # Après

Modifications importantes

Lors de la migration à partir de Sonnet 4.5

Le prefill des messages d'assistant n'est plus supporté

Ceci est une modification importante lors de la migration à partir de Sonnet 4.5 ou antérieur.

Le prefill des messages d'assistant retourne une erreur 400 sur Sonnet 4.6. Utilisez les sorties structurées, les instructions du message système, ou output_config.format à la place.

Cas d'usage courants de prefill et migrations :
- Contrôle du formatage de sortie (forcer la sortie JSON/YAML) : Utilisez les sorties structurées ou les outils avec des champs enum pour les tâches de classification.
- Élimination des préambules (suppression des phrases "Voici...") : Ajoutez des instructions directes dans le message système : "Répondez directement sans préambule. Ne commencez pas par des phrases comme 'Voici...', 'Basé sur...', etc."
- Éviter les mauvais refus : Claude est maintenant beaucoup mieux pour les refus appropriés. Une invite claire dans le message utilisateur sans prefill devrait être suffisante.
- Continuations (reprise des réponses interrompues) : Déplacez la continuation vers le message utilisateur : "Votre réponse précédente a été interrompue et s'est terminée par [previous_response]. Continuez à partir de là où vous vous étiez arrêté."
- Hydratation du contexte / cohérence des rôles (actualisation du contexte dans les longues conversations) : Injectez ce qui était auparavant des rappels d'assistant prefillés dans le tour utilisateur à la place.
L'échappement JSON des paramètres d'outils peut différer

Ceci est une modification importante lors de la migration à partir de Sonnet 4.5 ou antérieur.

L'échappement des chaînes JSON dans les paramètres d'outils peut différer des modèles précédents. Les analyseurs JSON standard gèrent cela automatiquement, mais l'analyse personnalisée basée sur des chaînes peut nécessiter des mises à jour.

Lors de la migration à partir de Claude 3.x

Mettez à jour les paramètres d'échantillonnage

Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.

Utilisez uniquement temperature OU top_p, pas les deux.
Mettez à jour les versions d'outils

Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.

Mettez à jour vers les dernières versions d'outils (text_editor_20250728, code_execution_20250825). Supprimez tout code utilisant la commande undo_edit.
Gérez la raison d'arrêt refusal

Mettez à jour votre application pour gérer les raisons d'arrêt refusal.
Mettez à jour vos invites pour les changements de comportement

Les modèles Claude 4 ont un style de communication plus concis et direct. Consultez les meilleures pratiques d'invite pour des conseils d'optimisation.

Modifications recommandées

Supprimez l'en-tête bêta fine-grained-tool-streaming-2025-05-14 — Le streaming d'outils à grain fin est maintenant GA sur Sonnet 4.6 et ne nécessite plus d'en-tête bêta.
Migrez output_format vers output_config.format — Le paramètre output_format est déprécié. Utilisez output_config.format à la place.

Migration à partir de Sonnet 4.5

Nous vous encourageons vivement à migrer de Sonnet 4.5 vers Sonnet 4.6, qui offre plus d'intelligence au même prix.

Si vous n'utilisez pas la réflexion étendue

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Si vous utilisez la réflexion étendue

Cas d'usage de codage et agentique

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16384,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "medium"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Cas d'usage de chat et non-codage

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "low"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Quand essayer la réflexion adaptative

Agents multi-étapes autonomes : agents de codage qui transforment les exigences en logiciels fonctionnels, pipelines d'analyse de données et recherche de bugs où le modèle s'exécute indépendamment sur plusieurs étapes. La réflexion adaptative permet au modèle d'étalonner son raisonnement par étape, restant sur la bonne voie sur des trajectoires plus longues. Pour ces charges de travail, commencez avec un effort high. Si la latence ou l'utilisation des tokens est une préoccupation, réduisez à medium.
Agents d'utilisation informatique : Sonnet 4.6 a atteint la meilleure précision de sa catégorie sur les évaluations d'utilisation informatique en utilisant le mode adaptatif.
Charges de travail bimodales : un mélange de tâches faciles et difficiles où la réflexion adaptative saute la réflexion sur les requêtes simples et raisonne profondément sur les requêtes complexes.

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Liste de contrôle de migration Sonnet 4.6

Migration vers Claude Sonnet 4.5

Claude Sonnet 4.5 combine une forte intelligence avec des performances rapides, ce qui le rend idéal pour les tâches quotidiennes de codage, d'analyse et de contenu.

Pour un aperçu complet des capacités, consultez l'aperçu des modèles.

La tarification de Sonnet 4.5 est de 3 $ par million de tokens d'entrée, 15 $ par million de tokens de sortie. Consultez la tarification Claude pour plus de détails.

Mettez à jour votre nom de modèle :

# À partir de Sonnet 4
model = "claude-sonnet-4-20250514"  # Avant
model = "claude-sonnet-4-5-20250929"  # Après

# À partir de Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Avant
model = "claude-sonnet-4-5-20250929"  # Après

Modifications importantes

Ces modifications importantes s'appliquent lors de la migration à partir des modèles Claude 3.x Sonnet.

Mettez à jour les paramètres d'échantillonnage

Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.

Utilisez uniquement temperature OU top_p, pas les deux.
Mettez à jour les versions d'outils

Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.

Mettez à jour vers les dernières versions d'outils (text_editor_20250728, code_execution_20250825). Supprimez tout code utilisant la commande undo_edit.
Gérez la raison d'arrêt refusal

Mettez à jour votre application pour gérer les raisons d'arrêt refusal.
Mettez à jour vos invites pour les changements de comportement

Les modèles Claude 4 ont un style de communication plus concis et direct. Consultez les meilleures pratiques d'invite pour des conseils d'optimisation.

Liste de contrôle de migration Sonnet 4.5

Mettez à jour l'ID du modèle vers claude-sonnet-4-5-20250929
IMPORTANT : Mettez à jour les versions d'outils vers les dernières (text_editor_20250728, code_execution_20250825) ; les versions héritées ne sont pas supportées (si vous migrez à partir de 3.x)
IMPORTANT : Supprimez tout code utilisant la commande undo_edit (le cas échéant)
IMPORTANT : Mettez à jour les paramètres d'échantillonnage pour utiliser uniquement temperature OU top_p, pas les deux (si vous migrez à partir de 3.x)
Gérez la nouvelle raison d'arrêt refusal dans votre application
Examinez et mettez à jour les invites en suivant les meilleures pratiques d'invite
Envisagez d'activer la réflexion étendue pour les tâches de raisonnement complexe
Testez dans un environnement de développement avant le déploiement en production

Migration vers Claude Haiku 4.5

Pour un aperçu complet des capacités, consultez l'aperçu des modèles.

La tarification de Haiku 4.5 est de 1 $ par million de tokens d'entrée, 5 $ par million de tokens de sortie. Consultez la tarification Claude pour plus de détails.

Mettez à jour votre nom de modèle :

# À partir de Haiku 3.5
model = "claude-3-5-haiku-20241022"  # Avant
model = "claude-haiku-4-5-20251001"  # Après

Examinez les nouvelles limites de débit : Haiku 4.5 a des limites de débit séparées de Haiku 3.5. Consultez la documentation des limites de débit pour plus de détails.

Pour des améliorations significatives des performances sur les tâches de codage et de raisonnement, envisagez d'activer la réflexion étendue avec thinking: {type: "enabled", budget_tokens: N}.

La réflexion étendue a un impact sur l'efficacité de la mise en cache des invites.

La réflexion étendue est dépréciée dans Claude 4.6 ou les modèles plus récents. Si vous utilisez des modèles plus récents, utilisez plutôt la réflexion adaptative.

Modifications importantes

Ces modifications importantes s'appliquent lors de la migration à partir des modèles Claude 3.x Haiku.

Mettez à jour les paramètres d'échantillonnage

Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.

Utilisez uniquement temperature OU top_p, pas les deux.
Mettez à jour les versions d'outils

Ceci est une modification importante lors de la migration à partir des modèles Claude 3.x.

Mettez à jour vers les dernières versions d'outils (text_editor_20250728, code_execution_20250825). Supprimez tout code utilisant la commande undo_edit.
Gérez la raison d'arrêt refusal

Mettez à jour votre application pour gérer les raisons d'arrêt refusal.
Mettez à jour vos invites pour les changements de comportement

Les modèles Claude 4 ont un style de communication plus concis et direct. Consultez les meilleures pratiques d'invite pour des conseils d'optimisation.

Liste de contrôle de migration Haiku 4.5

Mettez à jour l'ID du modèle vers claude-haiku-4-5-20251001
IMPORTANT : Mettez à jour les versions d'outils vers les dernières (text_editor_20250728, code_execution_20250825) ; les versions héritées ne sont pas supportées
IMPORTANT : Supprimez tout code utilisant la commande undo_edit (le cas échéant)
IMPORTANT : Mettez à jour les paramètres d'échantillonnage pour utiliser uniquement temperature OU top_p, pas les deux
Gérez la nouvelle raison d'arrêt refusal dans votre application
Examinez et ajustez pour les nouvelles limites de débit (séparées de Haiku 3.5)
Examinez et mettez à jour les invites en suivant les meilleures pratiques d'invite
Envisagez d'activer la réflexion étendue pour les tâches de raisonnement complexe
Testez dans un environnement de développement avant le déploiement en production

Besoin d'aide ?

Consultez la documentation de l'API pour les spécifications détaillées
Examinez les capacités du modèle pour les comparaisons de performances
Examinez les notes de version de l'API pour les mises à jour de l'API
Contactez le support si vous rencontrez des problèmes lors de la migration

Was this page helpful?