Claude 4.5 introduit trois modèles conçus pour différents cas d'usage :
Claude Opus 4.5 représente notre modèle le plus intelligent, combinant la capacité maximale avec des performances pratiques. Il offre des améliorations majeures dans le raisonnement, le codage et les tâches de résolution de problèmes complexes tout en maintenant les résultats de haute qualité attendus de la famille Opus.
Claude Opus 4.5 est le seul modèle qui supporte le paramètre d'effort, vous permettant de contrôler combien de tokens Claude utilise lors de la réponse. Cela vous donne la possibilité de faire un compromis entre la complétude de la réponse et l'efficacité des tokens avec un seul modèle.
Le paramètre d'effort affecte tous les tokens de la réponse, y compris les réponses texte, les appels d'outils et la réflexion étendue. Vous pouvez choisir entre :
Claude Opus 4.5 introduit des capacités d'utilisation informatique améliorées avec une nouvelle action de zoom qui permet l'inspection détaillée de régions d'écran spécifiques à pleine résolution. Cela permet à Claude d'examiner les éléments d'interface utilisateur à grain fin, le texte petit et les informations visuelles détaillées qui pourraient être peu clairs dans les captures d'écran standard.
La capacité de zoom est particulièrement utile pour :
Claude Opus 4.5 offre une intelligence de premier plan à un point de prix plus accessible que les modèles Opus précédents, rendant les capacités d'IA avancées disponibles pour une gamme plus large d'applications et de cas d'usage.
Claude Opus 4.5 préserve automatiquement tous les blocs de réflexion précédents tout au long des conversations, maintenant la continuité du raisonnement dans les interactions multi-tours étendues et les sessions d'utilisation d'outils. Cela garantit que Claude peut efficacement exploiter son historique de raisonnement complet lorsqu'il travaille sur des tâches complexes et longues.
Claude Sonnet 4.5 est notre meilleur modèle de codage à ce jour, avec des améliorations significatives dans tout le cycle de vie du développement :
Claude Sonnet 4.5 fonctionne significativement mieux sur les tâches de codage lorsque la réflexion étendue est activée. La réflexion étendue est désactivée par défaut, mais nous recommandons de l'activer pour le travail de codage complexe. Soyez conscient que la réflexion étendue impacte l'efficacité de la mise en cache des invites. Consultez le guide de migration pour les détails de configuration.
Claude Sonnet 4.5 introduit des avancées majeures dans les capacités d'agent :
Claude Sonnet 4.5 a une approche de communication affinée qui est concise, directe et naturelle. Il fournit des mises à jour de progrès basées sur les faits et peut ignorer les résumés verbeux après les appels d'outils pour maintenir l'élan du flux de travail (bien que cela puisse être ajusté avec le prompting).
Pour des conseils détaillés sur le travail avec ce style de communication, consultez les meilleures pratiques Claude 4.
Claude Sonnet 4.5 excelle dans les tâches de contenu créatif :
Claude Haiku 4.5 représente un saut transformateur pour la famille de modèles Haiku, apportant des capacités de frontière à notre classe de modèle la plus rapide :
Claude Haiku 4.5 offre des performances proches de la frontière correspondant à Sonnet 4 à un coût significativement inférieur et une vitesse plus rapide :
Claude Haiku 4.5 est le premier modèle Haiku à supporter la réflexion étendue, apportant des capacités de raisonnement avancées à la famille Haiku :
La réflexion étendue doit être activée explicitement en ajoutant un paramètre thinking à vos demandes d'API. Consultez la documentation de réflexion étendue pour les détails de mise en œuvre.
Claude Haiku 4.5 fonctionne significativement mieux sur les tâches de codage et de raisonnement lorsque la réflexion étendue est activée. La réflexion étendue est désactivée par défaut, mais nous recommandons de l'activer pour la résolution de problèmes complexes, le travail de codage et le raisonnement multi-étapes. Soyez conscient que la réflexion étendue impacte l'efficacité de la mise en cache des invites. Consultez le guide de migration pour les détails de configuration.
Claude Haiku 4.5 dispose de la conscience du contexte, permettant au modèle de suivre sa fenêtre de contexte restante tout au long d'une conversation :
C'est le premier modèle Haiku avec des capacités de conscience du contexte natives. Pour des conseils de prompting, consultez les meilleures pratiques Claude 4.
Claude Haiku 4.5 offre des capacités de codage robustes attendues des modèles Claude modernes :
Haiku 4.5 est conçu pour les cas d'usage qui exigent à la fois l'intelligence et l'efficacité :
L'appel d'outils programmatique permet à Claude d'écrire du code qui appelle vos outils de manière programmatique dans un conteneur d'exécution de code, plutôt que de nécessiter des allers-retours à travers le modèle pour chaque invocation d'outil. Cela réduit considérablement la latence pour les flux de travail multi-outils et diminue la consommation de tokens en permettant à Claude de filtrer ou traiter les données avant qu'elles n'atteignent la fenêtre de contexte du modèle.
tools=[
{
"type": "code_execution_20250825",
"name": "code_execution"
},
{
"name": "query_database",
"description": "Execute a SQL query against the sales database. Returns a list of rows as JSON objects.",
"input_schema": {...},
"allowed_callers": ["code_execution_20250825"] # Enable programmatic calling
}
]Avantages clés :
advanced-tool-use-2025-11-20L'outil de recherche d'outils permet à Claude de travailler avec des centaines ou des milliers d'outils en les découvrant et les chargeant dynamiquement à la demande. Au lieu de charger toutes les définitions d'outils dans la fenêtre de contexte dès le départ, Claude recherche votre catalogue d'outils et charge uniquement les outils dont il a besoin.
Deux variantes de recherche sont disponibles :
tool_search_tool_regex_20251119) : Claude construit des motifs regex pour rechercher les noms, descriptions et arguments des outilstool_search_tool_bm25_20251119) : Claude utilise des requêtes en langage naturel pour rechercher des outilstools=[
{
"type": "tool_search_tool_regex_20251119",
"name": "tool_search_tool_regex"
},
{
"name": "get_weather",
"description": "Get the weather at a specific location",
"input_schema": {...},
"defer_loading": True # Load on-demand via search
}
]Cette approche résout deux défis critiques :
advanced-tool-use-2025-11-20Le paramètre d'effort vous permet de contrôler combien de tokens Claude utilise lors de la réponse, en faisant un compromis entre la complétude de la réponse et l'efficacité des tokens :
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{"role": "user", "content": "..."}],
output_config={
"effort": "medium" # "low", "medium", or "high"
}
)Le paramètre d'effort affecte tous les tokens de la réponse, y compris les réponses texte, les appels d'outils et la réflexion étendue. Les niveaux d'effort inférieur produisent des réponses plus concises avec des explications minimales, tandis que l'effort supérieur fournit un raisonnement détaillé et des réponses complètes.
effort-2025-11-24Les exemples d'utilisation d'outils vous permettent de fournir des exemples concrets d'entrées d'outils valides pour aider Claude à comprendre comment utiliser vos outils plus efficacement. Ceci est particulièrement utile pour les outils complexes avec des objets imbriqués, des paramètres optionnels ou des entrées sensibles au format.
tools=[
{
"name": "get_weather",
"description": "Get the current weather in a given location",
"input_schema": {...},
"input_examples": [
{
"location": "San Francisco, CA",
"unit": "fahrenheit"
},
{
"location": "Tokyo, Japan",
"unit": "celsius"
},
{
"location": "New York, NY" # Demonstrates optional 'unit' parameter
}
]
}
]Les exemples sont inclus dans l'invite aux côtés de votre schéma d'outil, montrant à Claude des motifs concrets pour les appels d'outils bien formés. Chaque exemple doit être valide selon le input_schema de l'outil.
advanced-tool-use-2025-11-20.Le nouvel outil de mémoire permet à Claude de stocker et récupérer des informations en dehors de la fenêtre de contexte :
tools=[
{
"type": "memory_20250818",
"name": "memory"
}
]Cela permet :
context-management-2025-06-27Utilisez l'édition du contexte pour la gestion intelligente du contexte grâce à l'effacement automatique des appels d'outils :
response = client.beta.messages.create(
betas=["context-management-2025-06-27"],
model="claude-sonnet-4-5", # or claude-haiku-4-5
max_tokens=4096,
messages=[{"role": "user", "content": "..."}],
context_management={
"edits": [
{
"type": "clear_tool_uses_20250919",
"trigger": {"type": "input_tokens", "value": 500},
"keep": {"type": "tool_uses", "value": 2},
"clear_at_least": {"type": "input_tokens", "value": 100}
}
]
},
tools=[...]
)Cette fonctionnalité supprime automatiquement les appels d'outils et les résultats plus anciens lorsqu'on approche des limites de tokens, aidant à gérer le contexte dans les sessions d'agents longues.
context-management-2025-06-27Les modèles Claude 4.5 introduisent une nouvelle raison d'arrêt model_context_window_exceeded qui indique explicitement quand la génération s'est arrêtée en raison du dépassement de la limite de la fenêtre de contexte, plutôt que de la limite max_tokens demandée. Cela facilite la gestion des limites de fenêtre de contexte dans la logique de votre application.
{
"stop_reason": "model_context_window_exceeded",
"usage": {
"input_tokens": 150000,
"output_tokens": 49950
}
}Les modèles Claude 4.5 incluent une correction de bug qui préserve le formatage intentionnel dans les paramètres de chaîne d'appel d'outil. Auparavant, les sauts de ligne à la fin des paramètres de chaîne étaient parfois incorrectement supprimés. Cette correction garantit que les outils nécessitant un formatage précis (comme les éditeurs de texte) reçoivent les paramètres exactement comme prévu.
Ceci est une amélioration en arrière-plan sans modifications d'API requises. Cependant, les outils avec des paramètres de chaîne peuvent maintenant recevoir des valeurs avec des sauts de ligne à la fin qui ont été précédemment supprimés.
Exemple :
// Avant : Saut de ligne final accidentellement supprimé
{
"type": "tool_use",
"id": "toolu_01A09q90qw90lq917835lq9",
"name": "edit_todo",
"input": {
"file": "todo.txt",
"contents": "1. Chop onions.\n2. ???\n3. Profit"
}
}
// Après : Saut de ligne à la fin préservé comme prévu
{
"type": "tool_use",
"id": "toolu_01A09q90qw90lq917835lq9",
"name": "edit_todo",
"input": {
"file": "todo.txt",
"contents": "1. Chop onions.\n2. ???\n3. Profit\n"
}
}Les modèles Claude 4.5 incluent des optimisations automatiques pour améliorer les performances du modèle. Ces optimisations peuvent ajouter de petites quantités de tokens aux demandes, mais vous ne serez pas facturé pour ces tokens ajoutés par le système.
Les fonctionnalités suivantes ont été introduites dans Claude 4 et sont disponibles dans tous les modèles Claude 4, y compris Claude Sonnet 4.5 et Claude Haiku 4.5.
Les modèles Claude 4 introduisent une nouvelle raison d'arrêt refusal pour le contenu que le modèle refuse de générer pour des raisons de sécurité :
{
"id": "msg_014XEDjypDjFzgKVWdFUXxZP",
"type": "message",
"role": "assistant",
"model": "claude-sonnet-4-5",
"content": [{"type": "text", "text": "I would be happy to assist you. You can "}],
"stop_reason": "refusal",
"stop_sequence": null,
"usage": {
"input_tokens": 564,
"cache_creation_input_tokens": 0,
"cache_read_input_tokens": 0,
"output_tokens": 22
}
}Lors de l'utilisation des modèles Claude 4, vous devez mettre à jour votre application pour gérer les raisons d'arrêt refusal.
Avec la réflexion étendue activée, l'API Messages pour les modèles Claude 4 retourne un résumé du processus de réflexion complet de Claude. La réflexion résumée fournit tous les avantages en intelligence de la réflexion étendue, tout en prévenant les abus.
Bien que l'API soit cohérente entre les modèles Claude 3.7 et 4, les réponses en streaming pour la réflexion étendue pourraient revenir dans un motif de livraison « fragmenté », avec des délais possibles entre les événements de streaming.
La résumé est traitée par un modèle différent de celui que vous ciblez dans vos demandes. Le modèle de réflexion ne voit pas la sortie résumée.
Pour plus d'informations, consultez la documentation de réflexion étendue.
Les modèles Claude 4 supportent l'entrelacement de l'utilisation d'outils avec la réflexion étendue, permettant des conversations plus naturelles où les utilisations d'outils et les réponses peuvent être mélangées avec des messages réguliers.
La réflexion entrelacée est en bêta. Pour activer la réflexion entrelacée, ajoutez l'en-tête bêta interleaved-thinking-2025-05-14 à votre demande d'API.
Pour plus d'informations, consultez la documentation de réflexion étendue.
Les modèles Claude 4 ont des changements comportementaux notables qui peuvent affecter la façon dont vous structurez les invites :
Les modèles Claude 4 sont entraînés pour un suivi précis des instructions et nécessitent une direction plus explicite :
Pour des conseils complets sur le travail avec ces modèles, consultez les meilleures pratiques de prompt engineering Claude 4.
L'outil d'éditeur de texte a été mis à jour pour les modèles Claude 4 avec les modifications suivantes :
text_editor_20250728str_replace_based_edit_toolundo_edit n'est plus supportéeL'outil d'éditeur de texte str_replace_editor reste le même pour Claude Sonnet 3.7.
Si vous migrez depuis Claude Sonnet 3.7 et utilisez l'outil d'éditeur de texte :
# Claude Sonnet 3.7
tools=[
{
"type": "text_editor_20250124",
"name": "str_replace_editor"
}
]
# Claude 4 models
tools=[
{
"type": "text_editor_20250728",
"name": "str_replace_based_edit_tool"
}
]Pour plus d'informations, consultez la documentation de l'outil d'éditeur de texte.
Si vous utilisez l'outil d'exécution de code, assurez-vous d'utiliser la dernière version code_execution_20250825, qui ajoute les commandes Bash et les capacités de manipulation de fichiers.
La version héritée code_execution_20250522 (Python uniquement) est toujours disponible mais non recommandée pour les nouvelles implémentations.
Pour les instructions de migration, consultez la documentation de l'outil d'exécution de code.
Les modèles Claude 4.5 maintiennent une tarification compétitive :
| Modèle | Entrée | Sortie |
|---|---|---|
| Claude Opus 4.5 | 5 $ par million de tokens | 25 $ par million de tokens |
| Claude Sonnet 4.5 | 3 $ par million de tokens | 15 $ par million de tokens |
| Claude Haiku 4.5 | 1 $ par million de tokens | 5 $ par million de tokens |
Pour plus de détails, consultez la documentation de tarification.
À partir des modèles Claude 4.5 (Opus 4.5, Sonnet 4.5 et Haiku 4.5), AWS Bedrock et Google Vertex AI offrent deux types de points de terminaison :
Cette tarification régionale s'applique à tous les modèles Claude 4.5 : Opus 4.5, Sonnet 4.5 et Haiku 4.5.
L'API Claude (1P) est globale par défaut et n'est pas affectée par ce changement. L'API Claude est globale uniquement (équivalente à l'offre et à la tarification du point de terminaison global d'autres fournisseurs).
Pour les détails de mise en œuvre et les conseils de migration :
Les modèles Claude 4.5 sont disponibles sur :
| Modèle | API Claude | Amazon Bedrock | Google Cloud Vertex AI |
|---|---|---|---|
| Claude Opus 4.5 | claude-opus-4-5-20251101 | anthropic.claude-opus-4-5-20251101-v1:0 | claude-opus-4-5@20251101 |
| Claude Sonnet 4.5 | claude-sonnet-4-5-20250929 | anthropic.claude-sonnet-4-5-20250929-v1:0 | claude-sonnet-4-5@20250929 |
| Claude Haiku 4.5 | claude-haiku-4-5-20251001 | anthropic.claude-haiku-4-5-20251001-v1:0 | claude-haiku-4-5@20251001 |
Également disponible via les plateformes Claude.ai et Claude Code.
Les changements de rupture et les exigences de migration varient selon le modèle à partir duquel vous effectuez la mise à niveau. Pour des instructions de migration détaillées, y compris des guides étape par étape, les changements de rupture et les listes de contrôle de migration, consultez Migration vers Claude 4.5.
Le guide de migration couvre les scénarios suivants :
Mettez à niveau à partir des modèles précédents