Claude 4.5 introduit trois modèles conçus pour différents cas d'usage :
Claude Opus 4.5 représente notre modèle le plus intelligent, combinant la capacité maximale avec des performances pratiques. Il offre des améliorations décisives dans le raisonnement, le codage et les tâches de résolution de problèmes complexes tout en maintenant les résultats de haute qualité attendus de la famille Opus.
Claude Opus 4.5 est le seul modèle qui supporte le paramètre d'effort, vous permettant de contrôler le nombre de jetons que Claude utilise lors de la réponse. Cela vous donne la possibilité de faire un compromis entre la complétude de la réponse et l'efficacité des jetons avec un seul modèle.
Le paramètre d'effort affecte tous les jetons de la réponse, y compris les réponses textuelles, les appels d'outils et la réflexion étendue. Vous pouvez choisir entre :
Claude Opus 4.5 introduit des capacités d'utilisation informatique améliorées avec une nouvelle action de zoom qui permet une inspection détaillée de régions d'écran spécifiques à pleine résolution. Cela permet à Claude d'examiner les éléments d'interface utilisateur à grain fin, le petit texte et les informations visuelles détaillées qui pourraient être peu claires dans les captures d'écran standard.
La capacité de zoom est particulièrement précieuse pour :
Claude Opus 4.5 offre une intelligence de classe mondiale à un point de prix plus accessible que les modèles Opus précédents, rendant les capacités d'IA avancées disponibles pour une gamme plus large d'applications et de cas d'usage.
Claude Opus 4.5 préserve automatiquement tous les blocs de réflexion précédents tout au long des conversations, maintenant la continuité du raisonnement sur les interactions multi-tours étendues et les sessions d'utilisation d'outils. Cela garantit que Claude peut efficacement exploiter son historique de raisonnement complet lorsqu'il travaille sur des tâches complexes et longues.
Claude Sonnet 4.5 est notre meilleur modèle de codage à ce jour, avec des améliorations significatives sur l'ensemble du cycle de vie du développement :
Claude Sonnet 4.5 fonctionne considérablement mieux sur les tâches de codage lorsque la réflexion étendue est activée. La réflexion étendue est désactivée par défaut, mais nous recommandons de l'activer pour les travaux de codage complexes. Soyez conscient que la réflexion étendue impacte l'efficacité de la mise en cache des invites. Consultez le guide de migration pour les détails de configuration.
Claude Sonnet 4.5 introduit des avancées majeures dans les capacités d'agent :
Claude Sonnet 4.5 a une approche de communication affinée qui est concise, directe et naturelle. Il fournit des mises à jour de progression basées sur les faits et peut ignorer les résumés verbeux après les appels d'outils pour maintenir l'élan du flux de travail (bien que cela puisse être ajusté avec l'invite).
Pour des conseils détaillés sur le travail avec ce style de communication, consultez les meilleures pratiques Claude 4.
Claude Sonnet 4.5 excelle dans les tâches de contenu créatif :
Claude Haiku 4.5 représente un saut transformateur pour la famille de modèles Haiku, apportant des capacités de frontière à notre classe de modèles la plus rapide :
Claude Haiku 4.5 offre des performances proches de la frontière correspondant à Sonnet 4 à un coût considérablement inférieur et une vitesse plus rapide :
Claude Haiku 4.5 est le premier modèle Haiku à supporter la réflexion étendue, apportant des capacités de raisonnement avancées à la famille Haiku :
La réflexion étendue doit être activée explicitement en ajoutant un paramètre thinking à vos demandes d'API. Consultez la documentation de réflexion étendue pour les détails de mise en œuvre.
Claude Haiku 4.5 fonctionne considérablement mieux sur les tâches de codage et de raisonnement lorsque la réflexion étendue est activée. La réflexion étendue est désactivée par défaut, mais nous recommandons de l'activer pour la résolution de problèmes complexes, les travaux de codage et le raisonnement multi-étapes. Soyez conscient que la réflexion étendue impacte l'efficacité de la mise en cache des invites. Consultez le guide de migration pour les détails de configuration.
Claude Haiku 4.5 dispose de la conscience du contexte, permettant au modèle de suivre sa fenêtre de contexte restante tout au long d'une conversation :
C'est le premier modèle Haiku avec des capacités natives de conscience du contexte. Pour des conseils d'invite, consultez les meilleures pratiques Claude 4.
Claude Haiku 4.5 offre des capacités de codage robustes attendues des modèles Claude modernes :
Haiku 4.5 est conçu pour les cas d'usage qui exigent à la fois l'intelligence et l'efficacité :
L'appel d'outils programmatique permet à Claude d'écrire du code qui appelle vos outils de manière programmatique dans un conteneur d'exécution de code, plutôt que de nécessiter des allers-retours à travers le modèle pour chaque invocation d'outil. Cela réduit considérablement la latence pour les flux de travail multi-outils et diminue la consommation de jetons en permettant à Claude de filtrer ou traiter les données avant qu'elles n'atteignent la fenêtre de contexte du modèle.
tools=[
{
"type": "code_execution_20250825",
"name": "code_execution"
},
{
"name": "query_database",
"description": "Execute a SQL query against the sales database. Returns a list of rows as JSON objects.",
"input_schema": {...},
"allowed_callers": ["code_execution_20250825"] # Enable programmatic calling
}
]Avantages clés :
advanced-tool-use-2025-11-20L'outil de recherche d'outils permet à Claude de travailler avec des centaines ou des milliers d'outils en les découvrant dynamiquement et en les chargeant à la demande. Au lieu de charger toutes les définitions d'outils dans la fenêtre de contexte à l'avance, Claude recherche votre catalogue d'outils et charge uniquement les outils dont il a besoin.
Deux variantes de recherche sont disponibles :
tool_search_tool_regex_20251119) : Claude construit des modèles regex pour rechercher les noms, descriptions et arguments des outilstool_search_tool_bm25_20251119) : Claude utilise des requêtes en langage naturel pour rechercher des outilstools=[
{
"type": "tool_search_tool_regex_20251119",
"name": "tool_search_tool_regex"
},
{
"name": "get_weather",
"description": "Get the weather at a specific location",
"input_schema": {...},
"defer_loading": True # Load on-demand via search
}
]Cette approche résout deux défis critiques :
advanced-tool-use-2025-11-20Le paramètre d'effort vous permet de contrôler le nombre de jetons que Claude utilise lors de la réponse, en faisant un compromis entre la complétude de la réponse et l'efficacité des jetons :
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{"role": "user", "content": "..."}],
output_config={
"effort": "medium" # "low", "medium", or "high"
}
)Le paramètre d'effort affecte tous les jetons de la réponse, y compris les réponses textuelles, les appels d'outils et la réflexion étendue. Les niveaux d'effort inférieur produisent des réponses plus concises avec des explications minimales, tandis que l'effort supérieur fournit un raisonnement détaillé et des réponses complètes.
effort-2025-11-24Les exemples d'utilisation d'outils vous permettent de fournir des exemples concrets d'entrées d'outils valides pour aider Claude à comprendre comment utiliser vos outils plus efficacement. Ceci est particulièrement utile pour les outils complexes avec des objets imbriqués, des paramètres optionnels ou des entrées sensibles au format.
tools=[
{
"name": "get_weather",
"description": "Get the current weather in a given location",
"input_schema": {...},
"input_examples": [
{
"location": "San Francisco, CA",
"unit": "fahrenheit"
},
{
"location": "Tokyo, Japan",
"unit": "celsius"
},
{
"location": "New York, NY" # Demonstrates optional 'unit' parameter
}
]
}
]Les exemples sont inclus dans l'invite aux côtés de votre schéma d'outil, montrant à Claude des modèles concrets pour les appels d'outils bien formés. Chaque exemple doit être valide selon le input_schema de l'outil.
advanced-tool-use-2025-11-20.Le nouvel outil de mémoire permet à Claude de stocker et récupérer des informations en dehors de la fenêtre de contexte :
tools=[
{
"type": "memory_20250818",
"name": "memory"
}
]Cela permet :
context-management-2025-06-27Utilisez l'édition du contexte pour la gestion intelligente du contexte par l'effacement automatique des appels d'outils :
response = client.beta.messages.create(
betas=["context-management-2025-06-27"],
model="claude-sonnet-4-5", # or claude-haiku-4-5
max_tokens=4096,
messages=[{"role": "user", "content": "..."}],
context_management={
"edits": [
{
"type": "clear_tool_uses_20250919",
"trigger": {"type": "input_tokens", "value": 500},
"keep": {"type": "tool_uses", "value": 2},
"clear_at_least": {"type": "input_tokens", "value": 100}
}
]
},
tools=[...]
)Cette fonctionnalité supprime automatiquement les appels d'outils et les résultats plus anciens lorsque vous approchez des limites de jetons, aidant à gérer le contexte dans les sessions d'agents longues.
context-management-2025-06-27Les modèles Claude 4.5 introduisent une nouvelle raison d'arrêt model_context_window_exceeded qui indique explicitement quand la génération s'est arrêtée en raison du dépassement de la limite de la fenêtre de contexte, plutôt que de la limite max_tokens demandée. Cela facilite la gestion des limites de fenêtre de contexte dans votre logique d'application.
{
"stop_reason": "model_context_window_exceeded",
"usage": {
"input_tokens": 150000,
"output_tokens": 49950
}
}Les modèles Claude 4.5 incluent une correction de bogue qui préserve le formatage intentionnel dans les paramètres de chaîne d'appel d'outil. Auparavant, les sauts de ligne de fin dans les paramètres de chaîne étaient parfois incorrectement supprimés. Cette correction garantit que les outils nécessitant un formatage précis (comme les éditeurs de texte) reçoivent les paramètres exactement comme prévu.
Ceci est une amélioration en arrière-plan sans modifications d'API requises. Cependant, les outils avec des paramètres de chaîne peuvent maintenant recevoir des valeurs avec des sauts de ligne de fin qui étaient auparavant supprimés.
Exemple :
// Avant : Saut de ligne final accidentellement supprimé
{
"type": "tool_use",
"id": "toolu_01A09q90qw90lq917835lq9",
"name": "edit_todo",
"input": {
"file": "todo.txt",
"contents": "1. Chop onions.\n2. ???\n3. Profit"
}
}
// Après : Saut de ligne final préservé comme prévu
{
"type": "tool_use",
"id": "toolu_01A09q90qw90lq917835lq9",
"name": "edit_todo",
"input": {
"file": "todo.txt",
"contents": "1. Chop onions.\n2. ???\n3. Profit\n"
}
}Les modèles Claude 4.5 incluent des optimisations automatiques pour améliorer les performances du modèle. Ces optimisations peuvent ajouter de petites quantités de jetons aux demandes, mais vous ne serez pas facturé pour ces jetons ajoutés par le système.
Les fonctionnalités suivantes ont été introduites dans Claude 4 et sont disponibles sur tous les modèles Claude 4, y compris Claude Sonnet 4.5 et Claude Haiku 4.5.
Les modèles Claude 4 introduisent une nouvelle raison d'arrêt refusal pour le contenu que le modèle refuse de générer pour des raisons de sécurité :
{
"id": "msg_014XEDjypDjFzgKVWdFUXxZP",
"type": "message",
"role": "assistant",
"model": "claude-sonnet-4-5",
"content": [{"type": "text", "text": "I would be happy to assist you. You can "}],
"stop_reason": "refusal",
"stop_sequence": null,
"usage": {
"input_tokens": 564,
"cache_creation_input_tokens": 0,
"cache_read_input_tokens": 0,
"output_tokens": 22
}
}Lors de l'utilisation des modèles Claude 4, vous devez mettre à jour votre application pour gérer les raisons d'arrêt refusal.
Avec la réflexion étendue activée, l'API Messages pour les modèles Claude 4 retourne un résumé du processus de réflexion complet de Claude. La réflexion résumée fournit les avantages complets de l'intelligence de la réflexion étendue, tout en prévenant les abus.
Bien que l'API soit cohérente sur les modèles Claude 3.7 et 4, les réponses en streaming pour la réflexion étendue pourraient revenir dans un modèle de livraison « fragmenté », avec des délais possibles entre les événements de streaming.
La résumé est traitée par un modèle différent de celui que vous ciblez dans vos demandes. Le modèle de réflexion ne voit pas la sortie résumée.
Pour plus d'informations, consultez la documentation de réflexion étendue.
Les modèles Claude 4 supportent l'entrelacement de l'utilisation d'outils avec la réflexion étendue, permettant des conversations plus naturelles où les utilisations d'outils et les réponses peuvent être mélangées avec des messages réguliers.
La réflexion entrelacée est en bêta. Pour activer la réflexion entrelacée, ajoutez l'en-tête bêta interleaved-thinking-2025-05-14 à votre demande d'API.
Pour plus d'informations, consultez la documentation de réflexion étendue.
Les modèles Claude 4 ont des changements comportementaux notables qui peuvent affecter la façon dont vous structurez les invites :
Les modèles Claude 4 sont entraînés pour une suite précise des instructions et nécessitent une direction plus explicite :
Pour des conseils complets sur le travail avec ces modèles, consultez les meilleures pratiques d'ingénierie d'invite Claude 4.
L'outil d'éditeur de texte a été mis à jour pour les modèles Claude 4 avec les modifications suivantes :
text_editor_20250728str_replace_based_edit_toolundo_edit n'est plus supportéeL'outil d'éditeur de texte str_replace_editor reste le même pour Claude Sonnet 3.7.
Si vous migrez depuis Claude Sonnet 3.7 et utilisez l'outil d'éditeur de texte :
# Claude Sonnet 3.7
tools=[
{
"type": "text_editor_20250124",
"name": "str_replace_editor"
}
]
# Claude 4 models
tools=[
{
"type": "text_editor_20250728",
"name": "str_replace_based_edit_tool"
}
]Pour plus d'informations, consultez la documentation de l'outil d'éditeur de texte.
Si vous utilisez l'outil d'exécution de code, assurez-vous d'utiliser la dernière version code_execution_20250825, qui ajoute les commandes Bash et les capacités de manipulation de fichiers.
La version héritée code_execution_20250522 (Python uniquement) est toujours disponible mais non recommandée pour les nouvelles implémentations.
Pour les instructions de migration, consultez la documentation de l'outil d'exécution de code.
Les modèles Claude 4.5 maintiennent une tarification compétitive :
| Modèle | Entrée | Sortie |
|---|---|---|
| Claude Opus 4.5 | 5 $ par million de jetons | 25 $ par million de jetons |
| Claude Sonnet 4.5 | 3 $ par million de jetons | 15 $ par million de jetons |
| Claude Haiku 4.5 | 1 $ par million de jetons | 5 $ par million de jetons |
Pour plus de détails, consultez la documentation de tarification.
À partir des modèles Claude 4.5 (Opus 4.5, Sonnet 4.5 et Haiku 4.5), AWS Bedrock et Google Vertex AI offrent deux types de points de terminaison :
Cette tarification régionale s'applique à tous les modèles Claude 4.5 : Opus 4.5, Sonnet 4.5 et Haiku 4.5.
L'API Claude (1P) est mondiale par défaut et n'est pas affectée par ce changement. L'API Claude est mondiale uniquement (équivalente à l'offre et à la tarification du point de terminaison mondial d'autres fournisseurs).
Pour les détails de mise en œuvre et les conseils de migration :
Les modèles Claude 4.5 sont disponibles sur :
| Modèle | API Claude | Amazon Bedrock | Google Cloud Vertex AI |
|---|---|---|---|
| Claude Opus 4.5 | claude-opus-4-5-20251101 | anthropic.claude-opus-4-5-20251101-v1:0 | claude-opus-4-5@20251101 |
| Claude Sonnet 4.5 | claude-sonnet-4-5-20250929 | anthropic.claude-sonnet-4-5-20250929-v1:0 | claude-sonnet-4-5@20250929 |
| Claude Haiku 4.5 | claude-haiku-4-5-20251001 | anthropic.claude-haiku-4-5-20251001-v1:0 | claude-haiku-4-5@20251001 |
Également disponible via les plates-formes Claude.ai et Claude Code.
Les changements de rupture et les exigences de migration varient selon le modèle à partir duquel vous effectuez la mise à niveau. Pour des instructions de migration détaillées, y compris des guides étape par étape, des changements de rupture et des listes de contrôle de migration, consultez Migration vers Claude 4.5.
Le guide de migration couvre les scénarios suivants :
Mettez à niveau à partir des modèles précédents