Pour les notes de version des applications Claude, consultez les Notes de version des applications Claude dans le Centre d'aide Claude.
Pour les mises à jour de Claude Code, consultez le CHANGELOG.md complet dans le dépôt claude-code.
- Nous avons lancé Claude Fable 5 (
claude-fable-5), notre modèle le plus performant largement disponible, ainsi que Claude Mythos 5 (claude-mythos-5) pour les participants à Project Glasswing. Les deux modèles prennent en charge une fenêtre de contexte de 1M de tokens par défaut, 128k tokens de sortie maximum, et la réflexion adaptative toujours active. Consultez Présentation de Claude Fable 5 et Claude Mythos 5 pour les capacités, les changements d'API et la disponibilité.
- Claude Fable 5 et Claude Mythos 5 utilisent le tokenizer introduit avec Claude Opus 4.7. Par rapport aux modèles antérieurs à Claude Opus 4.7, le même texte produit environ 30 % de tokens en plus. Utilisez l'API de comptage de tokens avec
model: "claude-fable-5" pour mesurer vos prompts avec le nouveau tokenizer.
- Claude Fable 5 exécute des classificateurs de sécurité sur les requêtes et pendant la génération des réponses. Lorsqu'un classificateur refuse une requête, l'API Messages renvoie
stop_reason: "refusal". Vous n'êtes pas facturé pour une requête refusée avant qu'une sortie ne soit générée. Un paramètre optionnel fallbacks (en bêta sur l'API Claude et Claude Platform on AWS ; non pris en charge sur l'API Message Batches) réexécute les requêtes refusées sur un autre modèle, facturé aux tarifs du modèle de secours. Consultez Gestion des raisons d'arrêt.
- Le champ
stop_details.category sur les réponses de refus inclut désormais "reasoning_extraction" sur Claude Fable 5, renvoyé lorsqu'une requête est bloquée en vertu des restrictions des Conditions d'utilisation d'Anthropic concernant l'ingénierie inverse ou la duplication des sorties du modèle. Les catégories existantes "cyber" et "bio" restent inchangées. Aucun en-tête bêta n'est requis.
- Sur Claude Fable 5 et Claude Mythos 5, la réflexion adaptative est le seul mode de réflexion :
thinking: {"type": "disabled"} n'est pas pris en charge, et les budgets manuels de réflexion étendue ainsi que le préremplissage de l'assistant ne sont pas pris en charge (les deux renvoient une erreur 400). Consultez Migration de Claude Mythos Preview vers Claude Mythos 5.
- Sur Claude Fable 5 et Claude Mythos 5,
thinking.display est défini par défaut sur "omitted", comme pour Claude Opus 4.8, Claude Opus 4.7 et Claude Mythos Preview ; définissez display: "summarized" pour recevoir des résumés de réflexion lisibles. La chaîne de pensée brute n'est jamais renvoyée ; retransmettez les blocs de réflexion sans modification dans les conversations multi-tours sur le même modèle. Consultez Sortie de réflexion sur Claude Fable 5 et Claude Mythos 5.
- Claude Fable 5 nécessite une conservation des données de 30 jours sur l'API Claude et n'est pas disponible avec la conservation de données nulle. Consultez Exigences de conservation des données spécifiques aux modèles.
- Claude Managed Agents prend désormais en charge les déploiements planifiés, vous permettant d'exécuter des sessions selon un calendrier cron sans gérer votre propre planificateur.
- Les coffres-forts Claude Managed Agents prennent désormais en charge les identifiants de variables d'environnement, vous permettant d'injecter de manière sécurisée des secrets dans le bac à sable de l'agent pour les CLI, SDK et autres services qui s'authentifient via des variables d'environnement.
- Les événements webhook
session.thread_* incluent désormais un champ session_thread_id identifiant le fil multi-agent qui a déclenché l'événement.
- Nous avons annoncé la dépréciation du modèle Claude Opus 4.1 (
claude-opus-4-1-20250805), avec un retrait de l'API Claude prévu pour le 5 août 2026. Nous recommandons de migrer vers Claude Opus 4.8. Pour en savoir plus, consultez dépréciations de modèles.
- L'outil conseiller prend désormais en charge un paramètre
max_tokens pour plafonner la sortie du modèle conseiller par appel, réduisant la latence et le coût en tokens de sortie pour les charges de travail qui n'ont pas besoin de réponses complètes du conseiller. Définissez tools[].max_tokens sur la définition de l'outil conseiller ; consultez Plafonnement de la sortie du conseiller.
- Sur l'API Claude, vous n'êtes plus facturé pour une requête lorsqu'elle renvoie
stop_reason: "refusal" sans que Claude ait généré de sortie. Consultez Refus en streaming pour détecter et gérer les refus.
- Nous avons lancé Claude Opus 4.8 (claude-opus-4-8), notre modèle le plus performant en disponibilité générale. Claude Opus 4.8 prend en charge une fenêtre de contexte de 1M de tokens par défaut sur l'API Claude, Amazon Bedrock et Vertex AI (200k sur Microsoft Foundry), 128k tokens de sortie maximum, et le même ensemble d'outils et de fonctionnalités de plateforme que Claude Opus 4.7. Consultez Nouveautés de Claude Opus 4.8 pour les améliorations de capacités, les nouvelles fonctionnalités et les conseils de migration.
- Nous avons lancé les messages système en milieu de conversation. Sur Claude Opus 4.8, vous pouvez envoyer des messages
role: "system" après un tour utilisateur (sous réserve des règles de placement) dans le tableau messages, préservant les correspondances de cache de prompt lorsque les instructions changent pendant une session de longue durée. Aucun en-tête bêta n'est requis.
- Le champ
stop_details sur les réponses de refus est désormais documenté publiquement ; il renvoie une category (cyber, bio ou null) et une explanation lisible par l'humain, afin que votre application puisse acheminer différentes classes de refus vers l'étape suivante appropriée. Aucun en-tête bêta n'est requis.
- Sur Claude Opus 4.8, le paramètre effort est défini par défaut sur
high sur toutes les surfaces, y compris Claude Code et l'API Messages.
- Sur Claude Opus 4.8, la longueur minimale de prompt pouvant être mise en cache pour la mise en cache des prompts est de 1 024 tokens, inférieure à celle de Claude Opus 4.7.
- Avec la réflexion adaptative activée, Claude Opus 4.8 déclenche le raisonnement uniquement lorsqu'un tour en a besoin, réduisant les tokens de réflexion gaspillés par rapport à Claude Opus 4.7 au même niveau d'effort.
- Claude Opus 4.8 prend en charge l'entrée d'images haute résolution (jusqu'à 2576 pixels sur le côté long), comme Claude Opus 4.7.
- Les budgets de tâches prennent désormais en charge Claude Opus 4.8.
- L'outil conseiller prend désormais en charge Claude Opus 4.8.
- L'utilisation de l'ordinateur prend désormais en charge Claude Opus 4.8.
- Le mode rapide pour Claude Opus 4.8 est disponible en aperçu de recherche sur l'API Claude uniquement.
- Définir les paramètres d'échantillonnage
temperature, top_p ou top_k sur une valeur autre que celle par défaut renvoie une erreur 400 sur Claude Opus 4.8, comme sur Claude Opus 4.7. Consultez le guide de migration pour plus de détails.
- Dans Claude Code, nous avons étendu le mode Auto à davantage d'utilisateurs pour les tâches de longue durée. Consultez la documentation Claude Code.
- Dans Claude Code, les utilisateurs du forfait Max utilisent désormais par défaut le mode rapide sur Claude Opus 4.8. Consultez la documentation Claude Code.
- Dans Claude Code, les Workflows sont disponibles en aperçu de recherche, vous permettant de définir et d'exécuter des plans agentiques multi-étapes. Consultez la documentation Claude Code.
- Nous avons déprécié le mode rapide pour Claude Opus 4.6, avec une suppression environ 30 jours après le lancement. Migrez vers le mode rapide pour Claude Opus 4.8 ou Claude Opus 4.7. Pour en savoir plus, consultez Mode rapide.
- Pour les mises à jour de claude.ai, Cowork, Claude pour Microsoft 365 et autres applications Claude dans cette version, consultez les notes de version des applications Claude.
- La réponse de l'API Messages inclut désormais
usage.output_tokens_details.thinking_tokens, indiquant combien de tokens de sortie facturés correspondaient à la réflexion étendue. En streaming, la répartition n'apparaît que sur l'événement final message_delta. Aucun en-tête bêta n'est requis.
- Les tunnels MCP sont désormais disponibles en aperçu de recherche, vous permettant de vous connecter à des serveurs MCP dans votre réseau privé.
- Les bacs à sable auto-hébergés sont désormais disponibles pour Claude Managed Agents, comme alternative à l'exécution des outils dans l'infrastructure d'Anthropic. Consultez Bacs à sable auto-hébergés.
- Avec Claude Managed Agents, vous pouvez désormais mettre à jour les configurations de serveur MCP et d'outils de l'agent associées à une session active.
- Avec Claude Managed Agents, les sorties volumineuses des outils
agent_toolset et MCP dépassant 100K tokens sont désormais automatiquement déversées dans un fichier du bac à sable. Le modèle reçoit un aperçu tronqué avec le chemin du fichier et peut lire le contenu complet à partir de là.
- L'outil de recherche web renvoie désormais des données de dépôts SEC plus riches, facilitant l'ancrage des agents de recherche financière, de l'analyse des résultats et des flux de travail de due diligence dans des sources primaires avec citations.
- Nous avons lancé les diagnostics de cache en bêta publique. Passez
diagnostics.previous_message_id sur une requête Messages et l'API renvoie un cache_miss_reason expliquant où le préfixe du cache de prompt a divergé du tour précédent. Incluez l'en-tête bêta cache-diagnosis-2026-04-07 dans vos requêtes.
- Le mode rapide (aperçu de recherche) prend désormais en charge Claude Opus 4.7. Définissez
speed: "fast" avec model: "claude-opus-4-7" et l'en-tête bêta fast-mode-2026-02-01 pour une génération de tokens de sortie nettement plus rapide à un tarif premium. La tarification, les limites de débit et l'accès sont identiques à ceux du mode rapide Opus 4.6 ; les clients intéressés doivent rejoindre la liste d'attente.
- Nous avons lancé Claude Platform on AWS, apportant l'API Claude à une infrastructure gérée par Anthropic accessible via AWS, avec facturation AWS et authentification IAM. Accédez à l'API Messages complète, à l'API Files, à l'API Message Batches, à Claude Managed Agents, aux Agent Skills, à l'exécution de code et à l'utilisation d'outils via des points de terminaison AWS natifs. Pour en savoir plus, consultez Claude Platform on AWS.
- Les sessions multi-agents et les Outcomes sont désormais en bêta publique sous l'en-tête bêta standard
managed-agents-2026-04-01.
- L'actualisation en arrière-plan des identifiants de coffre-fort Claude Managed Agents est désormais prise en charge pour les identifiants
mcp_oauth. Consultez S'authentifier avec des coffres-forts.
- Les webhooks pour Claude Managed Agents sont désormais pris en charge. Les types d'événements webhook incluent les événements de cycle de vie de session et de coffre-fort. Consultez S'abonner aux webhooks.
- Des options supplémentaires de filtrage et de tri sont désormais prises en charge pour Claude Managed Agents. Les sessions peuvent être filtrées par statut, et les événements peuvent être filtrés par type. Les événements peuvent désormais être filtrés par date de création.
- Nous avons retiré la bêta de fenêtre de contexte de 1M de tokens (
context-1m-2025-08-07) pour Claude Sonnet 4.5 et Claude Sonnet 4. L'en-tête bêta n'a désormais aucun effet sur ces modèles, et les requêtes dépassant la fenêtre de contexte standard de 200k tokens renvoient une erreur. Pour utiliser la fenêtre de contexte de 1M, migrez vers Claude Sonnet 4.6 ou Claude Opus 4.6, où elle est en disponibilité générale à la tarification standard sans en-tête bêta requis.
- Nous avons publié l'API Rate Limits, permettant aux administrateurs d'interroger par programmation les limites de débit configurées pour leur organisation et leurs espaces de travail.
- La mémoire pour Claude Managed Agents est désormais en bêta publique sous l'en-tête standard
managed-agents-2026-04-01. Consultez Utilisation de la mémoire de l'agent pour le guide d'intégration complet.
- Nous avons retiré le modèle Claude Haiku 3 (
claude-3-haiku-20240307). Toutes les requêtes vers ce modèle renverront désormais une erreur. Nous recommandons de passer à Claude Haiku 4.5.
- Nous avons lancé Claude Opus 4.7, notre modèle le plus performant en disponibilité générale pour le raisonnement complexe et le codage agentique, au même tarif de 5 $ / 25 $ par MTok que Opus 4.6. Consultez Nouveautés de Claude Opus 4.7 pour les améliorations de capacités, les nouvelles fonctionnalités et le tokenizer mis à jour. Opus 4.7 inclut des changements d'API incompatibles par rapport à Opus 4.6 ; consultez Migration vers Claude Opus 4.7 avant de mettre à niveau.
- Claude in Amazon Bedrock est désormais ouvert à tous les clients Amazon Bedrock. Claude Opus 4.7 et Claude Haiku 4.5 sont disponibles en libre-service depuis la console Bedrock via le point de terminaison de l'API Messages à
/anthropic/v1/messages, dans 27 régions AWS avec des points de terminaison globaux et régionaux.
- Nous avons annoncé la dépréciation du modèle Claude Sonnet 4 (
claude-sonnet-4-20250514) et du modèle Claude Opus 4 (claude-opus-4-20250514), avec un retrait de l'API Claude prévu pour le 15 juin 2026. Nous recommandons de migrer vers Claude Sonnet 4.6 et Claude Opus 4.8 respectivement. Pour en savoir plus, consultez dépréciations de modèles.
- Nous avons lancé l'outil conseiller en bêta publique. Associez un modèle exécuteur plus rapide à un modèle conseiller de plus haute intelligence qui fournit des conseils stratégiques en cours de génération, afin que les charges de travail agentiques à long horizon obtiennent une qualité proche de celle du conseiller seul tandis que l'essentiel de la génération de tokens se fait aux tarifs du modèle exécuteur. Incluez l'en-tête bêta
advisor-tool-2026-03-01 dans vos requêtes.
- Nous avons lancé Claude Managed Agents en bêta publique, un harnais d'agent entièrement géré pour exécuter Claude en tant qu'agent autonome avec un bac à sable sécurisé, des outils intégrés et le streaming d'événements envoyés par le serveur. Créez des agents, configurez des conteneurs et exécutez des sessions via l'API. Tous les points de terminaison nécessitent l'en-tête bêta
managed-agents-2026-04-01. Pour en savoir plus, consultez Aperçu de Claude Managed Agents.
- Nous avons lancé le CLI
ant, un client en ligne de commande pour l'API Claude qui permet une interaction plus rapide avec l'API Claude, une intégration native avec Claude Code et le versionnage des ressources API dans des fichiers YAML. Pour en savoir plus, consultez le démarrage rapide CLI.
- Nous avons annoncé que Claude Mythos Preview est disponible en aperçu de recherche restreint pour les travaux de cybersécurité défensive dans le cadre de Project Glasswing. L'accès est sur invitation uniquement.
- L'API Messages est désormais disponible sur Amazon Bedrock en aperçu de recherche. Le nouveau point de terminaison Claude in Amazon Bedrock à
/anthropic/v1/messages utilise la même forme de requête que l'API Claude de première partie et s'exécute sur une infrastructure gérée par AWS sans aucun accès opérateur. Disponible dans us-east-1 ; contactez votre responsable de compte Anthropic pour demander l'accès. Pour en savoir plus, consultez Claude in Amazon Bedrock.
- Nous avons relevé le plafond
max_tokens à 300k sur l'API Message Batches pour Claude Opus 4.6 et Sonnet 4.6. Incluez l'en-tête bêta output-300k-2026-03-24 pour générer des sorties mono-tour plus longues pour le contenu long, les données structurées et les tâches de génération de code volumineuses.
- Nous retirons la bêta de fenêtre de contexte de 1M de tokens pour Claude Sonnet 4.5 et Claude Sonnet 4 le 30 avril 2026. Après cette date, l'en-tête bêta
context-1m-2025-08-07 n'aura aucun effet sur ces modèles, et les requêtes dépassant la fenêtre de contexte standard de 200k tokens renverront une erreur. Pour continuer à utiliser les fenêtres de contexte de 1M, migrez vers Claude Sonnet 4.6 ou Claude Opus 4.6, qui prennent en charge la fenêtre de contexte complète de 1M de tokens à la tarification standard sans en-tête bêta requis.
- Nous avons ajouté des champs de capacités de modèle à l'API Models.
GET /v1/models et GET /v1/models/{model_id} renvoient désormais max_input_tokens, max_tokens et un objet capabilities. Interrogez l'API pour découvrir ce que chaque modèle prend en charge.
- Nous avons lancé le champ
display pour la réflexion étendue, vous permettant d'omettre le contenu de réflexion des réponses pour un streaming plus rapide. Définissez thinking.display: "omitted" pour recevoir des blocs de réflexion avec un champ thinking vide et la signature préservée pour la continuité multi-tours. La facturation reste inchangée. Pour en savoir plus, consultez Contrôle de l'affichage de la réflexion.
- La fenêtre de contexte de 1M de tokens est désormais en disponibilité générale pour Claude Opus 4.6 et Sonnet 4.6 à la tarification standard. Les requêtes de plus de 200k tokens fonctionnent automatiquement pour ces modèles sans en-tête bêta requis. La fenêtre de contexte de 1M de tokens reste en bêta pour Claude Sonnet 4.5 et Sonnet 4.
- Nous avons supprimé les limites de débit dédiées au 1M pour tous les modèles pris en charge. Vos limites de compte standard s'appliquent désormais à toutes les longueurs de contexte.
- Nous avons relevé la limite de médias de 100 à 600 images ou pages PDF par requête lors de l'utilisation de la fenêtre de contexte de 1M de tokens.
- Nous avons lancé la mise en cache automatique pour l'API Messages. Ajoutez un seul champ
cache_control au corps de votre requête et le système met automatiquement en cache le dernier bloc pouvant être mis en cache, déplaçant le point de cache vers l'avant à mesure que les conversations s'allongent. Aucune gestion manuelle des points d'arrêt n'est requise. Fonctionne parallèlement au contrôle de cache au niveau des blocs existant pour une optimisation fine. Disponible sur l'API Claude et Microsoft Foundry (aperçu). Pour en savoir plus, consultez Mise en cache des prompts.
- Nous avons retiré le modèle Claude Sonnet 3.7 (
claude-3-7-sonnet-20250219) et le modèle Claude Haiku 3.5 (claude-3-5-haiku-20241022). Toutes les requêtes vers ces modèles renverront désormais une erreur. Nous recommandons de passer à Claude Sonnet 4.6 et Claude Haiku 4.5 respectivement. Les chercheurs peuvent demander un accès continu via le Programme d'accès pour chercheurs externes.
- Nous avons annoncé la dépréciation du modèle Claude Haiku 3 (
claude-3-haiku-20240307), avec un retrait prévu pour le 20 avril 2026. Nous recommandons de migrer vers Claude Haiku 4.5. Pour en savoir plus, consultez Dépréciations de modèles.
- Nous avons lancé le mode rapide en aperçu de recherche pour Opus 4.6, offrant une génération de tokens de sortie nettement plus rapide via le paramètre
speed. Le mode rapide est jusqu'à 2,5 fois plus rapide à un tarif premium. Les clients intéressés doivent rejoindre la liste d'attente.
- Nous avons lancé Claude Opus 4.6, notre modèle le plus intelligent pour les tâches agentiques complexes et le travail à long horizon. Opus 4.6 recommande la réflexion adaptative (
thinking: {type: "adaptive"}) ; la réflexion manuelle (type: "enabled" avec budget_tokens) est dépréciée. Opus 4.6 ne prend pas en charge le préremplissage des messages de l'assistant. Pour en savoir plus, consultez Nouveautés de Claude 4.6.
- Le paramètre effort est désormais en disponibilité générale (aucun en-tête bêta requis) et prend en charge Claude Opus 4.6. Effort remplace
budget_tokens pour contrôler la profondeur de réflexion sur les nouveaux modèles.
- Nous avons lancé l'API de compaction en bêta, fournissant une synthèse de contexte côté serveur pour des conversations effectivement infinies. Disponible sur Opus 4.6.
- Nous avons introduit les contrôles de résidence des données, vous permettant de spécifier où l'inférence du modèle s'exécute avec le paramètre
inference_geo. L'inférence aux États-Unis uniquement est disponible à 1,1x le tarif pour les modèles publiés après le 1er février 2026.
- La fenêtre de contexte de 1M de tokens est désormais disponible en bêta pour Claude Opus 4.6, en plus de Sonnet 4.5 et Sonnet 4. La tarification de contexte long s'applique aux requêtes dépassant 200k tokens d'entrée.
- Le streaming d'outils à granularité fine est désormais en disponibilité générale sur tous les modèles et plateformes (aucun en-tête bêta requis).
- Les sorties structurées sont désormais en disponibilité générale sur l'API Claude pour Claude Sonnet 4.5, Claude Opus 4.5 et Claude Haiku 4.5. La disponibilité générale inclut une prise en charge étendue des schémas, une latence de compilation de grammaire améliorée et un chemin d'intégration simplifié sans en-tête bêta requis. Le paramètre
output_format a été déplacé vers output_config.format. Les utilisateurs bêta existants peuvent continuer à utiliser l'en-tête bêta pendant la période de transition. Les sorties structurées restent en bêta publique sur Amazon Bedrock et Microsoft Foundry.
console.anthropic.com redirige désormais vers platform.claude.com. La Claude Console a déménagé vers son nouvel emplacement dans le cadre de notre consolidation de la marque Claude. Les favoris et liens existants continueront de fonctionner via une redirection automatique. Pour plus de détails, consultez l'annonce du 16 septembre 2025.
- Nous avons retiré le modèle Claude Opus 3 (
claude-3-opus-20240229). Toutes les requêtes vers ce modèle renverront désormais une erreur. Nous recommandons de passer à Claude Opus 4.5, qui offre une intelligence nettement améliorée à un tiers du coût. Les chercheurs peuvent demander un accès continu à Claude Opus 3 sur l'API via le Programme d'accès pour chercheurs externes.
- Nous avons lancé Claude Opus 4.5, notre modèle le plus intelligent combinant capacité maximale et performance pratique. Idéal pour les tâches spécialisées complexes, l'ingénierie logicielle professionnelle et les agents avancés. Offre des améliorations majeures en vision, codage et utilisation de l'ordinateur à un prix plus accessible que les modèles Opus précédents. Pour en savoir plus, consultez Aperçu des modèles.
- Nous avons lancé l'appel d'outils programmatique en bêta publique, permettant à Claude d'appeler des outils depuis l'exécution de code pour réduire la latence et l'utilisation de tokens dans les flux de travail multi-outils.
- Nous avons lancé l'outil de recherche d'outils en bêta publique, permettant à Claude de découvrir et charger dynamiquement des outils à la demande à partir de grands catalogues d'outils.
- Nous avons lancé le paramètre effort en bêta publique pour Claude Opus 4.5, vous permettant de contrôler l'utilisation de tokens en arbitrant entre l'exhaustivité et l'efficacité des réponses.
- Nous avons ajouté la compaction côté client à nos SDK Python et TypeScript, gérant automatiquement le contexte de conversation par synthèse lors de l'utilisation de
tool_runner.
- Les blocs de contenu de résultats de recherche sont désormais en disponibilité générale sur Amazon Bedrock. Pour en savoir plus, consultez Résultats de recherche.
- Nous avons lancé une nouvelle plateforme de documentation sur platform.claude.com/docs. Notre documentation se trouve désormais aux côtés de la Claude Console, offrant une expérience développeur unifiée. L'ancien site de documentation sur docs.claude.com redirigera vers le nouvel emplacement.
- Nous avons lancé Claude in Microsoft Foundry, apportant les modèles Claude aux clients Azure avec facturation Azure et authentification OAuth. Accédez à l'API Messages complète incluant la réflexion étendue, la mise en cache des prompts (5 minutes et 1 heure), la prise en charge PDF, l'API Files, les Agent Skills et l'utilisation d'outils. Pour en savoir plus, consultez Claude in Microsoft Foundry.
- Nous avons lancé les sorties structurées en bêta publique, offrant une conformité garantie au schéma pour les réponses de Claude. Utilisez les sorties JSON pour des réponses de données structurées ou l'utilisation d'outils stricte pour des entrées d'outils validées. Disponible pour Claude Sonnet 4.5 et Claude Opus 4.1. Pour l'activer, utilisez l'en-tête bêta
structured-outputs-2025-11-13.
- Nous avons annoncé la dépréciation du modèle Claude Sonnet 3.7. Pour en savoir plus, consultez Dépréciations de modèles.
- Nous avons retiré les modèles Claude Sonnet 3.5. Toutes les requêtes vers ces modèles renverront désormais une erreur.
- Nous avons étendu l'édition de contexte avec l'effacement des blocs de réflexion (
clear_thinking_20251015), permettant la gestion automatique des blocs de réflexion. Pour en savoir plus, consultez Édition de contexte.
- Nous avons lancé les Agent Skills (bêta
skills-2025-10-02), une nouvelle façon d'étendre les capacités de Claude. Les Skills sont des dossiers organisés d'instructions, de scripts et de ressources que Claude charge dynamiquement pour effectuer des tâches spécialisées. La version initiale inclut :
- Skills gérés par Anthropic : Skills préconstruits pour travailler avec des fichiers PowerPoint (.pptx), Excel (.xlsx), Word (.docx) et PDF
- Skills personnalisés : Téléchargez vos propres Skills via l'API Skills (points de terminaison
/v1/skills) pour packager l'expertise de domaine et les flux de travail organisationnels
- Les Skills nécessitent que l'outil d'exécution de code soit activé
- Pour en savoir plus, consultez Agent Skills et la référence API
- Nous avons lancé Claude Haiku 4.5, notre modèle Haiku le plus rapide et le plus intelligent avec des performances proches de la frontière. Idéal pour les applications en temps réel, le traitement à haut volume et les déploiements sensibles aux coûts nécessitant un raisonnement solide. Pour en savoir plus, consultez Aperçu des modèles.
- Nous avons lancé Claude Sonnet 4.5, notre meilleur modèle pour les agents complexes et le codage, avec la plus haute intelligence sur la plupart des tâches. Pour en savoir plus, consultez l'aperçu des modèles.
- Nous avons introduit la tarification de point de terminaison global pour Amazon Bedrock et Vertex AI. La tarification de l'API Claude (1P) n'est pas affectée.
- Nous avons introduit une nouvelle raison d'arrêt
model_context_window_exceeded qui vous permet de demander le maximum de tokens possible sans calculer la taille d'entrée. Pour en savoir plus, consultez Gestion des raisons d'arrêt.
- Nous avons lancé l'outil de mémoire en bêta, permettant à Claude de stocker et consulter des informations entre les conversations. Pour en savoir plus, consultez Outil de mémoire.
- Nous avons lancé l'édition de contexte en bêta, fournissant des stratégies pour gérer automatiquement le contexte de conversation. La version initiale prend en charge l'effacement des anciens résultats et appels d'outils à l'approche des limites de tokens. Pour en savoir plus, consultez Édition de contexte.
- Nous avons lancé les assistants d'outils en bêta pour les SDK Python et TypeScript, simplifiant la création et l'exécution d'outils avec une validation d'entrée typée et un exécuteur d'outils pour la gestion automatisée des outils dans les conversations. Pour plus de détails, consultez la documentation pour le SDK Python et le SDK TypeScript.
- Nous avons unifié nos offres pour développeurs sous la marque Claude. Vous devriez constater des noms et des URL mis à jour sur l'ensemble de notre plateforme et de notre documentation, mais nos interfaces pour développeurs resteront identiques. Voici quelques changements notables :
- Nous avons lancé l'outil de récupération web en version bêta, permettant à Claude de récupérer le contenu complet de pages web et de documents PDF spécifiés. Pour en savoir plus, consultez Outil de récupération web.
- Nous avons lancé l'API Claude Code Analytics, permettant aux organisations d'accéder par programmation aux métriques d'utilisation quotidiennes agrégées de Claude Code, notamment les métriques de productivité, les statistiques d'utilisation d'outils et les données de coûts.
- Nous avons lancé une version bêta du SDK C#.
- Nous avons lancé les graphiques de limites de débit sur la page Usage de la Console, vous permettant de surveiller votre utilisation des limites de débit de l'API et vos taux de mise en cache au fil du temps.
- Nous avons lancé la prise en charge des documents citables dans les résultats d'outils côté client. Pour en savoir plus, consultez Gérer les appels d'outils.
- Nous avons lancé la v2 de l'outil d'exécution de code en version bêta publique, remplaçant l'outil d'origine limité à Python par des capacités d'exécution de commandes Bash et de manipulation directe de fichiers, y compris l'écriture de code dans d'autres langages.
- Nous avons lancé une version bêta du SDK PHP.
- Les identifiants de requête sont désormais inclus directement dans les corps de réponse d'erreur, en plus de l'en-tête
request-id existant. Pour en savoir plus, consultez Erreurs.
- Nous avons publié l'API Usage & Cost, permettant aux administrateurs de surveiller par programmation les données d'utilisation et de coûts de leur organisation.
- Nous avons ajouté un nouveau point de terminaison à l'Admin API pour récupérer les informations de l'organisation. Pour plus de détails, consultez la référence de l'Admin API Organization Info.
- Nous avons annoncé la dépréciation des modèles Claude Sonnet 3.5 (
claude-3-5-sonnet-20240620 et claude-3-5-sonnet-20241022). Ces modèles seront retirés le 28 octobre 2025. Nous recommandons de migrer vers Claude Sonnet 4.5 (claude-sonnet-4-5-20250929) pour bénéficier de performances et de capacités améliorées. Pour en savoir plus, consultez Dépréciations de modèles.
- La durée de cache de 1 heure pour la mise en cache des prompts est désormais en disponibilité générale. Vous pouvez maintenant utiliser le TTL de cache étendu sans en-tête bêta. Pour en savoir plus, consultez Mise en cache des prompts.
- Certains clients peuvent rencontrer des erreurs 429 (
rate_limit_error) à la suite d'une forte augmentation de l'utilisation de l'API en raison des limites d'accélération sur l'API. Auparavant, des erreurs 529 (overloaded_error) se produisaient dans des scénarios similaires.
- Les blocs de contenu de résultats de recherche sont désormais en disponibilité générale sur l'API Claude et Vertex AI. Cette fonctionnalité permet des citations naturelles pour les applications RAG avec une attribution de source appropriée. L'en-tête bêta
search-results-2025-06-09 n'est plus requis. Pour en savoir plus, consultez Résultats de recherche.
- Nous avons lancé Claude Opus 4.1, une mise à jour incrémentale de Claude Opus 4 avec des capacités améliorées et des gains de performance.* Pour en savoir plus, consultez Aperçu des modèles.
* - Opus 4.1 ne permet pas de spécifier à la fois les paramètres temperature et top_p. Veuillez n'en utiliser qu'un seul.
- Nous avons publié
text_editor_20250728, un outil d'édition de texte mis à jour qui corrige certains problèmes des versions précédentes et ajoute un paramètre optionnel max_characters qui vous permet de contrôler la longueur de troncature lors de l'affichage de fichiers volumineux.
- Nous avons augmenté les limites de débit pour Claude Opus 4 sur l'API Claude afin de vous offrir plus de capacité pour développer et évoluer avec Claude. Pour les clients disposant de limites de débit de niveau d'utilisation 1 à 4, ces changements s'appliquent immédiatement à votre compte — aucune action requise.
- Nous avons retiré les modèles Claude 2.0, Claude 2.1 et Claude Sonnet 3. Toutes les requêtes vers ces modèles renverront désormais une erreur. Pour en savoir plus, consultez Dépréciations de modèles.
- Nous avons augmenté les limites de débit pour Claude Sonnet 4 sur l'API Claude afin de vous offrir plus de capacité pour développer et évoluer avec Claude. Pour les clients disposant de limites de débit de niveau d'utilisation 1 à 4, ces changements s'appliquent immédiatement à votre compte — aucune action requise.
- Nous avons lancé les blocs de contenu de résultats de recherche en version bêta, permettant des citations naturelles pour les applications RAG. Les outils peuvent désormais renvoyer des résultats de recherche avec une attribution de source appropriée, et Claude citera automatiquement ces sources dans ses réponses — avec une qualité de citation équivalente à celle de la recherche web. Cela élimine le besoin de contournements basés sur des documents dans les applications de base de connaissances personnalisées. Pour en savoir plus, consultez Résultats de recherche. Pour activer cette fonctionnalité, utilisez l'en-tête bêta
search-results-2025-06-09.
- Les utilisateurs de la Console disposant du rôle Développeur peuvent désormais accéder à la page Cost. Auparavant, le rôle Développeur permettait d'accéder à la page Usage, mais pas à la page Cost.
- Nous avons lancé le streaming d'outils à granularité fine en version bêta publique, une fonctionnalité qui permet à Claude de diffuser en streaming les paramètres d'utilisation d'outils sans mise en tampon ni validation JSON. Pour activer le streaming d'outils à granularité fine, utilisez l'en-tête bêta
fine-grained-tool-streaming-2025-05-14.
- Nous avons lancé Claude Opus 4 et Claude Sonnet 4, nos derniers modèles dotés de capacités de réflexion étendue. Pour en savoir plus, consultez Aperçu des modèles.
- Le comportement par défaut de la réflexion étendue dans les modèles Claude 4 renvoie un résumé du processus de réflexion complet de Claude, la réflexion complète étant chiffrée et renvoyée dans le champ
signature de la sortie du bloc thinking.
- Nous avons lancé la réflexion entrelacée en version bêta publique, une fonctionnalité qui permet à Claude de réfléchir entre les appels d'outils. Pour activer la réflexion entrelacée, utilisez l'en-tête bêta
interleaved-thinking-2025-05-14.
- Nous avons lancé l'API Files en version bêta publique, vous permettant de téléverser des fichiers et de les référencer dans l'API Messages et l'outil d'exécution de code.
- Nous avons lancé l'outil d'exécution de code en version bêta publique, un outil qui permet à Claude d'exécuter du code Python dans un environnement sécurisé et isolé.
- Nous avons lancé le connecteur MCP en version bêta publique, une fonctionnalité qui vous permet de vous connecter à des serveurs MCP distants directement depuis l'API Messages.
- Pour améliorer la qualité des réponses et réduire les erreurs d'outils, nous avons modifié la valeur par défaut du paramètre
top_p de nucleus sampling (échantillonnage par noyau) dans l'API Messages de 0,999 à 0,99 pour tous les modèles. Pour annuler ce changement, définissez top_p sur 0,999.
De plus, lorsque la réflexion étendue est activée, vous pouvez désormais définir top_p sur des valeurs comprises entre 0,95 et 1.
- Nous avons fait passer notre SDK Go de la version bêta à la disponibilité générale.
- Nous avons ajouté une granularité au niveau de la minute et de l'heure à la page Usage de la Console, ainsi que les taux d'erreurs 429 sur la page Usage.
- Nous avons fait passer notre SDK Ruby de la version bêta à la disponibilité générale.
- Nous avons lancé un outil de recherche web dans l'API, permettant à Claude d'accéder à des informations à jour provenant du web. Pour en savoir plus, consultez Outil de recherche web.
- Le contrôle de cache doit désormais être spécifié directement dans le bloc
content parent de tool_result et document.source. Pour assurer la rétrocompatibilité, si un contrôle de cache est détecté sur le dernier bloc de tool_result.content ou document.source.content, il sera automatiquement appliqué au bloc parent à la place. Un contrôle de cache sur tout autre bloc dans tool_result.content et document.source.content entraînera une erreur de validation.
- Nous avons lancé une version bêta du SDK Ruby.
- Nous avons fait passer notre SDK Java de la version bêta à la disponibilité générale.
- Nous avons fait passer notre SDK Go de la version alpha à la version bêta.
- Nous avons ajouté des blocs source URL pour les images et les PDF dans l'API Messages. Vous pouvez désormais référencer des images et des PDF directement via une URL au lieu de devoir les encoder en base64. Pour en savoir plus, consultez Vision et Prise en charge des PDF.
- Nous avons ajouté la prise en charge d'une option
none pour le paramètre tool_choice dans l'API Messages, qui empêche Claude d'appeler des outils. De plus, vous n'êtes plus obligé de fournir des tools lorsque vous incluez des blocs tool_use et tool_result.
- Nous avons lancé un point de terminaison d'API compatible OpenAI, vous permettant de tester les modèles Claude en modifiant simplement votre clé API, votre URL de base et le nom du modèle dans vos intégrations OpenAI existantes. Cette couche de compatibilité prend en charge les fonctionnalités de base de chat completions. Pour en savoir plus, consultez Compatibilité avec le SDK OpenAI.
- Nous avons lancé Claude Sonnet 3.7, notre modèle le plus intelligent à ce jour. Claude Sonnet 3.7 peut produire des réponses quasi instantanées ou montrer sa réflexion étendue étape par étape. Un seul modèle, deux façons de réfléchir. Pour en savoir plus sur tous les modèles Claude, consultez Aperçu des modèles.
- Nous avons ajouté la prise en charge de la vision à Claude Haiku 3.5, permettant au modèle d'analyser et de comprendre des images.
- Nous avons publié une implémentation d'utilisation d'outils économe en tokens, améliorant les performances globales lors de l'utilisation d'outils avec Claude. Pour en savoir plus, consultez Utilisation d'outils avec Claude.
- Nous avons modifié la température par défaut dans la Console pour les nouveaux prompts de 0 à 1, par souci de cohérence avec la température par défaut dans l'API. Les prompts enregistrés existants restent inchangés.
- Nous avons publié des versions mises à jour de nos outils qui découplent les outils d'édition de texte et bash de l'invite système de computer use :
bash_20250124 : Même fonctionnalité que la version précédente, mais indépendante de computer use. Ne nécessite pas d'en-tête bêta.
text_editor_20250124 : Même fonctionnalité que la version précédente, mais indépendante de computer use. Ne nécessite pas d'en-tête bêta.
computer_20250124 : Outil computer use mis à jour avec de nouvelles options de commande, notamment « hold_key », « left_mouse_down », « left_mouse_up », « scroll », « triple_click » et « wait ». Cet outil nécessite l'en-tête anthropic-beta « computer-use-2025-01-24 ».
Pour en savoir plus, consultez Utilisation d'outils avec Claude.
- Nous avons ajouté l'en-tête de réponse
anthropic-organization-id à toutes les réponses de l'API. Cet en-tête fournit l'identifiant de l'organisation associée à la clé API utilisée dans la requête.
- Nous avons fait passer notre SDK Java de la version alpha à la version bêta.
- Nous avons lancé la capacité de citations dans l'API, permettant à Claude de fournir une attribution de source pour les informations. Pour en savoir plus, consultez Citations.
- Nous avons ajouté la prise en charge des documents en texte brut et des documents à contenu personnalisé dans l'API Messages.
- Nous avons annoncé la dépréciation des modèles Claude 2, Claude 2.1 et Claude Sonnet 3. Pour en savoir plus, consultez Dépréciations de modèles.
- Nous avons mis à jour la mise en cache des prompts pour la rendre plus facile à utiliser. Désormais, lorsque vous définissez un point d'arrêt de cache, nous lirons automatiquement à partir de votre préfixe mis en cache le plus long.
- Vous pouvez désormais mettre des mots dans la bouche de Claude lors de l'utilisation d'outils.
Les fonctionnalités suivantes sont désormais en disponibilité générale dans l'API Claude :
- API Models : Interrogez les modèles disponibles, validez les identifiants de modèles et résolvez les alias de modèles vers leurs identifiants de modèles canoniques.
- API Message Batches : Traitez de grands lots de messages de manière asynchrone à 50 % du coût standard de l'API.
- API de comptage de tokens : Calculez le nombre de tokens des Messages avant de les envoyer à Claude.
- Mise en cache des prompts : Réduisez les coûts jusqu'à 90 % et la latence jusqu'à 80 % en mettant en cache et en réutilisant le contenu des prompts.
- Prise en charge des PDF : Traitez des PDF pour analyser à la fois le texte et le contenu visuel des documents.
Nous avons également publié de nouveaux SDK officiels :
- Nous avons ajouté la possibilité de regrouper par clé API sur les pages Usage et Cost de la Developer Console.
- Nous avons ajouté deux nouvelles colonnes Last used at et Cost ainsi que la possibilité de trier par n'importe quelle colonne sur la page API keys de la Developer Console.
- Nous avons publié l'Admin API, permettant aux utilisateurs de gérer par programmation les ressources de leur organisation.
- Nous avons mis à jour nos limites de débit pour l'API Messages. Nous avons remplacé la limite de débit de tokens par minute par de nouvelles limites de débit de tokens d'entrée et de sortie par minute. Pour en savoir plus, consultez Limites de débit.
- Nous avons ajouté la prise en charge de l'utilisation d'outils dans le Workbench.
- Nous avons ajouté la prise en charge des PDF pour tous les modèles Claude Sonnet 3.5. Pour en savoir plus, consultez Prise en charge des PDF.
- Claude Haiku 3.5 est désormais disponible sur l'API Claude en tant que modèle texte uniquement.
- Nous avons ajouté la prise en charge des PDF pour une utilisation avec le nouveau Claude Sonnet 3.5. Pour en savoir plus, consultez Prise en charge des PDF.
- Nous avons également ajouté le comptage de tokens, qui vous permet de déterminer le nombre total de tokens dans un Message avant de l'envoyer à Claude. Pour en savoir plus, consultez Comptage de tokens.
- Nous avons ajouté des outils de computer use définis par Anthropic à notre API pour une utilisation avec le nouveau Claude Sonnet 3.5. Pour en savoir plus, consultez Outil computer use.
- Claude Sonnet 3.5, notre modèle le plus intelligent à ce jour, vient de recevoir une mise à niveau et est désormais disponible sur l'API Claude. Pour en savoir plus, consultez la documentation Claude Sonnet.
- L'API Message Batches est désormais disponible en version bêta. Traitez de grands lots de requêtes de manière asynchrone dans l'API Claude pour 50 % de coût en moins. Pour en savoir plus, consultez Traitement par lots.
- Nous avons assoupli les restrictions sur l'ordre des tours
user/assistant dans notre API Messages. Les messages user/assistant consécutifs seront combinés en un seul message au lieu de générer une erreur, et nous n'exigeons plus que le premier message d'entrée soit un message user.
- Nous avons déprécié les forfaits Build et Scale au profit d'une suite de fonctionnalités standard (anciennement appelée Build), ainsi que de fonctionnalités supplémentaires disponibles via l'équipe commerciale. Pour en savoir plus, consultez nos informations sur la tarification de l'API.
- Nous avons ajouté la possibilité de désactiver l'utilisation d'outils en parallèle dans l'API. Définissez
disable_parallel_tool_use: true dans le champ tool_choice pour vous assurer que Claude utilise au plus un outil. Pour en savoir plus, consultez Utilisation d'outils en parallèle.
- Nous avons ajouté les Workspaces à la Developer Console. Les Workspaces vous permettent de définir des limites de dépenses ou de débit personnalisées, de regrouper des clés API, de suivre l'utilisation par projet et de contrôler l'accès avec des rôles utilisateur. Pour en savoir plus, consultez notre article de blog.
- Nous avons ajouté la prise en charge de l'utilisation du SDK dans les navigateurs en renvoyant des en-têtes CORS dans les réponses de l'API. Définissez
dangerouslyAllowBrowser: true lors de l'instanciation du SDK pour activer cette fonctionnalité.
- Nous avons fait passer les sorties de 8 192 tokens de la version bêta à la disponibilité générale pour Claude Sonnet 3.5.
- La mise en cache des prompts est désormais disponible en tant que fonctionnalité bêta dans l'API Claude. Mettez en cache et réutilisez des prompts pour réduire la latence jusqu'à 80 % et les coûts jusqu'à 90 %.
- Générez des sorties d'une longueur allant jusqu'à 8 192 tokens à partir de Claude Sonnet 3.5 avec le nouvel en-tête
anthropic-beta: max-tokens-3-5-sonnet-2024-07-15.
- Générez automatiquement des cas de test pour vos prompts à l'aide de Claude dans la Developer Console.
- Comparez côte à côte les sorties de différents prompts dans le nouveau mode de comparaison de sorties de la Developer Console.
- Consultez l'utilisation de l'API et la facturation ventilées par montant en dollars, nombre de tokens et clés API dans les nouveaux onglets Usage et Cost de la Developer Console.
- Consultez vos limites de débit actuelles de l'API dans le nouvel onglet Rate Limits de la Developer Console.
- Claude Sonnet 3.5, notre modèle le plus intelligent à ce jour, est désormais en disponibilité générale sur l'API Claude, Amazon Bedrock et Vertex AI.
- L'utilisation d'outils est désormais en disponibilité générale sur l'API Claude, Amazon Bedrock et Vertex AI.
- Notre outil générateur de prompts est désormais disponible dans la Developer Console. Le générateur de prompts facilite l'orientation de Claude pour générer des prompts de haute qualité adaptés à vos tâches spécifiques. Pour en savoir plus, consultez notre article de blog.