Construire/Notes de version
Mises à jour de Claude Platform, y compris l'API Claude, les SDK clients et la Claude Console.
Pour les notes de version sur Claude Apps, consultez les Notes de version pour Claude Apps dans le Centre d'aide Claude.
Pour les mises à jour de Claude Code, consultez le CHANGELOG.md complet dans le référentiel claude-code.
- Nous avons lancé Claude Opus 4.7, notre modèle le plus capable disponible pour le raisonnement complexe et le codage agentique, au même prix de $5 / $25 par MTok que Opus 4.6. Consultez Nouveautés de Claude Opus 4.7 pour les améliorations de capacité, les nouvelles fonctionnalités et le tokenizer mis à jour. Opus 4.7 inclut des changements cassants dans l'API par rapport à Opus 4.6 ; consultez Migration vers Claude Opus 4.7 avant de mettre à niveau.
- Nous avons annoncé la dépréciation du modèle Claude Sonnet 4 (
claude-sonnet-4-20250514) et du modèle Claude Opus 4 (claude-opus-4-20250514), avec retrait prévu sur l'API Claude le 15 juin 2026. Nous recommandons de migrer vers Claude Sonnet 4.6 et Claude Opus 4.7 respectivement. En savoir plus dans dépréciations de modèles.
- Nous avons lancé l'outil conseiller en bêta publique. Associez un modèle exécuteur plus rapide à un modèle conseiller plus intelligent qui fournit des conseils stratégiques en cours de génération, afin que les charges de travail agentiques à long horizon obtiennent une qualité proche de celle du conseiller seul tandis que la majorité de la génération de jetons se fait aux tarifs du modèle exécuteur. Incluez l'en-tête bêta
advisor-tool-2026-03-01 dans vos demandes.
- Nous avons lancé les Agents gérés Claude en bêta publique, un harnais d'agent entièrement géré pour exécuter Claude en tant qu'agent autonome avec isolation sécurisée, outils intégrés et streaming d'événements envoyés par le serveur. Créez des agents, configurez des conteneurs et exécutez des sessions via l'API. Tous les points de terminaison nécessitent l'en-tête bêta
managed-agents-2026-04-01. En savoir plus dans Aperçu des Agents gérés Claude.
- Nous avons lancé l'interface de ligne de commande
ant, un client en ligne de commande pour l'API Claude qui permet une interaction plus rapide avec l'API Claude, l'intégration native avec Claude Code et le versioning des ressources API dans les fichiers YAML. En savoir plus dans la référence CLI.
- Nous avons annoncé que Claude Mythos Preview est disponible en tant qu'aperçu de recherche fermé pour les travaux de cybersécurité défensive dans le cadre du Projet Glasswing. L'accès est sur invitation uniquement.
- L'API Messages est maintenant disponible sur Amazon Bedrock en tant qu'aperçu de recherche. Le nouveau point de terminaison Claude dans Amazon Bedrock à
/anthropic/v1/messages utilise la même forme de demande que l'API Claude propriétaire et s'exécute sur l'infrastructure gérée par AWS sans accès opérateur. Disponible dans us-east-1 ; contactez votre responsable de compte Anthropic pour demander l'accès. En savoir plus dans Claude dans Amazon Bedrock (aperçu de recherche).
- Nous avons augmenté le plafond
max_tokens à 300k sur l'API Message Batches pour Claude Opus 4.6 et Sonnet 4.6. Incluez l'en-tête bêta output-300k-2026-03-24 pour générer des sorties plus longues en un seul tour pour le contenu long, les données structurées et les tâches de génération de code volumineux.
- Nous retirons la bêta de la fenêtre de contexte de 1M jetons pour Claude Sonnet 4.5 et Claude Sonnet 4 le 30 avril 2026. Après cette date, l'en-tête bêta
context-1m-2025-08-07 n'aura aucun effet sur ces modèles, et les demandes qui dépassent la fenêtre de contexte standard de 200k jetons retourneront une erreur. Pour continuer à utiliser des fenêtres de contexte de 1M, migrez vers Claude Sonnet 4.6 ou Claude Opus 4.6, qui supportent la fenêtre de contexte complète de 1M jetons aux tarifs standard sans en-tête bêta requis.
- Nous avons ajouté des champs de capacité de modèle à l'API Models.
GET /v1/models et GET /v1/models/{model_id} retournent maintenant max_input_tokens, max_tokens et un objet capabilities. Interrogez l'API pour découvrir ce que chaque modèle supporte.
- Nous avons lancé le champ
display pour la réflexion étendue, vous permettant d'omettre le contenu de réflexion des réponses pour un streaming plus rapide. Définissez thinking.display: "omitted" pour recevoir des blocs de réflexion avec un champ thinking vide et la signature préservée pour la continuité multi-tours. La facturation est inchangée. En savoir plus dans Contrôle de l'affichage de la réflexion.
- La fenêtre de contexte de 1M jetons est maintenant généralement disponible pour Claude Opus 4.6 et Sonnet 4.6 aux tarifs standard. Les demandes dépassant 200k jetons fonctionnent automatiquement pour ces modèles sans en-tête bêta requis. La fenêtre de contexte de 1M jetons reste en bêta pour Claude Sonnet 4.5 et Sonnet 4.
- Nous avons supprimé les limites de débit dédiées de 1M pour tous les modèles supportés. Vos limites de compte standard s'appliquent maintenant à chaque longueur de contexte.
- Nous avons augmenté la limite de média de 100 à 600 images ou pages PDF par demande lors de l'utilisation de la fenêtre de contexte de 1M jetons.
- Nous avons lancé la mise en cache automatique pour l'API Messages. Ajoutez un seul champ
cache_control à votre corps de demande et le système met automatiquement en cache le dernier bloc cacheable, déplaçant le point de cache vers l'avant à mesure que les conversations se développent. Aucune gestion manuelle des points d'arrêt requise. Fonctionne aux côtés du contrôle de cache au niveau des blocs existants pour une optimisation fine. Disponible sur l'API Claude et Azure AI Foundry (aperçu). En savoir plus dans Mise en cache des invites.
- Nous avons retiré le modèle Claude Sonnet 3.7 (
claude-3-7-sonnet-20250219) et le modèle Claude Haiku 3.5 (claude-3-5-haiku-20241022). Toutes les demandes à ces modèles retourneront maintenant une erreur. Nous recommandons de mettre à niveau vers Claude Sonnet 4.6 et Claude Haiku 4.5 respectivement. Les chercheurs peuvent demander un accès continu via le Programme d'accès pour chercheurs externes.
- Nous avons annoncé la dépréciation du modèle Claude Haiku 3 (
claude-3-haiku-20240307), avec retrait prévu le 19 avril 2026. Nous recommandons de migrer vers Claude Haiku 4.5. En savoir plus dans dépréciations de modèles.
- Nous avons lancé le mode rapide en aperçu de recherche pour Opus 4.6, fournissant une génération de jetons de sortie significativement plus rapide via le paramètre
speed. Le mode rapide est jusqu'à 2,5 fois plus rapide aux tarifs premium. Les clients intéressés doivent rejoindre la liste d'attente.
- Nous avons lancé Claude Opus 4.6, notre modèle le plus intelligent pour les tâches agentiques complexes et le travail à long horizon. Opus 4.6 recommande la réflexion adaptative (
thinking: {type: "adaptive"}); la réflexion manuelle (type: "enabled" avec budget_tokens) est dépréciée. Opus 4.6 ne supporte pas le remplissage préalable des messages d'assistant. En savoir plus dans Nouveautés de Claude 4.6.
- Le paramètre effort est maintenant généralement disponible (aucun en-tête bêta requis) et supporte Claude Opus 4.6. L'effort remplace
budget_tokens pour contrôler la profondeur de réflexion sur les nouveaux modèles.
- Nous avons lancé l'API de compaction en bêta, fournissant une résumé de contexte côté serveur pour des conversations effectivement infinies. Disponible sur Opus 4.6.
- Nous avons introduit les contrôles de résidence des données, vous permettant de spécifier où l'inférence du modèle s'exécute avec le paramètre
inference_geo. L'inférence réservée aux États-Unis est disponible aux tarifs 1,1x pour les modèles publiés après le 1er février 2026.
- La est maintenant disponible en bêta pour Claude Opus 4.6, en plus de Sonnet 4.5 et Sonnet 4. La s'applique aux demandes dépassant 200k jetons d'entrée.
- Les sorties structurées sont maintenant généralement disponibles sur l'API Claude pour Claude Sonnet 4.5, Claude Opus 4.5 et Claude Haiku 4.5. La GA inclut le support de schéma étendu, la latence de compilation de grammaire améliorée et un chemin d'intégration simplifié sans en-tête bêta requis. Le paramètre
output_format a été déplacé vers output_config.format. Les utilisateurs bêta existants peuvent continuer à utiliser l'en-tête bêta pendant la période de transition. Les sorties structurées restent en bêta publique sur Amazon Bedrock et Microsoft Foundry.
console.anthropic.com redirige maintenant vers platform.claude.com. La Claude Console a déménagé vers son nouveau domicile dans le cadre de notre consolidation de marque Claude. Les signets et liens existants continueront à fonctionner via redirection automatique. Pour plus de détails, consultez l'annonce du 16 septembre 2025.
- Nous avons retiré le modèle Claude Opus 3 (
claude-3-opus-20240229). Toutes les demandes à ce modèle retourneront maintenant une erreur. Nous recommandons de mettre à niveau vers Claude Opus 4.5, qui offre une intelligence significativement améliorée à un tiers du coût. Les chercheurs peuvent demander un accès continu à Claude Opus 3 sur l'API via le Programme d'accès pour chercheurs externes.
- Nous avons lancé Claude Opus 4.5, notre modèle le plus intelligent combinant la capacité maximale avec des performances pratiques. Idéal pour les tâches spécialisées complexes, l'ingénierie logicielle professionnelle et les agents avancés. Offre des améliorations de changement d'étape dans la vision, le codage et l'utilisation d'ordinateur à un point de prix plus accessible que les modèles Opus précédents. En savoir plus dans Aperçu des modèles.
- Nous avons lancé l'appel d'outils programmatique en bêta publique, permettant à Claude d'appeler des outils depuis l'exécution de code pour réduire la latence et l'utilisation de jetons dans les flux de travail multi-outils.
- Nous avons lancé l'outil de recherche d'outils en bêta publique, permettant à Claude de découvrir et charger dynamiquement des outils à la demande à partir de grands catalogues d'outils.
- Nous avons lancé le paramètre effort en bêta publique pour Claude Opus 4.5, vous permettant de contrôler l'utilisation des jetons en échangeant entre la complétude de la réponse et l'efficacité.
- Nous avons ajouté la compaction côté client à nos SDK Python et TypeScript, gérant automatiquement le contexte de conversation par résumé lors de l'utilisation de
tool_runner.
- Les blocs de contenu des résultats de recherche sont maintenant généralement disponibles sur Amazon Bedrock. En savoir plus dans Résultats de recherche.
- Nous avons lancé une nouvelle plateforme de documentation à platform.claude.com/docs. Notre documentation vit maintenant côte à côte avec la Claude Console, fournissant une expérience développeur unifiée. Le site de documentation précédent à docs.claude.com redirigera vers le nouvel emplacement.
- Nous avons lancé Claude dans Microsoft Foundry, apportant les modèles Claude aux clients Azure avec la facturation Azure et l'authentification OAuth. Accédez à l'API Messages complète incluant la réflexion étendue, la mise en cache des invites (5 minutes et 1 heure), le support PDF, l'API Files, Agent Skills et l'utilisation d'outils. En savoir plus dans Claude dans Microsoft Foundry.
- Nous avons lancé les sorties structurées en bêta publique, fournissant la conformité de schéma garantie pour les réponses de Claude. Utilisez les sorties JSON pour les réponses de données structurées ou l'utilisation d'outils stricte pour les entrées d'outils validées. Disponible pour Claude Sonnet 4.5 et Claude Opus 4.1. Pour activer, utilisez l'en-tête bêta
structured-outputs-2025-11-13.
- Nous avons annoncé la dépréciation du modèle Claude Sonnet 3.7. En savoir plus dans Dépréciations de modèles.
- Nous avons retiré les modèles Claude Sonnet 3.5. Toutes les demandes à ces modèles retourneront maintenant une erreur.
- Nous avons étendu l'édition de contexte avec l'effacement des blocs de réflexion (
clear_thinking_20251015), permettant la gestion automatique des blocs de réflexion. En savoir plus dans Édition de contexte.
- Nous avons lancé Agent Skills (
skills-2025-10-02 bêta), une nouvelle façon d'étendre les capacités de Claude. Les Skills sont des dossiers organisés d'instructions, de scripts et de ressources que Claude charge dynamiquement pour effectuer des tâches spécialisées. La version initiale inclut :
- Skills gérés par Anthropic : Skills pré-construits pour travailler avec les fichiers PowerPoint (.pptx), Excel (.xlsx), Word (.docx) et PDF
- Skills personnalisés : Téléchargez vos propres Skills via l'API Skills (
/v1/skills points de terminaison) pour empaqueter l'expertise de domaine et les flux de travail organisationnels
- Les Skills nécessitent que l'outil d'exécution de code soit activé
- En savoir plus dans Agent Skills et référence API
- Nous avons lancé Claude Haiku 4.5, notre modèle Haiku le plus rapide et le plus intelligent avec des performances proches de la frontière. Idéal pour les applications en temps réel, le traitement à haut volume et les déploiements sensibles aux coûts nécessitant un raisonnement solide. En savoir plus dans Aperçu des modèles.
- Nous avons lancé Claude Sonnet 4.5, notre meilleur modèle pour les agents complexes et le codage, avec l'intelligence la plus élevée sur la plupart des tâches. En savoir plus dans l'aperçu des modèles.
- Nous avons introduit la tarification des points de terminaison mondiaux pour AWS Bedrock et Google Vertex AI. La tarification de l'API Claude (1P) n'est pas affectée.
- Nous avons introduit une nouvelle raison d'arrêt
model_context_window_exceeded qui vous permet de demander le maximum de jetons possibles sans calculer la taille d'entrée. En savoir plus dans Gestion des raisons d'arrêt.
- Nous avons lancé l'outil de mémoire en bêta, permettant à Claude de stocker et consulter des informations entre les conversations. En savoir plus dans Outil de mémoire.
- Nous avons lancé l'édition de contexte en bêta, fournissant des stratégies pour gérer automatiquement le contexte de conversation. La version initiale supporte l'effacement des résultats et appels d'outils plus anciens lors de l'approche des limites de jetons. En savoir plus dans Édition de contexte.
- Nous avons lancé les aides d'outils en bêta pour les SDK Python et TypeScript, simplifiant la création et l'exécution d'outils avec la validation d'entrée type-safe et un exécuteur d'outils pour la gestion automatique des outils dans les conversations. Pour les détails, consultez la documentation pour le SDK Python et le SDK TypeScript.
- Nous avons unifié nos offres de développeur sous la marque Claude. Vous devriez voir les noms et URL mis à jour sur notre plateforme et documentation, mais nos interfaces de développeur resteront les mêmes. Voici quelques changements notables :
- Nous avons lancé l'outil de récupération web en bêta, permettant à Claude de récupérer le contenu complet des pages web et documents PDF spécifiés. En savoir plus dans Outil de récupération web.
- Nous avons lancé l'API Claude Code Analytics, permettant aux organisations d'accéder par programme aux métriques d'utilisation quotidiennes agrégées pour Claude Code, y compris les métriques de productivité, les statistiques d'utilisation des outils et les données de coûts.
- Nous avons lancé une version bêta du SDK C#.
- Nous avons lancé les graphiques de limite de débit dans la page Utilisation de la Console, vous permettant de surveiller votre utilisation de limite de débit API et les taux de mise en cache au fil du temps.
- Nous avons lancé le support des documents citables dans les résultats d'outils côté client. En savoir plus dans Gérer les appels d'outils.
- Nous avons lancé la v2 de l'Outil d'exécution de code en bêta publique, remplaçant l'outil original réservé à Python par l'exécution de commandes Bash et les capacités de manipulation de fichiers directes, y compris l'écriture de code dans d'autres langages.
- Nous avons lancé une version bêta du SDK PHP.
- Nous avons augmenté les limites de débit sur la fenêtre de contexte de 1M jetons pour Claude Sonnet 4 sur l'API Claude.
- La fenêtre de contexte de 1M jetons est maintenant disponible sur Vertex AI de Google Cloud. Pour plus d'informations, consultez Claude sur Vertex AI.
- Les ID de demande sont maintenant inclus directement dans les corps de réponse d'erreur aux côtés de l'en-tête
request-id existant. En savoir plus dans Erreurs.
- Nous avons annoncé la dépréciation des modèles Claude Sonnet 3.5 (
claude-3-5-sonnet-20240620 et claude-3-5-sonnet-20241022). Ces modèles seront retirés le 28 octobre 2025. Nous recommandons de migrer vers Claude Sonnet 4.5 (claude-sonnet-4-5-20250929) pour des performances et capacités améliorées. En savoir plus dans Dépréciations de modèles.
- La durée de cache d'une heure pour la mise en cache des invites est maintenant généralement disponible. Vous pouvez maintenant utiliser le TTL de cache étendu sans en-tête bêta. En savoir plus dans Mise en cache des invites.
- Certains clients pourraient rencontrer des erreurs 429 (
rate_limit_error) erreurs suite à une augmentation nette de l'utilisation de l'API en raison des limites d'accélération sur l'API. Auparavant, les erreurs 529 (overloaded_error) se produiraient dans des scénarios similaires.
- Les blocs de contenu des résultats de recherche sont maintenant généralement disponibles sur l'API Claude et Vertex AI de Google Cloud. Cette fonctionnalité permet les citations naturelles pour les applications RAG avec l'attribution appropriée de la source. L'en-tête bêta
search-results-2025-06-09 n'est plus requis. En savoir plus dans Résultats de recherche.
- Nous avons lancé Claude Opus 4.1, une mise à jour progressive de Claude Opus 4 avec des capacités améliorées et des améliorations de performance.* En savoir plus dans Aperçu des modèles.
* - Opus 4.1 ne permet pas de spécifier à la fois les paramètres temperature et top_p. Veuillez n'en utiliser qu'un.
- Nous avons publié
text_editor_20250728, un outil d'édition de texte mis à jour qui corrige certains problèmes des versions précédentes et ajoute un paramètre max_characters optionnel qui vous permet de contrôler la longueur de troncature lors de la visualisation de fichiers volumineux.
- Nous avons augmenté les limites de débit pour Claude Opus 4 sur l'API Claude pour vous donner plus de capacité à construire et à l'échelle avec Claude. Pour les clients avec les limites de débit du niveau d'utilisation 1-4, ces changements s'appliquent immédiatement à votre compte - aucune action requise.
- Nous avons retiré les modèles Claude 2.0, Claude 2.1 et Claude Sonnet 3. Toutes les demandes à ces modèles retourneront maintenant une erreur. En savoir plus dans Dépréciations de modèles.
- Nous avons augmenté les limites de débit pour Claude Sonnet 4 sur l'API Claude pour vous donner plus de capacité à construire et à l'échelle avec Claude. Pour les clients avec les limites de débit du niveau d'utilisation 1-4, ces changements s'appliquent immédiatement à votre compte - aucune action requise.
- Nous avons lancé les blocs de contenu des résultats de recherche en bêta, permettant les citations naturelles pour les applications RAG. Les outils peuvent maintenant retourner les résultats de recherche avec l'attribution appropriée de la source, et Claude citera automatiquement ces sources dans ses réponses - correspondant à la qualité de citation de la recherche web. Cela élimine le besoin de contournements de documents dans les applications de base de connaissances personnalisées. En savoir plus dans Résultats de recherche. Pour activer cette fonctionnalité, utilisez l'en-tête bêta
search-results-2025-06-09.
- Les utilisateurs de la Console avec le rôle Développeur peuvent maintenant accéder à la page Coûts. Auparavant, le rôle Développeur permettait l'accès à la page Utilisation, mais pas à la page Coûts.
- Nous avons lancé le streaming d'outils fin en bêta publique, une fonctionnalité qui permet à Claude de streamer les paramètres d'utilisation d'outils sans mise en mémoire tampon / validation JSON. Pour activer le streaming d'outils fin, utilisez l'en-tête bêta
fine-grained-tool-streaming-2025-05-14.
- Nous avons lancé Claude Opus 4 et Claude Sonnet 4, nos derniers modèles avec capacités de réflexion étendue. En savoir plus dans Aperçu des modèles.
- Le comportement par défaut de la réflexion étendue dans les modèles Claude 4 retourne un résumé du processus de réflexion complet de Claude, avec la réflexion complète chiffrée et retournée dans le champ
signature de la sortie du bloc thinking.
- Nous avons lancé la réflexion entrelacée en bêta publique, une fonctionnalité qui permet à Claude de réfléchir entre les appels d'outils. Pour activer la réflexion entrelacée, utilisez l'en-tête bêta
interleaved-thinking-2025-05-14.
- Nous avons lancé l'API Files en bêta publique, vous permettant de télécharger des fichiers et de les référencer dans l'API Messages et l'outil d'exécution de code.
- Nous avons lancé l'outil d'exécution de code en bêta publique, un outil qui permet à Claude d'exécuter du code Python dans un environnement sécurisé et en sandbox.
- Nous avons lancé le en bêta publique, une fonctionnalité qui vous permet de vous connecter à des serveurs MCP distants directement depuis l'API Messages.
- Nous avons déplacé notre SDK Ruby de bêta à GA.
- Nous avons lancé un outil de recherche web dans l'API, permettant à Claude d'accéder à des informations à jour du web. En savoir plus dans Outil de recherche web.
- Le contrôle de cache doit maintenant être spécifié directement dans le bloc
content parent de tool_result et document.source. Pour la compatibilité rétroactive, si le contrôle de cache est détecté sur le dernier bloc dans tool_result.content ou document.source.content, il sera automatiquement appliqué au bloc parent à la place. Le contrôle de cache sur tout autre bloc dans tool_result.content et document.source.content entraînera une erreur de validation.
- Nous avons lancé une version bêta du SDK Ruby.
- Nous avons déplacé notre SDK Java de bêta à GA.
- Nous avons déplacé notre SDK Go d'alpha à bêta.
- Nous avons ajouté des blocs de source URL pour les images et les PDF dans l'API Messages. Vous pouvez maintenant référencer les images et les PDF directement via URL au lieu de devoir les encoder en base64. En savoir plus dans Vision et Support PDF.
- Nous avons ajouté le support d'une option
none au paramètre tool_choice dans l'API Messages qui empêche Claude d'appeler des outils. De plus, vous n'êtes plus obligé de fournir des tools lors de l'inclusion de blocs tool_use et tool_result.
- Nous avons lancé un point de terminaison API compatible avec OpenAI, vous permettant de tester les modèles Claude en changeant simplement votre clé API, URL de base et nom de modèle dans les intégrations OpenAI existantes. Cette couche de compatibilité supporte la fonctionnalité de complétions de chat de base. En savoir plus dans Compatibilité du SDK OpenAI.
- Nous avons lancé Claude Sonnet 3.7, notre modèle le plus intelligent à ce jour. Claude Sonnet 3.7 peut produire des réponses quasi-instantanées ou montrer sa réflexion étendue étape par étape. Un modèle, deux façons de penser. En savoir plus sur tous les modèles Claude dans Aperçu des modèles.
- Nous avons ajouté le support de la vision à Claude Haiku 3.5, permettant au modèle d'analyser et de comprendre les images.
- Nous avons publié une implémentation d'utilisation d'outils efficace en jetons, améliorant les performances globales lors de l'utilisation d'outils avec Claude. En savoir plus dans Utilisation d'outils avec Claude.
- Nous avons changé la température par défaut dans la Console pour les nouvelles invites de 0 à 1 pour la cohérence avec la température par défaut dans l'API. Les invites enregistrées existantes sont inchangées.
- Nous avons publié des versions mises à jour de nos outils qui découplent les outils d'édition de texte et bash du système d'invite d'utilisation d'ordinateur :
bash_20250124 : Même fonctionnalité que la version précédente mais indépendante de l'utilisation d'ordinateur. Ne nécessite pas d'en-tête bêta.
- : Même fonctionnalité que la version précédente mais indépendante de l'utilisation d'ordinateur. Ne nécessite pas d'en-tête bêta.
- Nous avons ajouté l'en-tête de réponse
anthropic-organization-id à toutes les réponses API. Cet en-tête fournit l'ID d'organisation associé à la clé API utilisée dans la demande.
- Nous avons déplacé notre SDK Java d'alpha à bêta.
- Nous avons lancé la capacité de citations dans l'API, permettant à Claude de fournir l'attribution de source pour les informations. En savoir plus dans Citations.
- Nous avons ajouté le support des documents en texte brut et des documents de contenu personnalisé dans l'API Messages.
- Nous avons annoncé la dépréciation des modèles Claude 2, Claude 2.1 et Claude Sonnet 3. En savoir plus dans Dépréciations de modèles.
- Nous avons mis à jour la mise en cache des invites pour être plus facile à utiliser. Maintenant, lorsque vous définissez un point d'arrêt de cache, nous lirons automatiquement à partir de votre préfixe précédemment mis en cache le plus long.
- Vous pouvez maintenant mettre des paroles dans la bouche de Claude lors de l'utilisation d'outils.
Les fonctionnalités suivantes sont désormais généralement disponibles dans l'API Claude :
- API Models : Interrogez les modèles disponibles, validez les ID de modèle et résolvez les alias de modèle vers leurs ID de modèle canoniques.
- API Message Batches : Traitez de grands lots de messages de manière asynchrone à 50 % du coût standard de l'API.
- API Token counting : Calculez les nombres de jetons pour les Messages avant de les envoyer à Claude.
- Prompt Caching : Réduisez les coûts jusqu'à 90 % et la latence jusqu'à 80 % en mettant en cache et en réutilisant le contenu des invites.
- Support PDF : Traitez les PDF pour analyser le contenu textuel et visuel dans les documents.
Nous avons également publié de nouveaux SDK officiels :
- Nous avons ajouté la possibilité de grouper par clé API sur les pages Usage et Cost de la Developer Console.
- Nous avons ajouté deux nouvelles colonnes Last used at et Cost et la possibilité de trier par n'importe quelle colonne sur la page API keys de la Developer Console.
- Nous avons publié l'Admin API, permettant aux utilisateurs de gérer par programmation les ressources de leur organisation.
- Nous avons mis à jour nos limites de débit pour l'API Messages. Nous avons remplacé la limite de débit des jetons par minute par de nouvelles limites de débit des jetons d'entrée et de sortie par minute. Lisez plus dans Rate limits.
- Nous avons ajouté le support de tool use dans le Workbench.
- Nous avons ajouté le support PDF pour tous les modèles Claude Sonnet 3.5. Lisez plus dans PDF support.
- Claude Haiku 3.5 est maintenant disponible sur l'API Claude en tant que modèle texte uniquement.
- Nous avons ajouté le support PDF pour une utilisation avec le nouveau Claude Sonnet 3.5. Lisez plus dans PDF support.
- Nous avons également ajouté le comptage des jetons, qui vous permet de déterminer le nombre total de jetons dans un Message avant de l'envoyer à Claude. Lisez plus dans Token counting.
- Nous avons ajouté des outils d'utilisation informatique définis par Anthropic à notre API pour une utilisation avec le nouveau Claude Sonnet 3.5. Lisez plus dans Computer use tool.
- Claude Sonnet 3.5, notre modèle le plus intelligent à ce jour, vient d'être amélioré et est maintenant disponible sur l'API Claude. Lisez plus dans la documentation Claude Sonnet.
- L'API Message Batches est maintenant disponible en bêta. Traitez de grands lots de requêtes de manière asynchrone dans l'API Claude pour 50 % moins cher. Lisez plus dans Batch processing.
- Nous avons assoupli les restrictions sur l'ordre des tours
user/assistant dans notre API Messages. Les messages user/assistant consécutifs seront combinés en un seul message au lieu de générer une erreur, et nous ne nécessitons plus que le premier message d'entrée soit un message user.
- Nous avons déprécié les plans Build et Scale en faveur d'une suite de fonctionnalités standard (anciennement appelée Build), ainsi que des fonctionnalités supplémentaires disponibles via les ventes. Lisez plus dans nos informations de tarification API.
- Nous avons ajouté la possibilité de désactiver l'utilisation parallèle des outils dans l'API. Définissez
disable_parallel_tool_use: true dans le champ tool_choice pour vous assurer que Claude utilise au maximum un outil. Lisez plus dans Parallel tool use.
- Nous avons ajouté des Workspaces à la Developer Console. Les Workspaces vous permettent de définir des limites de dépenses ou de débit personnalisées, de grouper les clés API, de suivre l'utilisation par projet et de contrôler l'accès avec les rôles d'utilisateur. Lisez plus dans notre blog post.
- Nous avons annoncé la dépréciation des modèles Claude 1. Lisez plus dans Model deprecations.
- Nous avons ajouté le support de l'utilisation du SDK dans les navigateurs en renvoyant les en-têtes CORS dans les réponses de l'API. Définissez
dangerouslyAllowBrowser: true dans l'instanciation du SDK pour activer cette fonctionnalité.
- Nous avons déplacé les sorties de 8 192 jetons de la bêta à la disponibilité générale pour Claude Sonnet 3.5.
- Prompt caching est maintenant disponible en tant que fonctionnalité bêta dans l'API Claude. Mettez en cache et réutilisez les invites pour réduire la latence jusqu'à 80 % et les coûts jusqu'à 90 %.
- Générez des sorties jusqu'à 8 192 jetons de longueur à partir de Claude Sonnet 3.5 avec le nouvel en-tête
anthropic-beta: max-tokens-3-5-sonnet-2024-07-15.
- Générez automatiquement des cas de test pour vos invites en utilisant Claude dans la Developer Console.
- Comparez les sorties de différentes invites côte à côte dans le nouveau mode de comparaison de sortie dans la Developer Console.
- Consultez l'utilisation de l'API et la facturation ventilées par montant en dollars, nombre de jetons et clés API dans les nouveaux onglets Usage et Cost dans la Developer Console.
- Consultez vos limites de débit API actuelles dans le nouvel onglet Rate Limits dans la Developer Console.
- Claude Sonnet 3.5, notre modèle le plus intelligent à ce jour, est maintenant généralement disponible sur l'API Claude, Amazon Bedrock et Google Vertex AI.
- Tool use est maintenant généralement disponible sur l'API Claude, Amazon Bedrock et Google Vertex AI.
- Notre outil de générateur d'invites est maintenant disponible dans la Developer Console. Prompt Generator facilite la guidance de Claude pour générer des invites de haute qualité adaptées à vos tâches spécifiques. Lisez plus dans notre blog post.