Modèles et tarificationModèles

Nouveautés de Claude Opus 4.8

Aperçu des nouvelles fonctionnalités et des changements de comportement dans Claude Opus 4.8.

Claude Opus 4.8 est le modèle de niveau Opus le plus performant d'Anthropic. Il s'appuie sur Claude Opus 4.7. Cette page résume toutes les nouveautés au lancement, y compris le « fast mode » (mode rapide, en aperçu de recherche sur l'API Claude) et une longueur minimale de prompt pouvant être mis en cache abaissée à 1 024 tokens.

Nouveau modèle

Modèle	ID de modèle API	Description
Claude Opus 4.8	claude-opus-4-8	Le modèle de niveau Opus le plus performant d'Anthropic pour le raisonnement complexe, le codage agentique à long horizon et le travail à haute autonomie

Claude Opus 4.8 prend en charge la fenêtre de contexte de 1M de tokens par défaut sur l'API Claude, Amazon Bedrock et Vertex AI (200k sur Microsoft Foundry), 128k tokens de sortie maximum, la réflexion adaptative, ainsi que le même ensemble d'outils et de fonctionnalités de plateforme que Claude Opus 4.7.

Pour la tarification complète et les spécifications, consultez la vue d'ensemble des modèles.

Nouvelles fonctionnalités

Messages système en milieu de conversation

Claude Opus 4.8 accepte les messages role: "system" immédiatement après un tour utilisateur dans le tableau messages (sous réserve des règles de placement). Cela vous permet d'ajouter des instructions mises à jour plus tard dans une conversation de longue durée sans répéter l'invite système complète, ce qui préserve les correspondances du cache de prompts sur les tours précédents et réduit le coût d'entrée sur les boucles agentiques. Aucun en-tête bêta n'est requis. Consultez Messages système en milieu de conversation pour les détails d'utilisation.

Détails d'arrêt en cas de refus

L'objet stop_details sur les réponses de refus (disponible depuis Claude Opus 4.7) est désormais documenté publiquement. Lorsque Claude refuse de traiter une requête, cet objet décrit la catégorie de refus, en plus de la raison d'arrêt refusal existante, ce qui permet à votre application de distinguer plus facilement les différentes classes de requêtes refusées et d'orienter l'utilisateur vers la bonne étape suivante. Aucun en-tête bêta n'est requis. Consultez Gestion des raisons d'arrêt pour la liste des catégories et les conseils de gestion.

Valeurs par défaut de l'effort

La valeur par défaut du paramètre effort sur Claude Opus 4.8 est high sur toutes les surfaces, y compris l'API Claude et Claude Code. Si vous définissez explicitement l'effort aujourd'hui, votre réglage reste inchangé. Consultez Effort pour des conseils par niveau.

Mode rapide

Le mode rapide est désormais disponible pour Claude Opus 4.8 en tant qu'aperçu de recherche sur l'API Claude. Définissez speed: "fast" pour obtenir jusqu'à 2,5 fois plus de tokens de sortie par seconde à partir du même modèle, à un tarif premium. Consultez Mode rapide pour l'accès, les modèles pris en charge et la tarification.

Minimum de mise en cache des prompts abaissé

La longueur minimale de prompt pouvant être mis en cache sur Claude Opus 4.8 est de 1 024 tokens, inférieure à celle de Claude Opus 4.7. Les prompts qui étaient trop courts pour être mis en cache sur Claude Opus 4.7 peuvent désormais créer des entrées de cache sans modification de code. Consultez Mise en cache des prompts pour les minimums par modèle.

Contraintes d'API héritées de Claude Opus 4.7

Ces contraintes sont inchangées par rapport à Claude Opus 4.7, donc le code qui fonctionne déjà sur Claude Opus 4.7 ne nécessite aucune modification. Elles s'appliquent uniquement à l'API Messages ; les Claude Managed Agents ne sont pas concernés.

Paramètres d'échantillonnage non pris en charge

Définir temperature, top_p ou top_k à une valeur autre que celle par défaut renvoie une erreur 400 sur Claude Opus 4.8, comme sur Claude Opus 4.7. Omettez ces paramètres et utilisez le prompting pour guider le comportement du modèle.

La réflexion adaptative est le seul mode de réflexion

Comme Claude Opus 4.7, Claude Opus 4.8 ne prend pas en charge les budgets de réflexion étendue. Définir thinking: {"type": "enabled", "budget_tokens": N} renvoie une erreur 400. Utilisez la réflexion adaptative et le paramètre effort pour contrôler la profondeur de réflexion.

Python

# Avant (Opus 4.6 ou antérieur)
thinking = {"type": "enabled", "budget_tokens": 32000}

# Après (Opus 4.7 et ultérieur)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}

Améliorations des capacités

Domaines d'amélioration

Par rapport à Claude Opus 4.7, Claude Opus 4.8 cible des améliorations comportementales dans les domaines suivants :

Codage agentique à long horizon, avec une meilleure gestion des contextes longs, moins de compactions et une meilleure récupération après compaction.
Calibration de l'effort de raisonnement, avec un comportement plus fiable à chaque niveau d'effort dans une variété de domaines.
Déclenchement des outils, avec moins de cas où un appel d'outil requis par la tâche est omis.

Réflexion adaptative

Avec la réflexion adaptative activée, Claude Opus 4.8 déclenche le raisonnement uniquement lorsqu'il estime que le tour en a besoin. Pour les recherches simples et les étapes agentiques courtes, il répond directement ; pour les problèmes complexes à plusieurs étapes, il raisonne avant de répondre. Cela réduit les tokens de réflexion gaspillés sur les charges de travail bimodales par rapport à Claude Opus 4.7 au même niveau d'effort. Comme sur Claude Opus 4.7, la réflexion est désactivée sauf si vous définissez explicitement thinking: {type: "adaptive"} dans votre requête.

Changements de comportement

Il ne s'agit pas de changements cassants de l'API, mais ils peuvent nécessiter des mises à jour de prompts. Consultez Migration vers Claude Opus 4.8 pour des conseils complets.

Moins de tokens de réflexion gaspillés au même niveau d'effort lorsque la réflexion adaptative est activée, car le modèle décide à chaque tour s'il doit réfléchir.
Meilleur déclenchement des outils. Le modèle est moins susceptible d'omettre un appel d'outil requis par la tâche, un problème signalé par certains utilisateurs sur Claude Opus 4.7.
Meilleure gestion de la compaction et qualité du contexte long. Les longues traces agentiques restent concentrées sur la tâche avec moins de dérives après compaction.

Guide de migration

Pour des instructions de migration étape par étape et la liste de contrôle complète de migration, consultez Migration vers Claude Opus 4.8. Si vous utilisez Claude Code ou l'Agent SDK, la compétence API Claude peut appliquer automatiquement ces étapes de migration à votre base de code.

Prochaines étapes

Guide de migration

Instructions de mise à niveau étape par étape depuis Claude Opus 4.7.

Effort

Conseils sur l'effort par niveau, y compris les nouvelles valeurs par défaut.

Réflexion adaptative

Le seul mode de réflexion activée pris en charge sur Claude Opus 4.8.

Mise en cache des prompts

Comment les messages système en milieu de conversation préservent les correspondances de cache.

Gestion des raisons d'arrêt

Détails d'arrêt en cas de refus et comment les gérer.

Mode rapide

Vitesse de sortie plus élevée à un tarif premium.

Was this page helpful?

Modèles et tarificationModèles

Nouveautés de Claude Opus 4.8

Aperçu des nouvelles fonctionnalités et des changements de comportement dans Claude Opus 4.8.

Nouveau modèle

Modèle	ID de modèle API	Description
Claude Opus 4.8	claude-opus-4-8	Le modèle de niveau Opus le plus performant d'Anthropic pour le raisonnement complexe, le codage agentique à long horizon et le travail à haute autonomie

Pour la tarification complète et les spécifications, consultez la vue d'ensemble des modèles.

Nouvelles fonctionnalités

Messages système en milieu de conversation

Détails d'arrêt en cas de refus

Valeurs par défaut de l'effort

Mode rapide

Minimum de mise en cache des prompts abaissé

Contraintes d'API héritées de Claude Opus 4.7

Paramètres d'échantillonnage non pris en charge

La réflexion adaptative est le seul mode de réflexion

Python

# Avant (Opus 4.6 ou antérieur)
thinking = {"type": "enabled", "budget_tokens": 32000}

# Après (Opus 4.7 et ultérieur)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}

Améliorations des capacités

Domaines d'amélioration

Par rapport à Claude Opus 4.7, Claude Opus 4.8 cible des améliorations comportementales dans les domaines suivants :

Codage agentique à long horizon, avec une meilleure gestion des contextes longs, moins de compactions et une meilleure récupération après compaction.
Calibration de l'effort de raisonnement, avec un comportement plus fiable à chaque niveau d'effort dans une variété de domaines.
Déclenchement des outils, avec moins de cas où un appel d'outil requis par la tâche est omis.

Réflexion adaptative

Changements de comportement

Il ne s'agit pas de changements cassants de l'API, mais ils peuvent nécessiter des mises à jour de prompts. Consultez Migration vers Claude Opus 4.8 pour des conseils complets.

Moins de tokens de réflexion gaspillés au même niveau d'effort lorsque la réflexion adaptative est activée, car le modèle décide à chaque tour s'il doit réfléchir.
Meilleur déclenchement des outils. Le modèle est moins susceptible d'omettre un appel d'outil requis par la tâche, un problème signalé par certains utilisateurs sur Claude Opus 4.7.
Meilleure gestion de la compaction et qualité du contexte long. Les longues traces agentiques restent concentrées sur la tâche avec moins de dérives après compaction.

Guide de migration

Prochaines étapes

Guide de migration

Instructions de mise à niveau étape par étape depuis Claude Opus 4.7.

Effort

Conseils sur l'effort par niveau, y compris les nouvelles valeurs par défaut.

Réflexion adaptative

Le seul mode de réflexion activée pris en charge sur Claude Opus 4.8.

Mise en cache des prompts

Comment les messages système en milieu de conversation préservent les correspondances de cache.

Gestion des raisons d'arrêt

Détails d'arrêt en cas de refus et comment les gérer.

Mode rapide

Vitesse de sortie plus élevée à un tarif premium.

Was this page helpful?

Nouveau modèle

Nouvelles fonctionnalités

Messages système en milieu de conversation

Détails d'arrêt en cas de refus

Valeurs par défaut de l'effort

Mode rapide

Minimum de mise en cache des prompts abaissé

Contraintes d'API héritées de Claude Opus 4.7

Paramètres d'échantillonnage non pris en charge

La réflexion adaptative est le seul mode de réflexion

Améliorations des capacités

Domaines d'amélioration

Réflexion adaptative

Changements de comportement

Guide de migration

Prochaines étapes

Nouveau modèle

Nouvelles fonctionnalités

Messages système en milieu de conversation

Détails d'arrêt en cas de refus

Valeurs par défaut de l'effort

Mode rapide

Minimum de mise en cache des prompts abaissé

Contraintes d'API héritées de Claude Opus 4.7

Paramètres d'échantillonnage non pris en charge

La réflexion adaptative est le seul mode de réflexion

Améliorations des capacités

Domaines d'amélioration

Réflexion adaptative

Changements de comportement

Guide de migration

Prochaines étapes

Nouveau modèle

Nouvelles fonctionnalités

Messages système en milieu de conversation

Détails d'arrêt en cas de refus

Valeurs par défaut de l'effort

Mode rapide

Minimum de mise en cache des prompts abaissé

Contraintes d'API héritées de Claude Opus 4.7

Paramètres d'échantillonnage non pris en charge

La réflexion adaptative est le seul mode de réflexion

Améliorations des capacités

Domaines d'amélioration

Réflexion adaptative

Changements de comportement

Guide de migration

Prochaines étapes

Nouveau modèle

Nouvelles fonctionnalités

Messages système en milieu de conversation

Détails d'arrêt en cas de refus

Valeurs par défaut de l'effort

Mode rapide

Minimum de mise en cache des prompts abaissé

Contraintes d'API héritées de Claude Opus 4.7

Paramètres d'échantillonnage non pris en charge

La réflexion adaptative est le seul mode de réflexion

Améliorations des capacités

Domaines d'amélioration

Réflexion adaptative

Changements de comportement

Guide de migration

Prochaines étapes