Claude Opus 4.8 est le modèle de niveau Opus le plus performant d'Anthropic. Il s'appuie sur Claude Opus 4.7. Cette page résume toutes les nouveautés au lancement, y compris le « fast mode » (mode rapide, en aperçu de recherche sur l'API Claude) et une longueur minimale de prompt pouvant être mis en cache abaissée à 1 024 tokens.
| Modèle | ID de modèle API | Description |
|---|---|---|
| Claude Opus 4.8 | claude-opus-4-8 | Le modèle de niveau Opus le plus performant d'Anthropic pour le raisonnement complexe, le codage agentique à long horizon et le travail à haute autonomie |
Claude Opus 4.8 prend en charge la fenêtre de contexte de 1M de tokens par défaut sur l'API Claude, Amazon Bedrock et Vertex AI (200k sur Microsoft Foundry), 128k tokens de sortie maximum, la réflexion adaptative, ainsi que le même ensemble d'outils et de fonctionnalités de plateforme que Claude Opus 4.7.
Pour la tarification complète et les spécifications, consultez la vue d'ensemble des modèles.
Claude Opus 4.8 accepte les messages role: "system" immédiatement après un tour utilisateur dans le tableau messages (sous réserve des règles de placement). Cela vous permet d'ajouter des instructions mises à jour plus tard dans une conversation de longue durée sans répéter l'invite système complète, ce qui préserve les correspondances du cache de prompts sur les tours précédents et réduit le coût d'entrée sur les boucles agentiques. Aucun en-tête bêta n'est requis. Consultez Messages système en milieu de conversation pour les détails d'utilisation.
L'objet stop_details sur les réponses de refus (disponible depuis Claude Opus 4.7) est désormais documenté publiquement. Lorsque Claude refuse de traiter une requête, cet objet décrit la catégorie de refus, en plus de la raison d'arrêt refusal existante, ce qui permet à votre application de distinguer plus facilement les différentes classes de requêtes refusées et d'orienter l'utilisateur vers la bonne étape suivante. Aucun en-tête bêta n'est requis. Consultez Gestion des raisons d'arrêt pour la liste des catégories et les conseils de gestion.
La valeur par défaut du paramètre effort sur Claude Opus 4.8 est high sur toutes les surfaces, y compris l'API Claude et Claude Code. Si vous définissez explicitement l'effort aujourd'hui, votre réglage reste inchangé. Consultez Effort pour des conseils par niveau.
Le mode rapide est désormais disponible pour Claude Opus 4.8 en tant qu'aperçu de recherche sur l'API Claude. Définissez speed: "fast" pour obtenir jusqu'à 2,5 fois plus de tokens de sortie par seconde à partir du même modèle, à un tarif premium. Consultez Mode rapide pour l'accès, les modèles pris en charge et la tarification.
La longueur minimale de prompt pouvant être mis en cache sur Claude Opus 4.8 est de 1 024 tokens, inférieure à celle de Claude Opus 4.7. Les prompts qui étaient trop courts pour être mis en cache sur Claude Opus 4.7 peuvent désormais créer des entrées de cache sans modification de code. Consultez Mise en cache des prompts pour les minimums par modèle.
Ces contraintes sont inchangées par rapport à Claude Opus 4.7, donc le code qui fonctionne déjà sur Claude Opus 4.7 ne nécessite aucune modification. Elles s'appliquent uniquement à l'API Messages ; les Claude Managed Agents ne sont pas concernés.
Définir temperature, top_p ou top_k à une valeur autre que celle par défaut renvoie une erreur 400 sur Claude Opus 4.8, comme sur Claude Opus 4.7. Omettez ces paramètres et utilisez le prompting pour guider le comportement du modèle.
Comme Claude Opus 4.7, Claude Opus 4.8 ne prend pas en charge les budgets de réflexion étendue. Définir thinking: {"type": "enabled", "budget_tokens": N} renvoie une erreur 400. Utilisez la réflexion adaptative et le paramètre effort pour contrôler la profondeur de réflexion.
# Avant (Opus 4.6 ou antérieur)
thinking = {"type": "enabled", "budget_tokens": 32000}
# Après (Opus 4.7 et ultérieur)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}Par rapport à Claude Opus 4.7, Claude Opus 4.8 cible des améliorations comportementales dans les domaines suivants :
Avec la réflexion adaptative activée, Claude Opus 4.8 déclenche le raisonnement uniquement lorsqu'il estime que le tour en a besoin. Pour les recherches simples et les étapes agentiques courtes, il répond directement ; pour les problèmes complexes à plusieurs étapes, il raisonne avant de répondre. Cela réduit les tokens de réflexion gaspillés sur les charges de travail bimodales par rapport à Claude Opus 4.7 au même niveau d'effort. Comme sur Claude Opus 4.7, la réflexion est désactivée sauf si vous définissez explicitement thinking: {type: "adaptive"} dans votre requête.
Il ne s'agit pas de changements cassants de l'API, mais ils peuvent nécessiter des mises à jour de prompts. Consultez Migration vers Claude Opus 4.8 pour des conseils complets.
Pour des instructions de migration étape par étape et la liste de contrôle complète de migration, consultez Migration vers Claude Opus 4.8. Si vous utilisez Claude Code ou l'Agent SDK, la compétence API Claude peut appliquer automatiquement ces étapes de migration à votre base de code.
Instructions de mise à niveau étape par étape depuis Claude Opus 4.7.
Conseils sur l'effort par niveau, y compris les nouvelles valeurs par défaut.
Le seul mode de réflexion activée pris en charge sur Claude Opus 4.8.
Comment les messages système en milieu de conversation préservent les correspondances de cache.
Détails d'arrêt en cas de refus et comment les gérer.
Vitesse de sortie plus élevée à un tarif premium.
Was this page helpful?