Loading...
    • Guide du développeur
    • Référence API
    • MCP
    • Ressources
    • Notes de version
    Search...
    ⌘K
    Premiers pas
    Introduction à ClaudeDémarrage rapide
    Modèles et tarification
    Aperçu des modèlesChoisir un modèleNouveautés dans Claude 4.6Guide de migrationDépréciation des modèlesTarification
    Créer avec Claude
    Aperçu des fonctionnalitésUtiliser l'API MessagesGérer les raisons d'arrêtMeilleures pratiques de prompting
    Gestion du contexte
    Fenêtres de contexteCompactionÉdition du contexte
    Capacités
    Mise en cache des promptsRéflexion étendueRéflexion adaptativeEffortStreaming de messagesTraitement par lotsCitationsSupport multilingueComptage des tokensEmbeddingsVisionSupport PDFAPI FilesRésultats de rechercheSorties structurées
    Outils
    AperçuComment implémenter l'utilisation d'outilsStreaming d'outils granulaireOutil BashOutil d'exécution de codeAppel d'outils programmatiqueOutil Computer useOutil Éditeur de texteOutil Web fetchOutil Web searchOutil MémoireOutil Tool search
    Compétences d'agent
    AperçuDémarrage rapideMeilleures pratiquesCompétences pour l'entrepriseUtiliser les compétences avec l'API
    SDK Agent
    AperçuDémarrage rapideSDK TypeScriptTypeScript V2 (aperçu)SDK PythonGuide de migration
    MCP dans l'API
    Connecteur MCPServeurs MCP distants
    Claude sur les plateformes tierces
    Amazon BedrockMicrosoft FoundryVertex AI
    Ingénierie des prompts
    AperçuGénérateur de promptsUtiliser les modèles de promptsAméliorateur de promptsÊtre clair et directUtiliser des exemples (prompting multi-coups)Laisser Claude réfléchir (CoT)Utiliser les balises XMLDonner un rôle à Claude (prompts système)Enchaîner les prompts complexesConseils pour le contexte longConseils pour la réflexion étendue
    Tester et évaluer
    Définir les critères de succèsDévelopper des cas de testUtiliser l'outil d'évaluationRéduire la latence
    Renforcer les garde-fous
    Réduire les hallucinationsAugmenter la cohérence des résultatsAtténuer les jailbreaksRefus en streamingRéduire les fuites de promptsGarder Claude dans le rôle
    Administration et surveillance
    Aperçu de l'API AdminRésidence des donnéesEspaces de travailAPI d'utilisation et de coûtsAPI Claude Code AnalyticsRétention zéro des données
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Modèles et tarification

    Quoi de neuf dans Claude 4.6

    Aperçu des nouvelles fonctionnalités et capacités de Claude Opus 4.6.

    Claude 4.6 représente la prochaine génération de modèles Claude, apportant des capacités nouvelles significatives et des améliorations d'API. Cette page résume toutes les nouvelles fonctionnalités disponibles au lancement.

    Nouveaux modèles

    ModèleID du modèle APIDescription
    Claude Opus 4.6claude-opus-4-6Notre modèle le plus intelligent pour construire des agents et du codage

    Claude Opus 4.6 supporte une fenêtre de contexte de 200K (avec fenêtre de contexte de 1M tokens disponible en bêta), 128K tokens de sortie maximum, la réflexion étendue, et toutes les fonctionnalités existantes de l'API Claude.

    Pour les tarifs complets et les spécifications, consultez l'aperçu des modèles.

    Nouvelles fonctionnalités

    Mode de réflexion adaptatif

    La réflexion adaptative (thinking: {type: "adaptive"}) est le mode de réflexion recommandé pour Opus 4.6. Claude décide dynamiquement quand et combien réfléchir. Au niveau d'effort par défaut (high), Claude réfléchira presque toujours. Aux niveaux d'effort inférieur, il peut ignorer la réflexion pour les problèmes plus simples.

    thinking: {type: "enabled"} et budget_tokens sont dépréciés sur Opus 4.6. Ils restent fonctionnels mais seront supprimés dans une future version du modèle. Utilisez la réflexion adaptative et le paramètre d'effort pour contrôler la profondeur de réflexion à la place. La réflexion adaptative active également automatiquement la réflexion entrelacée.

    response = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=16000,
        thinking={"type": "adaptive"},
        messages=[{"role": "user", "content": "Solve this complex problem..."}]
    )

    Paramètre d'effort GA

    Le paramètre d'effort est maintenant généralement disponible (aucun en-tête bêta requis). Un nouveau niveau d'effort max fournit la capacité absolue la plus élevée sur Opus 4.6. Combinez l'effort avec la réflexion adaptative pour des compromis coût-qualité optimaux.

    API de compaction (bêta)

    La compaction fournit un résumé de contexte automatique côté serveur, permettant des conversations effectivement infinies. Lorsque le contexte approche de la limite de la fenêtre, l'API résume automatiquement les parties antérieures de la conversation.

    Streaming d'outils à granularité fine (GA)

    Le streaming d'outils à granularité fine est maintenant généralement disponible sur tous les modèles et plates-formes. Aucun en-tête bêta n'est requis.

    128K tokens de sortie

    Opus 4.6 supporte jusqu'à 128K tokens de sortie, doublant la limite précédente de 64K. Cela permet des budgets de réflexion plus longs et des réponses plus complètes. Les SDK nécessitent le streaming pour les demandes avec de grandes valeurs max_tokens pour éviter les délais d'expiration HTTP. Si vous n'avez pas besoin de traiter les événements de manière incrémentale, utilisez .stream() avec .get_final_message() pour obtenir la réponse complète — consultez Streaming Messages pour plus de détails.

    Contrôles de résidence des données

    Les contrôles de résidence des données vous permettent de spécifier où l'inférence du modèle s'exécute en utilisant le paramètre inference_geo. Vous pouvez choisir le routage "global" (par défaut) ou "us" par demande. L'inférence réservée aux États-Unis est facturée à 1,1x sur Claude Opus 4.6 et les modèles plus récents.

    Dépréciations

    type: "enabled" et budget_tokens

    thinking: {type: "enabled", budget_tokens: N} est déprécié sur Opus 4.6. Il reste fonctionnel mais sera supprimé dans une future version du modèle. Migrez vers thinking: {type: "adaptive"} avec le paramètre d'effort.

    En-tête bêta interleaved-thinking-2025-05-14

    L'en-tête bêta interleaved-thinking-2025-05-14 est déprécié sur Opus 4.6. Il est ignoré en toute sécurité s'il est inclus, mais n'est plus requis. La réflexion adaptative active automatiquement la réflexion entrelacée. Supprimez betas=["interleaved-thinking-2025-05-14"] de vos demandes lors de l'utilisation d'Opus 4.6.

    output_format

    Le paramètre output_format pour les sorties structurées a été déplacé vers output_config.format. L'ancien paramètre reste fonctionnel mais est déprécié et sera supprimé dans une future version du modèle.

    # Before
    response = client.messages.create(
        output_format={"type": "json_schema", "schema": {...}},
        ...
    )
    
    # After
    response = client.messages.create(
        output_config={"format": {"type": "json_schema", "schema": {...}}},
        ...
    )

    Changements de rupture

    Suppression du préremplissage

    Le préremplissage des messages d'assistant (préremplissages du dernier tour d'assistant) n'est pas supporté sur Opus 4.6. Les demandes avec des messages d'assistant préremplis retournent une erreur 400.

    Alternatives :

    • Sorties structurées pour contrôler le format de réponse
    • Instructions du message système pour guider le style de réponse
    • output_config.format pour la sortie JSON

    Guillemets des paramètres d'outils

    Opus 4.6 peut produire un échappement de chaîne JSON légèrement différent dans les arguments d'appel d'outils (par exemple, gestion différente des échappements Unicode ou de l'échappement des barres obliques). Les analyseurs JSON standard gèrent ces différences automatiquement. Si vous analysez l'input d'appel d'outils en tant que chaîne brute plutôt que d'utiliser json.loads() ou JSON.parse(), vérifiez que votre logique d'analyse fonctionne toujours.

    Guide de migration

    Pour les instructions de migration étape par étape, consultez Migration vers Claude 4.6.

    Étapes suivantes

    Réflexion adaptative

    Apprenez comment utiliser le mode de réflexion adaptatif.

    Aperçu des modèles

    Comparez tous les modèles Claude.

    Compaction

    Explorez la compaction de contexte côté serveur.

    Guide de migration

    Instructions de migration étape par étape.

    Was this page helpful?

    • Nouveaux modèles
    • Nouvelles fonctionnalités
    • Mode de réflexion adaptatif
    • Paramètre d'effort GA
    • API de compaction (bêta)
    • Streaming d'outils à granularité fine (GA)
    • 128K tokens de sortie
    • Contrôles de résidence des données
    • Dépréciations
    • type: "enabled" et budget_tokens
    • En-tête bêta interleaved-thinking-2025-05-14
    • output_format
    • Changements de rupture
    • Suppression du préremplissage
    • Guillemets des paramètres d'outils
    • Guide de migration
    • Étapes suivantes