Loading...
    • Guide du développeur
    • Référence API
    • MCP
    • Ressources
    • Notes de version
    Search...
    ⌘K

    Premiers pas

    Introduction à ClaudeDémarrage rapide

    Modèles et tarification

    Aperçu des modèlesChoisir un modèleNouveautés dans Claude 4.5Migration vers Claude 4.5Dépréciations de modèlesTarification

    Créer avec Claude

    Aperçu des fonctionnalitésTravailler avec l'API MessagesFenêtres de contexteMeilleures pratiques de prompting

    Capacités

    Mise en cache des invitesÉdition du contexteRéflexion étendueMessages en streamingTraitement par lotsCitationsSupport multilingueComptage de tokensEmbeddingsVisionSupport PDFAPI FilesRésultats de rechercheExtension Google Sheets

    Outils

    AperçuComment implémenter l'utilisation d'outilsUtilisation efficace des outils en termes de jetonsStreaming d'outils à granularité fineOutil BashOutil d'exécution de codeOutil d'utilisation d'ordinateurOutil d'éditeur de texteOutil de récupération webOutil de recherche webOutil de mémoire

    Compétences de l'Agent

    Compétences d'AgentCommencer avec les Agent Skills dans l'APIBonnes pratiques de création de SkillsUtilisation des compétences

    SDK Agent

    AperçuRéférence du SDK Agent - TypeScriptRéférence du SDK Agent - Python

    Guides

    Entrée en StreamingGestion des PermissionsGestion des SessionsHébergement du SDK AgentModification des invites systèmeMCP dans le SDKOutils PersonnalisésSous-agents dans le SDKCommandes Slash dans le SDKCompétences d'agent dans le SDKSuivi des Coûts et de l'UtilisationListes de TâchesPlugins dans le SDK

    MCP dans l'API

    Connecteur MCPServeurs MCP distants

    Claude sur les plateformes tierces

    Amazon BedrockVertex AI

    Ingénierie des prompts

    AperçuGénérateur de promptsUtiliser des modèles de promptsAméliorateur de promptsSoyez clair et directUtiliser des exemples (prompting multishot)Laissez Claude réfléchir (CoT)Utiliser les balises XMLDonner un rôle à Claude (invites système)Préremplissez la réponse de ClaudeEnchaîner des prompts complexesConseils contexte longConseils pour la réflexion étendue

    Tester et évaluer

    Définir les critères de réussiteDévelopper des cas de testUtilisation de l'outil d'évaluationRéduction de la latence

    Renforcer les garde-fous

    Réduire les hallucinationsAméliorer la cohérenceAtténuer les jailbreakshandle-streaming-refusalsRéduire la fuite de promptGarder Claude dans son rôle

    Administration et surveillance

    Aperçu de l'API AdminAPI d'utilisation et de coûtAPI Claude Code Analytics
    Console
    Créer avec Claude

    Fenêtres de contexte

    Comprendre les fenêtres de contexte de Claude, y compris la pensée étendue, l'utilisation d'outils et la gestion des jetons.

    Comprendre la fenêtre de contexte

    La "fenêtre de contexte" fait référence à l'intégralité de la quantité de texte qu'un modèle de langage peut consulter et référencer lors de la génération de nouveau texte, plus le nouveau texte qu'il génère. Ceci est différent du large corpus de données sur lequel le modèle de langage a été entraîné, et représente plutôt une "mémoire de travail" pour le modèle. Une fenêtre de contexte plus large permet au modèle de comprendre et de répondre à des invites plus complexes et plus longues, tandis qu'une fenêtre de contexte plus petite peut limiter la capacité du modèle à gérer des invites plus longues ou à maintenir la cohérence lors de conversations étendues.

    Le diagramme ci-dessous illustre le comportement standard de la fenêtre de contexte pour les requêtes API1 :

    Diagramme de fenêtre de contexte

    1Pour les interfaces de chat, comme pour claude.ai, les fenêtres de contexte peuvent également être configurées sur un système rotatif "premier entré, premier sorti".

    • Accumulation progressive des jetons : Au fur et à mesure que la conversation progresse à travers les tours, chaque message utilisateur et réponse de l'assistant s'accumule dans la fenêtre de contexte. Les tours précédents sont préservés complètement.
    • Modèle de croissance linéaire : L'utilisation du contexte croît linéairement à chaque tour, avec les tours précédents préservés complètement.
    • Capacité de 200K jetons : La fenêtre de contexte totale disponible (200 000 jetons) représente la capacité maximale pour stocker l'historique de conversation et générer une nouvelle sortie de Claude.
    • Flux entrée-sortie : Chaque tour consiste en :
      • Phase d'entrée : Contient tout l'historique de conversation précédent plus le message utilisateur actuel
      • Phase de sortie : Génère une réponse textuelle qui devient partie d'une entrée future

    La fenêtre de contexte avec la pensée étendue

    Lors de l'utilisation de la pensée étendue, tous les jetons d'entrée et de sortie, y compris les jetons utilisés pour la réflexion, comptent vers la limite de la fenêtre de contexte, avec quelques nuances dans les situations multi-tours.

    Les jetons du budget de réflexion sont un sous-ensemble de votre paramètre max_tokens, sont facturés comme jetons de sortie, et comptent vers les limites de taux.

    Cependant, les blocs de réflexion précédents sont automatiquement supprimés du calcul de la fenêtre de contexte par l'API Claude et ne font pas partie de l'historique de conversation que le modèle "voit" pour les tours suivants, préservant la capacité de jetons pour le contenu de conversation réel.

    Le diagramme ci-dessous démontre la gestion spécialisée des jetons lorsque la pensée étendue est activée :

    Diagramme de fenêtre de contexte avec pensée étendue

    • Suppression de la pensée étendue : Les blocs de pensée étendue (montrés en gris foncé) sont générés pendant la phase de sortie de chaque tour, mais ne sont pas transmis comme jetons d'entrée pour les tours suivants. Vous n'avez pas besoin de supprimer les blocs de réflexion vous-même. L'API Claude fait cela automatiquement pour vous si vous les renvoyez.
    • Détails d'implémentation technique :
      • L'API exclut automatiquement les blocs de réflexion des tours précédents lorsque vous les renvoyez dans le cadre de l'historique de conversation.
      • Les jetons de pensée étendue sont facturés comme jetons de sortie une seule fois, lors de leur génération.
      • Le calcul effectif de la fenêtre de contexte devient : context_window = (input_tokens - previous_thinking_tokens) + current_turn_tokens.
      • Les jetons de réflexion incluent à la fois les blocs thinking et redacted_thinking.

    Cette architecture est efficace en jetons et permet un raisonnement extensif sans gaspillage de jetons, car les blocs de réflexion peuvent être substantiels en longueur.

    Vous pouvez en lire plus sur la fenêtre de contexte et la pensée étendue dans notre guide de pensée étendue.

    La fenêtre de contexte avec la pensée étendue et l'utilisation d'outils

    Le diagramme ci-dessous illustre la gestion des jetons de la fenêtre de contexte lors de la combinaison de la pensée étendue avec l'utilisation d'outils :

    Diagramme de fenêtre de contexte avec pensée étendue et utilisation d'outils

    1. 1

      Architecture du premier tour

      • Composants d'entrée : Configuration des outils et message utilisateur
      • Composants de sortie : Pensée étendue + réponse textuelle + demande d'utilisation d'outil
      • Calcul des jetons : Tous les composants d'entrée et de sortie comptent vers la fenêtre de contexte, et tous les composants de sortie sont facturés comme jetons de sortie.
    2. 2

      Gestion du résultat d'outil (tour 2)

      • Composants d'entrée : Chaque bloc du premier tour ainsi que le tool_result. Le bloc de pensée étendue doit être retourné avec les résultats d'outils correspondants. C'est le seul cas où vous devez retourner les blocs de réflexion.
      • Composants de sortie : Après que les résultats d'outils ont été renvoyés à Claude, Claude répondra avec seulement du texte (pas de pensée étendue supplémentaire jusqu'au prochain message user).
      • Calcul des jetons : Tous les composants d'entrée et de sortie comptent vers la fenêtre de contexte, et tous les composants de sortie sont facturés comme jetons de sortie.
    3. 3

      Troisième étape

      • Composants d'entrée : Toutes les entrées et la sortie du tour précédent sont transmises à l'exception du bloc de réflexion, qui peut maintenant être supprimé maintenant que Claude a terminé tout le cycle d'utilisation d'outil. L'API supprimera automatiquement le bloc de réflexion pour vous si vous le renvoyez, ou vous pouvez vous sentir libre de le supprimer vous-même à cette étape. C'est aussi là où vous ajouteriez le prochain tour User.
      • Composants de sortie : Puisqu'il y a un nouveau tour User en dehors du cycle d'utilisation d'outil, Claude générera un nouveau bloc de pensée étendue et continuera à partir de là.
      • Calcul des jetons : Les jetons de réflexion précédents sont automatiquement supprimés des calculs de fenêtre de contexte. Tous les autres blocs précédents comptent toujours comme partie de la fenêtre de jetons, et le bloc de réflexion dans le tour Assistant actuel compte comme partie de la fenêtre de contexte.
    • Considérations pour l'utilisation d'outils avec la pensée étendue :
      • Lors de la publication des résultats d'outils, le bloc de réflexion entier non modifié qui accompagne cette demande d'outil spécifique (y compris les portions de signature/expurgées) doit être inclus.
      • Le calcul effectif de la fenêtre de contexte pour la pensée étendue avec l'utilisation d'outils devient : context_window = input_tokens + current_turn_tokens.
      • Le système utilise des signatures cryptographiques pour vérifier l'authenticité du bloc de réflexion. Ne pas préserver les blocs de réflexion pendant l'utilisation d'outils peut briser la continuité de raisonnement de Claude. Ainsi, si vous modifiez les blocs de réflexion, l'API retournera une erreur.

    Les modèles Claude 4 supportent la pensée entrelacée, qui permet à Claude de réfléchir entre les appels d'outils et de faire un raisonnement plus sophistiqué après avoir reçu les résultats d'outils.

    Claude Sonnet 3.7 ne supporte pas la pensée entrelacée, donc il n'y a pas d'entrelacement de pensée étendue et d'appels d'outils sans un tour utilisateur non-tool_result entre les deux.

    Pour plus d'informations sur l'utilisation d'outils avec la pensée étendue, voir notre guide de pensée étendue.

    Fenêtre de contexte de 1M jetons

    Claude Sonnet 4 et 4.5 supportent une fenêtre de contexte d'un million de jetons. Cette fenêtre de contexte étendue vous permet de traiter des documents beaucoup plus volumineux, de maintenir des conversations plus longues, et de travailler avec des bases de code plus étendues.

    La fenêtre de contexte de 1M jetons est actuellement en bêta pour les organisations dans le niveau d'utilisation 4 et les organisations avec des limites de taux personnalisées. La fenêtre de contexte de 1M jetons n'est disponible que pour Claude Sonnet 4 et Sonnet 4.5.

    Pour utiliser la fenêtre de contexte de 1M jetons, incluez l'en-tête bêta context-1m-2025-08-07 dans vos requêtes API :

    Python
    from anthropic import Anthropic
    
    client = Anthropic()
    
    response = client.beta.messages.create(
        model="claude-sonnet-4-5",
        max_tokens=1024,
        messages=[
            {"role": "user", "content": "Traiter ce document volumineux..."}
        ],
        betas=["context-1m-2025-08-07"]
    )
    TypeScript
    import Anthropic from '@anthropic-ai/sdk';
    
    const anthropic = new Anthropic();
    
    const msg = await anthropic.beta.messages.create({
      model: 'claude-sonnet-4-5',
      max_tokens: 1024,
      messages: [
        { role: 'user', content: 'Traiter ce document volumineux...' }
      ],
      betas: ['context-1m-2025-08-07']
    });
    cURL
    curl https://api.anthropic.com/v1/messages \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "anthropic-beta: context-1m-2025-08-07" \
      -H "content-type: application/json" \
      -d '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 1024,
        "messages": [
          {"role": "user", "content": "Traiter ce document volumineux..."}
        ]
      }'

    Considérations importantes :

    • Statut bêta : Il s'agit d'une fonctionnalité bêta sujette à changement. Les fonctionnalités et la tarification peuvent être modifiées ou supprimées dans les versions futures.
    • Exigence de niveau d'utilisation : La fenêtre de contexte de 1M jetons est disponible pour les organisations dans le niveau d'utilisation 4 et les organisations avec des limites de taux personnalisées. Les organisations de niveau inférieur doivent avancer au niveau d'utilisation 4 pour accéder à cette fonctionnalité.
    • Disponibilité : La fenêtre de contexte de 1M jetons est actuellement disponible sur l'API Claude, Amazon Bedrock, et Vertex AI de Google Cloud.
    • Tarification : Les requêtes dépassant 200K jetons sont automatiquement facturées aux tarifs premium (2x entrée, 1,5x sortie). Voir la documentation de tarification pour les détails.
    • Limites de taux : Les requêtes de contexte long ont des limites de taux dédiées. Voir la documentation des limites de taux pour les détails.
    • Considérations multimodales : Lors du traitement d'un grand nombre d'images ou de PDF, soyez conscient que les fichiers peuvent varier dans l'utilisation des jetons. Lors de l'association d'une grande invite avec un grand nombre d'images, vous pourriez atteindre les limites de taille de requête.

    Conscience du contexte dans Claude Sonnet 4.5 et Haiku 4.5

    Claude Sonnet 4.5 et Claude Haiku 4.5 disposent de la conscience du contexte, permettant à ces modèles de suivre leur fenêtre de contexte restante (c'est-à-dire le "budget de jetons") tout au long d'une conversation. Cela permet à Claude d'exécuter des tâches et de gérer le contexte plus efficacement en comprenant combien d'espace il a pour travailler. Claude est nativement entraîné à utiliser ce contexte précisément pour persister dans la tâche jusqu'à la toute fin, plutôt que de devoir deviner combien de jetons restent. Pour un modèle, manquer de conscience du contexte c'est comme concourir dans une émission de cuisine sans horloge. Les modèles Claude 4.5 changent cela en informant explicitement le modèle de son contexte restant, afin qu'il puisse tirer le maximum d'avantage des jetons disponibles.

    Comment cela fonctionne :

    Au début d'une conversation, Claude reçoit des informations sur sa fenêtre de contexte totale :

    <budget:token_budget>200000</budget:token_budget>

    Le budget est fixé à 200K jetons (standard), 500K jetons (Claude.ai Enterprise), ou 1M jetons (bêta, pour les organisations éligibles).

    Après chaque appel d'outil, Claude reçoit une mise à jour sur la capacité restante :

    <system_warning>Utilisation des jetons : 35000/200000 ; 165000 restants</system_warning>

    Cette conscience aide Claude à déterminer combien de capacité reste pour le travail et permet une exécution plus efficace sur les tâches de longue durée. Les jetons d'image sont inclus dans ces budgets.

    Avantages :

    La conscience du contexte est particulièrement précieuse pour :

    • Les sessions d'agent de longue durée qui nécessitent une concentration soutenue
    • Les flux de travail multi-fenêtres de contexte où les transitions d'état importent
    • Les tâches complexes nécessitant une gestion soigneuse des jetons

    Pour des conseils d'invite sur l'exploitation de la conscience du contexte, voir notre guide des meilleures pratiques Claude 4.

    Gestion de la fenêtre de contexte avec les modèles Claude plus récents

    Dans les modèles Claude plus récents (à partir de Claude Sonnet 3.7), si la somme des jetons d'invite et des jetons de sortie dépasse la fenêtre de contexte du modèle, le système retournera une erreur de validation plutôt que de tronquer silencieusement le contexte. Ce changement fournit un comportement plus prévisible mais nécessite une gestion plus soigneuse des jetons.

    Pour planifier votre utilisation des jetons et vous assurer de rester dans les limites de la fenêtre de contexte, vous pouvez utiliser l'API de comptage de jetons pour estimer combien de jetons vos messages utiliseront avant de les envoyer à Claude.

    Voir notre tableau de comparaison de modèles pour une liste des tailles de fenêtre de contexte par modèle.

    Prochaines étapes

    Tableau de comparaison des modèles

    Voir notre tableau de comparaison des modèles pour une liste des tailles de fenêtre de contexte et de la tarification des jetons d'entrée / sortie par modèle.

    Aperçu de la pensée étendue

    Apprenez-en plus sur le fonctionnement de la pensée étendue et comment l'implémenter aux côtés d'autres fonctionnalités telles que l'utilisation d'outils et la mise en cache d'invites.

    • Comprendre la fenêtre de contexte
    • La fenêtre de contexte avec la pensée étendue
    • La fenêtre de contexte avec la pensée étendue et l'utilisation d'outils
    • Fenêtre de contexte de 1M jetons
    • Conscience du contexte dans Claude Sonnet 4.5 et Haiku 4.5
    • Gestion de la fenêtre de contexte avec les modèles Claude plus récents
    © 2025 ANTHROPIC PBC

    Products

    • Claude
    • Claude Code
    • Max plan
    • Team plan
    • Enterprise plan
    • Download app
    • Pricing
    • Log in

    Features

    • Claude and Slack
    • Claude in Excel

    Models

    • Opus
    • Sonnet
    • Haiku

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Claude Developer Platform

    • Overview
    • Developer docs
    • Pricing
    • Amazon Bedrock
    • Google Cloud’s Vertex AI
    • Console login

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Help and security

    • Availability
    • Status
    • Support center

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy

    Products

    • Claude
    • Claude Code
    • Max plan
    • Team plan
    • Enterprise plan
    • Download app
    • Pricing
    • Log in

    Features

    • Claude and Slack
    • Claude in Excel

    Models

    • Opus
    • Sonnet
    • Haiku

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Claude Developer Platform

    • Overview
    • Developer docs
    • Pricing
    • Amazon Bedrock
    • Google Cloud’s Vertex AI
    • Console login

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Help and security

    • Availability
    • Status
    • Support center

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    © 2025 ANTHROPIC PBC