CLI, SDK et bibliothèquesSDK clients

SDK Python

Installez et configurez le SDK Python d'Anthropic avec la prise en charge des clients synchrones et asynchrones

Le SDK Python d'Anthropic offre un accès pratique à l'API REST d'Anthropic depuis des applications Python. Il prend en charge les opérations synchrones et asynchrones, le streaming, ainsi que les intégrations avec Amazon Bedrock, Claude Platform sur AWS, Google Cloud et Microsoft Foundry.

Pour la documentation des fonctionnalités de l'API avec des exemples de code, consultez la référence API. Cette page couvre les fonctionnalités et la configuration du SDK spécifiques à Python.

Installation

pip install anthropic

Pour les intégrations spécifiques à une plateforme ou pour de meilleures performances asynchrones, installez avec les extras :

# Pour la prise en charge d'Amazon Bedrock
pip install "anthropic[bedrock]"

# Pour la prise en charge de Google Cloud
pip install "anthropic[vertex]"

# Pour la prise en charge de Claude Platform sur AWS
pip install "anthropic[aws]"

# La prise en charge de Microsoft Foundry est incluse dans le package de base

# Pour de meilleures performances asynchrones avec aiohttp
pip install "anthropic[aiohttp]"

Prérequis

Python 3.9 ou version ultérieure est requis.

Utilisation

import os
from anthropic import Anthropic

client = Anthropic(
    # Il s'agit de la valeur par défaut et elle peut être omise
    api_key=os.environ.get("ANTHROPIC_API_KEY"),
)

message = client.messages.create(
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": "Hello, Claude",
        }
    ],
    model="claude-opus-5",
)

for block in message.content:
    if block.type == "text":
        print(block.text)

Envisagez d'utiliser python-dotenv pour ajouter ANTHROPIC_API_KEY="my-anthropic-api-key" à votre fichier .env afin que votre clé API ne soit pas stockée dans le contrôle de source.

Pour les options d'authentification, y compris Workload Identity Federation, consultez Authentification.

Utilisation asynchrone

import os
import asyncio
from anthropic import AsyncAnthropic

client = AsyncAnthropic(
    api_key=os.environ.get("ANTHROPIC_API_KEY"),
)


async def main() -> None:
    message = await client.messages.create(
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": "Hello, Claude",
            }
        ],
        model="claude-opus-5",
    )
    print(message.content)


asyncio.run(main())

Utilisation d'aiohttp pour une meilleure concurrence

Pour de meilleures performances asynchrones, vous pouvez utiliser le backend HTTP aiohttp au lieu du httpx par défaut :

import os
import asyncio
from anthropic import AsyncAnthropic, DefaultAioHttpClient


async def main() -> None:
    async with AsyncAnthropic(
        api_key=os.environ.get("ANTHROPIC_API_KEY"),
        http_client=DefaultAioHttpClient(),
    ) as client:
        message = await client.messages.create(
            max_tokens=1024,
            messages=[
                {
                    "role": "user",
                    "content": "Hello, Claude",
                }
            ],
            model="claude-opus-5",
        )
        print(message.content)


asyncio.run(main())

Réponses en streaming

Le SDK prend en charge les réponses en streaming à l'aide des « Server-Sent Events » (événements envoyés par le serveur), ou SSE.

client = Anthropic()

stream = client.messages.create(
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": "Hello, Claude",
        }
    ],
    model="claude-opus-5",
    stream=True,
)
for event in stream:
    print(event.type)

Le client asynchrone utilise exactement la même interface :

client = AsyncAnthropic()

stream = await client.messages.create(
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": "Hello, Claude",
        }
    ],
    model="claude-opus-5",
    stream=True,
)
async for event in stream:
    print(event.type)

Assistants de streaming

Le SDK fournit également des assistants de streaming qui utilisent des gestionnaires de contexte et donnent accès au texte accumulé et au message final :

async def main() -> None:
    async with client.messages.stream(
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": "Say hello there!",
            }
        ],
        model="claude-opus-5",
    ) as stream:
        async for text in stream.text_stream:
            print(text, end="", flush=True)
        print()

        message = await stream.get_final_message()
        print(message.to_json())


asyncio.run(main())

Le streaming avec client.messages.stream(...) expose divers assistants, notamment l'accumulation et des événements spécifiques au SDK.

Vous pouvez également utiliser client.messages.create(..., stream=True) qui renvoie uniquement un itérable des événements du flux et utilise moins de mémoire (il ne construit pas d'objet de message final pour vous).

Comptage de tokens

Vous pouvez voir l'utilisation exacte pour une requête donnée via la propriété de réponse usage :

message = client.messages.create(...)
print(message.usage)
# Usage(input_tokens=25, output_tokens=13)

Vous pouvez également compter les tokens avant d'effectuer une requête :

count = client.messages.count_tokens(
    model="claude-opus-5", messages=[{"role": "user", "content": "Hello, world"}]
)
print(count.input_tokens)  # 10

Utilisation d'outils

Ce SDK prend en charge l'utilisation d'outils, également appelée appel de fonctions. Pour plus de détails, consultez Utilisation d'outils avec Claude.

Assistants d'outils

Le SDK fournit des assistants pour définir et exécuter des outils en tant que fonctions Python pures. Le décorateur @beta_tool génère le schéma de l'outil à partir de la signature de la fonction et de la docstring :

import json
from anthropic import Anthropic, beta_tool

client = Anthropic()


@beta_tool
def get_weather(location: str) -> str:
    """Get the weather for a given location.

    Args:
        location: The city and state, for example, San Francisco, CA
    Returns:
        A JSON-encoded string with the location, temperature, and weather condition.
    """
    return json.dumps(
        {
            "location": location,
            "temperature": "68°F",
            "condition": "Sunny",
        }
    )


# Utiliser le tool_runner pour gérer automatiquement les appels d'outils
runner = client.beta.messages.tool_runner(
    max_tokens=1024,
    model="claude-opus-5",
    tools=[get_weather],
    messages=[
        {"role": "user", "content": "What is the weather in SF?"},
    ],
)
for message in runner:
    print(message)

À chaque itération, une requête API est effectuée. Si la réponse inclut un appel à l'un des outils fournis, l'outil est automatiquement appelé et le résultat est renvoyé directement au modèle lors de l'itération suivante.

Lots de messages

Ce SDK prend en charge l'API Message Batches via client.messages.batches.

Création d'un lot

Message Batches prend un tableau de requêtes, où chaque objet possède un identifiant custom_id et les mêmes params de requête que l'API Messages standard :

client.messages.batches.create(
    requests=[
        {
            "custom_id": "my-first-request",
            "params": {
                "model": "claude-opus-5",
                "max_tokens": 1024,
                "messages": [{"role": "user", "content": "Hello, world"}],
            },
        },
        {
            "custom_id": "my-second-request",
            "params": {
                "model": "claude-opus-5",
                "max_tokens": 1024,
                "messages": [{"role": "user", "content": "Hi again, friend"}],
            },
        },
    ]
)

Obtention des résultats d'un lot

Une fois qu'un Message Batch a été traité, indiqué par .processing_status == 'ended', vous pouvez accéder aux résultats avec .batches.results() :

client = anthropic.Anthropic()
batch_id = "batch_abc123"
result_stream = client.messages.batches.results(batch_id)
for entry in result_stream:
    if entry.result.type == "succeeded":
        print(entry.result.message.content)

Téléversement de fichiers

Les paramètres de requête correspondant à des téléversements de fichiers peuvent être transmis sous de nombreuses formes différentes :

Un objet PathLike (par exemple, pathlib.Path)
Un tuple (filename, content, content_type)
Un objet de type fichier BinaryIO

from pathlib import Path
from anthropic import Anthropic

client = Anthropic()

# Téléverser en utilisant un chemin de fichier
client.beta.files.upload(
    file=Path("/path/to/file"),
)

# Téléverser en utilisant des octets
client.beta.files.upload(
    file=("file.txt", b"my bytes", "text/plain"),
)

Le client asynchrone utilise exactement la même interface. Si vous passez une instance PathLike, le contenu du fichier est lu automatiquement de manière asynchrone.

Gestion des erreurs

Lorsque la bibliothèque ne parvient pas à se connecter à l'API, ou si l'API renvoie un code d'état de non-réussite (c'est-à-dire une réponse 4xx ou 5xx), une sous-classe de APIError est levée :

import anthropic
# ...
try:
    message = client.messages.create(
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": "Hello, Claude",
            }
        ],
        model="claude-opus-5",
    )
except anthropic.APIConnectionError as e:
    print("The server could not be reached")
    print(e.__cause__)  # an underlying Exception, likely raised within httpx
except anthropic.RateLimitError as e:
    print("A 429 status code was received; we should back off a bit.")
except anthropic.APIStatusError as e:
    print("Another non-200-range status code was received")
    print(e.status_code)
    print(e.response)

Les codes d'erreur sont les suivants :

Code d'état	Type d'erreur
400	`BadRequestError`
401	`AuthenticationError`
403	`PermissionDeniedError`
404	`NotFoundError`
409	`ConflictError`
422	`UnprocessableEntityError`
429	`RateLimitError`
>=500	`InternalServerError`
N/A	`APIConnectionError`

Identifiants de requête

Pour plus d'informations sur le débogage des requêtes, consultez Request ID.

Toutes les réponses d'objets dans le SDK fournissent une propriété _request_id qui est ajoutée à partir de l'en-tête de réponse request-id afin que vous puissiez rapidement journaliser les requêtes en échec et les signaler à Anthropic.

message = client.messages.create(
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello, Claude"}],
    model="claude-opus-5",
)
print(message._request_id)  # e.g., req_018EeWyXxfu5pfWkrYcMdjWG

Contrairement aux autres propriétés qui utilisent un préfixe _, la propriété _request_id est publique. Sauf indication contraire dans la documentation, toutes les autres propriétés, méthodes et modules avec le préfixe _ sont privés.

Nouvelles tentatives

Certaines erreurs font automatiquement l'objet de 2 nouvelles tentatives par défaut, avec un court backoff exponentiel. Les erreurs de connexion (par exemple, en raison d'un problème de connectivité réseau), 408 Request Timeout, 409 Conflict, 429 Rate Limit et les erreurs internes >=500 font toutes l'objet de nouvelles tentatives par défaut.

Vous pouvez utiliser l'option max_retries pour configurer ou désactiver ce comportement :

# Configurez la valeur par défaut pour toutes les requêtes :
client = Anthropic(
    max_retries=0,  # default is 2
)

# Ou configurez par requête :
client.with_options(max_retries=5).messages.create(
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello, Claude"}],
    model="claude-opus-5",
)

Délais d'expiration

Par défaut, les requêtes expirent après 10 minutes. Vous pouvez configurer cela avec une option timeout, qui accepte un float ou un objet httpx.Timeout :

import httpx
from anthropic import Anthropic

# Configurer la valeur par défaut pour toutes les requêtes :
client = Anthropic(
    timeout=20.0,  # 20 seconds (default is 10 minutes)
)

# Contrôle plus granulaire :
client = Anthropic(
    timeout=httpx.Timeout(60.0, read=5.0, write=10.0, connect=2.0),
)

# Remplacer pour chaque requête :
client.with_options(timeout=5.0).messages.create(
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello, Claude"}],
    model="claude-opus-5",
)

En cas d'expiration du délai, le SDK lève une APITimeoutError.

Notez que les requêtes qui expirent font l'objet de deux nouvelles tentatives par défaut.

Requêtes longues

Envisagez d'utiliser l'API Messages en streaming pour les requêtes de longue durée.

Évitez de définir une valeur max_tokens élevée sans utiliser le streaming. Certains réseaux peuvent interrompre les connexions inactives après un certain temps, ce qui peut entraîner l'échec de la requête ou son expiration sans recevoir de réponse d'Anthropic.

Le SDK lèvera une ValueError si une requête sans streaming est censée prendre plus d'environ 10 minutes. Passer stream=True ou remplacer l'option timeout au niveau du client ou de la requête désactive cette erreur.

Une « latency » (latence) de requête attendue supérieure au délai d'expiration pour une requête sans streaming entraînera la fermeture de la connexion par le client et une nouvelle tentative sans recevoir de réponse.

Le SDK définit une option TCP socket keep-alive pour réduire l'impact des délais d'expiration des connexions inactives sur certains réseaux. Cela peut être remplacé en passant une option http_client personnalisée au client.

Pagination automatique

Les méthodes de liste de l'API Claude sont paginées. Vous pouvez utiliser la syntaxe for pour itérer sur les éléments de toutes les pages :

client = Anthropic()

all_batches = []
# Récupère automatiquement des pages supplémentaires selon les besoins.
for batch in client.messages.batches.list(limit=20):
    all_batches.append(batch)
print(all_batches)

Pour l'itération asynchrone :

async def main() -> None:
    all_batches = []
    async for batch in client.messages.batches.list(limit=20):
        all_batches.append(batch)
    print(all_batches)


asyncio.run(main())

Vous pouvez également utiliser les méthodes .has_next_page(), .next_page_info() ou .get_next_page() pour un contrôle plus granulaire lors du travail avec les pages :

first_page = await client.messages.batches.list(limit=20)

if first_page.has_next_page():
    print(f"will fetch next page using these details: {first_page.next_page_info()}")
    next_page = await first_page.get_next_page()
    print(f"number of items we just fetched: {len(next_page.data)}")

# Supprimez `await` pour une utilisation non asynchrone.

Ou travailler directement avec les données renvoyées :

first_page = await client.messages.batches.list(limit=20)

print(f"next page cursor: {first_page.last_id}")
for batch in first_page.data:
    print(batch.id)

# Supprimez `await` pour une utilisation non asynchrone.

En-têtes par défaut

Le SDK envoie automatiquement l'en-tête anthropic-version défini sur 2023-06-01.

Si nécessaire, vous pouvez le remplacer en définissant des en-têtes par défaut sur l'objet client ou par requête.

Le remplacement des en-têtes par défaut peut entraîner des types incorrects et d'autres comportements inattendus ou indéfinis dans le SDK.

# Définir les en-têtes par défaut pour toutes les requêtes sur le client
client = Anthropic(
    default_headers={"anthropic-version": "My-Custom-Value"},
)

# Ou remplacer par requête
client.messages.with_raw_response.create(
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello, Claude"}],
    model="claude-opus-5",
    extra_headers={"anthropic-version": "My-Custom-Value"},
)

Système de types

Paramètres de requête

Les paramètres de requête imbriqués sont des TypedDicts. Les réponses sont des modèles Pydantic qui disposent également de méthodes d'assistance pour des opérations telles que la resérialisation en JSON (v1, v2).

Les requêtes et réponses typées fournissent l'autocomplétion et la documentation dans votre éditeur. Si vous souhaitez voir les erreurs de type dans VS Code pour aider à détecter les bogues plus tôt, définissez python.analysis.typeCheckingMode sur basic.

Modèles de réponse

Pour convertir un modèle Pydantic en dictionnaire, utilisez les méthodes d'assistance :

message = client.messages.create(...)

# Convertir en chaîne JSON
json_str = message.to_json()

# Convertir en dictionnaire
data = message.to_dict()

Gestion des champs null et manquants

Dans les réponses, vous pouvez distinguer les champs qui sont explicitement null des champs qui n'ont pas été renvoyés (manquants) :

response = client.messages.create(
    model="claude-opus-5",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello"}],
)
if response.my_field is None:
    if "my_field" not in response.model_fields_set:
        print("field was not in the response")
    else:
        print("field was null")

Utilisation avancée

Accès aux données de réponse brutes (par exemple, les en-têtes)

La Response « brute » renvoyée par httpx est accessible via la propriété .with_raw_response sur le client. Ceci est utile pour accéder aux en-têtes de réponse ou à d'autres métadonnées :

client = Anthropic()

response = client.messages.with_raw_response.create(
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello, Claude"}],
    model="claude-opus-5",
)

print(response.headers.get("request-id"))
message = (
    response.parse()
)  # get the object that `messages.create()` would have returned
print(message.content)

Ces méthodes renvoient un objet APIResponse.

Streaming du corps de la réponse

L'approche .with_raw_response lit de manière anticipée l'intégralité du corps de la réponse lorsque vous effectuez la requête. Pour diffuser le corps de la réponse en streaming à la place, utilisez .with_streaming_response, qui nécessite un gestionnaire de contexte et ne lit le corps de la réponse qu'une fois que vous appelez .read(), .text(), .json(), .iter_bytes(), .iter_text(), .iter_lines() ou .parse(). Dans le client asynchrone, ce sont des méthodes asynchrones.

with client.messages.with_streaming_response.create(
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello, Claude"}],
    model="claude-opus-5",
) as response:
    print(response.headers.get("request-id"))

    for line in response.iter_lines():
        print(line)

Le gestionnaire de contexte est requis afin que la réponse soit fermée de manière fiable.

Journalisation

Le SDK utilise le module logging de la bibliothèque standard.

Vous pouvez activer la journalisation en définissant la variable d'environnement ANTHROPIC_LOG sur debug ou info :

export ANTHROPIC_LOG=debug

Effectuer des requêtes personnalisées/non documentées

Cette bibliothèque est typée pour un accès pratique à l'API documentée. Si vous devez accéder à des points de terminaison, des paramètres ou des propriétés de réponse non documentés, la bibliothèque peut toujours être utilisée.

Points de terminaison non documentés

Pour effectuer des requêtes vers des points de terminaison non documentés, vous pouvez utiliser client.get, client.post et d'autres verbes HTTP. Les options du client, telles que les nouvelles tentatives, sont respectées lors de ces requêtes.

import httpx

response = client.post(
    "/foo",
    cast_to=httpx.Response,
    body={"my_param": True},
)

print(response.json())

Paramètres de requête non documentés

Si vous souhaitez envoyer explicitement un paramètre supplémentaire, vous pouvez le faire avec les options de requête extra_query, extra_body et extra_headers.

Les paramètres extra_ remplacent les paramètres documentés du même nom. Pour des raisons de sécurité, assurez-vous que ces méthodes ne sont utilisées qu'avec des données d'entrée fiables.

Propriétés de réponse non documentées

Pour accéder aux propriétés de réponse non documentées, vous pouvez accéder aux champs supplémentaires comme response.unknown_prop. Vous pouvez également obtenir tous les champs supplémentaires du modèle Pydantic sous forme de dict avec response.model_extra.

Configuration du client HTTP

Vous pouvez directement remplacer le client httpx pour le personnaliser selon votre cas d'usage, y compris la prise en charge des proxys et des transports :

import httpx
from anthropic import Anthropic, DefaultHttpxClient

client = Anthropic(
    # Ou utilisez la variable d'environnement `ANTHROPIC_BASE_URL`
    base_url="http://my.test.server.example.com:8083",
    http_client=DefaultHttpxClient(
        proxy="http://my.test.proxy.example.com",
        transport=httpx.HTTPTransport(local_address="0.0.0.0"),
    ),
)

Vous pouvez également personnaliser le client requête par requête en utilisant with_options() :

client.with_options(http_client=DefaultHttpxClient(...))

Utilisez DefaultHttpxClient et DefaultAsyncHttpxClient au lieu de httpx.Client et httpx.AsyncClient bruts pour garantir que la configuration par défaut du SDK (comme les délais d'expiration et les limites de connexion) est préservée.

Gestion des ressources HTTP

Par défaut, la bibliothèque ferme les connexions HTTP sous-jacentes chaque fois que le client est récupéré par le ramasse-miettes. Vous pouvez fermer manuellement le client à l'aide de la méthode .close() si vous le souhaitez, ou avec un gestionnaire de contexte qui se ferme à la sortie.

with Anthropic() as client:
    message = client.messages.create(...)

# Le client HTTP est automatiquement fermé

Fonctionnalités bêta

Les fonctionnalités bêta sont disponibles avant leur publication générale afin d'obtenir des retours précoces et de tester de nouvelles fonctionnalités. Vous pouvez vérifier la disponibilité de toutes les capacités et de tous les outils de Claude dans la vue d'ensemble de la création avec Claude.

Vous pouvez accéder à la plupart des fonctionnalités bêta de l'API via la propriété beta du client. Pour activer une fonctionnalité bêta particulière, vous devez ajouter l'en-tête bêta approprié au champ betas lors de la création d'un message.

Par exemple, pour utiliser l'API Files :

client = Anthropic()

response = client.beta.messages.create(
    model="claude-opus-5",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "Please summarize this document for me."},
                {
                    "type": "document",
                    "source": {
                        "type": "file",
                        "file_id": "file_abc123",
                    },
                },
            ],
        },
    ],
    betas=["files-api-2025-04-14"],
)

Intégrations de plateformes

Pour des guides détaillés de configuration de plateforme avec des exemples de code, consultez :

Les cinq classes de client sont incluses dans le package de base anthropic :

Fournisseur	Client	Dépendances supplémentaires
Agent Platform	`from anthropic import AnthropicVertex`	`pip install "anthropic[vertex]"`
Bedrock	`from anthropic import AnthropicBedrockMantle`	`pip install "anthropic[bedrock]"`
Bedrock (chemin `bedrock-runtime`)	`from anthropic import AnthropicBedrock`	`pip install "anthropic[bedrock]"`
Claude Platform sur AWS	`from anthropic import AnthropicAWS`	`pip install "anthropic[aws]"`
Foundry	`from anthropic import AnthropicFoundry`	Aucune

Le client AnthropicAWS est en version bêta. Passez workspace_id au constructeur ou définissez la variable d'environnement ANTHROPIC_AWS_WORKSPACE_ID.

Utilisez AnthropicBedrockMantle pour les nouveaux projets ; AnthropicBedrock reste disponible pour les applications existantes utilisant l'API InvokeModel de Bedrock.

Gestion sémantique des versions

Ce package suit généralement les conventions SemVer, bien que certaines modifications incompatibles avec les versions antérieures puissent être publiées en tant que versions mineures :

Les modifications qui n'affectent que les types statiques, sans casser le comportement à l'exécution.
Les modifications des éléments internes de la bibliothèque qui sont techniquement publics mais qui ne sont pas destinés ou documentés pour un usage externe.
Les modifications qui ne devraient pas avoir d'impact sur la grande majorité des utilisateurs en pratique.

Déterminer la version installée

Si vous avez effectué une mise à niveau vers la dernière version mais que vous ne voyez pas les nouvelles fonctionnalités attendues, votre environnement Python utilise probablement encore une version plus ancienne. Vous pouvez déterminer la version utilisée à l'exécution avec :

print(anthropic.__version__)

Ressources supplémentaires

Was this page helpful?

CLI, SDK et bibliothèquesSDK clients

SDK Python

Installez et configurez le SDK Python d'Anthropic avec la prise en charge des clients synchrones et asynchrones

Pour la documentation des fonctionnalités de l'API avec des exemples de code, consultez la référence API. Cette page couvre les fonctionnalités et la configuration du SDK spécifiques à Python.

Installation

pip install anthropic

Pour les intégrations spécifiques à une plateforme ou pour de meilleures performances asynchrones, installez avec les extras :

# Pour la prise en charge d'Amazon Bedrock
pip install "anthropic[bedrock]"

# Pour la prise en charge de Google Cloud
pip install "anthropic[vertex]"

# Pour la prise en charge de Claude Platform sur AWS
pip install "anthropic[aws]"

# La prise en charge de Microsoft Foundry est incluse dans le package de base

# Pour de meilleures performances asynchrones avec aiohttp
pip install "anthropic[aiohttp]"

Prérequis

Python 3.9 ou version ultérieure est requis.

Utilisation

import os
from anthropic import Anthropic

client = Anthropic(
    # Il s'agit de la valeur par défaut et elle peut être omise
    api_key=os.environ.get("ANTHROPIC_API_KEY"),
)

message = client.messages.create(
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": "Hello, Claude",
        }
    ],
    model="claude-opus-5",
)

for block in message.content:
    if block.type == "text":
        print(block.text)

Envisagez d'utiliser python-dotenv pour ajouter ANTHROPIC_API_KEY="my-anthropic-api-key" à votre fichier .env afin que votre clé API ne soit pas stockée dans le contrôle de source.

Pour les options d'authentification, y compris Workload Identity Federation, consultez Authentification.

Utilisation asynchrone

import os
import asyncio
from anthropic import AsyncAnthropic

client = AsyncAnthropic(
    api_key=os.environ.get("ANTHROPIC_API_KEY"),
)


async def main() -> None:
    message = await client.messages.create(
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": "Hello, Claude",
            }
        ],
        model="claude-opus-5",
    )
    print(message.content)


asyncio.run(main())

Utilisation d'aiohttp pour une meilleure concurrence

Pour de meilleures performances asynchrones, vous pouvez utiliser le backend HTTP aiohttp au lieu du httpx par défaut :

import os
import asyncio
from anthropic import AsyncAnthropic, DefaultAioHttpClient


async def main() -> None:
    async with AsyncAnthropic(
        api_key=os.environ.get("ANTHROPIC_API_KEY"),
        http_client=DefaultAioHttpClient(),
    ) as client:
        message = await client.messages.create(
            max_tokens=1024,
            messages=[
                {
                    "role": "user",
                    "content": "Hello, Claude",
                }
            ],
            model="claude-opus-5",
        )
        print(message.content)


asyncio.run(main())

Réponses en streaming

Le SDK prend en charge les réponses en streaming à l'aide des « Server-Sent Events » (événements envoyés par le serveur), ou SSE.

client = Anthropic()

stream = client.messages.create(
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": "Hello, Claude",
        }
    ],
    model="claude-opus-5",
    stream=True,
)
for event in stream:
    print(event.type)

Le client asynchrone utilise exactement la même interface :

client = AsyncAnthropic()

stream = await client.messages.create(
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": "Hello, Claude",
        }
    ],
    model="claude-opus-5",
    stream=True,
)
async for event in stream:
    print(event.type)

Assistants de streaming

Le SDK fournit également des assistants de streaming qui utilisent des gestionnaires de contexte et donnent accès au texte accumulé et au message final :

async def main() -> None:
    async with client.messages.stream(
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": "Say hello there!",
            }
        ],
        model="claude-opus-5",
    ) as stream:
        async for text in stream.text_stream:
            print(text, end="", flush=True)
        print()

        message = await stream.get_final_message()
        print(message.to_json())


asyncio.run(main())

Le streaming avec client.messages.stream(...) expose divers assistants, notamment l'accumulation et des événements spécifiques au SDK.

Comptage de tokens

Vous pouvez voir l'utilisation exacte pour une requête donnée via la propriété de réponse usage :

message = client.messages.create(...)
print(message.usage)
# Usage(input_tokens=25, output_tokens=13)

Vous pouvez également compter les tokens avant d'effectuer une requête :

count = client.messages.count_tokens(
    model="claude-opus-5", messages=[{"role": "user", "content": "Hello, world"}]
)
print(count.input_tokens)  # 10

Utilisation d'outils

Ce SDK prend en charge l'utilisation d'outils, également appelée appel de fonctions. Pour plus de détails, consultez Utilisation d'outils avec Claude.

Assistants d'outils

import json
from anthropic import Anthropic, beta_tool

client = Anthropic()


@beta_tool
def get_weather(location: str) -> str:
    """Get the weather for a given location.

    Args:
        location: The city and state, for example, San Francisco, CA
    Returns:
        A JSON-encoded string with the location, temperature, and weather condition.
    """
    return json.dumps(
        {
            "location": location,
            "temperature": "68°F",
            "condition": "Sunny",
        }
    )


# Utiliser le tool_runner pour gérer automatiquement les appels d'outils
runner = client.beta.messages.tool_runner(
    max_tokens=1024,
    model="claude-opus-5",
    tools=[get_weather],
    messages=[
        {"role": "user", "content": "What is the weather in SF?"},
    ],
)
for message in runner:
    print(message)

Lots de messages

Ce SDK prend en charge l'API Message Batches via client.messages.batches.

Création d'un lot

Message Batches prend un tableau de requêtes, où chaque objet possède un identifiant custom_id et les mêmes params de requête que l'API Messages standard :

client.messages.batches.create(
    requests=[
        {
            "custom_id": "my-first-request",
            "params": {
                "model": "claude-opus-5",
                "max_tokens": 1024,
                "messages": [{"role": "user", "content": "Hello, world"}],
            },
        },
        {
            "custom_id": "my-second-request",
            "params": {
                "model": "claude-opus-5",
                "max_tokens": 1024,
                "messages": [{"role": "user", "content": "Hi again, friend"}],
            },
        },
    ]
)

Obtention des résultats d'un lot

Une fois qu'un Message Batch a été traité, indiqué par .processing_status == 'ended', vous pouvez accéder aux résultats avec .batches.results() :

client = anthropic.Anthropic()
batch_id = "batch_abc123"
result_stream = client.messages.batches.results(batch_id)
for entry in result_stream:
    if entry.result.type == "succeeded":
        print(entry.result.message.content)

Téléversement de fichiers

Les paramètres de requête correspondant à des téléversements de fichiers peuvent être transmis sous de nombreuses formes différentes :

Un objet PathLike (par exemple, pathlib.Path)
Un tuple (filename, content, content_type)
Un objet de type fichier BinaryIO

from pathlib import Path
from anthropic import Anthropic

client = Anthropic()

# Téléverser en utilisant un chemin de fichier
client.beta.files.upload(
    file=Path("/path/to/file"),
)

# Téléverser en utilisant des octets
client.beta.files.upload(
    file=("file.txt", b"my bytes", "text/plain"),
)

Le client asynchrone utilise exactement la même interface. Si vous passez une instance PathLike, le contenu du fichier est lu automatiquement de manière asynchrone.

Gestion des erreurs

import anthropic
# ...
try:
    message = client.messages.create(
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": "Hello, Claude",
            }
        ],
        model="claude-opus-5",
    )
except anthropic.APIConnectionError as e:
    print("The server could not be reached")
    print(e.__cause__)  # an underlying Exception, likely raised within httpx
except anthropic.RateLimitError as e:
    print("A 429 status code was received; we should back off a bit.")
except anthropic.APIStatusError as e:
    print("Another non-200-range status code was received")
    print(e.status_code)
    print(e.response)

Les codes d'erreur sont les suivants :

Code d'état	Type d'erreur
400	`BadRequestError`
401	`AuthenticationError`
403	`PermissionDeniedError`
404	`NotFoundError`
409	`ConflictError`
422	`UnprocessableEntityError`
429	`RateLimitError`
>=500	`InternalServerError`
N/A	`APIConnectionError`

Identifiants de requête

Pour plus d'informations sur le débogage des requêtes, consultez Request ID.

message = client.messages.create(
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello, Claude"}],
    model="claude-opus-5",
)
print(message._request_id)  # e.g., req_018EeWyXxfu5pfWkrYcMdjWG

Nouvelles tentatives

Vous pouvez utiliser l'option max_retries pour configurer ou désactiver ce comportement :

# Configurez la valeur par défaut pour toutes les requêtes :
client = Anthropic(
    max_retries=0,  # default is 2
)

# Ou configurez par requête :
client.with_options(max_retries=5).messages.create(
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello, Claude"}],
    model="claude-opus-5",
)

Délais d'expiration

Par défaut, les requêtes expirent après 10 minutes. Vous pouvez configurer cela avec une option timeout, qui accepte un float ou un objet httpx.Timeout :

import httpx
from anthropic import Anthropic

# Configurer la valeur par défaut pour toutes les requêtes :
client = Anthropic(
    timeout=20.0,  # 20 seconds (default is 10 minutes)
)

# Contrôle plus granulaire :
client = Anthropic(
    timeout=httpx.Timeout(60.0, read=5.0, write=10.0, connect=2.0),
)

# Remplacer pour chaque requête :
client.with_options(timeout=5.0).messages.create(
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello, Claude"}],
    model="claude-opus-5",
)

En cas d'expiration du délai, le SDK lève une APITimeoutError.

Notez que les requêtes qui expirent font l'objet de deux nouvelles tentatives par défaut.

Requêtes longues

Envisagez d'utiliser l'API Messages en streaming pour les requêtes de longue durée.

Pagination automatique

Les méthodes de liste de l'API Claude sont paginées. Vous pouvez utiliser la syntaxe for pour itérer sur les éléments de toutes les pages :

client = Anthropic()

all_batches = []
# Récupère automatiquement des pages supplémentaires selon les besoins.
for batch in client.messages.batches.list(limit=20):
    all_batches.append(batch)
print(all_batches)

Pour l'itération asynchrone :

async def main() -> None:
    all_batches = []
    async for batch in client.messages.batches.list(limit=20):
        all_batches.append(batch)
    print(all_batches)


asyncio.run(main())

Vous pouvez également utiliser les méthodes .has_next_page(), .next_page_info() ou .get_next_page() pour un contrôle plus granulaire lors du travail avec les pages :

first_page = await client.messages.batches.list(limit=20)

if first_page.has_next_page():
    print(f"will fetch next page using these details: {first_page.next_page_info()}")
    next_page = await first_page.get_next_page()
    print(f"number of items we just fetched: {len(next_page.data)}")

# Supprimez `await` pour une utilisation non asynchrone.

Ou travailler directement avec les données renvoyées :

first_page = await client.messages.batches.list(limit=20)

print(f"next page cursor: {first_page.last_id}")
for batch in first_page.data:
    print(batch.id)

# Supprimez `await` pour une utilisation non asynchrone.

En-têtes par défaut

Le SDK envoie automatiquement l'en-tête anthropic-version défini sur 2023-06-01.

Si nécessaire, vous pouvez le remplacer en définissant des en-têtes par défaut sur l'objet client ou par requête.

Le remplacement des en-têtes par défaut peut entraîner des types incorrects et d'autres comportements inattendus ou indéfinis dans le SDK.

# Définir les en-têtes par défaut pour toutes les requêtes sur le client
client = Anthropic(
    default_headers={"anthropic-version": "My-Custom-Value"},
)

# Ou remplacer par requête
client.messages.with_raw_response.create(
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello, Claude"}],
    model="claude-opus-5",
    extra_headers={"anthropic-version": "My-Custom-Value"},
)

Système de types

Paramètres de requête

Modèles de réponse

Pour convertir un modèle Pydantic en dictionnaire, utilisez les méthodes d'assistance :

message = client.messages.create(...)

# Convertir en chaîne JSON
json_str = message.to_json()

# Convertir en dictionnaire
data = message.to_dict()

Gestion des champs null et manquants

Dans les réponses, vous pouvez distinguer les champs qui sont explicitement null des champs qui n'ont pas été renvoyés (manquants) :

response = client.messages.create(
    model="claude-opus-5",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello"}],
)
if response.my_field is None:
    if "my_field" not in response.model_fields_set:
        print("field was not in the response")
    else:
        print("field was null")

Utilisation avancée

Accès aux données de réponse brutes (par exemple, les en-têtes)

client = Anthropic()

response = client.messages.with_raw_response.create(
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello, Claude"}],
    model="claude-opus-5",
)

print(response.headers.get("request-id"))
message = (
    response.parse()
)  # get the object that `messages.create()` would have returned
print(message.content)

Ces méthodes renvoient un objet APIResponse.

Streaming du corps de la réponse

with client.messages.with_streaming_response.create(
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello, Claude"}],
    model="claude-opus-5",
) as response:
    print(response.headers.get("request-id"))

    for line in response.iter_lines():
        print(line)

Le gestionnaire de contexte est requis afin que la réponse soit fermée de manière fiable.

Journalisation

Le SDK utilise le module logging de la bibliothèque standard.

Vous pouvez activer la journalisation en définissant la variable d'environnement ANTHROPIC_LOG sur debug ou info :

export ANTHROPIC_LOG=debug

Effectuer des requêtes personnalisées/non documentées

Points de terminaison non documentés

import httpx

response = client.post(
    "/foo",
    cast_to=httpx.Response,
    body={"my_param": True},
)

print(response.json())

Paramètres de requête non documentés

Si vous souhaitez envoyer explicitement un paramètre supplémentaire, vous pouvez le faire avec les options de requête extra_query, extra_body et extra_headers.

Les paramètres extra_ remplacent les paramètres documentés du même nom. Pour des raisons de sécurité, assurez-vous que ces méthodes ne sont utilisées qu'avec des données d'entrée fiables.

Propriétés de réponse non documentées

Configuration du client HTTP

Vous pouvez directement remplacer le client httpx pour le personnaliser selon votre cas d'usage, y compris la prise en charge des proxys et des transports :

import httpx
from anthropic import Anthropic, DefaultHttpxClient

client = Anthropic(
    # Ou utilisez la variable d'environnement `ANTHROPIC_BASE_URL`
    base_url="http://my.test.server.example.com:8083",
    http_client=DefaultHttpxClient(
        proxy="http://my.test.proxy.example.com",
        transport=httpx.HTTPTransport(local_address="0.0.0.0"),
    ),
)

Vous pouvez également personnaliser le client requête par requête en utilisant with_options() :

client.with_options(http_client=DefaultHttpxClient(...))

Gestion des ressources HTTP

with Anthropic() as client:
    message = client.messages.create(...)

# Le client HTTP est automatiquement fermé

Fonctionnalités bêta

Par exemple, pour utiliser l'API Files :

client = Anthropic()

response = client.beta.messages.create(
    model="claude-opus-5",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "Please summarize this document for me."},
                {
                    "type": "document",
                    "source": {
                        "type": "file",
                        "file_id": "file_abc123",
                    },
                },
            ],
        },
    ],
    betas=["files-api-2025-04-14"],
)

Intégrations de plateformes

Pour des guides détaillés de configuration de plateforme avec des exemples de code, consultez :

Les cinq classes de client sont incluses dans le package de base anthropic :

Fournisseur	Client	Dépendances supplémentaires
Agent Platform	`from anthropic import AnthropicVertex`	`pip install "anthropic[vertex]"`
Bedrock	`from anthropic import AnthropicBedrockMantle`	`pip install "anthropic[bedrock]"`
Bedrock (chemin `bedrock-runtime`)	`from anthropic import AnthropicBedrock`	`pip install "anthropic[bedrock]"`
Claude Platform sur AWS	`from anthropic import AnthropicAWS`	`pip install "anthropic[aws]"`
Foundry	`from anthropic import AnthropicFoundry`	Aucune

Le client AnthropicAWS est en version bêta. Passez workspace_id au constructeur ou définissez la variable d'environnement ANTHROPIC_AWS_WORKSPACE_ID.

Utilisez AnthropicBedrockMantle pour les nouveaux projets ; AnthropicBedrock reste disponible pour les applications existantes utilisant l'API InvokeModel de Bedrock.

Gestion sémantique des versions

Ce package suit généralement les conventions SemVer, bien que certaines modifications incompatibles avec les versions antérieures puissent être publiées en tant que versions mineures :

Les modifications qui n'affectent que les types statiques, sans casser le comportement à l'exécution.
Les modifications des éléments internes de la bibliothèque qui sont techniquement publics mais qui ne sont pas destinés ou documentés pour un usage externe.
Les modifications qui ne devraient pas avoir d'impact sur la grande majorité des utilisateurs en pratique.

Déterminer la version installée

print(anthropic.__version__)

Ressources supplémentaires

Was this page helpful?

Installation

Prérequis

Utilisation

Utilisation asynchrone

Utilisation d'aiohttp pour une meilleure concurrence

Réponses en streaming

Assistants de streaming

Comptage de tokens

Utilisation d'outils

Assistants d'outils

Lots de messages

Création d'un lot

Obtention des résultats d'un lot

Téléversement de fichiers

Gestion des erreurs

Identifiants de requête

Nouvelles tentatives

Délais d'expiration

Requêtes longues

Pagination automatique

En-têtes par défaut

Système de types

Paramètres de requête

Modèles de réponse

Gestion des champs null et manquants

Utilisation avancée

Accès aux données de réponse brutes (par exemple, les en-têtes)

Streaming du corps de la réponse

Journalisation

Effectuer des requêtes personnalisées/non documentées

Points de terminaison non documentés

Paramètres de requête non documentés

Propriétés de réponse non documentées

Configuration du client HTTP

Gestion des ressources HTTP

Fonctionnalités bêta

Intégrations de plateformes

Gestion sémantique des versions

Déterminer la version installée

Ressources supplémentaires

Installation

Prérequis

Utilisation

Utilisation asynchrone

Utilisation d'aiohttp pour une meilleure concurrence

Réponses en streaming

Assistants de streaming

Comptage de tokens

Utilisation d'outils

Assistants d'outils

Lots de messages

Création d'un lot

Obtention des résultats d'un lot

Téléversement de fichiers

Gestion des erreurs

Identifiants de requête

Nouvelles tentatives

Délais d'expiration

Requêtes longues

Pagination automatique

En-têtes par défaut

Système de types

Paramètres de requête

Modèles de réponse

Gestion des champs null et manquants

Utilisation avancée

Accès aux données de réponse brutes (par exemple, les en-têtes)

Streaming du corps de la réponse

Journalisation

Effectuer des requêtes personnalisées/non documentées

Points de terminaison non documentés

Paramètres de requête non documentés

Propriétés de réponse non documentées

Configuration du client HTTP

Gestion des ressources HTTP

Fonctionnalités bêta

Intégrations de plateformes

Gestion sémantique des versions

Déterminer la version installée

Ressources supplémentaires

Installation

Prérequis

Utilisation

Utilisation asynchrone

Utilisation d'aiohttp pour une meilleure concurrence

Réponses en streaming

Assistants de streaming

Comptage de tokens

Utilisation d'outils

Assistants d'outils

Lots de messages

Création d'un lot

Obtention des résultats d'un lot

Téléversement de fichiers

Gestion des erreurs

Identifiants de requête

Nouvelles tentatives

Délais d'expiration

Requêtes longues

Pagination automatique

En-têtes par défaut

Système de types

Paramètres de requête

Modèles de réponse

Gestion des champs null et manquants

Utilisation avancée

Accès aux données de réponse brutes (par exemple, les en-têtes)

Streaming du corps de la réponse

Journalisation

Effectuer des requêtes personnalisées/non documentées

Points de terminaison non documentés

Paramètres de requête non documentés

Propriétés de réponse non documentées

Configuration du client HTTP

Gestion des ressources HTTP

Fonctionnalités bêta

Intégrations de plateformes

Gestion sémantique des versions

Déterminer la version installée

Ressources supplémentaires

Installation

Prérequis

Utilisation

Utilisation asynchrone

Utilisation d'aiohttp pour une meilleure concurrence

Réponses en streaming

Assistants de streaming

Comptage de tokens

Utilisation d'outils

Assistants d'outils

Lots de messages

Création d'un lot

Obtention des résultats d'un lot

Téléversement de fichiers

Gestion des erreurs

Identifiants de requête

Nouvelles tentatives

Délais d'expiration

Requêtes longues

Pagination automatique

En-têtes par défaut

Système de types

Paramètres de requête

Modèles de réponse

Gestion des champs null et manquants

Utilisation avancée

Accès aux données de réponse brutes (par exemple, les en-têtes)

Streaming du corps de la réponse

Journalisation

Effectuer des requêtes personnalisées/non documentées

Points de terminaison non documentés

Paramètres de requête non documentés

Propriétés de réponse non documentées

Configuration du client HTTP

Gestion des ressources HTTP

Fonctionnalités bêta

Intégrations de plateformes

Gestion sémantique des versions

Déterminer la version installée

Ressources supplémentaires