Die Token-Zählung ermöglicht es Ihnen, die Anzahl der Token in einer Nachricht zu bestimmen, bevor Sie sie an Claude senden, und hilft Ihnen, fundierte Entscheidungen über Ihre Prompts und Nutzung zu treffen. Mit der Token-Zählung können Sie
This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
Der Token-Zählungs-Endpunkt akzeptiert die gleiche strukturierte Liste von Eingaben zum Erstellen einer Nachricht, einschließlich Unterstützung für System-Prompts, Tools, Bilder und PDFs. Die Antwort enthält die Gesamtzahl der Input-Token.
Die Token-Anzahl sollte als Schätzung betrachtet werden. In einigen Fällen kann die tatsächliche Anzahl der Input-Token, die beim Erstellen einer Nachricht verwendet werden, um einen kleinen Betrag abweichen.
Token-Zählungen können Token enthalten, die automatisch von Anthropic für Systemoptimierungen hinzugefügt werden. Sie werden nicht für von Systemen hinzugefügte Token in Rechnung gestellt. Die Abrechnung spiegelt nur Ihren Inhalt wider.
Alle aktiven Modelle unterstützen die Token-Zählung.
client = anthropic.Anthropic()
response = client.messages.count_tokens(
model="claude-opus-4-7",
system="You are a scientist",
messages=[{"role": "user", "content": "Hello, Claude"}],
)
print(response.json()){ "input_tokens": 14 }Server Tool Token-Zählungen gelten nur für den ersten Sampling-Aufruf.
client = anthropic.Anthropic()
response = client.messages.count_tokens(
model="claude-opus-4-7",
tools=[
{
"name": "get_weather",
"description": "Get the current weather in a given location",
"input_schema": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "The city and state, e.g. San Francisco, CA",
}
},
"required": ["location"],
},
}
],
messages=[{"role": "user", "content": "What's the weather like in San Francisco?"}],
)
print(response.json()){ "input_tokens": 403 }import base64
import httpx
image_url = "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
image_media_type = "image/jpeg"
image_data = base64.standard_b64encode(httpx.get(image_url).content).decode("utf-8")
client = anthropic.Anthropic()
response = client.messages.count_tokens(
model="claude-opus-4-7",
messages=[
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "base64",
"media_type": image_media_type,
"data": image_data,
},
},
{"type": "text", "text": "Describe this image"},
],
}
],
)
print(response.json()){ "input_tokens": 1551 }Siehe wie das Kontextfenster mit erweitertem Denken berechnet wird für weitere Details
client = anthropic.Anthropic()
response = client.messages.count_tokens(
model="claude-sonnet-4-6",
thinking={"type": "enabled", "budget_tokens": 16000},
messages=[
{
"role": "user",
"content": "Are there an infinite number of prime numbers such that n mod 4 == 3?",
},
{
"role": "assistant",
"content": [
{
"type": "thinking",
"thinking": "This is a nice number theory question. Let's think about it step by step...",
"signature": "EuYBCkQYAiJAgCs1le6/Pol5Z4/JMomVOouGrWdhYNsH3ukzUECbB6iWrSQtsQuRHJID6lWV...",
},
{
"type": "text",
"text": "Yes, there are infinitely many prime numbers p such that p mod 4 = 3...",
},
],
},
{"role": "user", "content": "Can you write a formal proof?"},
],
)
print(response.json()){ "input_tokens": 88 }Das Token-Zählen unterstützt PDFs mit den gleichen Einschränkungen wie die Messages API.
import base64
import anthropic
client = anthropic.Anthropic()
with open("document.pdf", "rb") as pdf_file:
pdf_base64 = base64.standard_b64encode(pdf_file.read()).decode("utf-8")
response = client.messages.count_tokens(
model="claude-opus-4-7",
messages=[
{
"role": "user",
"content": [
{
"type": "document",
"source": {
"type": "base64",
"media_type": "application/pdf",
"data": pdf_base64,
},
},
{"type": "text", "text": "Please summarize this document."},
],
}
],
)
print(response.json()){ "input_tokens": 2188 }Das Token-Zählen ist kostenlos zu verwenden, unterliegt aber Anfragen pro Minute Ratenlimits basierend auf Ihrer Nutzungsstufe. Wenn Sie höhere Limits benötigen, kontaktieren Sie den Vertrieb über die Claude Console.
| Nutzungsstufe | Anfragen pro Minute (RPM) |
|---|---|
| 1 | 100 |
| 2 | 2.000 |
| 3 | 4.000 |
| 4 | 8.000 |
Das Token-Zählen und die Nachrichtenerstellung haben separate und unabhängige Ratenlimits. Die Nutzung des einen zählt nicht gegen die Limits des anderen.
Was this page helpful?