Diese Seite bietet detaillierte Preisinformationen für Anthropic-Modelle und -Funktionen. Alle Preise sind in USD.
Die aktuellsten Preisinformationen finden Sie unter claude.com/pricing.
Die folgende Tabelle zeigt die Preisgestaltung für alle Claude-Modelle über verschiedene Nutzungsstufen hinweg:
| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.6 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.5 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.6 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = Million Token. Die Spalte „Base Input Tokens" zeigt die standardmäßige Eingabepreisgestaltung, „Cache Writes" und „Cache Hits" sind spezifisch für Prompt-Caching, und „Output Tokens" zeigt die Ausgabepreisgestaltung. Siehe Prompt-Caching-Preisgestaltung unten für eine Erklärung der Cache-Spalten und Preismultiplikatoren.
Claude-Modelle sind auf AWS Bedrock, Google Vertex AI und Microsoft Foundry verfügbar. Für offizielle Preisgestaltung besuchen Sie:
Preisgestaltung für regionale und Multi-Region-Endpunkte für Claude 4.5-Modelle und darüber hinaus
Ab Claude Sonnet 4.5 und Haiku 4.5:
Regionale und Multi-Region-Endpunkte beinhalten einen 10%-Aufschlag gegenüber globalen Endpunkten. Die Claude API (1P) ist standardmäßig global; für 1P-Datenresidenz-Optionen und Preisgestaltung siehe Datenresidenz-Preisgestaltung unten.
Umfang: Diese Preisstruktur gilt für Claude Sonnet 4.5, Haiku 4.5 und alle zukünftigen Modelle. Frühere Modelle (Claude Sonnet 4, Opus 4 und frühere Versionen) behalten ihre bestehende Preisgestaltung.
Für Implementierungsdetails und Code-Beispiele:
Prompt-Caching reduziert Kosten und Latenz, indem zuvor verarbeitete Teile Ihres Prompts über API-Aufrufe hinweg wiederverwendet werden. Anstatt denselben großen System-Prompt, das Dokument oder den Gesprächsverlauf bei jeder Anfrage neu zu verarbeiten, liest die API aus dem Cache zu einem Bruchteil des standardmäßigen Eingabepreises.
Es gibt zwei Möglichkeiten, Prompt-Caching zu aktivieren:
cache_control-Feld auf der obersten Ebene Ihrer Anfrage hinzu. Das System verwaltet automatisch Cache-Breakpoints, wenn Gespräche wachsen. Dies ist der empfohlene Ausgangspunkt für die meisten Anwendungsfälle.cache_control direkt auf einzelnen Inhaltsblöcken für eine präzise Kontrolle darüber, was genau zwischengespeichert wird.Prompt-Caching verwendet die folgenden Preismultiplikatoren relativ zu den Basis-Eingabe-Token-Sätzen:
| Cache-Operation | Multiplikator | Dauer |
|---|---|---|
| 5-Minuten-Cache-Schreib | 1,25x Basis-Eingabepreis | Cache gültig für 5 Minuten |
| 1-Stunden-Cache-Schreib | 2x Basis-Eingabepreis | Cache gültig für 1 Stunde |
| Cache-Lesezugriff (Hit) | 0,1x Basis-Eingabepreis | Gleiche Dauer wie der vorherige Schreib |
Cache-Schreib-Token werden berechnet, wenn Inhalte zum ersten Mal gespeichert werden. Cache-Lesezugriff-Token werden berechnet, wenn eine nachfolgende Anfrage den zwischengespeicherten Inhalt abruft. Ein Cache-Hit kostet 10% des standardmäßigen Eingabepreises, was bedeutet, dass sich Caching nach nur einem Cache-Lesezugriff für die 5-Minuten-Dauer (1,25x Schreib) oder nach zwei Cache-Lesezugriffen für die 1-Stunden-Dauer (2x Schreib) amortisiert.
Diese Multiplikatoren stapeln sich mit anderen Preismodifikatoren, einschließlich des Batch API-Rabatts und der Datenresidenz.
Für Implementierungsdetails, unterstützte Modelle und Code-Beispiele siehe die Prompt-Caching-Dokumentation.
Für Claude Opus 4.6 und neuere Modelle führt die Angabe von reiner US-Inferenz über den Parameter inference_geo zu einem Multiplikator von 1,1x auf alle Token-Preiskategorien, einschließlich Eingabe-Token, Ausgabe-Token, Cache-Schreib und Cache-Lesezugriff. Globales Routing (Standard) verwendet Standardpreisgestaltung.
Dies gilt nur für die Claude API (1P). Drittanbieter-Plattformen haben ihre eigene regionale Preisgestaltung. Siehe AWS Bedrock und Google Vertex AI für Details. Frühere Modelle behalten ihre bestehende Preisgestaltung unabhängig von inference_geo-Einstellungen.
Weitere Informationen finden Sie in der Datenresidenz-Dokumentation.
Fast Mode (Beta: Forschungsvorschau) für Claude Opus 4.6 bietet erheblich schnellere Ausgabe zu Premium-Preisgestaltung (6x Standardsätze). Fast-Mode-Preisgestaltung gilt über das gesamte Kontextfenster, einschließlich Anfragen über 200k Eingabe-Token. Derzeit auf Opus 4.6 unterstützt:
| Eingabe | Ausgabe |
|---|---|
| $30 / MTok | $150 / MTok |
Fast-Mode-Preisgestaltung stapelt sich mit anderen Preismodifikatoren:
Fast Mode ist nicht mit der Batch API verfügbar.
Weitere Informationen finden Sie in der Fast-Mode-Dokumentation.
Die Batch API ermöglicht die asynchrone Verarbeitung großer Mengen von Anfragen mit einem 50%-Rabatt auf Eingabe- und Ausgabe-Token.
| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.6 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.5 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.6 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 |
Weitere Informationen zur Batch-Verarbeitung finden Sie in der Batch-Verarbeitungs-Dokumentation.
Claude Mythos Preview, Opus 4.6 und Sonnet 4.6 beinhalten das vollständige 1M-Token-Kontextfenster zu Standardpreisgestaltung. (Eine 900k-Token-Anfrage wird zum gleichen Pro-Token-Satz wie eine 9k-Token-Anfrage berechnet.) Prompt-Caching- und Batch-Verarbeitungsrabatte gelten zu Standardsätzen über das gesamte Kontextfenster.
Tool use requests are priced based on:
tools parameter)Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.
The additional tokens from tool use come from:
tools parameter in API requests (tool names, descriptions, and schemas)tool_use content blocks in API requests and responsestool_result content blocks in API requestsWhen you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.6 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.1 | auto, noneany, tool |
These token counts are added to your normal input and output tokens to calculate the total cost of a request.
Für aktuelle Pro-Modell-Preise siehe den Abschnitt Modellpreisgestaltung.
Weitere Informationen zur Tool-Use-Implementierung und Best Practices finden Sie in der Tool-Use-Dokumentation.
The bash tool adds 245 input tokens to your API calls.
Additional tokens are consumed by:
Siehe Tool-Use-Preisgestaltung für vollständige Preisdetails.
Code execution is free when used with web search or web fetch. When web_search_20260209 or web_fetch_20260209 is included in your API request, there are no additional charges for code execution tool calls beyond the standard input and output token costs.
When used without these tools, code execution is billed by execution time, tracked separately from token usage:
Code execution usage is tracked in the response:
"usage": {
"input_tokens": 105,
"output_tokens": 239,
"server_tool_use": {
"code_execution_requests": 1
}
}The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.
In addition to the base tokens, the following additional input tokens are needed for the text editor tool:
| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7 (deprecated)) | 700 tokens |
Siehe Tool-Use-Preisgestaltung für vollständige Preisdetails.
Web search usage is charged in addition to token usage:
"usage": {
"input_tokens": 105,
"output_tokens": 6039,
"cache_read_input_tokens": 7123,
"cache_creation_input_tokens": 7345,
"server_tool_use": {
"web_search_requests": 1
}
}Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.
Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.
Web fetch usage has no additional charges beyond standard token costs:
"usage": {
"input_tokens": 25039,
"output_tokens": 931,
"cache_read_input_tokens": 0,
"cache_creation_input_tokens": 0,
"server_tool_use": {
"web_fetch_requests": 1
}
}The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.
To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
Computer use follows the standard tool use pricing. When using the computer use tool:
System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt
Computer use tool token usage:
| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
Additional token consumption:
If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Claude Managed Agents wird in zwei Dimensionen berechnet: Token und Session-Laufzeit.
Alle Token, die von einer Claude Managed Agents-Session verbraucht werden, werden zu den in Modellpreisgestaltung oben angegebenen Sätzen berechnet. Prompt-Caching-Multiplikatoren gelten identisch. Web-Suche, die innerhalb einer Session ausgelöst wird, verursacht die standardmäßigen $10 pro 1.000 Suchen.
Die folgenden Messages API-Modifikatoren gelten nicht für Claude Managed Agents-Sessions:
| Modifikator | Warum es nicht gilt |
|---|---|
| Batch API-Rabatt | Sessions sind zustandsbehaftet und interaktiv. Es gibt keinen Batch-Modus. |
| Fast-Mode-Premium | Inferenzgeschwindigkeit wird von der Laufzeit verwaltet. |
| Datenresidenz-Multiplikator | inference_geo ist ein Messages API-Anfrage-Feld. |
| Long-Context-Premium | Kontextfenster wird von der Laufzeit verwaltet. |
| Drittanbieter-Plattform-Preisgestaltung | Claude Managed Agents ist nur über die Claude API direkt verfügbar. |
| SKU | Satz | Messung |
|---|---|---|
| Session-Laufzeit | $0,08 pro Session-Stunde | running-Status-Dauer |
Die Laufzeit wird auf die Millisekunde gemessen und fällt nur an, während der Status der Session running ist. Zeit, die idle (warten auf Ihre nächste Nachricht oder eine Tool-Bestätigung), rescheduling oder terminated ist, zählt nicht zur Laufzeit.
Session-Laufzeit ersetzt das Code Execution-Container-Stunden-Abrechnungsmodell bei Verwendung von Claude Managed Agents. Sie werden nicht separat für Container-Stunden zusätzlich zur Session-Laufzeit berechnet.
Eine einstündige Coding-Session mit Claude Opus 4.6, die 50.000 Eingabe-Token und 15.000 Ausgabe-Token verbraucht:
| Posten | Berechnung | Kosten |
|---|---|---|
| Eingabe-Token | 50.000 × $5 / 1.000.000 | $0,25 |
| Ausgabe-Token | 15.000 × $25 / 1.000.000 | $0,375 |
| Session-Laufzeit | 1,0 Stunde × $0,08 | $0,08 |
| Gesamt | $0,705 |
Wenn Prompt-Caching aktiv ist und 40.000 der Eingabe-Token Cache-Lesezugriffe sind:
| Posten | Berechnung | Kosten |
|---|---|---|
| Nicht zwischengespeicherte Eingabe-Token | 10.000 × $5 / 1.000.000 | $0,05 |
| Cache-Lesezugriff-Token | 40.000 × $5 × 0,1 / 1.000.000 | $0,02 |
| Ausgabe-Token | 15.000 × $25 / 1.000.000 | $0,375 |
| Session-Laufzeit | 1,0 Stunde × $0,08 | $0,08 |
| Gesamt | $0,525 |
Beispielberechnung für die Verarbeitung von 10.000 Support-Tickets:
Für eine detaillierte Anleitung dieser Berechnung siehe den Customer-Support-Agent-Leitfaden.
Beim Erstellen von Agenten mit Claude:
Für Hochvolumen-Agent-Anwendungen kontaktieren Sie das Enterprise-Sales-Team für benutzerdefinierte Preisvereinbarungen.
Rate Limits variieren je nach Nutzungsstufe und beeinflussen, wie viele Anfragen Sie stellen können:
Für detaillierte Rate-Limit-Informationen siehe die Rate-Limits-Dokumentation.
Für höhere Rate Limits oder benutzerdefinierte Preisvereinbarungen kontaktieren Sie das Sales-Team.
Mengenrabatte können für Hochvolumen-Benutzer verfügbar sein. Diese werden von Fall zu Fall verhandelt.
Für Enterprise-Kunden mit spezifischen Anforderungen:
Kontaktieren Sie das Sales-Team unter [email protected] oder über die Claude Console, um Enterprise-Preisoptionen zu besprechen.
Wie wird die Token-Nutzung berechnet?
Token sind Textstücke, die Modelle verarbeiten. Als grobe Schätzung ist 1 Token ungefähr 4 Zeichen oder 0,75 Wörter im Englischen. Die genaue Anzahl variiert je nach Sprache und Inhaltstyp.
Gibt es kostenlose Stufen oder Testversionen?
Neue Benutzer erhalten eine kleine Menge kostenloser Credits zum Testen der API. Kontaktieren Sie den Vertrieb für Informationen über erweiterte Testversionen für Enterprise-Evaluierung.
Wie stapeln sich Rabatte?
Batch API- und Prompt-Caching-Rabatte können kombiniert werden. Beispielsweise bietet die Verwendung beider Funktionen zusammen erhebliche Kosteneinsparungen im Vergleich zu Standard-API-Aufrufen. Siehe Prompt-Caching-Preisgestaltung für die Interaktion der Multiplikatoren.
Welche Zahlungsmethoden werden akzeptiert?
Große Kreditkarten werden für Standardkonten akzeptiert. Enterprise-Kunden können Rechnungen und andere Zahlungsmethoden vereinbaren.
Für zusätzliche Fragen zur Preisgestaltung kontaktieren Sie [email protected].
Was this page helpful?
| $0.50 / MTok |
| $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
| 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.6 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |