Loading...
  • Erstellen
  • Admin
  • Modelle & Preise
  • Client-SDKs
  • API-Referenz
Search...
⌘K
Modelle
ModellübersichtEin Modell auswählenWas ist neu in Claude Opus 4.7MigrationsleitfadenModell-AbkündigungenModellkartenSystem-Prompts
Preise
Preise
Log in
Preise
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Modelle & Preise/Preise

Preisgestaltung

Erfahren Sie mehr über die Preisstruktur von Anthropic für Modelle und Funktionen

Diese Seite bietet detaillierte Preisinformationen für Anthropics Modelle und Funktionen. Alle Preise sind in USD.

Die aktuellsten Preisinformationen finden Sie unter claude.com/pricing.

Modellpreisgestaltung

Die folgende Tabelle zeigt die Preisgestaltung für alle Claude-Modelle über verschiedene Nutzungsstufen hinweg:

ModelBase Input Tokens5m Cache Writes1h Cache WritesCache Hits & RefreshesOutput Tokens
Claude Opus 4.7$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.6$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.5$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.1$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Opus 4 (deprecated)$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Sonnet 4.6$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 4.5$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 4 (deprecated)$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Haiku 4.5$1 / MTok$1.25 / MTok$2 / MTok$0.10 / MTok$5 / MTok
Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI)$0.80 / MTok$1 / MTok$1.60 / MTok$0.08 / MTok$4 / MTok

MTok = Million Token. Die Spalte „Base Input Tokens" zeigt die standardmäßige Eingabepreisgestaltung, „Cache Writes" und „Cache Hits" sind spezifisch für Prompt Caching, und „Output Tokens" zeigt die Ausgabepreisgestaltung. Siehe Prompt Caching Preisgestaltung unten für eine Erklärung der Cache-Spalten und Preismultiplikatoren.

Opus 4.7 verwendet einen neuen Tokenizer im Vergleich zu früheren Modellen, was zu seiner verbesserten Leistung bei einer Vielzahl von Aufgaben beiträgt. Dieser neue Tokenizer kann bis zu 35% mehr Token für denselben festen Text verwenden.

Preisgestaltung auf Drittanbieter-Plattformen

Claude-Modelle sind auf AWS Bedrock, Google Vertex AI und Microsoft Foundry verfügbar. Für offizielle Preisgestaltung besuchen Sie:

  • AWS Bedrock Preisgestaltung
  • Google Vertex AI Preisgestaltung
  • Microsoft Foundry Preisgestaltung

Preisgestaltung für regionale und Multi-Region-Endpunkte für Claude 4.5-Modelle und darüber hinaus

Ab Claude Sonnet 4.5 und Haiku 4.5:

  • AWS Bedrock bietet zwei Endpunkt-Typen: globale Endpunkte (dynamisches Routing für maximale Verfügbarkeit) und regionale Endpunkte (garantiertes Daten-Routing durch spezifische geografische Regionen).
  • Google Vertex AI bietet drei Endpunkt-Typen: globale Endpunkte, Multi-Region-Endpunkte (dynamisches Routing innerhalb eines geografischen Bereichs) und regionale Endpunkte.

Regionale und Multi-Region-Endpunkte beinhalten einen 10%-Aufschlag gegenüber globalen Endpunkten. Die Claude API (1P) ist standardmäßig global; für 1P-Datenresidenz-Optionen und Preisgestaltung siehe Datenresidenz-Preisgestaltung unten.

Umfang: Diese Preisstruktur gilt für Claude Sonnet 4.5, Haiku 4.5 und alle zukünftigen Modelle. Frühere Modelle (Claude Sonnet 4 (veraltet), Opus 4 (veraltet) und frühere Versionen) behalten ihre bestehende Preisgestaltung.

Für Implementierungsdetails und Code-Beispiele:

  • AWS Bedrock globale vs. regionale Endpunkte
  • Google Vertex AI globale, Multi-Region- und regionale Endpunkte

Funktionsspezifische Preisgestaltung

Prompt Caching

Prompt Caching reduziert Kosten und Latenz durch die Wiederverwendung zuvor verarbeiteter Teile Ihres Prompts über API-Aufrufe hinweg. Anstatt denselben großen System-Prompt, Dokument oder Gesprächsverlauf bei jeder Anfrage neu zu verarbeiten, liest die API aus dem Cache zu einem Bruchteil des standardmäßigen Eingabepreises.

Es gibt zwei Möglichkeiten, Prompt Caching zu aktivieren:

  • Automatisches Caching: Fügen Sie ein einzelnes cache_control-Feld auf der obersten Ebene Ihrer Anfrage hinzu. Das System verwaltet automatisch Cache-Breakpoints, während Gespräche wachsen. Dies ist der empfohlene Ausgangspunkt für die meisten Anwendungsfälle.
  • Explizite Cache-Breakpoints: Platzieren Sie cache_control direkt auf einzelnen Inhaltsblöcken für präzise Kontrolle darüber, was genau zwischengespeichert wird.

Prompt Caching verwendet die folgenden Preismultiplikatoren relativ zu den Basis-Eingabe-Token-Raten:

Cache-OperationMultiplikatorDauer
5-Minuten-Cache-Schreibvorgang1,25x Basis-EingabepreisCache gültig für 5 Minuten
1-Stunden-Cache-Schreibvorgang2x Basis-EingabepreisCache gültig für 1 Stunde
Cache-Lesezugriff (Hit)0,1x Basis-EingabepreisGleiche Dauer wie der vorherige Schreibvorgang

Cache-Schreib-Token werden berechnet, wenn Inhalte zum ersten Mal gespeichert werden. Cache-Lese-Token werden berechnet, wenn eine nachfolgende Anfrage den zwischengespeicherten Inhalt abruft. Ein Cache-Hit kostet 10% des standardmäßigen Eingabepreises, was bedeutet, dass sich Caching nach nur einem Cache-Lesezugriff für die 5-Minuten-Dauer (1,25x Schreibvorgang) oder nach zwei Cache-Lesezugriffen für die 1-Stunden-Dauer (2x Schreibvorgang) auszahlt.

Diese Multiplikatoren stapeln sich mit anderen Preismodifiern, einschließlich des Batch API-Rabatts und der Datenresidenz.

Für Implementierungsdetails, unterstützte Modelle und Code-Beispiele siehe die Prompt Caching-Dokumentation.

Datenresidenz-Preisgestaltung

Für Claude Opus 4.7, Claude Opus 4.6 und neuere Modelle führt die Angabe von reiner US-Inferenz über den inference_geo-Parameter zu einem 1,1x-Multiplikator auf alle Token-Preiskategorien, einschließlich Eingabe-Token, Ausgabe-Token, Cache-Schreibvorgänge und Cache-Lesezugriffe. Globales Routing (Standard) verwendet Standardpreisgestaltung.

Dies gilt nur für die Claude API (1P). Drittanbieter-Plattformen haben ihre eigene regionale Preisgestaltung. Siehe AWS Bedrock und Google Vertex AI für Details. Frühere Modelle behalten ihre bestehende Preisgestaltung unabhängig von inference_geo-Einstellungen.

Weitere Informationen finden Sie in der Datenresidenz-Dokumentation.

Fast Mode Preisgestaltung

Fast Mode (Beta: Forschungsvorschau) für Claude Opus 4.6 bietet erheblich schnellere Ausgabe zu Premium-Preisgestaltung (6x Standardraten). Fast Mode Preisgestaltung gilt über das gesamte Kontextfenster, einschließlich Anfragen über 200k Eingabe-Token. Derzeit auf Opus 4.6 unterstützt:

EingabeAusgabe
$30 / MTok$150 / MTok

Fast Mode Preisgestaltung stapelt sich mit anderen Preismodifiern:

  • Prompt Caching Multiplikatoren gelten zusätzlich zur Fast Mode Preisgestaltung
  • Datenresidenz Multiplikatoren gelten zusätzlich zur Fast Mode Preisgestaltung

Fast Mode ist nicht mit der Batch API verfügbar.

Weitere Informationen finden Sie in der Fast Mode Dokumentation.

Batch-Verarbeitung

Die Batch API ermöglicht asynchrone Verarbeitung großer Mengen von Anfragen mit einem 50%-Rabatt auf Eingabe- und Ausgabe-Token.

ModelBatch inputBatch output
Claude Opus 4.7$2.50 / MTok$12.50 / MTok
Claude Opus 4.6$2.50 / MTok$12.50 / MTok
Claude Opus 4.5$2.50 / MTok$12.50 / MTok
Claude Opus 4.1$7.50 / MTok$37.50 / MTok
Claude Opus 4 (deprecated)$7.50 / MTok$37.50 / MTok
Claude Sonnet 4.6$1.50 / MTok$7.50 / MTok
Claude Sonnet 4.5$1.50 / MTok$7.50 / MTok
Claude Sonnet 4 (deprecated)$1.50 / MTok$7.50 / MTok
Claude Haiku 4.5$0.50 / MTok$2.50 / MTok
Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI)$0.40 / MTok$2 / MTok

Weitere Informationen zur Batch-Verarbeitung finden Sie in der Batch-Verarbeitungs-Dokumentation.

Long Context Preisgestaltung

Claude Mythos Preview, Opus 4.7, Opus 4.6 und Sonnet 4.6 beinhalten das vollständige 1M Token Kontextfenster zu Standardpreisgestaltung. (Eine 900k-Token-Anfrage wird zum gleichen Pro-Token-Satz wie eine 9k-Token-Anfrage berechnet.) Prompt Caching und Batch-Verarbeitungsrabatte gelten zu Standardraten über das gesamte Kontextfenster.

Tool Use Preisgestaltung

Tool use requests are priced based on:

  1. The total number of input tokens sent to the model (including in the tools parameter)
  2. The number of output tokens generated
  3. For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

The additional tokens from tool use come from:

  • The tools parameter in API requests (tool names, descriptions, and schemas)
  • tool_use content blocks in API requests and responses
  • tool_result content blocks in API requests

When you use tools, the API also automatically includes a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

ModelTool choiceTool use system prompt token count
Claude Opus 4.7auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.6auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.1auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4 (deprecated)auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4.6auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4 (deprecated)auto, none
any, tool
346 tokens
313 tokens
Claude Haiku 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI)auto, none
any, tool
264 tokens
340 tokens

These token counts are added to your normal input and output tokens to calculate the total cost of a request.

Für aktuelle Pro-Modell-Preise siehe den Abschnitt Modellpreisgestaltung.

Weitere Informationen zur Tool Use Implementierung und Best Practices finden Sie in der Tool Use Dokumentation.

Spezifische Tool-Preisgestaltung

Bash Tool

The bash tool adds 245 input tokens to your API calls.

Additional tokens are consumed by:

  • Command outputs (stdout/stderr)
  • Error messages
  • Large file contents

Siehe Tool Use Preisgestaltung für vollständige Preisdetails.

Code Execution Tool

Code execution is free when used with web search or web fetch. When web_search_20260209 or web_fetch_20260209 is included in your API request, there are no additional charges for code execution tool calls beyond the standard input and output token costs.

When used without these tools, code execution is billed by execution time, tracked separately from token usage:

  • Execution time has a minimum of 5 minutes
  • Each organization receives 1,550 free hours of usage per month
  • Additional usage beyond 1,550 hours is billed at $0.05 per hour, per container
  • If files are included in the request, execution time is billed even if the tool is not invoked, due to files being preloaded onto the container

Code execution usage is tracked in the response:

{
  "usage": {
    "input_tokens": 105,
    "output_tokens": 239,
    "server_tool_use": {
      "code_execution_requests": 1
    }
  }
}

Text Editor Tool

The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.

In addition to the base tokens, the following additional input tokens are needed for the text editor tool:

ToolAdditional input tokens
text_editor_20250429 (Claude 4.x)700 tokens

Siehe Tool Use Preisgestaltung für vollständige Preisdetails.

Web Search Tool

Web search usage is charged in addition to token usage:

{
  "usage": {
    "input_tokens": 105,
    "output_tokens": 6039,
    "cache_read_input_tokens": 7123,
    "cache_creation_input_tokens": 7345,
    "server_tool_use": {
      "web_search_requests": 1
    }
  }
}

Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.

Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

Web Fetch Tool

Web fetch usage has no additional charges beyond standard token costs:

{
  "usage": {
    "input_tokens": 25039,
    "output_tokens": 931,
    "cache_read_input_tokens": 0,
    "cache_creation_input_tokens": 0,
    "server_tool_use": {
      "web_fetch_requests": 1
    }
  }
}

The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.

To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.

Example token usage for typical content:

  • Average web page (10 kB): ~2,500 tokens
  • Large documentation page (100 kB): ~25,000 tokens
  • Research paper PDF (500 kB): ~125,000 tokens

Computer Use Tool

Computer use follows the standard tool use pricing. When using the computer use tool:

System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt

Computer use tool token usage:

ModelInput tokens per tool definition
Claude 4.x models735 tokens

Additional token consumption:

  • Screenshot images (see Vision pricing)
  • Tool execution results returned to Claude

If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

Claude Managed Agents Preisgestaltung

Claude Managed Agents wird auf zwei Dimensionen abgerechnet: Token und Session-Laufzeit.

Token

Alle Token, die von einer Claude Managed Agents Session verbraucht werden, werden zu den Raten berechnet, die in Modellpreisgestaltung oben gezeigt werden. Prompt Caching Multiplikatoren gelten identisch. Web Search, die innerhalb einer Session ausgelöst wird, verursacht die standardmäßigen $10 pro 1.000 Suchen.

Die folgenden Messages API Modifizierer gelten nicht für Claude Managed Agents Sessions:

ModifiziererWarum es nicht gilt
Batch API RabattSessions sind zustandsbehaftet und interaktiv. Es gibt keinen Batch-Modus.
Fast Mode PremiumInferenzgeschwindigkeit wird von der Runtime verwaltet.
Datenresidenz Multiplikatorinference_geo ist ein Messages API Anfrage-Feld.
Long Context PremiumKontextfenster wird von der Runtime verwaltet.
Drittanbieter-Plattform PreisgestaltungClaude Managed Agents ist nur über die Claude API direkt verfügbar.

Session-Laufzeit

SKURateMessung
Session-Laufzeit$0,08 pro Session-Stunderunning Status Dauer

Laufzeit wird auf die Millisekunde gemessen und fällt nur an, während der Status der Session running ist. Zeit, die idle (warten auf Ihre nächste Nachricht oder eine Tool-Bestätigung), rescheduling oder terminated ist, zählt nicht zur Laufzeit.

Session-Laufzeit ersetzt das Code Execution Container-Stunden-Abrechnungsmodell bei Verwendung von Claude Managed Agents. Sie werden nicht separat für Container-Stunden zusätzlich zur Session-Laufzeit berechnet.

Durchgerechnetes Beispiel

Eine einstündige Coding-Session mit Claude Opus 4.7, die 50.000 Eingabe-Token und 15.000 Ausgabe-Token verbraucht:

PostenBerechnungKosten
Eingabe-Token50.000 × $5 / 1.000.000$0,25
Ausgabe-Token15.000 × $25 / 1.000.000$0,375
Session-Laufzeit1,0 Stunde × $0,08$0,08
Gesamt$0,705

Wenn Prompt Caching aktiv ist und 40.000 der Eingabe-Token Cache-Lesezugriffe sind:

PostenBerechnungKosten
Nicht zwischengespeicherte Eingabe-Token10.000 × $5 / 1.000.000$0,05
Cache-Lese-Token40.000 × $5 × 0,1 / 1.000.000$0,02
Ausgabe-Token15.000 × $25 / 1.000.000$0,375
Session-Laufzeit1,0 Stunde × $0,08$0,08
Gesamt$0,525

Beispielberechnung für die Verarbeitung von 10.000 Support-Tickets:

  • Durchschnittlich ~3.700 Token pro Gespräch
  • Verwendung von Claude Haiku 4.5 bei $1/MTok Eingabe, $5/MTok Ausgabe
  • Gesamtkosten: ~$37,00 pro 10.000 Tickets

Für eine detaillierte Anleitung dieser Berechnung siehe den Customer Support Agent Guide.

Zusätzliche Preisüberlegungen

Kostenoptimierungsstrategien

Beim Erstellen von Agents mit Claude:

  1. Verwenden Sie geeignete Modelle: Wählen Sie Haiku für einfache Aufgaben, Sonnet für komplexes Reasoning
  2. Implementieren Sie Prompt Caching: Reduzieren Sie Kosten für wiederholten Kontext
  3. Batch-Operationen: Verwenden Sie die Batch API für nicht zeitkritische Aufgaben
  4. Überwachen Sie Nutzungsmuster: Verfolgen Sie Token-Verbrauch, um Optimierungsmöglichkeiten zu identifizieren

Für High-Volume-Agent-Anwendungen kontaktieren Sie das Enterprise Sales Team für benutzerdefinierte Preisvereinbarungen.

Rate Limits

Rate Limits variieren je nach Nutzungsstufe und beeinflussen, wie viele Anfragen Sie stellen können:

  • Tier 1: Einstiegs-Nutzung mit grundlegenden Limits
  • Tier 2: Erhöhte Limits für wachsende Anwendungen
  • Tier 3: Höhere Limits für etablierte Anwendungen
  • Tier 4: Maximale Standard-Limits
  • Enterprise: Benutzerdefinierte Limits verfügbar

Für detaillierte Rate Limit Informationen siehe die Rate Limits Dokumentation.

Für höhere Rate Limits oder benutzerdefinierte Preisvereinbarungen kontaktieren Sie das Sales Team.

Mengenrabatte

Mengenrabatte können für High-Volume-Benutzer verfügbar sein. Diese werden von Fall zu Fall verhandelt.

  • Standard-Tiers verwenden die oben gezeigten Preise
  • Enterprise-Kunden können Sales kontaktieren für benutzerdefinierte Preisgestaltung
  • Akademische und Forschungsrabatte können verfügbar sein

Enterprise Preisgestaltung

Für Enterprise-Kunden mit spezifischen Anforderungen:

  • Benutzerdefinierte Rate Limits
  • Mengenrabatte
  • Dedizierter Support
  • Benutzerdefinierte Bedingungen

Kontaktieren Sie das Sales Team unter [email protected] oder über die Claude Console, um Enterprise-Preisoptionen zu besprechen.

Abrechnung und Zahlung

  • Die Abrechnung basiert auf tatsächlicher monatlicher Nutzung
  • Alle Zahlungen sind in USD
  • Kreditkarten- und Rechnungsoptionen verfügbar
  • Nutzungsverfolgung verfügbar in der Claude Console

Häufig gestellte Fragen

Wie wird die Token-Nutzung berechnet?

Token sind Textstücke, die Modelle verarbeiten. Als grobe Schätzung ist 1 Token ungefähr 4 Zeichen oder 0,75 Wörter im Englischen. Die genaue Anzahl variiert je nach Sprache und Inhaltstyp.

Gibt es kostenlose Tiers oder Trials?

Neue Benutzer erhalten eine kleine Menge kostenloser Credits zum Testen der API. Kontaktieren Sie Sales für Informationen über erweiterte Trials für Enterprise-Evaluierung.

Wie stapeln sich Rabatte?

Batch API und Prompt Caching Rabatte können kombiniert werden. Zum Beispiel bietet die Verwendung beider Funktionen zusammen erhebliche Kosteneinsparungen im Vergleich zu Standard-API-Aufrufen. Siehe Prompt Caching Preisgestaltung für die Interaktion der Multiplikatoren.

Welche Zahlungsmethoden werden akzeptiert?

Große Kreditkarten werden für Standard-Konten akzeptiert. Enterprise-Kunden können Rechnungen und andere Zahlungsmethoden vereinbaren.

Für zusätzliche Fragen zur Preisgestaltung kontaktieren Sie [email protected].

Was this page helpful?

  • Modellpreisgestaltung
  • Preisgestaltung auf Drittanbieter-Plattformen
  • Funktionsspezifische Preisgestaltung
  • Prompt Caching
  • Datenresidenz-Preisgestaltung
  • Fast Mode Preisgestaltung
  • Batch-Verarbeitung
  • Long Context Preisgestaltung
  • Tool Use Preisgestaltung
  • Spezifische Tool-Preisgestaltung
  • Claude Managed Agents Preisgestaltung
  • Token
  • Session-Laufzeit
  • Durchgerechnetes Beispiel
  • Zusätzliche Preisüberlegungen
  • Kostenoptimierungsstrategien
  • Rate Limits
  • Mengenrabatte
  • Enterprise Preisgestaltung
  • Abrechnung und Zahlung
  • Häufig gestellte Fragen