Modelle & PreiseModelle

Preise

Erfahre mehr über Anthropics Preisstruktur für Modelle und Funktionen

Diese Seite bietet detaillierte Preisinformationen für Anthropics Modelle und Funktionen. Alle Preise sind in USD angegeben.

Die aktuellsten Preisinformationen findest du unter claude.com/pricing.

Modellpreise

Die folgende Tabelle zeigt die Preise für alle Claude-Modelle:

Modell	Basis-Input-Token	5-Min.-Cache-Schreibvorgänge	1-Std.-Cache-Schreibvorgänge	Cache-Treffer & -Aktualisierungen	Output-Token
Claude Fable 5	$10 / MTok	$12.50 / MTok	$20 / MTok	$1 / MTok	$50 / MTok
Claude Mythos 5 (begrenzte Verfügbarkeit)	$10 / MTok	$12.50 / MTok	$20 / MTok	$1 / MTok	$50 / MTok
Claude Opus 4.8	$5 / MTok	$6.25 / MTok	$10 / MTok	$0.50 / MTok	$25 / MTok
Claude Opus 4.7	$5 / MTok	$6.25 / MTok	$10 / MTok	$0.50 / MTok	$25 / MTok
Claude Opus 4.6	$5 / MTok	$6.25 / MTok	$10 / MTok	$0.50 / MTok	$25 / MTok
Claude Opus 4.5	$5 / MTok	$6.25 / MTok	$10 / MTok	$0.50 / MTok	$25 / MTok
Claude Opus 4.1 (veraltet)	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Opus 4 (eingestellt, außer auf Google Cloud)	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Sonnet 5 bis 31. August 2026	$2 / MTok	$2.50 / MTok	$4 / MTok	$0.20 / MTok	$10 / MTok
Claude Sonnet 5 ab 1. September 2026	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 4.6	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 4.5	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 4 (eingestellt, außer auf Bedrock und Google Cloud)	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Haiku 4.5	$1 / MTok	$1.25 / MTok	$2 / MTok	$0.10 / MTok	$5 / MTok
Claude Haiku 3.5 (eingestellt, außer auf Bedrock und Google Cloud)	$0.80 / MTok	$1 / MTok	$1.60 / MTok	$0.08 / MTok	$4 / MTok

Der Einführungspreis von 2 $/10 $ pro Million Input-/Output-Token gilt bis zum 31. August 2026. Danach tritt der Standardpreis von 3 $/15 $ pro Million Input-/Output-Token in Kraft.

MTok = Million Token. Die Spalte „Base Input Tokens" zeigt die Standard-Input-Preise, die Spalten „5m Cache Writes", „1h Cache Writes" und „Cache Hits & Refreshes" beziehen sich speziell auf Prompt-Caching, und „Output Tokens" zeigt die Output-Preise. Siehe Prompt-Caching-Preise für eine Erklärung der Cache-Spalten und Preismultiplikatoren.

Claude Opus 4.7 und spätere Opus-Modelle, Claude Fable 5, Claude Mythos 5, Claude Mythos Preview und Claude Sonnet 5 verwenden einen neueren Tokenizer, der zu ihrer verbesserten Leistung bei einer Vielzahl von Aufgaben beiträgt. Dieser Tokenizer erzeugt etwa 30 % mehr Token für denselben Text. Claude Sonnet 4.6 und frühere Modelle verwenden den vorherigen Tokenizer.

Für Preise zu Claude Platform on AWS siehe Claude Platform on AWS – Preise.

Cloud-Plattform-Preise

Dieser Abschnitt behandelt von Partnern betriebene Cloud-Plattformen, bei denen der Cloud-Anbieter dir die Rechnung stellt. Für von Anthropic betriebene Cloud-Plattformen, die über einen Marketplace abgerechnet werden, siehe Claude Platform on AWS – Preise und Claude in Microsoft Foundry – Preise.

Claude-Modelle sind auf Amazon Bedrock und Google Cloud verfügbar. Offizielle Preise findest du unter:

Preise für regionale und Multi-Region-Endpunkte für Claude 4.5-Modelle und neuer

Ab Claude Sonnet 4.5, Haiku 4.5 und Opus 4.5:

Bedrock bietet zwei Endpunkttypen: globale Endpunkte (dynamisches Routing für maximale Verfügbarkeit) und regionale Endpunkte (garantiertes Daten-Routing durch bestimmte geografische Regionen).
Google Cloud bietet drei Endpunkttypen: globale Endpunkte, Multi-Region-Endpunkte (dynamisches Routing innerhalb eines geografischen Gebiets) und regionale Endpunkte.

Regionale und Multi-Region-Endpunkte beinhalten einen Aufschlag von 10 % gegenüber globalen Endpunkten. Die Claude API (First-Party) ist standardmäßig global; für First-Party-Optionen zur Datenresidenz und deren Preise siehe Preise für Datenresidenz.

Geltungsbereich: Diese Preisstruktur gilt für Claude Sonnet 4.5, Haiku 4.5, Opus 4.5 und alle zukünftigen Modelle. Frühere Modelle (Claude Opus 4.1 (veraltet) und vorherige Versionen) behalten ihre bestehenden Preise.

Für Implementierungsdetails und Codebeispiele:

Amazon Bedrock – globale vs. regionale Endpunkte für Opus 4.7, Haiku 4.5 und spätere Modelle, oder die Legacy-Integration für alle anderen Modelle auf Bedrock
Google Cloud – globale, Multi-Region- und regionale Endpunkte

Claude Platform on AWS – Preise

Claude Platform on AWS rechnet über den AWS Marketplace mit Claude Consumption Units (CCUs) ab. Anthropic bewertet deine Token-Nutzung in USD zu den Standardtarifen pro Modell und Funktion, wendet etwaige ausgehandelte Rabatte an, rechnet das Ergebnis in CCUs zu 0,01 $ pro CCU um und meldet die CCU-Menge stündlich an den AWS Marketplace. Deine AWS-Rechnung zeigt eine einzelne CCU-Position.

Konzept	Details
Abrechnungseinheit	Claude Consumption Unit (CCU)
CCU-Preis	0,01 $ pro CCU (fest; Rabatte werden bei der Token-zu-CCU-Umrechnung angewendet, nicht auf den CCU-Preis)
Umrechnung	Token-Nutzung wird in USD zu Standardtarifen pro Modell und Funktion bewertet (identisch mit den Claude API-Preisen), dann in CCUs zu 0,01 $ pro CCU umgerechnet
Abrechnungsrhythmus	Stündliche Messung an den AWS Marketplace; monatliche Rechnungen
Zahlungsmodell	Nur nachträglich (Postpaid); keine Prepaid-Guthaben
Rabatte	Werden als weniger gemessene CCUs angewendet
Steuern	Messung vor Steuern; AWS Marketplace übernimmt die Steuerabwicklung
Kostentransparenz	Echtzeit-Aufschlüsselung in der Claude Console (Zugriff über die AWS Console); AWS Cost Explorer zeigt aggregierte CCU

Claude Consumption Units. Wenn der Kunde über bestimmte Marketplace-Plattformen (z. B. Claude Platform on AWS) auf die Dienste zugreift, wird die Nutzung in Claude Consumption Units („CCU") statt pro MTok abgerechnet. Eine CCU ist eine Maßeinheit, die ausschließlich für die Abrechnung über Marketplace-Plattformen verwendet wird. Einhundert (100) CCU entsprechen 1,00 USD an Gebühren für die Dienste, berechnet zu den geltenden Preisen auf claude.com/pricing#api, nach Anwendung etwaiger Rabatte.

Inferenz-Geografie

Für Claude Opus 4.6, Claude Sonnet 4.6 und spätere Modelle wird bei Verwendung von inference_geo: "us" ein Preismultiplikator von 1,1x angewendet. inference_geo: "global" (Standard) verwendet die Standardpreise. Siehe Datenresidenz für Details.

Private Angebote

Wenn du dich auf der Serviceseite Claude Platform on AWS in der AWS Console anmeldest, sucht die AWS Console nach einem mit deinem Konto verknüpften privaten Angebot und fordert dich auf, es im AWS Marketplace zu akzeptieren. Kontaktiere deinen Anthropic-Ansprechpartner für die Bedingungen privater Angebote.

Wenn du bereits ein privates Angebot für Amazon Bedrock hast, kontaktiere deinen Anthropic- oder AWS-Ansprechpartner, bevor du mit Claude Platform on AWS beginnst, um sicherzustellen, dass deine Rabatte korrekt angewendet werden. Rabatte können nicht rückwirkend auf Nutzung angewendet werden, die vor der Annahme deines privaten Angebots angefallen ist.

Claude in Microsoft Foundry – Preise

Claude in Microsoft Foundry rechnet über den Azure Marketplace mit Claude Consumption Units (CCUs) ab. Anthropic bewertet deine Token-Nutzung in USD zu den Standardtarifen pro Modell und Funktion, wendet etwaige ausgehandelte Rabatte an, rechnet das Ergebnis in CCUs zu 0,01 $ pro CCU um und meldet die CCU-Menge stündlich an den Azure Marketplace. Deine Azure-Rechnung zeigt eine einzelne CCU-Position.

Konzept	Details
Abrechnungseinheit	Claude Consumption Unit (CCU)
CCU-Preis	0,01 $ pro CCU (fest; Rabatte werden bei der Token-zu-CCU-Umrechnung angewendet, nicht auf den CCU-Preis)
Umrechnung	Token-Nutzung wird in USD zu Standardtarifen pro Modell und Funktion bewertet (identisch mit den Claude API-Preisen), dann in CCUs zu 0,01 $ pro CCU umgerechnet
Abrechnungsrhythmus	Stündliche Messung an den Azure Marketplace; monatliche Rechnungen
Zahlungsmodell	Nur nachträglich (Postpaid); keine Prepaid-Guthaben
Rabatte	Werden als weniger gemessene CCUs angewendet
Steuern	Messung vor Steuern; Azure Marketplace übernimmt die Steuerabwicklung
Kostentransparenz	Azure Cost Management zeigt aggregierte CCU

Claude Consumption Units. Wenn der Kunde über bestimmte Marketplace-Plattformen (z. B. Claude Platform on AWS, Claude in Microsoft Foundry) auf die Dienste zugreift, wird die Nutzung in Claude Consumption Units („CCU") statt pro MTok abgerechnet. Eine CCU ist eine Maßeinheit, die ausschließlich für die Abrechnung über Marketplace-Plattformen verwendet wird. Einhundert (100) CCU entsprechen 1,00 USD an Gebühren für die Dienste, berechnet zu den geltenden Preisen auf claude.com/pricing#api, nach Anwendung etwaiger Rabatte.

Inferenz-Geografie

Auf Azure gehostete Deployments können den Deployment-Typ „US Data Zone Standard" verwenden, der die Inferenz innerhalb der Vereinigten Staaten hält. Dies entspricht inference_geo: "us" in der Claude API und wendet denselben Preismultiplikator von 1,1x an. Siehe Datenresidenz für Details.

Funktionsspezifische Preise

Prompt-Caching

„Prompt caching" (Prompt-Caching) reduziert Kosten und Latenz, indem bereits verarbeitete Teile deines Prompts über API-Aufrufe hinweg wiederverwendet werden. Anstatt denselben großen System-Prompt, dasselbe Dokument oder denselben Gesprächsverlauf bei jeder Anfrage erneut zu verarbeiten, liest die API aus dem Cache zu einem Bruchteil des Standard-Input-Preises.

Es gibt zwei Möglichkeiten, Prompt-Caching zu aktivieren:

Automatisches Caching: Füge ein einzelnes cache_control-Feld auf der obersten Ebene deiner Anfrage hinzu. Das System verwaltet Cache-Breakpoints automatisch, während Gespräche wachsen. Dies ist der empfohlene Ausgangspunkt für die meisten Anwendungsfälle.
Explizite Cache-Breakpoints: Platziere cache_control direkt auf einzelnen Content-Blöcken für eine feingranulare Kontrolle darüber, was genau gecacht wird.

Prompt-Caching verwendet die folgenden Preismultiplikatoren relativ zu den Basis-Input-Token-Tarifen:

Cache-Operation	Multiplikator	Dauer
5-Minuten-Cache-Schreibvorgang	1,25x Basis-Input-Preis	Cache 5 Minuten gültig
1-Stunden-Cache-Schreibvorgang	2x Basis-Input-Preis	Cache 1 Stunde gültig
Cache-Lesevorgang (Treffer)	0,1x Basis-Input-Preis	Gleiche Dauer wie der vorangehende Schreibvorgang

Cache-Schreib-Token werden berechnet, wenn Inhalte erstmals gespeichert werden. Cache-Lese-Token werden berechnet, wenn eine nachfolgende Anfrage den gecachten Inhalt abruft. Ein Cache-Treffer kostet 10 % des Standard-Input-Preises, was bedeutet, dass sich das Caching bereits nach einem einzigen Cache-Lesevorgang für die 5-Minuten-Dauer (1,25x Schreibvorgang) bzw. nach zwei Cache-Lesevorgängen für die 1-Stunden-Dauer (2x Schreibvorgang) amortisiert.

Diese Multiplikatoren kombinieren sich mit anderen Preismodifikatoren, einschließlich des Batch-API-Rabatts und der Datenresidenz.

Für Implementierungsdetails, unterstützte Modelle und Codebeispiele siehe Prompt-Caching.

Preise für Datenresidenz

Für Claude Opus 4.6, Claude Sonnet 4.6 und spätere Modelle führt die Angabe von US-only-Inferenz über den Parameter inference_geo zu einem Multiplikator von 1,1x auf alle Token-Preiskategorien, einschließlich Input-Token, Output-Token, Cache-Schreibvorgängen und Cache-Lesevorgängen. Globales Routing (Standard) verwendet die Standardpreise.

Dies gilt für die Claude API (First-Party) und Claude Platform on AWS. Bei Claude in Microsoft Foundry gilt derselbe Multiplikator von 1,1x für Deployments, die den Deployment-Typ „US Data Zone Standard" verwenden (siehe Inferenz-Geografie). Von Partnern betriebene Plattformen (Bedrock und Google Cloud) haben unabhängige regionale Preise. Siehe Bedrock und Google Cloud für Details. Frühere Modelle unterstützen den Parameter inference_geo nicht und verwenden immer die Standardpreise; Anfragen, die den Parameter bei diesen Modellen enthalten, geben einen 400-Fehler zurück.

Weitere Informationen findest du unter Datenresidenz.

Fast-Mode-Preise

Fast Mode (Schnellmodus), in der Research Preview, bietet deutlich schnellere Ausgaben für Claude Opus 4.8 und Claude Opus 4.7 zu Premium-Preisen. Fast-Mode-Preise gelten über das gesamte Kontextfenster, einschließlich Anfragen mit über 200k Input-Token. Fast Mode ist auf Claude Platform on AWS nicht verfügbar.

Modell	Input	Output
Claude Opus 4.8	10 $ / MTok	50 $ / MTok
Claude Opus 4.7	30 $ / MTok	150 $ / MTok

Fast Mode für Claude Opus 4.7 ist veraltet und wird am 24. Juli 2026 entfernt. Seit dem 29. Juni 2026 ist Fast Mode auf Claude Opus 4.6 nicht verfügbar: Anfragen an claude-opus-4-6 mit speed: "fast" laufen mit Standardgeschwindigkeit und werden zu Standardtarifen abgerechnet. Siehe Fast Mode.

Fast-Mode-Preise kombinieren sich mit anderen Preismodifikatoren:

Prompt-Caching-Multiplikatoren werden zusätzlich zu den Fast-Mode-Preisen angewendet
Datenresidenz-Multiplikatoren werden zusätzlich zu den Fast-Mode-Preisen angewendet

Fast Mode ist mit der Batch API nicht verfügbar.

Weitere Informationen findest du unter Fast Mode.

Batch-Verarbeitung

Die Batch API ermöglicht die asynchrone Verarbeitung großer Mengen von Anfragen mit einem Rabatt von 50 % auf Input- und Output-Token.

Modell	Batch-Input	Batch-Output
Claude Fable 5	$5 / MTok	$25 / MTok
Claude Mythos 5 (begrenzte Verfügbarkeit)	$5 / MTok	$25 / MTok
Claude Opus 4.8	$2.50 / MTok	$12.50 / MTok
Claude Opus 4.7	$2.50 / MTok	$12.50 / MTok
Claude Opus 4.6	$2.50 / MTok	$12.50 / MTok
Claude Opus 4.5	$2.50 / MTok	$12.50 / MTok
Claude Opus 4.1 (veraltet)	$7.50 / MTok	$37.50 / MTok
Claude Opus 4 (eingestellt, außer auf Google Cloud)	$7.50 / MTok	$37.50 / MTok
Claude Sonnet 5 bis 31. August 2026	$1 / MTok	$5 / MTok
Claude Sonnet 5 ab 1. September 2026	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 4.6	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 4.5	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 4 (eingestellt, außer auf Bedrock und Google Cloud)	$1.50 / MTok	$7.50 / MTok
Claude Haiku 4.5	$0.50 / MTok	$2.50 / MTok
Claude Haiku 3.5 (eingestellt, außer auf Bedrock und Google Cloud)	$0.40 / MTok	$2 / MTok

Weitere Informationen zur Batch-Verarbeitung findest du unter Batch-Verarbeitung.

Preise für langen Kontext

Claude Fable 5, Claude Mythos 5, Claude Mythos Preview, Claude Opus 4.8, Opus 4.7, Opus 4.6, Sonnet 5 und Sonnet 4.6 beinhalten das vollständige 1M-Token-Kontextfenster zu Standardpreisen. (Eine Anfrage mit 900k Token wird zum gleichen Preis pro Token abgerechnet wie eine Anfrage mit 9k Token.) Prompt-Caching- und Batch-Verarbeitungs-Rabatte gelten zu Standardtarifen über das gesamte Kontextfenster.

Preise für Tool-Nutzung

Anfragen zur Tool-Nutzung werden basierend auf folgenden Faktoren berechnet:

Die Gesamtzahl der an das Modell gesendeten Input-Token (einschließlich des tools-Parameters)
Die Anzahl der generierten Output-Token
Bei serverseitigen Tools zusätzliche nutzungsbasierte Kosten (z. B. Gebühren für die Websuche pro durchgeführter Suche)

Clientseitige Tools werden genauso berechnet wie jede andere Claude-API-Anfrage, während serverseitige Tools je nach ihrer spezifischen Nutzung zusätzliche Kosten verursachen können.

Die zusätzlichen Token aus der Tool-Nutzung stammen aus:

Dem tools-Parameter in API-Anfragen (Tool-Namen, Beschreibungen und Schemas)
tool_use-Inhaltsblöcken in API-Anfragen und -Antworten
tool_result-Inhaltsblöcken in API-Anfragen

Wenn du tools verwendest, fügt die API automatisch einen speziellen System-Prompt für das Modell hinzu, der die Tool-Nutzung ermöglicht. Die Anzahl der für die Tool-Nutzung erforderlichen Token ist für jedes Modell unten aufgeführt (ohne die oben genannten zusätzlichen Token). Beachte, dass die Tabelle davon ausgeht, dass mindestens 1 Tool bereitgestellt wird. Wenn keine tools bereitgestellt werden, verwendet eine Tool-Auswahl von none 0 zusätzliche System-Prompt-Token.

Modell	Tool-Auswahl	Token-Anzahl des System-Prompts für Tool-Nutzung
Claude Opus 4.8	`auto`, `none` `any`, `tool`	290 Token 410 Token
Claude Opus 4.7	`auto`, `none` `any`, `tool`	675 Token 804 Token
Claude Opus 4.6	`auto`, `none` `any`, `tool`	497 Token 589 Token
Claude Opus 4.5	`auto`, `none` `any`, `tool`	496 Token 588 Token
Claude Opus 4.1 (veraltet)	`auto`, `none` `any`, `tool`	313 Token 315 Token
Claude Opus 4 (eingestellt, außer auf Google Cloud)	`auto`, `none` `any`, `tool`	313 Token 315 Token
Claude Sonnet 5	`auto`, `none` `any`, `tool`	354 Token 474 Token
Claude Sonnet 4.6	`auto`, `none` `any`, `tool`	497 Token 589 Token
Claude Sonnet 4.5	`auto`, `none` `any`, `tool`	496 Token 588 Token
Claude Sonnet 4 (eingestellt, außer auf Bedrock und Google Cloud)	`auto`, `none` `any`, `tool`	313 Token 315 Token
Claude Haiku 4.5	`auto`, `none` `any`, `tool`	496 Token 588 Token
Claude Haiku 3.5 (eingestellt, außer auf Bedrock und Google Cloud)	`auto`, `none` `any`, `tool`	264 Token 355 Token

Diese Token-Anzahlen werden zu deinen normalen Input- und Output-Token addiert, um die Gesamtkosten einer Anfrage zu berechnen.

Aktuelle Preise pro Modell findest du im Abschnitt Modellpreise.

Weitere Informationen zur Implementierung von Tool-Nutzung und Best Practices findest du unter Tool-Nutzung.

Preise für spezifische Tools

Bash-Tool

Das Bash-Tool fügt deinen API-Aufrufen 245 Input-Tokens hinzu.

Zusätzliche Tokens werden verbraucht durch:

Befehlsausgaben (stdout/stderr)
Fehlermeldungen
Große Dateiinhalte

Siehe Preise für Tool-Nutzung für vollständige Preisdetails.

Code-Execution-Tool

Code-Ausführung ist kostenlos, wenn sie mit Websuche oder Web-Fetch verwendet wird. Wenn web_search_20260209 (oder neuer) oder web_fetch_20260209 (oder neuer) in deiner API-Anfrage enthalten ist, fallen für Aufrufe des Code-Ausführungs-Tools keine zusätzlichen Kosten an, abgesehen von den standardmäßigen Kosten für Input- und Output-Token.

Bei Verwendung ohne diese Tools wird die Code-Ausführung nach Ausführungszeit abgerechnet, die getrennt von der Token-Nutzung erfasst wird:

Die Ausführungszeit hat ein Minimum von 5 Minuten
Jede Organisation erhält 1.550 kostenlose Stunden Nutzung pro Monat
Zusätzliche Nutzung über 1.550 Stunden hinaus wird mit 0,05 $ pro Stunde, pro Container abgerechnet
Wenn Dateien in der Anfrage enthalten sind, wird die Ausführungszeit auch dann berechnet, wenn das Tool nicht aufgerufen wird, da die Dateien vorab in den Container geladen werden

Die Nutzung der Code-Ausführung wird in der Antwort erfasst:

{
  "usage": {
    "input_tokens": 105,
    "output_tokens": 239,
    "server_tool_use": {
      "code_execution_requests": 1
    }
  }
}

Text-Editor-Tool

Das Texteditor-Tool verwendet dieselbe Preisstruktur wie andere Tools, die mit Claude verwendet werden. Es folgt der standardmäßigen Preisgestaltung für Input- und Output-Token basierend auf dem Claude-Modell, das du verwendest.

Zusätzlich zu den Basis-Token werden die folgenden zusätzlichen Input-Token für das Texteditor-Tool benötigt:

Tool	Zusätzliche Input-Token
`text_editor_20250429` (Claude 4.x)	700 Token

Siehe Preise für Tool-Nutzung für vollständige Preisdetails.

Web-Search-Tool

Die Nutzung der Websuche wird zusätzlich zur Token-Nutzung berechnet:

{
  "usage": {
    "input_tokens": 105,
    "output_tokens": 6039,
    "cache_read_input_tokens": 7123,
    "cache_creation_input_tokens": 7345,
    "server_tool_use": {
      "web_search_requests": 1
    }
  }
}

Die Websuche ist über die Claude API für 10 $ pro 1.000 Suchanfragen verfügbar, zuzüglich der Standard-Token-Kosten für suchgenerierte Inhalte. Websuchergebnisse, die im Verlauf einer Konversation abgerufen werden, werden als Input-Token gezählt – sowohl in Suchiterationen, die während eines einzelnen Turns ausgeführt werden, als auch in nachfolgenden Konversations-Turns.

Jede Websuche zählt als eine Nutzung, unabhängig von der Anzahl der zurückgegebenen Ergebnisse. Wenn während der Websuche ein Fehler auftritt, wird die Websuche nicht in Rechnung gestellt.

Web-Fetch-Tool

Die Nutzung von Web Fetch verursacht keine zusätzlichen Kosten über die standardmäßigen Token-Kosten hinaus:

{
  "usage": {
    "input_tokens": 25039,
    "output_tokens": 931,
    "cache_read_input_tokens": 0,
    "cache_creation_input_tokens": 0,
    "server_tool_use": {
      "web_fetch_requests": 1
    }
  }
}

Das Web-Fetch-Tool ist über die Claude API ohne zusätzliche Kosten verfügbar. Du zahlst nur die standardmäßigen Token-Kosten für die abgerufenen Inhalte, die Teil deines Konversationskontexts werden.

Um dich davor zu schützen, versehentlich große Inhalte abzurufen, die übermäßig viele Tokens verbrauchen würden, verwende den Parameter max_content_tokens, um angemessene Limits basierend auf deinem Anwendungsfall und deinen Budgetüberlegungen festzulegen.

Beispiel für den Token-Verbrauch bei typischen Inhalten:

Durchschnittliche Webseite (10 kB): ~2.500 Tokens
Große Dokumentationsseite (100 kB): ~25.000 Tokens
Forschungsarbeit als PDF (500 kB): ~125.000 Tokens

Computer-Use-Tool

Computer use folgt der standardmäßigen Preisgestaltung für Tool-Nutzung. Bei der Verwendung des Computer-Use-Tools:

System-Prompt-Overhead: Die Computer-Use-Beta fügt dem System-Prompt 466–499 Token hinzu

Token-Verbrauch des Computer-Use-Tools:

Modell	Input-Token pro Tool-Definition
Claude 4.x-Modelle	735 Token

Zusätzlicher Token-Verbrauch:

Screenshot-Bilder (siehe Vision-Preisgestaltung)
Ergebnisse der Tool-Ausführung, die an Claude zurückgegeben werden

Wenn du neben Computer Use auch Bash- oder Text-Editor-Tools verwendest, haben diese Tools ihre eigenen Token-Kosten, wie auf ihren jeweiligen Seiten dokumentiert.

Claude Managed Agents – Preise

Claude Managed Agents wird nach zwei Dimensionen abgerechnet: Token und Session-Laufzeit.

Token

Alle von einer Claude Managed Agents-Session verbrauchten Token werden zu den unter Modellpreise angegebenen Tarifen abgerechnet. Prompt-Caching-Multiplikatoren gelten identisch. Innerhalb einer Session ausgelöste Websuchen verursachen die standardmäßigen 10 $ pro 1.000 Suchen. Auf Claude Platform on AWS werden Session-Token- und Laufzeitgebühren zum Standardtarif in Claude Consumption Units umgerechnet.

Die folgenden Messages-API-Modifikatoren gelten nicht für Claude Managed Agents-Sessions:

Modifikator	Warum er nicht gilt
Batch-API-Rabatt	Sessions sind zustandsbehaftet und interaktiv. Es gibt keinen Batch-Modus.
Fast-Mode-Aufschlag	Die Inferenzgeschwindigkeit wird von der Laufzeitumgebung verwaltet.
Datenresidenz-Multiplikator	`inference_geo` ist ein Messages-API-Anfragefeld.
Cloud-Plattform-Preise	Nicht auf von Partnern betriebenen Cloud-Plattformen verfügbar.

Session-Laufzeit

SKU	Tarif	Messung
Session-Laufzeit	0,08 $ pro Session-Stunde	Dauer des `running`-Status

Die Laufzeit wird millisekundengenau gemessen und fällt nur an, während der Status der Session running ist. Zeit im Status idle (Warten auf deine nächste Nachricht oder eine Tool-Bestätigung), rescheduling oder terminated zählt nicht zur Laufzeit.

Die Session-Laufzeit ersetzt das Code-Execution-Abrechnungsmodell nach Container-Stunden bei der Verwendung von Claude Managed Agents. Container-Stunden werden dir nicht zusätzlich zur Session-Laufzeit separat in Rechnung gestellt.

Rechenbeispiel

Eine einstündige Coding-Session mit Claude Opus 4.8, die 50.000 Input-Token und 15.000 Output-Token verbraucht:

Position	Berechnung	Kosten
Input-Token	50.000 × 5 $ / 1.000.000	0,25 $
Output-Token	15.000 × 25 $ / 1.000.000	0,375 $
Session-Laufzeit	1,0 Stunde × 0,08 $	0,08 $
Gesamt		0,705 $

Wenn Prompt-Caching aktiv ist und 40.000 der Input-Token Cache-Lesevorgänge sind:

Position	Berechnung	Kosten
Ungecachte Input-Token	10.000 × 5 $ / 1.000.000	0,05 $
Cache-Lese-Token	40.000 × 5 $ × 0,1 / 1.000.000	0,02 $
Output-Token	15.000 × 25 $ / 1.000.000	0,375 $
Session-Laufzeit	1,0 Stunde × 0,08 $	0,08 $
Gesamt		0,525 $

Beispielrechnung für die Verarbeitung von 10.000 Support-Tickets:

Durchschnittlich ~3.700 Token pro Gespräch
Mit Claude Haiku 4.5 zu 1 $/MTok Input, 5 $/MTok Output
Gesamtkosten: ~37,00 $ pro 10.000 Tickets

Eine detaillierte Erläuterung dieser Berechnung findest du im Leitfaden für Kundensupport-Agenten.

Zusätzliche Preisüberlegungen

Strategien zur Kostenoptimierung

Beim Erstellen von Agenten mit Claude:

Verwende geeignete Modelle: Wähle Haiku für einfache Aufgaben, Sonnet für die meisten Produktions-Workloads und Opus für die komplexesten Reasoning-Aufgaben
Implementiere Prompt-Caching: Reduziere Kosten für wiederholten Kontext
Batch-Operationen: Verwende die Batch API für nicht zeitkritische Aufgaben
Überwache Nutzungsmuster: Verfolge den Token-Verbrauch, um Optimierungsmöglichkeiten zu identifizieren

Für Agenten-Anwendungen mit hohem Volumen kontaktiere das Enterprise-Vertriebsteam für individuelle Preisvereinbarungen.

Ratenlimits

Ratenlimits variieren je nach Nutzungsstufe und beeinflussen, wie viele Anfragen du stellen kannst:

Start-Stufe: Einstiegslimits für den Anfang
Build-Stufe: Erhöhte Limits für wachsende Anwendungen
Scale-Stufe: Höchste Standardlimits für Produktions-Workloads

Detaillierte Informationen zu Ratenlimits findest du unter Ratenlimits.

Für Limits über die Scale-Stufe hinaus oder individuelle Preisvereinbarungen kontaktiere das Vertriebsteam.

Mengenrabatte

Mengenrabatte können für Nutzer mit hohem Volumen verfügbar sein. Diese werden individuell ausgehandelt.

Standard-Nutzungsstufen verwenden die unter Modellpreise angegebenen Preise
Enterprise-Kunden können den Vertrieb kontaktieren für individuelle Preise
Rabatte für akademische Einrichtungen und Forschung können verfügbar sein

Enterprise-Preise

Für Enterprise-Kunden mit spezifischen Anforderungen:

Individuelle Ratenlimits
Mengenrabatte
Dedizierter Support
Individuelle Vertragsbedingungen

Kontaktiere das Vertriebsteam unter [email protected] oder über die Claude Console, um Enterprise-Preisoptionen zu besprechen.

Abrechnung und Zahlung

Die Abrechnung basiert auf der tatsächlichen monatlichen Nutzung
Alle Zahlungen erfolgen in USD
Kreditkarten- und Rechnungsoptionen verfügbar
Nutzungsverfolgung in der Claude Console verfügbar

Häufig gestellte Fragen

Wie wird die Token-Nutzung berechnet?

Token sind Textteile, die Modelle verarbeiten. Als grobe Schätzung entspricht 1 Token etwa 4 Zeichen oder 0,75 Wörtern im Englischen. Die genaue Anzahl variiert je nach Sprache und Inhaltstyp.

Gibt es kostenlose Stufen oder Testversionen?

Neue Nutzer erhalten eine kleine Menge kostenloser Guthaben zum Testen der API. Kontaktiere den Vertrieb für Informationen über erweiterte Testversionen zur Enterprise-Evaluierung.

Wie kombinieren sich Rabatte?

Batch-API- und Prompt-Caching-Rabatte können kombiniert werden. Die gemeinsame Nutzung beider Funktionen bietet beispielsweise erhebliche Kosteneinsparungen im Vergleich zu Standard-API-Aufrufen. Siehe Prompt-Caching-Preise für Informationen darüber, wie die Multiplikatoren zusammenwirken.

Welche Zahlungsmethoden werden akzeptiert?

Gängige Kreditkarten werden für Standardkonten akzeptiert. Enterprise-Kunden können Rechnungsstellung und andere Zahlungsmethoden vereinbaren.

Bei weiteren Fragen zu Preisen kontaktiere [email protected].

Was this page helpful?

Modelle & PreiseModelle

Preise

Erfahre mehr über Anthropics Preisstruktur für Modelle und Funktionen

Diese Seite bietet detaillierte Preisinformationen für Anthropics Modelle und Funktionen. Alle Preise sind in USD angegeben.

Die aktuellsten Preisinformationen findest du unter claude.com/pricing.

Modellpreise

Die folgende Tabelle zeigt die Preise für alle Claude-Modelle:

Modell	Basis-Input-Token	5-Min.-Cache-Schreibvorgänge	1-Std.-Cache-Schreibvorgänge	Cache-Treffer & -Aktualisierungen	Output-Token
Claude Fable 5	$10 / MTok	$12.50 / MTok	$20 / MTok	$1 / MTok	$50 / MTok
Claude Mythos 5 (begrenzte Verfügbarkeit)	$10 / MTok	$12.50 / MTok	$20 / MTok	$1 / MTok	$50 / MTok
Claude Opus 4.8	$5 / MTok	$6.25 / MTok	$10 / MTok	$0.50 / MTok	$25 / MTok
Claude Opus 4.7	$5 / MTok	$6.25 / MTok	$10 / MTok	$0.50 / MTok	$25 / MTok
Claude Opus 4.6	$5 / MTok	$6.25 / MTok	$10 / MTok	$0.50 / MTok	$25 / MTok
Claude Opus 4.5	$5 / MTok	$6.25 / MTok	$10 / MTok	$0.50 / MTok	$25 / MTok
Claude Opus 4.1 (veraltet)	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Opus 4 (eingestellt, außer auf Google Cloud)	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Sonnet 5 bis 31. August 2026	$2 / MTok	$2.50 / MTok	$4 / MTok	$0.20 / MTok	$10 / MTok
Claude Sonnet 5 ab 1. September 2026	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 4.6	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 4.5	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 4 (eingestellt, außer auf Bedrock und Google Cloud)	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Haiku 4.5	$1 / MTok	$1.25 / MTok	$2 / MTok	$0.10 / MTok	$5 / MTok
Claude Haiku 3.5 (eingestellt, außer auf Bedrock und Google Cloud)	$0.80 / MTok	$1 / MTok	$1.60 / MTok	$0.08 / MTok	$4 / MTok

Der Einführungspreis von 2 $/10 $ pro Million Input-/Output-Token gilt bis zum 31. August 2026. Danach tritt der Standardpreis von 3 $/15 $ pro Million Input-/Output-Token in Kraft.

Für Preise zu Claude Platform on AWS siehe Claude Platform on AWS – Preise.

Cloud-Plattform-Preise

Claude-Modelle sind auf Amazon Bedrock und Google Cloud verfügbar. Offizielle Preise findest du unter:

Preise für regionale und Multi-Region-Endpunkte für Claude 4.5-Modelle und neuer

Ab Claude Sonnet 4.5, Haiku 4.5 und Opus 4.5:

Bedrock bietet zwei Endpunkttypen: globale Endpunkte (dynamisches Routing für maximale Verfügbarkeit) und regionale Endpunkte (garantiertes Daten-Routing durch bestimmte geografische Regionen).
Google Cloud bietet drei Endpunkttypen: globale Endpunkte, Multi-Region-Endpunkte (dynamisches Routing innerhalb eines geografischen Gebiets) und regionale Endpunkte.

Für Implementierungsdetails und Codebeispiele:

Amazon Bedrock – globale vs. regionale Endpunkte für Opus 4.7, Haiku 4.5 und spätere Modelle, oder die Legacy-Integration für alle anderen Modelle auf Bedrock
Google Cloud – globale, Multi-Region- und regionale Endpunkte

Claude Platform on AWS – Preise

Konzept	Details
Abrechnungseinheit	Claude Consumption Unit (CCU)
CCU-Preis	0,01 $ pro CCU (fest; Rabatte werden bei der Token-zu-CCU-Umrechnung angewendet, nicht auf den CCU-Preis)
Umrechnung	Token-Nutzung wird in USD zu Standardtarifen pro Modell und Funktion bewertet (identisch mit den Claude API-Preisen), dann in CCUs zu 0,01 $ pro CCU umgerechnet
Abrechnungsrhythmus	Stündliche Messung an den AWS Marketplace; monatliche Rechnungen
Zahlungsmodell	Nur nachträglich (Postpaid); keine Prepaid-Guthaben
Rabatte	Werden als weniger gemessene CCUs angewendet
Steuern	Messung vor Steuern; AWS Marketplace übernimmt die Steuerabwicklung
Kostentransparenz	Echtzeit-Aufschlüsselung in der Claude Console (Zugriff über die AWS Console); AWS Cost Explorer zeigt aggregierte CCU

Inferenz-Geografie

Private Angebote

Claude in Microsoft Foundry – Preise

Konzept	Details
Abrechnungseinheit	Claude Consumption Unit (CCU)
CCU-Preis	0,01 $ pro CCU (fest; Rabatte werden bei der Token-zu-CCU-Umrechnung angewendet, nicht auf den CCU-Preis)
Umrechnung	Token-Nutzung wird in USD zu Standardtarifen pro Modell und Funktion bewertet (identisch mit den Claude API-Preisen), dann in CCUs zu 0,01 $ pro CCU umgerechnet
Abrechnungsrhythmus	Stündliche Messung an den Azure Marketplace; monatliche Rechnungen
Zahlungsmodell	Nur nachträglich (Postpaid); keine Prepaid-Guthaben
Rabatte	Werden als weniger gemessene CCUs angewendet
Steuern	Messung vor Steuern; Azure Marketplace übernimmt die Steuerabwicklung
Kostentransparenz	Azure Cost Management zeigt aggregierte CCU

Inferenz-Geografie

Funktionsspezifische Preise

Prompt-Caching

Es gibt zwei Möglichkeiten, Prompt-Caching zu aktivieren:

Automatisches Caching: Füge ein einzelnes cache_control-Feld auf der obersten Ebene deiner Anfrage hinzu. Das System verwaltet Cache-Breakpoints automatisch, während Gespräche wachsen. Dies ist der empfohlene Ausgangspunkt für die meisten Anwendungsfälle.
Explizite Cache-Breakpoints: Platziere cache_control direkt auf einzelnen Content-Blöcken für eine feingranulare Kontrolle darüber, was genau gecacht wird.

Prompt-Caching verwendet die folgenden Preismultiplikatoren relativ zu den Basis-Input-Token-Tarifen:

Cache-Operation	Multiplikator	Dauer
5-Minuten-Cache-Schreibvorgang	1,25x Basis-Input-Preis	Cache 5 Minuten gültig
1-Stunden-Cache-Schreibvorgang	2x Basis-Input-Preis	Cache 1 Stunde gültig
Cache-Lesevorgang (Treffer)	0,1x Basis-Input-Preis	Gleiche Dauer wie der vorangehende Schreibvorgang

Diese Multiplikatoren kombinieren sich mit anderen Preismodifikatoren, einschließlich des Batch-API-Rabatts und der Datenresidenz.

Für Implementierungsdetails, unterstützte Modelle und Codebeispiele siehe Prompt-Caching.

Preise für Datenresidenz

Weitere Informationen findest du unter Datenresidenz.

Fast-Mode-Preise

Modell	Input	Output
Claude Opus 4.8	10 $ / MTok	50 $ / MTok
Claude Opus 4.7	30 $ / MTok	150 $ / MTok

Fast-Mode-Preise kombinieren sich mit anderen Preismodifikatoren:

Prompt-Caching-Multiplikatoren werden zusätzlich zu den Fast-Mode-Preisen angewendet
Datenresidenz-Multiplikatoren werden zusätzlich zu den Fast-Mode-Preisen angewendet

Fast Mode ist mit der Batch API nicht verfügbar.

Weitere Informationen findest du unter Fast Mode.

Batch-Verarbeitung

Die Batch API ermöglicht die asynchrone Verarbeitung großer Mengen von Anfragen mit einem Rabatt von 50 % auf Input- und Output-Token.

Modell	Batch-Input	Batch-Output
Claude Fable 5	$5 / MTok	$25 / MTok
Claude Mythos 5 (begrenzte Verfügbarkeit)	$5 / MTok	$25 / MTok
Claude Opus 4.8	$2.50 / MTok	$12.50 / MTok
Claude Opus 4.7	$2.50 / MTok	$12.50 / MTok
Claude Opus 4.6	$2.50 / MTok	$12.50 / MTok
Claude Opus 4.5	$2.50 / MTok	$12.50 / MTok
Claude Opus 4.1 (veraltet)	$7.50 / MTok	$37.50 / MTok
Claude Opus 4 (eingestellt, außer auf Google Cloud)	$7.50 / MTok	$37.50 / MTok
Claude Sonnet 5 bis 31. August 2026	$1 / MTok	$5 / MTok
Claude Sonnet 5 ab 1. September 2026	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 4.6	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 4.5	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 4 (eingestellt, außer auf Bedrock und Google Cloud)	$1.50 / MTok	$7.50 / MTok
Claude Haiku 4.5	$0.50 / MTok	$2.50 / MTok
Claude Haiku 3.5 (eingestellt, außer auf Bedrock und Google Cloud)	$0.40 / MTok	$2 / MTok

Weitere Informationen zur Batch-Verarbeitung findest du unter Batch-Verarbeitung.

Preise für langen Kontext

Preise für Tool-Nutzung

Anfragen zur Tool-Nutzung werden basierend auf folgenden Faktoren berechnet:

Die Gesamtzahl der an das Modell gesendeten Input-Token (einschließlich des tools-Parameters)
Die Anzahl der generierten Output-Token
Bei serverseitigen Tools zusätzliche nutzungsbasierte Kosten (z. B. Gebühren für die Websuche pro durchgeführter Suche)

Clientseitige Tools werden genauso berechnet wie jede andere Claude-API-Anfrage, während serverseitige Tools je nach ihrer spezifischen Nutzung zusätzliche Kosten verursachen können.

Die zusätzlichen Token aus der Tool-Nutzung stammen aus:

Dem tools-Parameter in API-Anfragen (Tool-Namen, Beschreibungen und Schemas)
tool_use-Inhaltsblöcken in API-Anfragen und -Antworten
tool_result-Inhaltsblöcken in API-Anfragen

Modell	Tool-Auswahl	Token-Anzahl des System-Prompts für Tool-Nutzung
Claude Opus 4.8	`auto`, `none` `any`, `tool`	290 Token 410 Token
Claude Opus 4.7	`auto`, `none` `any`, `tool`	675 Token 804 Token
Claude Opus 4.6	`auto`, `none` `any`, `tool`	497 Token 589 Token
Claude Opus 4.5	`auto`, `none` `any`, `tool`	496 Token 588 Token
Claude Opus 4.1 (veraltet)	`auto`, `none` `any`, `tool`	313 Token 315 Token
Claude Opus 4 (eingestellt, außer auf Google Cloud)	`auto`, `none` `any`, `tool`	313 Token 315 Token
Claude Sonnet 5	`auto`, `none` `any`, `tool`	354 Token 474 Token
Claude Sonnet 4.6	`auto`, `none` `any`, `tool`	497 Token 589 Token
Claude Sonnet 4.5	`auto`, `none` `any`, `tool`	496 Token 588 Token
Claude Sonnet 4 (eingestellt, außer auf Bedrock und Google Cloud)	`auto`, `none` `any`, `tool`	313 Token 315 Token
Claude Haiku 4.5	`auto`, `none` `any`, `tool`	496 Token 588 Token
Claude Haiku 3.5 (eingestellt, außer auf Bedrock und Google Cloud)	`auto`, `none` `any`, `tool`	264 Token 355 Token

Diese Token-Anzahlen werden zu deinen normalen Input- und Output-Token addiert, um die Gesamtkosten einer Anfrage zu berechnen.

Aktuelle Preise pro Modell findest du im Abschnitt Modellpreise.

Weitere Informationen zur Implementierung von Tool-Nutzung und Best Practices findest du unter Tool-Nutzung.

Preise für spezifische Tools

Bash-Tool

Das Bash-Tool fügt deinen API-Aufrufen 245 Input-Tokens hinzu.

Zusätzliche Tokens werden verbraucht durch:

Befehlsausgaben (stdout/stderr)
Fehlermeldungen
Große Dateiinhalte

Siehe Preise für Tool-Nutzung für vollständige Preisdetails.

Code-Execution-Tool

Bei Verwendung ohne diese Tools wird die Code-Ausführung nach Ausführungszeit abgerechnet, die getrennt von der Token-Nutzung erfasst wird:

Die Ausführungszeit hat ein Minimum von 5 Minuten
Jede Organisation erhält 1.550 kostenlose Stunden Nutzung pro Monat
Zusätzliche Nutzung über 1.550 Stunden hinaus wird mit 0,05 $ pro Stunde, pro Container abgerechnet
Wenn Dateien in der Anfrage enthalten sind, wird die Ausführungszeit auch dann berechnet, wenn das Tool nicht aufgerufen wird, da die Dateien vorab in den Container geladen werden

Die Nutzung der Code-Ausführung wird in der Antwort erfasst:

{
  "usage": {
    "input_tokens": 105,
    "output_tokens": 239,
    "server_tool_use": {
      "code_execution_requests": 1
    }
  }
}

Text-Editor-Tool

Zusätzlich zu den Basis-Token werden die folgenden zusätzlichen Input-Token für das Texteditor-Tool benötigt:

Tool	Zusätzliche Input-Token
`text_editor_20250429` (Claude 4.x)	700 Token

Siehe Preise für Tool-Nutzung für vollständige Preisdetails.

Web-Search-Tool

Die Nutzung der Websuche wird zusätzlich zur Token-Nutzung berechnet:

{
  "usage": {
    "input_tokens": 105,
    "output_tokens": 6039,
    "cache_read_input_tokens": 7123,
    "cache_creation_input_tokens": 7345,
    "server_tool_use": {
      "web_search_requests": 1
    }
  }
}

Jede Websuche zählt als eine Nutzung, unabhängig von der Anzahl der zurückgegebenen Ergebnisse. Wenn während der Websuche ein Fehler auftritt, wird die Websuche nicht in Rechnung gestellt.

Web-Fetch-Tool

Die Nutzung von Web Fetch verursacht keine zusätzlichen Kosten über die standardmäßigen Token-Kosten hinaus:

{
  "usage": {
    "input_tokens": 25039,
    "output_tokens": 931,
    "cache_read_input_tokens": 0,
    "cache_creation_input_tokens": 0,
    "server_tool_use": {
      "web_fetch_requests": 1
    }
  }
}

Beispiel für den Token-Verbrauch bei typischen Inhalten:

Durchschnittliche Webseite (10 kB): ~2.500 Tokens
Große Dokumentationsseite (100 kB): ~25.000 Tokens
Forschungsarbeit als PDF (500 kB): ~125.000 Tokens

Computer-Use-Tool

Computer use folgt der standardmäßigen Preisgestaltung für Tool-Nutzung. Bei der Verwendung des Computer-Use-Tools:

System-Prompt-Overhead: Die Computer-Use-Beta fügt dem System-Prompt 466–499 Token hinzu

Token-Verbrauch des Computer-Use-Tools:

Modell	Input-Token pro Tool-Definition
Claude 4.x-Modelle	735 Token

Zusätzlicher Token-Verbrauch:

Screenshot-Bilder (siehe Vision-Preisgestaltung)
Ergebnisse der Tool-Ausführung, die an Claude zurückgegeben werden

Wenn du neben Computer Use auch Bash- oder Text-Editor-Tools verwendest, haben diese Tools ihre eigenen Token-Kosten, wie auf ihren jeweiligen Seiten dokumentiert.

Claude Managed Agents – Preise

Claude Managed Agents wird nach zwei Dimensionen abgerechnet: Token und Session-Laufzeit.

Token

Die folgenden Messages-API-Modifikatoren gelten nicht für Claude Managed Agents-Sessions:

Modifikator	Warum er nicht gilt
Batch-API-Rabatt	Sessions sind zustandsbehaftet und interaktiv. Es gibt keinen Batch-Modus.
Fast-Mode-Aufschlag	Die Inferenzgeschwindigkeit wird von der Laufzeitumgebung verwaltet.
Datenresidenz-Multiplikator	`inference_geo` ist ein Messages-API-Anfragefeld.
Cloud-Plattform-Preise	Nicht auf von Partnern betriebenen Cloud-Plattformen verfügbar.

Session-Laufzeit

SKU	Tarif	Messung
Session-Laufzeit	0,08 $ pro Session-Stunde	Dauer des `running`-Status

Rechenbeispiel

Eine einstündige Coding-Session mit Claude Opus 4.8, die 50.000 Input-Token und 15.000 Output-Token verbraucht:

Position	Berechnung	Kosten
Input-Token	50.000 × 5 $ / 1.000.000	0,25 $
Output-Token	15.000 × 25 $ / 1.000.000	0,375 $
Session-Laufzeit	1,0 Stunde × 0,08 $	0,08 $
Gesamt		0,705 $

Wenn Prompt-Caching aktiv ist und 40.000 der Input-Token Cache-Lesevorgänge sind:

Position	Berechnung	Kosten
Ungecachte Input-Token	10.000 × 5 $ / 1.000.000	0,05 $
Cache-Lese-Token	40.000 × 5 $ × 0,1 / 1.000.000	0,02 $
Output-Token	15.000 × 25 $ / 1.000.000	0,375 $
Session-Laufzeit	1,0 Stunde × 0,08 $	0,08 $
Gesamt		0,525 $

Beispielrechnung für die Verarbeitung von 10.000 Support-Tickets:

Durchschnittlich ~3.700 Token pro Gespräch
Mit Claude Haiku 4.5 zu 1 $/MTok Input, 5 $/MTok Output
Gesamtkosten: ~37,00 $ pro 10.000 Tickets

Eine detaillierte Erläuterung dieser Berechnung findest du im Leitfaden für Kundensupport-Agenten.

Zusätzliche Preisüberlegungen

Strategien zur Kostenoptimierung

Beim Erstellen von Agenten mit Claude:

Verwende geeignete Modelle: Wähle Haiku für einfache Aufgaben, Sonnet für die meisten Produktions-Workloads und Opus für die komplexesten Reasoning-Aufgaben
Implementiere Prompt-Caching: Reduziere Kosten für wiederholten Kontext
Batch-Operationen: Verwende die Batch API für nicht zeitkritische Aufgaben
Überwache Nutzungsmuster: Verfolge den Token-Verbrauch, um Optimierungsmöglichkeiten zu identifizieren

Für Agenten-Anwendungen mit hohem Volumen kontaktiere das Enterprise-Vertriebsteam für individuelle Preisvereinbarungen.

Ratenlimits

Ratenlimits variieren je nach Nutzungsstufe und beeinflussen, wie viele Anfragen du stellen kannst:

Start-Stufe: Einstiegslimits für den Anfang
Build-Stufe: Erhöhte Limits für wachsende Anwendungen
Scale-Stufe: Höchste Standardlimits für Produktions-Workloads

Detaillierte Informationen zu Ratenlimits findest du unter Ratenlimits.

Für Limits über die Scale-Stufe hinaus oder individuelle Preisvereinbarungen kontaktiere das Vertriebsteam.

Mengenrabatte

Mengenrabatte können für Nutzer mit hohem Volumen verfügbar sein. Diese werden individuell ausgehandelt.

Standard-Nutzungsstufen verwenden die unter Modellpreise angegebenen Preise
Enterprise-Kunden können den Vertrieb kontaktieren für individuelle Preise
Rabatte für akademische Einrichtungen und Forschung können verfügbar sein

Enterprise-Preise

Für Enterprise-Kunden mit spezifischen Anforderungen:

Individuelle Ratenlimits
Mengenrabatte
Dedizierter Support
Individuelle Vertragsbedingungen

Kontaktiere das Vertriebsteam unter [email protected] oder über die Claude Console, um Enterprise-Preisoptionen zu besprechen.

Abrechnung und Zahlung

Die Abrechnung basiert auf der tatsächlichen monatlichen Nutzung
Alle Zahlungen erfolgen in USD
Kreditkarten- und Rechnungsoptionen verfügbar
Nutzungsverfolgung in der Claude Console verfügbar

Häufig gestellte Fragen

Wie wird die Token-Nutzung berechnet?

Token sind Textteile, die Modelle verarbeiten. Als grobe Schätzung entspricht 1 Token etwa 4 Zeichen oder 0,75 Wörtern im Englischen. Die genaue Anzahl variiert je nach Sprache und Inhaltstyp.

Gibt es kostenlose Stufen oder Testversionen?

Neue Nutzer erhalten eine kleine Menge kostenloser Guthaben zum Testen der API. Kontaktiere den Vertrieb für Informationen über erweiterte Testversionen zur Enterprise-Evaluierung.

Wie kombinieren sich Rabatte?

Welche Zahlungsmethoden werden akzeptiert?

Gängige Kreditkarten werden für Standardkonten akzeptiert. Enterprise-Kunden können Rechnungsstellung und andere Zahlungsmethoden vereinbaren.

Bei weiteren Fragen zu Preisen kontaktiere [email protected].

Was this page helpful?

Modellpreise

Cloud-Plattform-Preise

Claude Platform on AWS – Preise

Inferenz-Geografie

Private Angebote

Claude in Microsoft Foundry – Preise

Inferenz-Geografie

Funktionsspezifische Preise

Prompt-Caching

Preise für Datenresidenz

Fast-Mode-Preise

Batch-Verarbeitung

Preise für langen Kontext

Preise für Tool-Nutzung

Preise für spezifische Tools

Bash-Tool

Code-Execution-Tool

Text-Editor-Tool

Web-Search-Tool

Web-Fetch-Tool

Computer-Use-Tool

Claude Managed Agents – Preise

Token

Session-Laufzeit

Rechenbeispiel

Zusätzliche Preisüberlegungen

Strategien zur Kostenoptimierung

Ratenlimits

Mengenrabatte

Enterprise-Preise

Abrechnung und Zahlung

Häufig gestellte Fragen

Modellpreise

Cloud-Plattform-Preise

Claude Platform on AWS – Preise

Inferenz-Geografie

Private Angebote

Claude in Microsoft Foundry – Preise

Inferenz-Geografie

Funktionsspezifische Preise

Prompt-Caching

Preise für Datenresidenz

Fast-Mode-Preise

Batch-Verarbeitung

Preise für langen Kontext

Preise für Tool-Nutzung

Preise für spezifische Tools

Bash-Tool

Code-Execution-Tool

Text-Editor-Tool

Web-Search-Tool

Web-Fetch-Tool

Computer-Use-Tool

Claude Managed Agents – Preise

Token

Session-Laufzeit

Rechenbeispiel

Zusätzliche Preisüberlegungen

Strategien zur Kostenoptimierung

Ratenlimits

Mengenrabatte

Enterprise-Preise

Abrechnung und Zahlung

Häufig gestellte Fragen

Modellpreise

Cloud-Plattform-Preise

Claude Platform on AWS – Preise

Inferenz-Geografie

Private Angebote

Claude in Microsoft Foundry – Preise

Inferenz-Geografie

Funktionsspezifische Preise

Prompt-Caching

Preise für Datenresidenz

Fast-Mode-Preise

Batch-Verarbeitung

Preise für langen Kontext

Preise für Tool-Nutzung

Preise für spezifische Tools

Bash-Tool

Code-Execution-Tool

Text-Editor-Tool

Web-Search-Tool

Web-Fetch-Tool

Computer-Use-Tool

Claude Managed Agents – Preise

Token

Session-Laufzeit

Rechenbeispiel

Zusätzliche Preisüberlegungen

Strategien zur Kostenoptimierung

Ratenlimits

Mengenrabatte

Enterprise-Preise

Abrechnung und Zahlung

Häufig gestellte Fragen

Modellpreise

Cloud-Plattform-Preise

Claude Platform on AWS – Preise

Inferenz-Geografie

Private Angebote

Claude in Microsoft Foundry – Preise

Inferenz-Geografie

Funktionsspezifische Preise

Prompt-Caching

Preise für Datenresidenz

Fast-Mode-Preise

Batch-Verarbeitung

Preise für langen Kontext

Preise für Tool-Nutzung

Preise für spezifische Tools

Bash-Tool

Code-Execution-Tool

Text-Editor-Tool

Web-Search-Tool

Web-Fetch-Tool

Computer-Use-Tool

Claude Managed Agents – Preise

Token

Session-Laufzeit

Rechenbeispiel

Zusätzliche Preisüberlegungen

Strategien zur Kostenoptimierung

Ratenlimits

Mengenrabatte

Enterprise-Preise

Abrechnung und Zahlung

Häufig gestellte Fragen