Modelle & PreiseModelle

Was ist neu in Claude Opus 5

Überblick über neue Features und Verhaltensänderungen in Claude Opus 5.

Claude Opus 5 ist eine sprunghafte Verbesserung gegenüber Claude Opus 4.8, mit den größten Fortschritten bei tiefem Reasoning, agentischen und langfristigen Aufgaben sowie der Skalierung von Test-Time-Compute. Diese Seite fasst alles Neue in Claude Opus 5 zusammen, einschließlich standardmäßig aktiviertem Thinking, Tool-Änderungen mitten in der Konversation und einer Breaking Change dazu, wann Thinking deaktiviert werden kann.

Neues Modell

Modell	API-Modell-ID	Beschreibung
Claude Opus 5	`claude-opus-5`	Für komplexes agentisches Coding und Enterprise-Arbeit

Claude Opus 5 hat ein 1M-Token-Kontextfenster (1M Token ist sowohl der Standard als auch das Maximum; es gibt keine kleinere Kontextvariante), 128k maximale Output-Token und Thinking standardmäßig aktiviert.

Vollständige Preise und Spezifikationen findest du in der Modellübersicht.

Neue Features

Tool-Änderungen mitten in der Konversation (Beta)

Du kannst Tools zwischen den Turns einer Konversation hinzufügen oder entfernen und dabei den Prompt-Cache erhalten, anstatt für die gesamte Dauer einer Session eine feste Tool-Liste erneut zu senden. Tool-Änderungen mitten in der Konversation befinden sich in der Beta: Füge den Beta-Header mid-conversation-tool-changes-2026-07-01 in deine Requests ein. Siehe Tool-Änderungen mitten in der Konversation für die Verwendung.

Default-Fallbacks-Modus

Der fallbacks-Parameter unterstützt einen neuen "default"-Modus, der Anthropics empfohlene Fallback-Modelle nach Refusal-Kategorie anwendet, anstatt einer Modellliste, die du selbst pflegst. Der gesamte fallbacks-Parameter befindet sich in der Beta. Verwende den Beta-Header server-side-fallback-2026-07-01, der sowohl den "default"-Modus als auch explizite Modelllisten unterstützt (der frühere Header server-side-fallback-2026-06-01 akzeptiert nur explizite Listen). Siehe Refusals und Fallback.

Niedrigeres Prompt-Cache-Minimum

Die minimale cachebare Prompt-Länge auf Claude Opus 5 beträgt 512 Token, gegenüber 1.024 Token auf Claude Opus 4.8. Prompts, die auf Claude Opus 4.8 zu kurz zum Cachen waren, können jetzt ohne Code-Änderungen Cache-Einträge erstellen. Siehe Prompt-Caching für die Minima pro Modell.

Fast Mode

Fast Mode (Research Preview) ist für Claude Opus 5 nur über die Claude API verfügbar; er ist derzeit nicht auf Amazon Bedrock, Google Cloud oder Microsoft Foundry verfügbar. Fast Mode für Claude Opus 5 kostet 10 $ pro Million Input-Token und 50 $ pro Million Output-Token. Siehe Fast Mode für Zugang, unterstützte Modelle und Preise.

Verhaltensänderungen

Thinking standardmäßig aktiviert

Auf Claude Opus 4.8 laufen Requests ohne Thinking, es sei denn, du setzt thinking: {"type": "adaptive"}. Auf Claude Opus 5 laufen dieselben Requests mit aktiviertem Thinking: Das Modell entscheidet bei jedem Turn, wann und wie viel es denkt, und der Effort-Parameter ist die Steuerung für die Denktiefe. Der Wire-Wert ist unverändert; thinking: {"type": "adaptive"} bleibt gültig und ist äquivalent zum Standard.

Da max_tokens ein hartes Limit für den gesamten Output ist (Thinking plus Antworttext), solltest du es für Workloads überprüfen, die auf Claude Opus 4.8 ohne Thinking liefen.

Die API behält die Option, Thinking zu deaktivieren, vorbehaltlich der unten beschriebenen Effort-Einschränkung.

Effort ist wichtiger

Claude Opus 5 wandelt zusätzlichen Effort zuverlässiger in bessere Ergebnisse um als jedes frühere Opus-Modell, daher hat das von dir gewählte Effort-Level mehr Gewicht. Die vollständige Skala ist verfügbar: low, medium, high, xhigh und max, wobei max die oberste Stufe für das tiefstmögliche Reasoning ist. Beginne mit dem Standard high und passe basierend auf deinen Evals in beide Richtungen an: Gehe nach unten, wo die Qualität gehalten wird, um Token und Latenz zu sparen, oder nach oben für die anspruchsvollste Arbeit. Wenn du mit xhigh- oder max-Effort arbeitest, setze ein großes max_tokens, damit das Modell Raum hat, über Subagenten und Tool-Aufrufe hinweg zu denken und zu handeln.

Dieser Request dreht den Effort ganz auf max hoch:

client = anthropic.Anthropic()

with client.messages.stream(
    model="claude-opus-5",
    max_tokens=64000,
    output_config={"effort": "max"},
    messages=[
        {
            "role": "user",
            "content": "Explain why the sum of two even numbers is always even.",
        }
    ],
) as stream:
    response = stream.get_final_message()

print(response)

Thinking ist auf Claude Opus 5 standardmäßig aktiviert, daher ist kein thinking-Feld erforderlich.

Deaktivieren von Thinking erfordert Effort `high` oder niedriger

Auf Claude Opus 5 wird thinking: {"type": "disabled"} nur akzeptiert, wenn das Effort-Level high oder niedriger ist. Das Setzen von thinking: {"type": "disabled"} mit Effort xhigh oder max gibt einen 400-Fehler zurück. Dies ist ab Claude Opus 5 allgemein verfügbares Verhalten, das bei jedem Request durchgesetzt wird, und es ist eine Breaking Change gegenüber Claude Opus 4.8, wo das Deaktivieren von Thinking unabhängig vom Effort-Level war. Wenn du heute Thinking bei hohen Effort-Levels deaktivierst, behalte entweder Thinking deaktiviert und setze Effort auf high oder niedriger, oder behalte das Effort-Level und entferne das thinking-Feld.

Mit deaktiviertem Thinking kann Claude Opus 5 gelegentlich einen Tool-Aufruf in seinen Text-Output schreiben, anstatt einen tool_use-Block auszugeben, oder interne XML-Tags in seine sichtbare Antwort aufnehmen. Wo möglich, lasse Thinking aktiviert und steuere die Token-Kosten mit niedrigeren Effort-Levels; für Integrationen, die Thinking deaktiviert lassen müssen, siehe Ausführen mit deaktiviertem Thinking für Prompting-Gegenmaßnahmen.

Unterschiede im Modellverhalten

Über die oben genannten API-Änderungen hinaus verhält sich Claude Opus 5 anders als Claude Opus 4.8, und zwar auf eine Weise, die dir auffallen kann, ohne dass du Code änderst. Standardmäßige nutzerseitige Antworten und schriftliche Ergebnisse fallen länger aus. In agentischen Sessions berichtet das Modell dem Nutzer häufiger über seinen Fortschritt. In Multi-Agent-Frameworks delegiert es bereitwilliger an Subagenten. Es verifiziert außerdem seine eigene Arbeit, ohne dazu aufgefordert zu werden; entferne daher Verifizierungsanweisungen, die von früheren Modellen übernommen wurden („füge einen abschließenden Verifizierungsschritt hinzu", „verwende einen Subagenten zur Verifizierung"); sie verursachen auf Claude Opus 5 eine Über-Verifizierung. Für Prompting-Muster, die jedes dieser Verhaltensweisen abstimmen, siehe Prompting für Claude Opus 5.

Verbesserungen der Fähigkeiten

Im Vergleich zu Claude Opus 4.8 ist Claude Opus 5 eine sprunghafte Verbesserung statt einer inkrementellen, und es liefert Frontier-Intelligenz zur Hälfte der Kosten von Claude Fable 5. Die größten Fortschritte liegen in:

Tiefem Reasoning, das mehrstufige Analysen über lange Problemketten hinweg aufrechterhält.
Agentischem Coding und langfristigen Aufgaben, wobei es über ausgedehnte Tool-Nutzungs-Schleifen hinweg bei der Aufgabe bleibt und Multi-File-Features, größere Refactorings und End-to-End-Feature-Arbeit abschließt, ohne Stubs oder Platzhalter zu hinterlassen.
Skalierung von Test-Time-Compute, wobei zusätzlicher Effort (bis zum max-Level) in bessere Ergebnisse umgewandelt wird.
Effizienz bei niedrigeren Effort-Levels, wobei low- und medium-Effort starke Qualität bei einem Bruchteil der Token und Latenz höherer Einstellungen liefern.
Code-Review und Bug-Finding, wobei echte Bugs mit hoher Rate pro Durchlauf und wenigen False Positives aufgedeckt werden und die Genauigkeit auch bei niedrigeren Effort-Levels erhalten bleibt.
Vision, also dem Verstehen von Diagrammen, Dokumenten und Schaubildern sowie dem Nachbilden von UI- und Frontend-Visuals, am stärksten, wenn es Tools erhält, um seine Arbeit iterativ zu analysieren, zuzuschneiden und zu verifizieren.
Long-Context-Arbeit, mit einem 1M-Token-Kontextfenster als Standard und Maximum zugleich sowie konsistentem Befolgen von Anweisungen, Tool-Aufrufen und Reasoning über das gesamte Fenster hinweg.
Office- und Dokumentaufgaben, also dem Generieren und Bearbeiten komplexer Spreadsheets mit mehreren Blättern und nicht-trivialen Formeln sowie dem Erstellen gut strukturierter Foliensätze.
Multi-Agent-Koordination, also dem Betreiben von Teams aus Subagenten mit effektiven Writer-Verifier-Mustern und wenigen Fällen, in denen Agenten die Arbeit der anderen überschreiben.

Für die Prompting-Muster, die das Beste aus diesen Fähigkeiten herausholen, siehe Prompting für Claude Opus 5.

Preise

Claude Opus 5 kostet 5 $ pro Million Input-Token und 25 $ pro Million Output-Token, unverändert gegenüber Claude Opus 4.8.

Siehe Preise für vollständige Preise, einschließlich Batch-Verarbeitung, Prompt-Caching und Fast-Mode-Tarifen.

Verfügbarkeit

Claude Opus 5 ist verfügbar auf:

Claude API: verfügbar für alle Kunden als claude-opus-5.
AWS: verfügbar über Claude in Amazon Bedrock als anthropic.claude-opus-5. Claude Opus 5 ist auch über die InvokeModel-API auf bedrock-runtime erreichbar, die von derselben Infrastruktur bedient wird; die Integration Claude on Amazon Bedrock (Legacy) führt es nicht in ihrer ARN-versionierten Modell-ID-Tabelle auf.
Google Cloud: verfügbar über Claude on Google Cloud als claude-opus-5.
Microsoft Foundry: verfügbar über Claude in Microsoft Foundry.

Claude Opus 4.8 bleibt auf all diesen Plattformen verfügbar.

Migrationsleitfaden

Um von Claude Opus 4.8 zu migrieren, aktualisiere deine Modell-ID:

model = "claude-opus-4-8"  # Before
model = "claude-opus-5"  # After

Überprüfe dann die beiden Verhaltensänderungen: Thinking ist standardmäßig aktiviert, und das Deaktivieren von Thinking mit Effort xhigh oder max gibt einen 400-Fehler zurück. Siehe den Migrationsleitfaden für eine Schritt-für-Schritt-Anleitung.

Nächste Schritte

Modellübersicht

Vollständige Spezifikationen und Preise für alle aktuellen Claude-Modelle.

Prompting für Claude Opus 5

Verhaltensunterschiede und Prompting-Muster speziell für Claude Opus 5.

Effort

Steuere, wie viele Token Claude beim Antworten verwendet, von low bis max.

Thinking

Wie Thinking funktioniert, wenn es standardmäßig aktiviert ist, und wann es deaktiviert werden kann.

Task-Budgets

Gib Claude ein beratendes Token-Budget, an dem es seine Arbeit ausrichten kann.

Migrationsleitfaden

Leitfaden für die Migration von früheren Claude-Versionen zu den neuesten Claude-Modellen.

Fast Mode

Erhalte mehr Output-Token pro Sekunde von Claude Opus-Modellen zu Premium-Preisen.

Was this page helpful?

Modelle & PreiseModelle

Was ist neu in Claude Opus 5

Überblick über neue Features und Verhaltensänderungen in Claude Opus 5.

Neues Modell

Modell	API-Modell-ID	Beschreibung
Claude Opus 5	`claude-opus-5`	Für komplexes agentisches Coding und Enterprise-Arbeit

Vollständige Preise und Spezifikationen findest du in der Modellübersicht.

Neue Features

Tool-Änderungen mitten in der Konversation (Beta)

Default-Fallbacks-Modus

Niedrigeres Prompt-Cache-Minimum

Fast Mode

Verhaltensänderungen

Thinking standardmäßig aktiviert

Da max_tokens ein hartes Limit für den gesamten Output ist (Thinking plus Antworttext), solltest du es für Workloads überprüfen, die auf Claude Opus 4.8 ohne Thinking liefen.

Die API behält die Option, Thinking zu deaktivieren, vorbehaltlich der unten beschriebenen Effort-Einschränkung.

Effort ist wichtiger

Dieser Request dreht den Effort ganz auf max hoch:

client = anthropic.Anthropic()

with client.messages.stream(
    model="claude-opus-5",
    max_tokens=64000,
    output_config={"effort": "max"},
    messages=[
        {
            "role": "user",
            "content": "Explain why the sum of two even numbers is always even.",
        }
    ],
) as stream:
    response = stream.get_final_message()

print(response)

Thinking ist auf Claude Opus 5 standardmäßig aktiviert, daher ist kein thinking-Feld erforderlich.

Deaktivieren von Thinking erfordert Effort `high` oder niedriger

Unterschiede im Modellverhalten

Verbesserungen der Fähigkeiten

Tiefem Reasoning, das mehrstufige Analysen über lange Problemketten hinweg aufrechterhält.
Agentischem Coding und langfristigen Aufgaben, wobei es über ausgedehnte Tool-Nutzungs-Schleifen hinweg bei der Aufgabe bleibt und Multi-File-Features, größere Refactorings und End-to-End-Feature-Arbeit abschließt, ohne Stubs oder Platzhalter zu hinterlassen.
Skalierung von Test-Time-Compute, wobei zusätzlicher Effort (bis zum max-Level) in bessere Ergebnisse umgewandelt wird.
Effizienz bei niedrigeren Effort-Levels, wobei low- und medium-Effort starke Qualität bei einem Bruchteil der Token und Latenz höherer Einstellungen liefern.
Code-Review und Bug-Finding, wobei echte Bugs mit hoher Rate pro Durchlauf und wenigen False Positives aufgedeckt werden und die Genauigkeit auch bei niedrigeren Effort-Levels erhalten bleibt.
Vision, also dem Verstehen von Diagrammen, Dokumenten und Schaubildern sowie dem Nachbilden von UI- und Frontend-Visuals, am stärksten, wenn es Tools erhält, um seine Arbeit iterativ zu analysieren, zuzuschneiden und zu verifizieren.
Long-Context-Arbeit, mit einem 1M-Token-Kontextfenster als Standard und Maximum zugleich sowie konsistentem Befolgen von Anweisungen, Tool-Aufrufen und Reasoning über das gesamte Fenster hinweg.
Office- und Dokumentaufgaben, also dem Generieren und Bearbeiten komplexer Spreadsheets mit mehreren Blättern und nicht-trivialen Formeln sowie dem Erstellen gut strukturierter Foliensätze.
Multi-Agent-Koordination, also dem Betreiben von Teams aus Subagenten mit effektiven Writer-Verifier-Mustern und wenigen Fällen, in denen Agenten die Arbeit der anderen überschreiben.

Für die Prompting-Muster, die das Beste aus diesen Fähigkeiten herausholen, siehe Prompting für Claude Opus 5.

Preise

Claude Opus 5 kostet 5 $ pro Million Input-Token und 25 $ pro Million Output-Token, unverändert gegenüber Claude Opus 4.8.

Siehe Preise für vollständige Preise, einschließlich Batch-Verarbeitung, Prompt-Caching und Fast-Mode-Tarifen.

Verfügbarkeit

Claude Opus 5 ist verfügbar auf:

Claude API: verfügbar für alle Kunden als claude-opus-5.
AWS: verfügbar über Claude in Amazon Bedrock als anthropic.claude-opus-5. Claude Opus 5 ist auch über die InvokeModel-API auf bedrock-runtime erreichbar, die von derselben Infrastruktur bedient wird; die Integration Claude on Amazon Bedrock (Legacy) führt es nicht in ihrer ARN-versionierten Modell-ID-Tabelle auf.
Google Cloud: verfügbar über Claude on Google Cloud als claude-opus-5.
Microsoft Foundry: verfügbar über Claude in Microsoft Foundry.

Claude Opus 4.8 bleibt auf all diesen Plattformen verfügbar.

Migrationsleitfaden

Um von Claude Opus 4.8 zu migrieren, aktualisiere deine Modell-ID:

model = "claude-opus-4-8"  # Before
model = "claude-opus-5"  # After

Nächste Schritte

Modellübersicht

Vollständige Spezifikationen und Preise für alle aktuellen Claude-Modelle.

Prompting für Claude Opus 5

Verhaltensunterschiede und Prompting-Muster speziell für Claude Opus 5.

Effort

Steuere, wie viele Token Claude beim Antworten verwendet, von low bis max.

Thinking

Wie Thinking funktioniert, wenn es standardmäßig aktiviert ist, und wann es deaktiviert werden kann.

Task-Budgets

Gib Claude ein beratendes Token-Budget, an dem es seine Arbeit ausrichten kann.

Migrationsleitfaden

Leitfaden für die Migration von früheren Claude-Versionen zu den neuesten Claude-Modellen.

Fast Mode

Erhalte mehr Output-Token pro Sekunde von Claude Opus-Modellen zu Premium-Preisen.

Was this page helpful?

Neues Modell

Neue Features

Tool-Änderungen mitten in der Konversation (Beta)

Default-Fallbacks-Modus

Niedrigeres Prompt-Cache-Minimum

Fast Mode

Verhaltensänderungen

Thinking standardmäßig aktiviert

Effort ist wichtiger

Deaktivieren von Thinking erfordert Effort high oder niedriger

Unterschiede im Modellverhalten

Verbesserungen der Fähigkeiten

Preise

Verfügbarkeit

Migrationsleitfaden

Nächste Schritte

Neues Modell

Neue Features

Tool-Änderungen mitten in der Konversation (Beta)

Default-Fallbacks-Modus

Niedrigeres Prompt-Cache-Minimum

Fast Mode

Verhaltensänderungen

Thinking standardmäßig aktiviert

Effort ist wichtiger

Deaktivieren von Thinking erfordert Effort high oder niedriger

Unterschiede im Modellverhalten

Verbesserungen der Fähigkeiten

Preise

Verfügbarkeit

Migrationsleitfaden

Nächste Schritte

Neues Modell

Neue Features

Tool-Änderungen mitten in der Konversation (Beta)

Default-Fallbacks-Modus

Niedrigeres Prompt-Cache-Minimum

Fast Mode

Verhaltensänderungen

Thinking standardmäßig aktiviert

Effort ist wichtiger

Deaktivieren von Thinking erfordert Effort `high` oder niedriger

Unterschiede im Modellverhalten

Verbesserungen der Fähigkeiten

Preise

Verfügbarkeit

Migrationsleitfaden

Nächste Schritte

Neues Modell

Neue Features

Tool-Änderungen mitten in der Konversation (Beta)

Default-Fallbacks-Modus

Niedrigeres Prompt-Cache-Minimum

Fast Mode

Verhaltensänderungen

Thinking standardmäßig aktiviert

Effort ist wichtiger

Deaktivieren von Thinking erfordert Effort `high` oder niedriger

Unterschiede im Modellverhalten

Verbesserungen der Fähigkeiten

Preise

Verfügbarkeit

Migrationsleitfaden

Nächste Schritte