Claude Opus 4.8 ist Anthropics leistungsfähigstes Modell der Opus-Klasse. Es baut auf Claude Opus 4.7 auf. Diese Seite fasst alle Neuerungen zum Launch zusammen, einschließlich des Fast-Modus (Research Preview auf der Claude API) und einer niedrigeren Mindestlänge von 1.024 Token für cachebare Prompts.
| Modell | API-Modell-ID | Beschreibung |
|---|---|---|
| Claude Opus 4.8 | claude-opus-4-8 | Anthropics leistungsfähigstes Modell der Opus-Klasse für komplexes Reasoning, langfristiges agentisches Coding und hochautonome Arbeit |
Claude Opus 4.8 unterstützt standardmäßig das 1M-Token-Kontextfenster auf der Claude API, Amazon Bedrock und Vertex AI (200k auf Microsoft Foundry), 128k maximale Output-Token, adaptives Denken und denselben Satz an Tools und Plattformfunktionen wie Claude Opus 4.7.
Vollständige Preise und Spezifikationen findest du in der Modellübersicht.
Claude Opus 4.8 akzeptiert role: "system"-Nachrichten direkt nach einem User-Turn im messages-Array (vorbehaltlich der Platzierungsregeln). Damit kannst du später in einer lang laufenden Konversation aktualisierte Anweisungen anhängen, ohne den vollständigen System-Prompt zu wiederholen. Das erhält Prompt-Cache-Treffer auf den früheren Turns und reduziert die Input-Kosten bei agentischen Schleifen. Es ist kein Beta-Header erforderlich. Siehe Systemnachrichten mitten in der Konversation für Details zur Verwendung.
Das stop_details-Objekt bei Refusal-Antworten (verfügbar seit Claude Opus 4.7) ist jetzt öffentlich dokumentiert. Wenn Claude es ablehnt, eine Anfrage zu erfüllen, beschreibt dieses Objekt die Kategorie der Ablehnung – zusätzlich zum bestehenden refusal-Stop-Reason. Das erleichtert es deiner Anwendung, verschiedene Klassen abgelehnter Anfragen zu unterscheiden und den Nutzer zum richtigen nächsten Schritt weiterzuleiten. Es ist kein Beta-Header erforderlich. Siehe Umgang mit Stop-Reasons für die Kategorieliste und Hinweise zur Handhabung.
Der Standardwert des Effort-Parameters bei Claude Opus 4.8 ist high auf allen Oberflächen, einschließlich der Claude API und Claude Code. Wenn du Effort heute explizit setzt, bleibt deine Einstellung unverändert. Siehe Effort für Hinweise zu den einzelnen Stufen.
Der Fast-Modus ist jetzt für Claude Opus 4.8 als Research Preview auf der Claude API verfügbar. Setze speed: "fast", um bis zu 2,5x mehr Output-Token pro Sekunde vom selben Modell zu Premium-Preisen zu erhalten. Siehe Fast-Modus für Zugang, unterstützte Modelle und Preise.
Die Mindestlänge für cachebare Prompts bei Claude Opus 4.8 beträgt 1.024 Token, niedriger als bei Claude Opus 4.7. Prompts, die bei Claude Opus 4.7 zu kurz zum Cachen waren, können jetzt ohne Codeänderungen Cache-Einträge erstellen. Siehe Prompt-Caching für die Mindestwerte pro Modell.
Diese Einschränkungen sind gegenüber Claude Opus 4.7 unverändert, sodass Code, der bereits auf Claude Opus 4.7 läuft, keine Änderungen benötigt. Sie gelten nur für die Messages API; Claude Managed Agents sind nicht betroffen.
Das Setzen von temperature, top_p oder top_k auf einen Nicht-Standardwert gibt bei Claude Opus 4.8 einen 400-Fehler zurück, genau wie bei Claude Opus 4.7. Lass diese Parameter weg und nutze Prompting, um das Verhalten des Modells zu steuern.
Wie Claude Opus 4.7 unterstützt Claude Opus 4.8 keine Budgets für erweitertes Denken. Das Setzen von thinking: {"type": "enabled", "budget_tokens": N} gibt einen 400-Fehler zurück. Verwende adaptives Denken und den Effort-Parameter, um die Denktiefe zu steuern.
# Vorher (Opus 4.6 oder früher)
thinking = {"type": "enabled", "budget_tokens": 32000}
# Nachher (Opus 4.7 und später)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}Im Vergleich zu Claude Opus 4.7 zielt Claude Opus 4.8 auf Verhaltensverbesserungen in folgenden Bereichen ab:
Mit aktiviertem adaptivem Denken löst Claude Opus 4.8 Reasoning nur dann aus, wenn es einschätzt, dass der Turn es benötigt. Bei einfachen Lookups und kurzen agentischen Schritten antwortet es direkt; bei komplexen mehrstufigen Problemen denkt es vor dem Antworten nach. Das reduziert verschwendete Thinking-Token bei bimodalen Workloads im Vergleich zu Claude Opus 4.7 auf derselben Effort-Stufe. Wie bei Claude Opus 4.7 ist das Denken deaktiviert, sofern du nicht explizit thinking: {type: "adaptive"} in deiner Anfrage setzt.
Dies sind keine API-Breaking-Changes, können aber Prompt-Anpassungen erfordern. Siehe Migration zu Claude Opus 4.8 für vollständige Hinweise.
Für schrittweise Migrationsanweisungen und die vollständige Migrations-Checkliste siehe Migration zu Claude Opus 4.8. Wenn du Claude Code oder das Agent SDK verwendest, kann der Claude API Skill diese Migrationsschritte automatisch auf deine Codebasis anwenden.
Schrittweise Upgrade-Anweisungen von Claude Opus 4.7.
Hinweise zu den einzelnen Effort-Stufen, einschließlich der neuen Standardwerte.
Der einzige unterstützte Thinking-On-Modus bei Claude Opus 4.8.
Wie Systemnachrichten mitten in der Konversation Cache-Treffer erhalten.
Refusal-Stop-Details und wie du damit umgehst.
Höhere Output-Geschwindigkeit zu Premium-Preisen.
Was this page helpful?