• Nachrichten
  • Managed Agents
  • Admin

Search...
⌘K
Modelle
ModellübersichtModell-IDs und VersionierungModell auswählenVorstellung von Claude Fable 5 und Claude Mythos 5Neuerungen in Claude Opus 4.8Upgrade zwischen ModellversionenEingestellte ModelleModellkartenSystem-PromptsPreise

Log in
Neuerungen in Claude Opus 4.8
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Modelle & Preise/Modelle

Was ist neu in Claude Opus 4.8

Überblick über neue Funktionen und Verhaltensänderungen in Claude Opus 4.8.

Claude Opus 4.8 ist Anthropics leistungsfähigstes Modell der Opus-Klasse. Es baut auf Claude Opus 4.7 auf. Diese Seite fasst alle Neuerungen zum Launch zusammen, einschließlich des Fast-Modus (Research Preview auf der Claude API) und einer niedrigeren Mindestlänge von 1.024 Token für cachebare Prompts.

Neues Modell

ModellAPI-Modell-IDBeschreibung
Claude Opus 4.8claude-opus-4-8Anthropics leistungsfähigstes Modell der Opus-Klasse für komplexes Reasoning, langfristiges agentisches Coding und hochautonome Arbeit

Claude Opus 4.8 unterstützt standardmäßig das 1M-Token-Kontextfenster auf der Claude API, Amazon Bedrock und Vertex AI (200k auf Microsoft Foundry), 128k maximale Output-Token, adaptives Denken und denselben Satz an Tools und Plattformfunktionen wie Claude Opus 4.7.

Vollständige Preise und Spezifikationen findest du in der Modellübersicht.

Neue Funktionen

Systemnachrichten mitten in der Konversation

Claude Opus 4.8 akzeptiert role: "system"-Nachrichten direkt nach einem User-Turn im messages-Array (vorbehaltlich der Platzierungsregeln). Damit kannst du später in einer lang laufenden Konversation aktualisierte Anweisungen anhängen, ohne den vollständigen System-Prompt zu wiederholen. Das erhält Prompt-Cache-Treffer auf den früheren Turns und reduziert die Input-Kosten bei agentischen Schleifen. Es ist kein Beta-Header erforderlich. Siehe Systemnachrichten mitten in der Konversation für Details zur Verwendung.

Refusal-Stop-Details

Das stop_details-Objekt bei Refusal-Antworten (verfügbar seit Claude Opus 4.7) ist jetzt öffentlich dokumentiert. Wenn Claude es ablehnt, eine Anfrage zu erfüllen, beschreibt dieses Objekt die Kategorie der Ablehnung – zusätzlich zum bestehenden refusal-Stop-Reason. Das erleichtert es deiner Anwendung, verschiedene Klassen abgelehnter Anfragen zu unterscheiden und den Nutzer zum richtigen nächsten Schritt weiterzuleiten. Es ist kein Beta-Header erforderlich. Siehe Umgang mit Stop-Reasons für die Kategorieliste und Hinweise zur Handhabung.

Effort-Standardwerte

Der Standardwert des Effort-Parameters bei Claude Opus 4.8 ist high auf allen Oberflächen, einschließlich der Claude API und Claude Code. Wenn du Effort heute explizit setzt, bleibt deine Einstellung unverändert. Siehe Effort für Hinweise zu den einzelnen Stufen.

Fast-Modus

Der Fast-Modus ist jetzt für Claude Opus 4.8 als Research Preview auf der Claude API verfügbar. Setze speed: "fast", um bis zu 2,5x mehr Output-Token pro Sekunde vom selben Modell zu Premium-Preisen zu erhalten. Siehe Fast-Modus für Zugang, unterstützte Modelle und Preise.

Niedrigeres Prompt-Cache-Minimum

Die Mindestlänge für cachebare Prompts bei Claude Opus 4.8 beträgt 1.024 Token, niedriger als bei Claude Opus 4.7. Prompts, die bei Claude Opus 4.7 zu kurz zum Cachen waren, können jetzt ohne Codeänderungen Cache-Einträge erstellen. Siehe Prompt-Caching für die Mindestwerte pro Modell.

Von Claude Opus 4.7 übernommene API-Einschränkungen



Diese Einschränkungen sind gegenüber Claude Opus 4.7 unverändert, sodass Code, der bereits auf Claude Opus 4.7 läuft, keine Änderungen benötigt. Sie gelten nur für die Messages API; Claude Managed Agents sind nicht betroffen.

Sampling-Parameter nicht unterstützt

Das Setzen von temperature, top_p oder top_k auf einen Nicht-Standardwert gibt bei Claude Opus 4.8 einen 400-Fehler zurück, genau wie bei Claude Opus 4.7. Lass diese Parameter weg und nutze Prompting, um das Verhalten des Modells zu steuern.

Adaptives Denken ist der einzige Denkmodus

Wie Claude Opus 4.7 unterstützt Claude Opus 4.8 keine Budgets für erweitertes Denken. Das Setzen von thinking: {"type": "enabled", "budget_tokens": N} gibt einen 400-Fehler zurück. Verwende adaptives Denken und den Effort-Parameter, um die Denktiefe zu steuern.

Python
# Vorher (Opus 4.6 oder früher)
thinking = {"type": "enabled", "budget_tokens": 32000}

# Nachher (Opus 4.7 und später)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}

Verbesserungen der Fähigkeiten

Verbesserungsbereiche

Im Vergleich zu Claude Opus 4.7 zielt Claude Opus 4.8 auf Verhaltensverbesserungen in folgenden Bereichen ab:

  • Langfristiges agentisches Coding, einschließlich besserer Handhabung langer Kontexte, weniger Compactions und besserer Compaction-Wiederherstellung.
  • Kalibrierung des Reasoning-Efforts, mit zuverlässigerem Verhalten auf jeder Effort-Stufe über eine Reihe von Domänen hinweg.
  • Tool-Triggering, mit weniger Fällen, in denen ein für die Aufgabe erforderlicher Tool-Aufruf übersprungen wird.

Adaptives Denken

Mit aktiviertem adaptivem Denken löst Claude Opus 4.8 Reasoning nur dann aus, wenn es einschätzt, dass der Turn es benötigt. Bei einfachen Lookups und kurzen agentischen Schritten antwortet es direkt; bei komplexen mehrstufigen Problemen denkt es vor dem Antworten nach. Das reduziert verschwendete Thinking-Token bei bimodalen Workloads im Vergleich zu Claude Opus 4.7 auf derselben Effort-Stufe. Wie bei Claude Opus 4.7 ist das Denken deaktiviert, sofern du nicht explizit thinking: {type: "adaptive"} in deiner Anfrage setzt.

Verhaltensänderungen

Dies sind keine API-Breaking-Changes, können aber Prompt-Anpassungen erfordern. Siehe Migration zu Claude Opus 4.8 für vollständige Hinweise.

  • Weniger verschwendete Thinking-Token auf derselben Effort-Stufe bei aktiviertem adaptivem Denken, weil das Modell pro Turn entscheidet, ob es nachdenkt.
  • Besseres Tool-Triggering. Das Modell überspringt seltener einen Tool-Aufruf, den die Aufgabe erfordert – ein Problem, das einige Nutzer bei Claude Opus 4.7 gemeldet haben.
  • Bessere Compaction-Handhabung und Long-Context-Qualität. Lange agentische Traces bleiben bei der Aufgabe, mit weniger Entgleisungen nach einer Compaction.

Migrationsleitfaden

Für schrittweise Migrationsanweisungen und die vollständige Migrations-Checkliste siehe Migration zu Claude Opus 4.8. Wenn du Claude Code oder das Agent SDK verwendest, kann der Claude API Skill diese Migrationsschritte automatisch auf deine Codebasis anwenden.

Nächste Schritte


Migrationsleitfaden

Schrittweise Upgrade-Anweisungen von Claude Opus 4.7.

Effort

Hinweise zu den einzelnen Effort-Stufen, einschließlich der neuen Standardwerte.

Adaptives Denken

Der einzige unterstützte Thinking-On-Modus bei Claude Opus 4.8.

Prompt-Caching

Wie Systemnachrichten mitten in der Konversation Cache-Treffer erhalten.

Umgang mit Stop-Reasons

Refusal-Stop-Details und wie du damit umgehst.


Fast-Modus

Höhere Output-Geschwindigkeit zu Premium-Preisen.

Was this page helpful?

  • Neues Modell
  • Neue Funktionen
  • Systemnachrichten mitten in der Konversation
  • Refusal-Stop-Details
  • Effort-Standardwerte
  • Fast-Modus
  • Niedrigeres Prompt-Cache-Minimum
  • Von Claude Opus 4.7 übernommene API-Einschränkungen
  • Sampling-Parameter nicht unterstützt
  • Adaptives Denken ist der einzige Denkmodus
  • Verbesserungen der Fähigkeiten
  • Verbesserungsbereiche
  • Adaptives Denken
  • Verhaltensänderungen
  • Migrationsleitfaden
  • Nächste Schritte