Modelle & Preise

Neuerungen in Claude 4.6

Übersicht über neue Funktionen und Möglichkeiten in Claude Opus 4.6.

Claude 4.6 stellt die nächste Generation von Claude-Modellen dar und bringt erhebliche neue Funktionen und API-Verbesserungen mit sich. Diese Seite fasst alle neuen Funktionen zusammen, die beim Start verfügbar sind.

Neue Modelle

Modell	API-Modell-ID	Beschreibung
Claude Opus 4.6	`claude-opus-4-6`	Unser intelligentestes Modell zum Erstellen von Agenten und zum Programmieren

Claude Opus 4.6 unterstützt ein Kontextfenster von 200K (mit 1M-Token-Kontextfenster verfügbar in Beta), 128K maximale Ausgabe-Token, erweitertes Denken und alle bestehenden Claude-API-Funktionen.

Für vollständige Preise und Spezifikationen siehe Modellübersicht.

Neue Funktionen

Adaptiver Thinking-Modus

Adaptives Denken (thinking: {type: "adaptive"}) ist der empfohlene Thinking-Modus für Opus 4.6. Claude entscheidet dynamisch, wann und wie viel gedacht werden soll. Auf der Standard-Anstrengungsstufe (high) wird Claude fast immer denken. Bei niedrigeren Anstrengungsstufen kann es das Denken bei einfacheren Problemen überspringen.

thinking: {type: "enabled"} und budget_tokens sind veraltet auf Opus 4.6. Sie bleiben funktionsfähig, werden aber in einer zukünftigen Modellversion entfernt. Verwenden Sie stattdessen adaptives Denken und den Anstrengungsparameter, um die Denktiefe zu steuern. Adaptives Denken aktiviert auch automatisch verschachteltes Denken.

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[{"role": "user", "content": "Solve this complex problem..."}]
)

Anstrengungsparameter GA

Der Anstrengungsparameter ist jetzt allgemein verfügbar (kein Beta-Header erforderlich). Eine neue max-Anstrengungsstufe bietet die absolut höchste Leistung auf Opus 4.6. Kombinieren Sie Anstrengung mit adaptivem Denken für optimale Kosten-Qualitäts-Kompromisse.

Kompaktions-API (Beta)

Kompaktierung bietet automatische, serverseitige Kontextzusammenfassung und ermöglicht effektiv unendliche Gespräche. Wenn sich der Kontext dem Fenster-Limit nähert, fasst die API automatisch frühere Teile des Gesprächs zusammen.

Feingranulares Tool-Streaming (GA)

Feingranulares Tool-Streaming ist jetzt allgemein verfügbar auf allen Modellen und Plattformen. Kein Beta-Header ist erforderlich.

128K Ausgabe-Token

Opus 4.6 unterstützt bis zu 128K Ausgabe-Token und verdoppelt damit das vorherige 64K-Limit. Dies ermöglicht längere Denk-Budgets und umfassendere Antworten. Die SDKs erfordern Streaming für Anfragen mit großen max_tokens-Werten, um HTTP-Timeouts zu vermeiden. Wenn Sie Ereignisse nicht inkrementell verarbeiten müssen, verwenden Sie .stream() mit .get_final_message(), um die vollständige Antwort zu erhalten — siehe Streaming Messages für Details.

Datenresidenz-Kontrollen

Datenresidenz-Kontrollen ermöglichen es Ihnen, anzugeben, wo die Modell-Inferenz mit dem Parameter inference_geo ausgeführt wird. Sie können pro Anfrage "global" (Standard) oder "us"-Routing wählen. Nur US-Inferenz wird auf Claude Opus 4.6 und neueren Modellen mit 1,1x berechnet.

Veraltete Funktionen

`type: "enabled"` und `budget_tokens`

thinking: {type: "enabled", budget_tokens: N} ist veraltet auf Opus 4.6. Es bleibt funktionsfähig, wird aber in einer zukünftigen Modellversion entfernt. Migrieren Sie zu thinking: {type: "adaptive"} mit dem Anstrengungsparameter.

`interleaved-thinking-2025-05-14` Beta-Header

Der interleaved-thinking-2025-05-14 Beta-Header ist veraltet auf Opus 4.6. Er wird sicher ignoriert, falls enthalten, ist aber nicht mehr erforderlich. Adaptives Denken aktiviert automatisch verschachteltes Denken. Entfernen Sie betas=["interleaved-thinking-2025-05-14"] aus Ihren Anfragen bei Verwendung von Opus 4.6.

`output_format`

Der Parameter output_format für strukturierte Ausgaben wurde zu output_config.format verschoben. Der alte Parameter bleibt funktionsfähig, ist aber veraltet und wird in einer zukünftigen Modellversion entfernt.

# Before
response = client.messages.create(
    output_format={"type": "json_schema", "schema": {...}},
    ...
)

# After
response = client.messages.create(
    output_config={"format": {"type": "json_schema", "schema": {...}}},
    ...
)

Breaking Changes

Prefill-Entfernung

Das Vorausfüllen von Assistenten-Nachrichten (Last-Assistant-Turn-Prefills) wird nicht unterstützt auf Opus 4.6. Anfragen mit vorausgefüllten Assistenten-Nachrichten geben einen 400-Fehler zurück.

Alternativen:

Strukturierte Ausgaben zur Kontrolle des Antwortformats
System-Prompt-Anweisungen zur Anleitung des Antwortstils
output_config.format für JSON-Ausgabe

Tool-Parameter-Anführungszeichen

Opus 4.6 kann leicht unterschiedliche JSON-String-Escaping in Tool-Call-Argumenten erzeugen (z. B. unterschiedliche Behandlung von Unicode-Escapes oder Forward-Slash-Escaping). Standard-JSON-Parser handhaben diese Unterschiede automatisch. Wenn Sie Tool-Call-input als rohe Zeichenkette analysieren, anstatt json.loads() oder JSON.parse() zu verwenden, überprüfen Sie, ob Ihre Parsing-Logik noch funktioniert.

Migrationsleitfaden

Für schrittweise Migrationsanweisungen siehe Migration zu Claude 4.6.

Nächste Schritte

Adaptives Denken

Erfahren Sie, wie Sie den adaptiven Thinking-Modus verwenden.

Modellübersicht

Vergleichen Sie alle Claude-Modelle.

Kompaktierung

Erkunden Sie serverseitige Kontext-Kompaktierung.

Migrationsleitfaden

Schrittweise Migrationsanweisungen.

Was this page helpful?

Modelle & Preise

Neuerungen in Claude 4.6

Übersicht über neue Funktionen und Möglichkeiten in Claude Opus 4.6.

Neue Modelle

Modell	API-Modell-ID	Beschreibung
Claude Opus 4.6	`claude-opus-4-6`	Unser intelligentestes Modell zum Erstellen von Agenten und zum Programmieren

Claude Opus 4.6 unterstützt ein Kontextfenster von 200K (mit 1M-Token-Kontextfenster verfügbar in Beta), 128K maximale Ausgabe-Token, erweitertes Denken und alle bestehenden Claude-API-Funktionen.

Für vollständige Preise und Spezifikationen siehe Modellübersicht.

Neue Funktionen

Adaptiver Thinking-Modus

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[{"role": "user", "content": "Solve this complex problem..."}]
)

Anstrengungsparameter GA

Kompaktions-API (Beta)

Feingranulares Tool-Streaming (GA)

Feingranulares Tool-Streaming ist jetzt allgemein verfügbar auf allen Modellen und Plattformen. Kein Beta-Header ist erforderlich.

128K Ausgabe-Token

Datenresidenz-Kontrollen

Veraltete Funktionen

`type: "enabled"` und `budget_tokens`

`interleaved-thinking-2025-05-14` Beta-Header

`output_format`

# Before
response = client.messages.create(
    output_format={"type": "json_schema", "schema": {...}},
    ...
)

# After
response = client.messages.create(
    output_config={"format": {"type": "json_schema", "schema": {...}}},
    ...
)

Breaking Changes

Prefill-Entfernung

Alternativen:

Strukturierte Ausgaben zur Kontrolle des Antwortformats
System-Prompt-Anweisungen zur Anleitung des Antwortstils
output_config.format für JSON-Ausgabe

Tool-Parameter-Anführungszeichen

Migrationsleitfaden

Für schrittweise Migrationsanweisungen siehe Migration zu Claude 4.6.

Nächste Schritte

Adaptives Denken

Erfahren Sie, wie Sie den adaptiven Thinking-Modus verwenden.

Modellübersicht

Vergleichen Sie alle Claude-Modelle.

Kompaktierung

Erkunden Sie serverseitige Kontext-Kompaktierung.

Migrationsleitfaden

Schrittweise Migrationsanweisungen.

Was this page helpful?

Neue Modelle

Neue Funktionen

Adaptiver Thinking-Modus

Anstrengungsparameter GA

Kompaktions-API (Beta)

Feingranulares Tool-Streaming (GA)

128K Ausgabe-Token

Datenresidenz-Kontrollen

Veraltete Funktionen

type: "enabled" und budget_tokens

interleaved-thinking-2025-05-14 Beta-Header

output_format

Breaking Changes

Prefill-Entfernung

Tool-Parameter-Anführungszeichen

Migrationsleitfaden

Nächste Schritte

Neue Modelle

Neue Funktionen

Adaptiver Thinking-Modus

Anstrengungsparameter GA

Kompaktions-API (Beta)

Feingranulares Tool-Streaming (GA)

128K Ausgabe-Token

Datenresidenz-Kontrollen

Veraltete Funktionen

type: "enabled" und budget_tokens

interleaved-thinking-2025-05-14 Beta-Header

output_format

Breaking Changes

Prefill-Entfernung

Tool-Parameter-Anführungszeichen

Migrationsleitfaden

Nächste Schritte

`type: "enabled"` und `budget_tokens`

`interleaved-thinking-2025-05-14` Beta-Header

`output_format`

`type: "enabled"` und `budget_tokens`

`interleaved-thinking-2025-05-14` Beta-Header

`output_format`