Claude Opus 4.7 ist unser bislang leistungsfähigstes allgemein verfügbares Modell. Es ist hochgradig autonom und erbringt außergewöhnliche Leistungen bei langfristigen agentengestützten Aufgaben, Wissensarbeit, Vision-Aufgaben und Memory-Aufgaben. Diese Seite fasst alles Neue beim Start zusammen.
| Modell | API-Modell-ID | Beschreibung |
|---|---|---|
| Claude Opus 4.7 | claude-opus-4-7 | Unser leistungsfähigstes allgemein verfügbares Modell für komplexes Reasoning und agentengestütztes Coding |
Claude Opus 4.7 unterstützt das 1M-Token-Kontextfenster, 128k maximale Ausgabe-Token, adaptives Thinking und denselben Satz von Tools und Plattformfunktionen wie Claude Opus 4.6.
Für vollständige Preise und Spezifikationen siehe Modellübersicht.
Claude Opus 4.7 ist unser erstes Claude-Modell mit Unterstützung für hochauflösende Bilder. Die maximale Bildauflösung wurde auf 2576px / 3,75MP erhöht (erhöht von unserem bisherigen Limit von 1568px / 1,15MP). Diese Änderung sollte Leistungsgewinne bei Vision-intensiven Workloads ermöglichen und ist besonders wichtig für Computer-Use und Screenshot-/Artefakt-/Dokumentverständnis-Workflows.
Was this page helpful?
Darüber hinaus sind Operationen wie das Zuordnen von Koordinaten zu Bildern jetzt einfacher — die Koordinaten des Modells sind 1
mit tatsächlichen Pixeln, daher ist keine Skalierungsfaktor-Mathematik erforderlich.Hochauflösende Bilder verwenden mehr Token. Wenn die zusätzliche Bildqualität nicht erforderlich ist, reduzieren Sie die Bildauflösung vor dem Senden an Claude, um Token-Nutzungssteigerungen zu vermeiden.
Über die Auflösung hinaus verbessert sich Claude Opus 4.7 auch bei:
Siehe Bilder und Vision für Details.
xhigh Effort-StufeDer Effort-Parameter ermöglicht es Ihnen, Claudes Intelligenz vs. Token-Verbrauch abzustimmen und Leistung gegen schnellere Geschwindigkeit und niedrigere Kosten zu tauschen. Beginnen Sie mit der neuen xhigh Effort-Stufe für Coding und agentengestützte Anwendungsfälle, und verwenden Sie mindestens high Effort für die meisten intelligenzempfindlichen Anwendungsfälle. Siehe Empfohlene Effort-Stufen für Claude Opus 4.7 für Anleitung pro Stufe. (Nur Messages API; Claude Managed Agents verwaltet Effort automatisch.)
Claude Opus 4.7 führt Task Budgets ein. Ein Task Budget gibt Claude eine grobe Schätzung, wie viele Token für eine vollständige agentengestützte Schleife angestrebt werden sollen, einschließlich Thinking, Tool-Aufrufe, Tool-Ergebnisse und endgültige Ausgabe. Das Modell sieht einen laufenden Countdown und nutzt ihn, um Arbeit zu priorisieren und die Aufgabe elegant zu beenden, wenn das Budget aufgebraucht ist. Um es zu verwenden, setzen Sie den Beta-Header task-budgets-2026-03-13 und fügen Sie Folgendes zu Ihrer Output-Konfiguration hinzu:
response = client.beta.messages.create(
model="claude-opus-4-7",
max_tokens=128000,
output_config={
"effort": "high",
"task_budget": {"type": "tokens", "total": 128000},
},
messages=[
{"role": "user", "content": "Review the codebase and propose a refactor plan."}
],
betas=["task-budgets-2026-03-13"],
)Sie müssen möglicherweise mit verschiedenen Task Budgets für Ihren Anwendungsfall experimentieren. Wenn dem Modell ein Task Budget gegeben wird, das für eine bestimmte Aufgabe zu restriktiv ist, kann es die Aufgabe weniger gründlich ausführen oder sich weigern, die Aufgabe ganz zu erledigen.
Für offene agentengestützte Aufgaben, bei denen Qualität wichtiger ist als Geschwindigkeit, setzen Sie kein Task Budget; reservieren Sie Task Budgets für Workloads, bei denen Sie das Modell auf eine Token-Zuteilung beschränken müssen. Der Mindestwert für ein Task Budget ist 20k Token.
Dies ist keine harte Obergrenze; es ist ein Vorschlag, dessen sich das Modell bewusst ist. Dies unterscheidet sich von max_tokens, das eine harte Pro-Request-Obergrenze für generierte Token ist (max_tokens wird nicht an das Modell übergeben, und das Modell ist sich dessen nicht bewusst), während task_budget eine beratende Obergrenze über die gesamte agentengestützte Schleife ist. Verwenden Sie task_budget, wenn Sie möchten, dass sich das Modell selbst moderiert, und max_tokens als harte Pro-Request-Obergrenze zur Nutzungsbegrenzung.
Diese Breaking Changes gelten nur für die Messages API. Wenn Sie Claude Managed Agents verwenden, gibt es keine Breaking API-Änderungen für Claude Opus 4.7.
Extended Thinking Budgets werden in Claude Opus 4.7 entfernt. Das Setzen von thinking: {"type": "enabled", "budget_tokens": N} gibt einen 400-Fehler zurück. Adaptives Thinking ist der einzige Thinking-On-Modus, und in unseren internen Evaluierungen übertrifft es zuverlässig Extended Thinking.
# Vorher (Opus 4.6)
thinking = {"type": "enabled", "budget_tokens": 32000}
# Nachher (Opus 4.7)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}Adaptives Thinking ist standardmäßig deaktiviert auf Claude Opus 4.7. Anfragen ohne thinking-Feld laufen ohne Thinking. Setzen Sie thinking: {type: "adaptive"} explizit, um es zu aktivieren.
Ab Claude Opus 4.7 gibt das Setzen von temperature, top_p oder top_k auf einen beliebigen Nicht-Standard-Wert einen 400-Fehler zurück. Der sicherste Migrationspfad ist, diese Parameter vollständig aus Anfragen wegzulassen und Prompting zu verwenden, um das Verhalten des Modells zu lenken. Wenn Sie temperature = 0 für Determinismus verwendet haben, beachten Sie, dass es nie identische Ausgaben garantierte.
Ab Claude Opus 4.7 wird Thinking-Inhalt standardmäßig aus der Antwort weggelassen. Thinking-Blöcke erscheinen immer noch im Antwort-Stream, aber ihr thinking-Feld ist leer, es sei denn, der Aufrufer entscheidet sich explizit dafür. Dies ist eine stille Änderung — es wird kein Fehler ausgelöst — und die Antwortlatenz wird leicht verbessert. Wenn Reasoning-Ausgaben benötigt werden, können Sie display auf "summarized" setzen und mit einer einzeiligen Änderung wieder aktivieren:
thinking = {
"type": "adaptive",
"display": "summarized", # oder "omitted" (Standard)
}Wenn Ihr Produkt Reasoning an Benutzer streamt, wird die neue Standardeinstellung als lange Pause vor Ausgabebeginn angezeigt. Setzen Sie "display": "summarized", um sichtbare Fortschritte während des Thinking wiederherzustellen.
Claude Opus 4.7 verwendet einen neuen Tokenizer, der zu seiner verbesserten Leistung bei einer breiten Palette von Aufgaben beiträgt. Dieser neue Tokenizer kann beim Verarbeiten von Text ungefähr 1x bis 1,35x so viele Token verwenden wie frühere Modelle (bis zu ~35% mehr, variierend je nach Inhalt), und /v1/messages/count_tokens gibt eine andere Anzahl von Token für Claude Opus 4.7 zurück als für Claude Opus 4.6. Die Token-Effizienz von Claude Opus 4.7 kann je nach Workload-Form variieren. Prompting-Interventionen, task_budget und effort können helfen, Kosten zu kontrollieren und angemessene Token-Nutzung sicherzustellen. Beachten Sie, dass diese Kontrollen möglicherweise die Modell-Intelligenz beeinträchtigen.
Wir empfehlen, Ihre max_tokens-Parameter zu aktualisieren, um zusätzlichen Spielraum zu geben, einschließlich Komprimierungs-Trigger. Claude Opus 4.7 bietet ein 1M-Kontextfenster zu Standard-API-Preisen ohne Long-Context-Aufschlag.
Claude Opus 4.7 zeigt bedeutende Gewinne bei Wissensarbeiter-Aufgaben, besonders dort, wo das Modell seine eigenen Ausgaben visuell überprüfen muss:
Wenn bestehende Prompts Mitigationen in diesen Bereichen haben (z.B. "überprüfen Sie das Folienlayout vor der Rückgabe"), versuchen Sie, dieses Scaffolding zu entfernen und neu zu bewerten.
Claude Opus 4.7 ist besser darin, dateiystem-basiertes Memory zu schreiben und zu verwenden. Wenn ein Agent einen Scratchpad, eine Notizen-Datei oder einen strukturierten Memory-Store über Turns hinweg verwaltet, sollte dieser Agent sich verbessern beim Notieren von Notizen für sich selbst und beim Nutzen seiner Notizen in zukünftigen Aufgaben. Um Claude einen verwalteten Scratchpad zu geben, ohne Ihren eigenen zu bauen, verwenden Sie das Client-seitige Memory-Tool.
Siehe Unterstützung für hochauflösende Bilder oben.
Dies sind keine API-Breaking-Changes, können aber Prompt-Updates erfordern. Siehe Migration zu Claude Opus 4.7 für vollständige Anleitung.
Für Schritt-für-Schritt-Migrationsanweisungen und die vollständige Migrations-Checkliste siehe Migration zu Claude Opus 4.7. Wenn Sie Claude Code oder das Agent SDK verwenden, kann das Claude API Skill diese Migrationsschritte automatisch auf Ihre Codebasis anwenden.
Geben Sie Claude ein beratenes Token-Budget über eine vollständige agentengestützte Schleife.
Der einzige unterstützte Thinking-On-Modus auf Claude Opus 4.7.
Effort-Anleitung pro Stufe für Claude Opus 4.7.
Unterstützung für hochauflösende Bilder und 1
.Schritt-für-Schritt-Upgrade-Anweisungen.