Loading...
    • Entwicklerleitfaden
    • API-Referenz
    • MCP
    • Ressourcen
    • Versionshinweise
    Search...
    ⌘K
    Erste Schritte
    Einführung in ClaudeSchnelleinstieg
    Modelle & Preise
    ModellübersichtModell auswählenNeuerungen in Claude 4.6MigrationsleitfadenModellabschreibungenPreise
    Mit Claude entwickeln
    FunktionsübersichtMessages API verwendenStop-Gründe verarbeitenBest Practices für Prompts
    Modellfähigkeiten
    Extended ThinkingAdaptive ThinkingAufwandFast Mode (Research Preview)Strukturierte AusgabenZitateStreaming MessagesBatch-VerarbeitungPDF-UnterstützungSuchergebnisseMehrsprachige UnterstützungEmbeddingsVision
    Tools
    ÜbersichtTool-Nutzung implementierenWeb-Such-ToolWeb-Abruf-ToolCode-Ausführungs-ToolMemory-ToolBash-ToolComputer-Use-ToolText-Editor-Tool
    Tool-Infrastruktur
    Tool-SucheProgrammgesteuerte Tool-AufrufeFeingranulares Tool-Streaming
    Kontextverwaltung
    KontextfensterKomprimierungKontextbearbeitungPrompt CachingToken-Zählung
    Dateien & Assets
    Files API
    Agent Skills
    ÜbersichtSchnelleinstiegBest PracticesSkills für UnternehmenSkills mit der API verwenden
    Agent SDK
    ÜbersichtSchnelleinstiegTypeScript SDKTypeScript V2 (Preview)Python SDKMigrationsleitfaden
    MCP in der API
    MCP-ConnectorRemote MCP-Server
    Claude auf Plattformen von Drittanbietern
    Amazon BedrockMicrosoft FoundryVertex AI
    Prompt Engineering
    ÜbersichtPrompt-GeneratorPrompt-Vorlagen verwendenPrompt-VerbessererKlar und direkt seinBeispiele verwenden (Multishot Prompting)Claude denken lassen (CoT)XML-Tags verwendenClaude eine Rolle geben (System Prompts)Komplexe Prompts verkettenTipps für lange KontexteTipps für Extended Thinking
    Testen & Evaluieren
    Erfolgskriterien definierenTestfälle entwickelnEvaluierungstool verwendenLatenz reduzieren
    Schutzmaßnahmen verstärken
    Halluzinationen reduzierenAusgabekonsistenz erhöhenJailbreaks abschwächenStreaming-AblehnungenPrompt-Lecks reduzierenClaude im Charakter halten
    Verwaltung und Überwachung
    Admin API ÜbersichtDatenspeicherortArbeitsbereicheUsage and Cost APIClaude Code Analytics APIZero Data Retention
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Modelle & Preise

    Neuerungen in Claude 4.6

    Übersicht über neue Funktionen und Möglichkeiten in Claude Opus 4.6.

    Claude 4.6 stellt die nächste Generation von Claude-Modellen dar und bringt erhebliche neue Funktionen und API-Verbesserungen mit sich. Diese Seite fasst alle neuen Funktionen zusammen, die beim Start verfügbar sind.

    Neue Modelle

    ModellAPI-Modell-IDBeschreibung
    Claude Opus 4.6claude-opus-4-6Unser intelligentestes Modell zum Erstellen von Agenten und zum Programmieren

    Claude Opus 4.6 unterstützt ein Kontextfenster von 200K (mit 1M-Token-Kontextfenster verfügbar in Beta), 128K maximale Ausgabe-Token, erweitertes Denken und alle bestehenden Claude-API-Funktionen.

    Für vollständige Preise und Spezifikationen siehe Modellübersicht.

    Neue Funktionen

    Adaptiver Thinking-Modus

    Adaptives Denken (thinking: {type: "adaptive"}) ist der empfohlene Thinking-Modus für Opus 4.6. Claude entscheidet dynamisch, wann und wie viel gedacht werden soll. Auf der Standard-Anstrengungsstufe (high) wird Claude fast immer denken. Bei niedrigeren Anstrengungsstufen kann es das Denken bei einfacheren Problemen überspringen.

    thinking: {type: "enabled"} und budget_tokens sind veraltet auf Opus 4.6. Sie bleiben funktionsfähig, werden aber in einer zukünftigen Modellversion entfernt. Verwenden Sie stattdessen adaptives Denken und den Anstrengungsparameter, um die Denktiefe zu steuern. Adaptives Denken aktiviert auch automatisch verschachteltes Denken.

    response = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=16000,
        thinking={"type": "adaptive"},
        messages=[{"role": "user", "content": "Solve this complex problem..."}]
    )

    Anstrengungsparameter GA

    Der Anstrengungsparameter ist jetzt allgemein verfügbar (kein Beta-Header erforderlich). Eine neue max-Anstrengungsstufe bietet die absolut höchste Leistung auf Opus 4.6. Kombinieren Sie Anstrengung mit adaptivem Denken für optimale Kosten-Qualitäts-Kompromisse.

    Kompaktions-API (Beta)

    Kompaktierung bietet automatische, serverseitige Kontextzusammenfassung und ermöglicht effektiv unendliche Gespräche. Wenn sich der Kontext dem Fenster-Limit nähert, fasst die API automatisch frühere Teile des Gesprächs zusammen.

    Feingranulares Tool-Streaming (GA)

    Feingranulares Tool-Streaming ist jetzt allgemein verfügbar auf allen Modellen und Plattformen. Kein Beta-Header ist erforderlich.

    128K Ausgabe-Token

    Opus 4.6 unterstützt bis zu 128K Ausgabe-Token und verdoppelt damit das vorherige 64K-Limit. Dies ermöglicht längere Denk-Budgets und umfassendere Antworten. Die SDKs erfordern Streaming für Anfragen mit großen max_tokens-Werten, um HTTP-Timeouts zu vermeiden. Wenn Sie Ereignisse nicht inkrementell verarbeiten müssen, verwenden Sie .stream() mit .get_final_message(), um die vollständige Antwort zu erhalten — siehe Streaming Messages für Details.

    Datenresidenz-Kontrollen

    Datenresidenz-Kontrollen ermöglichen es Ihnen, anzugeben, wo die Modell-Inferenz mit dem Parameter inference_geo ausgeführt wird. Sie können pro Anfrage "global" (Standard) oder "us"-Routing wählen. Nur US-Inferenz wird auf Claude Opus 4.6 und neueren Modellen mit 1,1x berechnet.

    Veraltete Funktionen

    type: "enabled" und budget_tokens

    thinking: {type: "enabled", budget_tokens: N} ist veraltet auf Opus 4.6. Es bleibt funktionsfähig, wird aber in einer zukünftigen Modellversion entfernt. Migrieren Sie zu thinking: {type: "adaptive"} mit dem Anstrengungsparameter.

    interleaved-thinking-2025-05-14 Beta-Header

    Der interleaved-thinking-2025-05-14 Beta-Header ist veraltet auf Opus 4.6. Er wird sicher ignoriert, falls enthalten, ist aber nicht mehr erforderlich. Adaptives Denken aktiviert automatisch verschachteltes Denken. Entfernen Sie betas=["interleaved-thinking-2025-05-14"] aus Ihren Anfragen bei Verwendung von Opus 4.6.

    output_format

    Der Parameter output_format für strukturierte Ausgaben wurde zu output_config.format verschoben. Der alte Parameter bleibt funktionsfähig, ist aber veraltet und wird in einer zukünftigen Modellversion entfernt.

    # Before
    response = client.messages.create(
        output_format={"type": "json_schema", "schema": {...}},
        ...
    )
    
    # After
    response = client.messages.create(
        output_config={"format": {"type": "json_schema", "schema": {...}}},
        ...
    )

    Breaking Changes

    Prefill-Entfernung

    Das Vorausfüllen von Assistenten-Nachrichten (Last-Assistant-Turn-Prefills) wird nicht unterstützt auf Opus 4.6. Anfragen mit vorausgefüllten Assistenten-Nachrichten geben einen 400-Fehler zurück.

    Alternativen:

    • Strukturierte Ausgaben zur Kontrolle des Antwortformats
    • System-Prompt-Anweisungen zur Anleitung des Antwortstils
    • output_config.format für JSON-Ausgabe

    Tool-Parameter-Anführungszeichen

    Opus 4.6 kann leicht unterschiedliche JSON-String-Escaping in Tool-Call-Argumenten erzeugen (z. B. unterschiedliche Behandlung von Unicode-Escapes oder Forward-Slash-Escaping). Standard-JSON-Parser handhaben diese Unterschiede automatisch. Wenn Sie Tool-Call-input als rohe Zeichenkette analysieren, anstatt json.loads() oder JSON.parse() zu verwenden, überprüfen Sie, ob Ihre Parsing-Logik noch funktioniert.

    Migrationsleitfaden

    Für schrittweise Migrationsanweisungen siehe Migration zu Claude 4.6.

    Nächste Schritte

    Adaptives Denken

    Erfahren Sie, wie Sie den adaptiven Thinking-Modus verwenden.

    Modellübersicht

    Vergleichen Sie alle Claude-Modelle.

    Kompaktierung

    Erkunden Sie serverseitige Kontext-Kompaktierung.

    Migrationsleitfaden

    Schrittweise Migrationsanweisungen.

    Was this page helpful?

    • Neue Modelle
    • Neue Funktionen
    • Adaptiver Thinking-Modus
    • Anstrengungsparameter GA
    • Kompaktions-API (Beta)
    • Feingranulares Tool-Streaming (GA)
    • 128K Ausgabe-Token
    • Datenresidenz-Kontrollen
    • Veraltete Funktionen
    • type: "enabled" und budget_tokens
    • interleaved-thinking-2025-05-14 Beta-Header
    • output_format
    • Breaking Changes
    • Prefill-Entfernung
    • Tool-Parameter-Anführungszeichen
    • Migrationsleitfaden
    • Nächste Schritte