Loading...
    • Erstellen
    • Admin
    • Modelle & Preise
    • Client SDKs
    • API-Referenz
    Search...
    ⌘K
    Erste Schritte
    Einführung in ClaudeSchnellstart
    Mit Claude erstellen
    FunktionsübersichtVerwendung der Messages APIClaude API-FähigkeitStop-Gründe verarbeiten
    Modellmöglichkeiten
    Extended ThinkingAdaptive ThinkingAufwandTask Budgets (Beta)Fast Mode (Beta: Research Preview)Strukturierte AusgabenZitateStreaming MessagesBatch-VerarbeitungSuchergebnisseStreaming-AblehnungenMehrsprachige UnterstützungEmbeddings
    Tools
    ÜbersichtWie Tool-Nutzung funktioniertWeb Search ToolWeb Fetch ToolCode Execution ToolAdvisor ToolMemory ToolBash ToolComputer Use ToolText Editor Tool
    Tool-Infrastruktur
    Tool-ReferenzTool-SucheProgrammgesteuerte Tool-AufrufeFeingranulares Tool-Streaming
    Kontextverwaltung
    KontextfensterKomprimierungKontextbearbeitungPrompt CachingToken-Zählung
    Mit Dateien arbeiten
    Files APIPDF-UnterstützungBilder und Vision
    Skills
    ÜbersichtSchnellstartBest PracticesSkills für UnternehmenSkills in der API
    MCP
    Remote MCP ServerMCP Connector
    Prompt Engineering
    ÜbersichtBest Practices für PromptingConsole Prompting Tools
    Testen und evaluieren
    Erfolg definieren und Evaluierungen erstellenVerwendung des Evaluation Tools in ConsoleLatenz reduzieren
    Guardrails verstärken
    Halluzinationen reduzierenAusgabekonsistenz erhöhenJailbreaks abschwächenPrompt-Leak reduzieren
    Ressourcen
    Glossar
    Versionshinweise
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Prompt Engineering

    Best Practices für Prompting

    Umfassender Leitfaden zu Prompt-Engineering-Techniken für Claudes neueste Modelle, mit Schwerpunkt auf Klarheit, Beispiele, XML-Strukturierung, Thinking und agentenbasierte Systeme.

    Dies ist die einzige Referenz für Prompt Engineering mit Claudes neuesten Modellen, einschließlich Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6 und Claude Haiku 4.5. Es behandelt grundlegende Techniken, Ausgabekontrolle, Tool-Nutzung, Thinking und agentenbasierte Systeme. Springen Sie zu dem Abschnitt, der Ihrer Situation entspricht.

    Einen Überblick über die Modellmöglichkeiten finden Sie in der Modellübersicht. Weitere Informationen zu den Neuerungen in Claude Opus 4.7 finden Sie unter Neuerungen in Claude Opus 4.7. Migrationsleitfäden finden Sie im Migrationsleitfaden.

    Prompting mit Claude Opus 4.7

    Claude Opus 4.7 ist unser fähigstes allgemein verfügbares Modell mit besonderen Stärken bei langfristiger agentenbasierter Arbeit, Knowledge Work, Vision und Memory-Aufgaben. Es funktioniert gut direkt mit bestehenden Claude Opus 4.6-Prompts. Die folgenden Muster behandeln die Verhaltensweisen, die am häufigsten Anpassungen erfordern.

    Informationen zu API-Parameteränderungen bei der Migration von Claude Opus 4.6 (Effort-Level, Task-Budgets, Thinking-Konfiguration, Entfernung von Sampling-Parametern und Tokenisierung) finden Sie im Migrationsleitfaden.

    Antwortlänge und Ausführlichkeit

    Claude Opus 4.7 kalibriert die Antwortlänge danach, wie komplex es die Aufgabe beurteilt, anstatt sich auf eine feste Ausführlichkeit zu verlassen. Dies bedeutet normalerweise kürzere Antworten bei einfachen Abfragen und viel längere bei offenen Analysen.

    Wenn Ihr Produkt von einem bestimmten Stil oder einer bestimmten Ausführlichkeit der Ausgabe abhängt, müssen Sie möglicherweise Ihre Prompts anpassen. Um beispielsweise die Ausführlichkeit zu verringern, könnten Sie hinzufügen:

    Geben Sie prägnante, fokussierte Antworten. Überspringen Sie nicht wesentliche Kontexte und halten Sie Beispiele minimal.

    Wenn Sie spezifische Beispiele für Arten von Ausführlichkeit sehen (z. B. Übererklärungen), können Sie zusätzliche Anweisungen in Ihrem Prompt hinzufügen, um diese zu verhindern. Positive Beispiele, die zeigen, wie Claude mit dem angemessenen Maß an Prägnanz kommunizieren kann, sind in der Regel effektiver als negative Beispiele oder Anweisungen, die dem Modell sagen, was es nicht tun soll.

    Kalibrierung von Effort und Thinking-Tiefe

    Der Effort-Parameter ermöglicht es Ihnen, Claudes Intelligenz gegenüber Token-Ausgaben abzuwägen und Fähigkeit gegen schnellere Geschwindigkeit und niedrigere Kosten zu tauschen. Beginnen Sie mit dem neuen xhigh Effort-Level für Coding- und agentenbasierte Anwendungsfälle und verwenden Sie mindestens high Effort für die meisten intelligenzempfindlichen Anwendungsfälle. Experimentieren Sie mit anderen Effort-Leveln, um die Token-Nutzung und Intelligenz weiter zu optimieren:

    • max: Max Effort kann in einigen Anwendungsfällen Leistungsgewinne liefern, kann aber abnehmende Erträge durch erhöhte Token-Nutzung zeigen. Diese Einstellung kann auch manchmal zu Überdenken neigen. Wir empfehlen, Max Effort für intelligenzfordernde Aufgaben zu testen.
    • xhigh (neu): Extra hoher Effort ist die beste Einstellung für die meisten Coding- und agentenbasierten Anwendungsfälle.
    • high: Diese Einstellung balanciert Token-Nutzung und Intelligenz. Für die meisten intelligenzempfindlichen Anwendungsfälle empfehlen wir mindestens high Effort.
    • medium: Gut für kostensensitive Anwendungsfälle, die die Token-Nutzung reduzieren müssen, während sie Intelligenz opfern.
    • low: Reservieren Sie für kurze, begrenzte Aufgaben und latenzempfindliche Workloads, die nicht intelligenzempfindlich sind.

    Ein bedeutsamer Unterschied zu Claude Opus 4.6 ist, dass Claude Opus 4.7 Effort-Level streng respektiert, besonders am unteren Ende. Bei low und medium beschränkt das Modell seine Arbeit auf das, was gefragt wurde, anstatt darüber hinauszugehen. Dies ist gut für Latenz und Kosten, aber bei mäßig komplexen Aufgaben, die mit low Effort laufen, besteht ein gewisses Risiko von Unterdenken.

    Wenn Sie oberflächliches Denken bei komplexen Problemen beobachten, erhöhen Sie den Effort auf high oder xhigh, anstatt es zu umgehen. Wenn Sie den Effort bei low für Latenz halten müssen, fügen Sie gezielt Anleitung hinzu:

    Diese Aufgabe beinhaltet mehrstufiges Denken. Denken Sie sorgfältig über das Problem nach, bevor Sie antworten.

    Wir erwarten, dass Effort für dieses Modell wichtiger ist als für jedes vorherige Opus, und empfehlen, damit aktiv zu experimentieren, wenn Sie upgraden.

    Das Auslöseverhalten für adaptives Thinking ist steuerbar. Wenn Sie feststellen, dass das Modell häufiger denkt als gewünscht – was bei großen oder komplexen System-Prompts vorkommen kann – fügen Sie Anleitung hinzu, um es zu steuern. Wie immer sollten Sie die Auswirkung von Prompt-Änderungen auf die Leistung messen. Beispiel:

    Thinking erhöht die Latenz und sollte nur verwendet werden, wenn es die Antwortqualität bedeutsam verbessert – typischerweise für Probleme, die mehrstufiges Denken erfordern. Im Zweifelsfall antworten Sie direkt.

    Umgekehrt, wenn Sie schwierige Workloads bei medium laufen lassen und Unterdenken sehen, ist der erste Hebel, den Effort zu erhöhen. Wenn Sie feinere Kontrolle benötigen, fordern Sie es direkt an.

    Wenn Sie Claude Opus 4.7 mit max oder xhigh Effort laufen lassen, setzen Sie ein großes maximales Output-Token-Budget, damit das Modell Platz zum Denken und Handeln über seine Subagenten und Tool-Aufrufe hinweg hat. Wir empfehlen, mit 64k Tokens zu beginnen und von dort aus zu optimieren.

    Tool-Nutzungs-Auslösung

    Claude Opus 4.7 hat eine Tendenz, Tools weniger häufig zu verwenden als Claude Opus 4.6 und stattdessen mehr Reasoning zu nutzen. Dies führt in den meisten Fällen zu besseren Ergebnissen. Das Erhöhen der Effort-Einstellung ist jedoch ein nützlicher Hebel, um die Ebene der Tool-Nutzung zu erhöhen, besonders bei Knowledge Work. high oder xhigh Effort-Einstellungen zeigen deutlich mehr Tool-Nutzung bei agentenbasierter Suche und Coding. Für Szenarien, in denen Sie mehr Tool-Nutzung möchten, können Sie auch Ihren Prompt anpassen, um das Modell explizit anzuweisen, wann und wie es seine Tools richtig nutzen soll. Wenn Sie beispielsweise feststellen, dass das Modell Ihre Web-Suchtools nicht nutzt, beschreiben Sie klar, warum und wie es sollte.

    Benutzerseitige Fortschrittsaktualisierungen

    Claude Opus 4.7 bietet regelmäßigere, höherwertige Aktualisierungen für den Benutzer während langer agentenbasierter Traces. Wenn Sie Gerüste hinzugefügt haben, um Zwischenstatus-Meldungen zu erzwingen („Nach jedem 3. Tool-Aufruf Fortschritt zusammenfassen"), versuchen Sie, diese zu entfernen. Wenn Sie feststellen, dass die Länge oder der Inhalt von Claude Opus 4.7's benutzerseitigen Aktualisierungen nicht gut auf Ihren Anwendungsfall abgestimmt sind, beschreiben Sie explizit, wie diese Aktualisierungen aussehen sollten, und geben Sie Beispiele.

    Literalere Befolgung von Anweisungen

    Claude Opus 4.7 interpretiert Prompts literaler und expliziter als Claude Opus 4.6, besonders bei niedrigeren Effort-Leveln. Es wird eine Anweisung nicht stillschweigend von einem Element auf ein anderes verallgemeinern, und es wird keine Anfragen ableiten, die Sie nicht gestellt haben. Der Vorteil dieses Literalismus ist Präzision und weniger Durcheinander, und es funktioniert generell besser für API-Anwendungsfälle mit sorgfältig abgestimmten Prompts, strukturierter Extraktion und Pipelines, wo Sie vorhersehbares Verhalten möchten. Wenn Sie möchten, dass Claude eine Anweisung breit anwendet, geben Sie den Umfang explizit an (zum Beispiel „Wenden Sie diese Formatierung auf jeden Abschnitt an, nicht nur auf den ersten").

    Ton und Schreibstil

    Wie bei jedem neuen Modell kann sich der Prosastil bei längeren Schriften verschieben. Claude Opus 4.7 ist direkter und eigenwilliger, mit weniger validierungsgerichteter Formulierung und weniger Emojis als Claudes wärmerer Stil von Opus 4.6. Wenn Ihr Produkt auf eine bestimmte Stimme angewiesen ist, bewerten Sie Stil-Prompts gegen die neue Baseline neu.

    Wenn Ihre Produktstimme beispielsweise wärmer oder gesprächiger ist, fügen Sie hinzu:

    Verwenden Sie einen warmen, kooperativen Ton. Bestätigen Sie den Rahmen des Benutzers, bevor Sie antworten.

    Kontrolle der Subagenten-Erzeugung

    Claude Opus 4.7 neigt dazu, standardmäßig weniger Subagenten zu erzeugen. Dieses Verhalten ist jedoch durch Prompting steuerbar; geben Sie Claude Opus 4.7 explizite Anleitung, wann Subagenten wünschenswert sind. Ein Spielbeispiel für einen Coding-Anwendungsfall:

    Erzeugen Sie keinen Subagenten für Arbeit, die Sie direkt in einer einzigen Antwort abschließen können (z. B. Umgestaltung einer Funktion, die Sie bereits sehen können).
    
    Erzeugen Sie mehrere Subagenten in derselben Runde, wenn Sie über Elemente verteilen oder mehrere Dateien lesen.

    Design- und Frontend-Standardwerte

    Claude Opus 4.7 hat stärkere Design-Instinkte als Claude Opus 4.6, mit einem konsistenten Standard-Hausstil: warme Creme-/Off-White-Hintergründe (~#F4F1EA), Serif-Display-Typ (Georgia, Fraunces, Playfair), kursive Wort-Akzente und ein Terrakotta-/Bernstein-Akzent. Dies liest sich gut für redaktionelle, Gastgewerbe- und Portfolio-Briefs, wird sich aber für Dashboards, Dev-Tools, Fintech, Healthcare oder Enterprise-Apps falsch anfühlen – und es erscheint auch in Foliendecks sowie Web-UIs.

    Dieser Standard ist persistent. Generische Anweisungen („verwenden Sie keine Creme", „machen Sie es sauber und minimal") neigen dazu, das Modell zu einer anderen festen Palette zu verschieben, anstatt Vielfalt zu erzeugen. Zwei Ansätze funktionieren zuverlässig:

    1. Geben Sie eine konkrete Alternative an. Das Modell folgt expliziten Spezifikationen präzise:

    Entwerfen Sie eine Desktop-Landingpage für eine Nahrungsergänzungsmarke namens AEFRM.
    
    Die visuelle Richtung sollte aus einer kalten monochromen Atmosphäre mit blassem Silbergrau stammen, das allmählich in Blaugrau und nahezu Schwarz übergeht, ähnlich einer nebligen metallischen Oberfläche.
    
    Die Seite sollte sich scharf und kontrolliert anfühlen, mit einem starken Gefühl für Struktur und Zurückhaltung.
    
    Verwenden Sie dieses Tonsystem auf der gesamten Seite, anstatt helle Akzentfarben einzuführen.
    
    Verwenden Sie das hochgeladene Bild im Hero-Design in Schwarz und Weiß.
    
    Das Layout sollte mit klaren horizontalen Abschnitten und einem zentrierten Container mit maximaler Breite aufgebaut sein. Verwenden Sie durchgehend 4px Eckenradius auf Karten, Schaltflächen, Eingaben und Medienrahmen. Ränder sollten großzügig wirken, mit genug Leerraum um jeden Abschnitt, damit die Seite atmen kann.
    
    Die Typografie sollte eine quadratische, eckige serifenlose Schrift mit größerem Buchstabenabstand als üblich verwenden, besonders in Überschriften und Navigation, damit der Text mehr konstruiert und weniger komprimiert wirkt. Überschrifttext kann groß und Großbuchstaben sein, während unterstützender Text kurz und spärlich bleibt. Die Untertexte sollten mit Alumni Sans SC in 4-6px wie winzige kleine Texte in Ecken unten Mitte geschrieben werden.
    
    Für die Struktur beginnen Sie mit einem Hero-Abschnitt, der eine starke Produktaussage, einen kurzen unterstützenden Absatz und einen sauberen Produkt-Platzhalter oder Packshot-Rahmen enthält. Darunter fügen Sie ein Vorteil-Raster mit drei oder vier Blöcken hinzu, dann einen Formulierungs- oder Zutaten-Abschnitt und schließlich einen CTA.
    
    Schaltflächen sollten flach und präzise sein, mit subtilen Hover-Änderungen unter Verwendung von transition: all 160ms ease out, wobei sich Helligkeit und Grenzkontrast leicht verschieben, anstatt dramatische Bewegung zu verwenden.
    
    Farbpalette sollte in diesem Bereich bleiben:
    #E9ECEC, #C9D2D4, #8C9A9E, #44545B, #11171B.

    2. Lassen Sie das Modell Optionen vorschlagen, bevor Sie bauen. Dies bricht den Standard und gibt Benutzern Kontrolle. Wenn Sie sich zuvor auf temperature für Design-Vielfalt verlassen haben, verwenden Sie diesen Ansatz – er erzeugt bedeutsam unterschiedliche Richtungen über Läufe hinweg. Beispiel-Prompt:

    Schlagen Sie vor dem Bauen 4 unterschiedliche visuelle Richtungen vor, die auf diesen Brief zugeschnitten sind (jeweils als: bg hex / accent hex / typeface — einzeilige Begründung). Bitten Sie den Benutzer, eine auszuwählen, und implementieren Sie dann nur diese Richtung.

    Darüber hinaus erfordert Claude Opus 4.7 weniger Frontend-Design-Prompting als vorherige Modelle, um generische Muster zu vermeiden, die Benutzer die „KI-Müll"-Ästhetik nennen. Bei früheren Modellen empfahlen wir einen längeren Prompt-Snippet in unserer Frontend-Design-Fähigkeit. Claude Opus 4.7 generiert jedoch mit minimalerer Prompting-Anleitung charakteristische, kreative Frontends. Dieser Prompt-Snippet funktioniert gut mit den obigen Prompting-Ratschlägen für Vielfalt:

    <frontend_aesthetics>
    VERWENDEN Sie NIEMALS generische KI-generierte Ästhetik wie übernutzte Schriftfamilien (Inter, Roboto, Arial, System-Schriften), klischeehafte Farbschemen (besonders lila Verläufe auf weißem oder dunklem Hintergrund), vorhersehbare Layouts und Komponentenmuster sowie Cookie-Cutter-Design, dem kontextspezifischer Charakter fehlt. Verwenden Sie einzigartige Schriften, kohärente Farben und Themen sowie Animationen für Effekte und Mikro-Interaktionen.
    </frontend_aesthetics>

    Interaktive Coding-Produkte

    Die Token-Nutzung und das Verhalten von Claude Opus 4.7 können sich zwischen autonomen, asynchronen Coding-Agenten mit einer einzelnen Benutzer-Runde und interaktiven, synchronen Coding-Agenten mit mehreren Benutzer-Runden unterscheiden. Speziell neigt es dazu, mehr Tokens in interaktiven Einstellungen zu verwenden, hauptsächlich weil es nach Benutzer-Runden mehr denkt. Dies kann die langfristige Kohärenz, Befolgung von Anweisungen und Coding-Fähigkeiten in langen, interaktiven Coding-Sitzungen verbessern, kommt aber auch mit mehr Token-Nutzung. Um sowohl Leistung als auch Token-Effizienz in Coding-Produkten zu maximieren, empfehlen wir die Verwendung von xhigh oder high Effort, das Hinzufügen autonomer Funktionen wie eines Auto-Modus und die Reduzierung der Anzahl der erforderlichen menschlichen Interaktionen.

    Natürlich ist es bei der Begrenzung der erforderlichen menschlichen Interaktionen wichtig, die Aufgabe, Absicht und relevante Einschränkungen in der ersten menschlichen Runde anzugeben. Die Bereitstellung gut spezifizierter, klarer und genauer Aufgabenbeschreibungen im Voraus kann helfen, Autonomie und Intelligenz zu maximieren und gleichzeitig zusätzliche Token-Nutzung nach Benutzer-Runden zu minimieren. Wir stellen fest, dass Claude Opus 4.7 autonomer ist als vorherige Modelle, dieses Nutzungsmuster hilft, Leistung zu maximieren. Im Gegensatz dazu neigen mehrdeutige oder unterspecifizierte Prompts, die progressiv über mehrere Benutzer-Runden vermittelt werden, dazu, die Token-Effizienz relativ zu reduzieren und manchmal die Leistung.

    Code-Review-Harnesses

    Claude Opus 4.7 ist bedeutsam besser darin, Bugs zu finden als vorherige Modelle, und hat sowohl höhere Recall als auch Precision in unseren Evals – 11pp besserer Recall in einem unserer schwierigsten Bug-Finding-Evals basierend auf echten Anthropic PRs. Wenn Ihr Code-Review-Harness jedoch für ein früheres Modell abgestimmt wurde, können Sie anfangs niedrigere Recall sehen. Dies ist wahrscheinlich ein Harness-Effekt, keine Fähigkeitsregression. Wenn ein Review-Prompt Dinge sagt wie „berichten Sie nur über hochschwere Probleme", „seien Sie konservativ" oder „nitpicken Sie nicht", kann Claude Opus 4.7 diese Anweisung treuer befolgen als frühere Modelle – es kann den Code genauso gründlich untersuchen, die Bugs identifizieren und dann Erkenntnisse nicht berichten, die es unter Ihrer angegebenen Schwelle beurteilt. Dies kann sich als das Modell zeigen, das die gleiche Untersuchungstiefe durchführt, aber weniger Untersuchungen in gemeldete Erkenntnisse umwandelt, besonders bei Bugs mit niedrigerer Schwere. Precision steigt typischerweise, aber gemessener Recall kann fallen, obwohl die zugrunde liegende Bug-Finding-Fähigkeit des Modells verbessert hat.

    Einige empfohlene Prompt-Sprache:

    Berichten Sie über jedes Problem, das Sie finden, einschließlich solcher, bei denen Sie unsicher sind oder die Sie als niedrig-schwer einstufen. Filtern Sie nicht nach Wichtigkeit oder Vertrauen in dieser Phase – ein separater Verifizierungsschritt wird das tun. Ihr Ziel hier ist Abdeckung: es ist besser, eine Erkenntnis zu zeigen, die später gefiltert wird, als einen echten Bug stillschweigend zu übersehen. Für jeden Fund geben Sie Ihr Vertrauensniveau und eine geschätzte Schwere an, damit ein nachgelagerter Filter sie einstufen kann.

    Dieser Prompt kann verwendet werden, ohne einen tatsächlichen zweiten Schritt zu haben, aber das Verschieben der Vertrauensfilterung aus dem Finding-Schritt hilft oft. Wenn Ihr Harness einen separaten Verifizierungs-, Deduplizierungs- oder Ranking-Schritt hat, teilen Sie dem Modell explizit mit, dass sein Job im Finding-Schritt Abdeckung ist, anstatt zu filtern.

    Wenn Sie möchten, dass das Modell in einem einzigen Durchgang selbst filtert, seien Sie konkret darüber, wo die Schwelle liegt, anstatt qualitative Begriffe wie „wichtig" zu verwenden – zum Beispiel „berichten Sie über alle Bugs, die zu falschem Verhalten, einem Test-Fehler oder einem irreführenden Ergebnis führen könnten; lassen Sie nur Nits wie reine Stil- oder Benennungspräferenzen weg."

    Wir empfehlen, Prompts gegen eine Teilmenge Ihrer Evals oder Testfälle zu iterieren, um Recall- oder F1-Score-Gewinne zu validieren.

    Computernutzung

    Die Computernutzungs-Fähigkeit funktioniert über Auflösungen hinweg, bis zu einer neuen maximalen Auflösung von 2576px / 3,75MP. In unseren Computernutzungs-Tests stellen wir fest, dass das Senden von Bildern bei 1080p ein gutes Gleichgewicht zwischen Leistung und Kosten bietet.

    Für besonders kostensensitive Workloads empfehlen wir 720p oder 1366×768 als kostengünstigere Optionen mit starker Leistung. Wir empfehlen, dass Sie Ihre eigenen Tests durchführen, um die idealen Einstellungen für Ihren Anwendungsfall zu finden; das Experimentieren mit Effort-Einstellungen kann auch helfen, das Verhalten des Modells zu optimieren.

    Allgemeine Prinzipien

    Seien Sie klar und direkt

    Claude reagiert gut auf klare, explizite Anweisungen. Spezifisch zu sein über Ihre gewünschte Ausgabe kann helfen, Ergebnisse zu verbessern. Wenn Sie „über und über hinaus" Verhalten möchten, fordern Sie es explizit an, anstatt sich auf das Modell zu verlassen, um dies aus vagen Prompts abzuleiten.

    Denken Sie an Claude als einen brillanten, aber neuen Mitarbeiter, dem der Kontext Ihrer Normen und Workflows fehlt. Je präziser Sie erklären, was Sie möchten, desto besser das Ergebnis.

    Goldene Regel: Zeigen Sie Ihren Prompt einem Kollegen mit minimalem Kontext zur Aufgabe und bitten Sie ihn, ihn zu befolgen. Wenn sie verwirrt wären, wird Claude es auch sein.

    • Seien Sie spezifisch über das gewünschte Ausgabeformat und Einschränkungen.
    • Geben Sie Anweisungen als sequenzielle Schritte mit nummerierten Listen oder Aufzählungspunkten an, wenn die Reihenfolge oder Vollständigkeit der Schritte wichtig ist.

    Fügen Sie Kontext hinzu, um die Leistung zu verbessern

    Das Bereitstellen von Kontext oder Motivation hinter Ihren Anweisungen, z. B. das Erklären an Claude, warum solches Verhalten wichtig ist, kann Claude helfen, Ihre Ziele besser zu verstehen und gezielter zu reagieren.

    Claude ist intelligent genug, um aus der Erklärung zu verallgemeinern.

    Verwenden Sie Beispiele effektiv

    Beispiele sind einer der zuverlässigsten Wege, um Claudes Ausgabeformat, Ton und Struktur zu steuern. Ein paar gut gestaltete Beispiele (bekannt als Few-Shot oder Multishot Prompting) können die Genauigkeit und Konsistenz dramatisch verbessern.

    Wenn Sie Beispiele hinzufügen, machen Sie sie:

    • Relevant: Spiegeln Sie Ihren tatsächlichen Anwendungsfall eng wider.
    • Vielfältig: Decken Sie Grenzfälle ab und variieren Sie genug, damit Claude unbeabsichtigte Muster nicht aufgreift.
    • Strukturiert: Wickeln Sie Beispiele in <example> Tags (mehrere Beispiele in <examples> Tags), damit Claude sie von Anweisungen unterscheiden kann.
    Fügen Sie 3–5 Beispiele für beste Ergebnisse ein. Sie können auch Claude bitten, Ihre Beispiele auf Relevanz und Vielfalt zu bewerten, oder zusätzliche basierend auf Ihrem ursprünglichen Satz zu generieren.

    Strukturieren Sie Prompts mit XML-Tags

    XML-Tags helfen Claude, komplexe Prompts eindeutig zu analysieren, besonders wenn Ihr Prompt Anweisungen, Kontext, Beispiele und variable Eingaben mischt. Das Umwickeln jeder Art von Inhalt in sein eigenes Tag (z. B. <instructions>, <context>, <input>) reduziert Fehlinterpretationen.

    Best Practices:

    • Verwenden Sie konsistente, beschreibende Tag-Namen über Ihre Prompts hinweg.
    • Verschachteln Sie Tags, wenn Inhalt eine natürliche Hierarchie hat (Dokumente in <documents>, jeweils in <document index="n">).

    Geben Sie Claude eine Rolle

    Das Festlegen einer Rolle im System-Prompt konzentriert Claudes Verhalten und Ton auf Ihren Anwendungsfall. Selbst ein einzelner Satz macht einen Unterschied:

    Python
    import anthropic
    
    client = anthropic.Anthropic()
    
    message = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        system="You are a helpful coding assistant specializing in Python.",
        messages=[
            {"role": "user", "content": "How do I sort a list of dictionaries by key?"}
        ],
    )
    print(message.content)

    Long-Context-Prompting

    Wenn Sie mit großen Dokumenten oder datenreichen Eingaben arbeiten (20k+ Tokens), strukturieren Sie Ihren Prompt sorgfältig, um die besten Ergebnisse zu erhalten:

    • Platzieren Sie Langform-Daten oben: Platzieren Sie Ihre langen Dokumente und Eingaben oben in Ihrem Prompt, über Ihrer Abfrage, Anweisungen und Beispielen. Dies kann die Leistung über alle Modelle hinweg erheblich verbessern.

      Abfragen am Ende können die Antwortqualität in Tests um bis zu 30% verbessern, besonders bei komplexen, mehrdokumentigen Eingaben.
    • Strukturieren Sie Dokumentinhalt und Metadaten mit XML-Tags: Wenn Sie mehrere Dokumente verwenden, wickeln Sie jedes Dokument in <document> Tags mit <document_content> und <source> (und anderen Metadaten) Untertags zur Klarheit.

    • Verankern Sie Antworten in Zitaten: Für Langdokument-Aufgaben bitten Sie Claude, zuerst relevante Teile der Dokumente zu zitieren, bevor es seine Aufgabe ausführt. Dies hilft Claude, durch das Rauschen des restlichen Dokumentinhalts zu schneiden.

    Modell-Selbstwissen

    Wenn Sie möchten, dass Claude sich selbst in Ihrer Anwendung korrekt identifiziert oder bestimmte API-Strings verwendet:

    Beispiel-Prompt für Modellidentität
    Der Assistent ist Claude, erstellt von Anthropic. Das aktuelle Modell ist Claude Opus 4.7.

    Für LLM-gestützte Apps, die Modell-Strings angeben müssen:

    Beispiel-Prompt für Modell-String
    Wenn ein LLM benötigt wird, verwenden Sie bitte standardmäßig Claude Opus 4.7, es sei denn, der Benutzer fordert etwas anderes an. Der genaue Modell-String für Claude Opus 4.7 ist claude-opus-4-7.

    Ausgabe und Formatierung

    Kommunikationsstil und Ausführlichkeit

    Claudes neueste Modelle haben einen prägnanten und natürlicheren Kommunikationsstil im Vergleich zu früheren Modellen:

    • Direkter und fundierter: Bietet faktengestützte Fortschrittsberichte anstelle von selbstfeiernden Aktualisierungen
    • Gesprächiger: Etwas fließender und umgangssprachlicher, weniger maschinenähnlich
    • Weniger ausführlich: Kann detaillierte Zusammenfassungen aus Effizienzgründen überspringen, es sei denn, Sie fordern dies an

    Dies bedeutet, dass Claude möglicherweise verbale Zusammenfassungen nach Tool-Aufrufen überspringt und direkt zur nächsten Aktion springt. Wenn Sie mehr Sichtbarkeit in sein Denken bevorzugen:

    Beispiel-Prompt
    Geben Sie nach Abschluss einer Aufgabe, die Tool-Nutzung beinhaltet, eine kurze Zusammenfassung der Arbeit, die Sie geleistet haben.

    Kontrollieren Sie das Format von Antworten

    Es gibt einige besonders effektive Wege, um die Ausgabeformatierung zu steuern:

    1. Sagen Sie Claude, was es tun soll, anstatt was es nicht tun soll

      • Anstelle von: „Verwenden Sie kein Markdown in Ihrer Antwort"
      • Versuchen Sie: „Ihre Antwort sollte aus sanft fließenden Prosa-Absätzen bestehen."
    2. Verwenden Sie XML-Format-Indikatoren

      • Versuchen Sie: „Schreiben Sie die Prosa-Abschnitte Ihrer Antwort in <smoothly_flowing_prose_paragraphs> Tags."
    3. Passen Sie Ihren Prompt-Stil an den gewünschten Ausgabe-Stil an

      Der Formatierungsstil, der in Ihrem Prompt verwendet wird, kann Claudes Antwort-Stil beeinflussen. Wenn Sie immer noch Steuerbarkeitsprobleme mit der Ausgabeformatierung haben, versuchen Sie, Ihren Prompt-Stil so nah wie möglich an Ihren gewünschten Ausgabe-Stil anzupassen. Zum Beispiel kann das Entfernen von Markdown aus Ihrem Prompt das Volumen von Markdown in der Ausgabe reduzieren.

    4. Verwenden Sie detaillierte Prompts für spezifische Formatierungspräferenzen

      Für mehr Kontrolle über Markdown- und Formatierungsnutzung geben Sie explizite Anleitung:

    Beispiel-Prompt zur Minimierung von Markdown
    <avoid_excessive_markdown_and_bullet_points>
    Wenn Sie Berichte, Dokumente, technische Erklärungen, Analysen oder andere Langform-Inhalte schreiben, schreiben Sie in klarer, fließender Prosa mit vollständigen Absätzen und Sätzen. Verwenden Sie Standard-Absatzumbrüche zur Organisation und reservieren Sie Markdown hauptsächlich für `Inline-Code`, Code-Blöcke (```...```) und einfache Überschriften (###, und ###). Vermeiden Sie die Verwendung von **fett** und *kursiv*.
    
    VERWENDEN Sie KEINE nummerierten Listen (1. ...) oder ungeordneten Listen (*), es sei denn: a) Sie präsentieren wirklich diskrete Elemente, bei denen ein Listenformat die beste Option ist, oder b) der Benutzer fordert explizit eine Liste oder Ranking an
    
    Anstatt Elemente mit Aufzählungspunkten oder Nummern aufzulisten, integrieren Sie sie natürlich in Sätze. Diese Anleitung gilt besonders für technisches Schreiben. Die Verwendung von Prosa anstelle von übermäßiger Formatierung wird die Benutzerzufriedenheit verbessern. GEBEN Sie NIEMALS eine Serie von übermäßig kurzen Aufzählungspunkten aus.
    
    Ihr Ziel ist lesbarer, fließender Text, der den Leser natürlich durch Ideen führt, anstatt Informationen in isolierte Punkte zu fragmentieren.
    </avoid_excessive_markdown_and_bullet_points>

    LaTeX-Ausgabe

    Claude Opus 4.6 verwendet standardmäßig LaTeX für mathematische Ausdrücke, Gleichungen und technische Erklärungen. Wenn Sie Klartext bevorzugen, fügen Sie die folgenden Anweisungen zu Ihrem Prompt hinzu:

    Beispiel-Prompt
    Formatieren Sie Ihre Antwort nur in Klartext. Verwenden Sie kein LaTeX, MathJax oder andere Markup-Notation wie \( \), $, oder \frac{}{}. Schreiben Sie alle mathematischen Ausdrücke mit Standard-Textzeichen (z. B. „/" für Division, „*" für Multiplikation und „^" für Exponenten).

    Dokumenterstellung

    Claudes neueste Modelle zeichnen sich durch die Erstellung von Präsentationen, Animationen und visuellen Dokumenten mit beeindruckender kreativer Flair und starker Befolgung von Anweisungen aus. Die Modelle erzeugen in den meisten Fällen beim ersten Versuch polierte, nutzbare Ausgaben.

    Für beste Ergebnisse bei der Dokumenterstellung:

    Beispiel-Prompt
    Erstellen Sie eine professionelle Präsentation zu [Thema]. Fügen Sie durchdachte Design-Elemente, visuelle Hierarchie und ansprechende Animationen ein, wo angemessen.

    Migration weg von vorausgefüllten Antworten

    Ab Claude 4.6 Modellen und Claude Mythos Preview werden vorausgefüllte Antworten auf der letzten Assistent-Runde nicht mehr unterstützt. Bei Mythos Preview geben Anfragen mit vorausgefüllten Assistent-Meldungen einen 400-Fehler zurück. Die Modell-Intelligenz und Befolgung von Anweisungen haben sich so weit entwickelt, dass die meisten Anwendungsfälle von Vorausfüllung es nicht mehr benötigen. Bestehende Modelle werden weiterhin Vorausfüllungen unterstützen, und das Hinzufügen von Assistent-Meldungen an anderer Stelle in der Konversation ist nicht betroffen.

    Hier sind häufige Vorausfüllungs-Szenarien und wie Sie weg von ihnen migrieren:

    Tool-Nutzung

    Tool-Nutzung

    Claudes neueste Modelle sind für präzise Befolgung von Anweisungen trainiert und profitieren von expliziter Anleitung, um bestimmte Tools zu verwenden. Wenn Sie sagen „können Sie einige Änderungen vorschlagen", wird Claude manchmal nur Vorschläge machen, anstatt sie zu implementieren, selbst wenn Änderungen das sein könnten, was Sie beabsichtigt haben.

    Damit Claude Maßnahmen ergreift, seien Sie expliziter:

    Um Claude standardmäßig proaktiver bei der Ergreifung von Maßnahmen zu machen, können Sie dies zu Ihrem System-Prompt hinzufügen:

    Beispiel-Prompt für proaktive Maßnahmen
    <default_to_action>
    Implementieren Sie standardmäßig Änderungen, anstatt sie nur vorzuschlagen. Wenn die Absicht des Benutzers unklar ist, leiten Sie die wahrscheinlichste nützliche Aktion ab und fahren Sie fort, indem Sie Tools verwenden, um fehlende Details zu entdecken, anstatt zu raten. Versuchen Sie, die Absicht des Benutzers darüber abzuleiten, ob ein Tool-Aufruf (z. B. Datei-Bearbeitung oder Lesen) beabsichtigt ist oder nicht, und handeln Sie entsprechend.
    </default_to_action>

    Andererseits, wenn Sie möchten, dass das Modell standardmäßig zögerlicher ist, weniger geneigt, direkt in Implementierungen zu springen, und nur Maßnahmen ergreift, wenn angefordert, können Sie dieses Verhalten mit einem Prompt wie dem folgenden steuern:

    Beispiel-Prompt für konservative Maßnahmen
    <do_not_act_before_instructions>
    Springen Sie nicht in Implementierung oder Änderungsdateien, es sei denn, Sie werden klar angewiesen, Änderungen vorzunehmen. Wenn die Absicht des Benutzers mehrdeutig ist, geben Sie standardmäßig Informationen, führen Recherchen durch und geben Empfehlungen, anstatt Maßnahmen zu ergreifen. Fahren Sie nur mit Bearbeitungen, Änderungen oder Implementierungen fort, wenn der Benutzer dies explizit anfordert.
    </do_not_act_before_instructions>

    Claude Opus 4.5 und Claude Opus 4.6 reagieren auch empfindlicher auf den System-Prompt als vorherige Modelle. Wenn Ihre Prompts dazu ausgelegt waren, Unterauslösung bei Tools oder Fähigkeiten zu reduzieren, können diese Modelle jetzt überauslösen. Die Lösung ist, aggressive Sprache zu reduzieren. Wo Sie möglicherweise gesagt haben „KRITISCH: Sie MÜSSEN dieses Tool verwenden, wenn...", können Sie normalere Prompting wie „Verwenden Sie dieses Tool, wenn..." verwenden.

    Parallele Werkzeugaufrufe optimieren

    Claudes neueste Modelle zeichnen sich durch parallele Werkzeugausführung aus. Diese Modelle werden:

    • Mehrere spekulative Suchen während der Recherche durchführen
    • Mehrere Dateien gleichzeitig lesen, um schneller Kontext aufzubauen
    • Bash-Befehle parallel ausführen (was sogar die Systemleistung bremsen kann)

    Dieses Verhalten ist leicht steuerbar. Während das Modell eine hohe Erfolgsquote bei parallelen Werkzeugaufrufen ohne Aufforderung hat, können Sie dies auf ~100% erhöhen oder die Aggressivitätsstufe anpassen:

    Beispiel-Prompt für maximale parallele Effizienz
    <use_parallel_tool_calls>
    Wenn Sie mehrere Werkzeuge aufrufen möchten und es keine Abhängigkeiten zwischen den Werkzeugaufrufen gibt, führen Sie alle unabhängigen Werkzeugaufrufe parallel aus. Priorisieren Sie das gleichzeitige Aufrufen von Werkzeugen, wann immer die Aktionen parallel ausgeführt werden können, anstatt sequenziell. Wenn Sie beispielsweise 3 Dateien lesen, führen Sie 3 Werkzeugaufrufe parallel aus, um alle 3 Dateien gleichzeitig in den Kontext zu laden. Maximieren Sie die Nutzung paralleler Werkzeugaufrufe, wo möglich, um Geschwindigkeit und Effizienz zu erhöhen. Wenn jedoch einige Werkzeugaufrufe von vorherigen Aufrufen abhängen, um abhängige Werte wie die Parameter zu informieren, rufen Sie diese Werkzeuge NICHT parallel auf und rufen Sie sie stattdessen sequenziell auf. Verwenden Sie niemals Platzhalter oder raten Sie fehlende Parameter in Werkzeugaufrufen.
    </use_parallel_tool_calls>
    Beispiel-Prompt zur Reduzierung paralleler Ausführung
    Führen Sie Operationen sequenziell mit kurzen Pausen zwischen den einzelnen Schritten aus, um Stabilität zu gewährleisten.

    Denken und Argumentation

    Überdenken und übermäßige Gründlichkeit

    Claude Opus 4.6 führt erheblich mehr vorbereitende Erkundungen durch als frühere Modelle, besonders bei höheren effort-Einstellungen. Diese anfängliche Arbeit hilft oft, die endgültigen Ergebnisse zu optimieren, aber das Modell kann umfangreichen Kontext sammeln oder mehrere Forschungsstränge verfolgen, ohne dazu aufgefordert zu werden. Wenn Ihre Prompts das Modell zuvor dazu ermutigten, gründlicher zu sein, sollten Sie diese Anleitung für Claude Opus 4.6 anpassen:

    • Ersetzen Sie pauschale Standardvorgaben durch gezielere Anweisungen. Anstatt „Standardmäßig [tool] verwenden" fügen Sie Anleitung wie „[tool] verwenden, wenn es Ihr Verständnis des Problems verbessern würde" hinzu.
    • Entfernen Sie Über-Prompting. Werkzeuge, die in früheren Modellen zu wenig ausgelöst wurden, werden wahrscheinlich jetzt angemessen ausgelöst. Anweisungen wie „Im Zweifelsfall [tool] verwenden" führen zu Überauslösung.
    • Verwenden Sie effort als Fallback. Wenn Claude weiterhin zu aggressiv ist, verwenden Sie eine niedrigere Einstellung für effort.

    In einigen Fällen kann Claude Opus 4.6 umfangreich denken, was Denk-Token aufblähen und Antworten verlangsamen kann. Wenn dieses Verhalten unerwünscht ist, können Sie explizite Anweisungen hinzufügen, um sein Denken einzuschränken, oder Sie können die effort-Einstellung senken, um das Gesamtdenken und die Token-Nutzung zu reduzieren.

    Beispiel-Prompt
    Wenn Sie sich überlegen, wie Sie ein Problem angehen, wählen Sie einen Ansatz und halten Sie daran fest. Vermeiden Sie es, Entscheidungen zu überdenken, es sei denn, Sie stoßen auf neue Informationen, die Ihrer Argumentation direkt widersprechen. Wenn Sie zwischen zwei Ansätzen abwägen, wählen Sie einen und verfolgen Sie ihn. Sie können später immer noch den Kurs korrigieren, wenn der gewählte Ansatz fehlschlägt.

    Wenn Sie eine harte Obergrenze für Denkkosten benötigen, ist erweitertes Denken mit einer budget_tokens-Obergrenze auf Opus 4.6 und Sonnet 4.6 noch funktionsfähig, wird aber nicht mehr empfohlen. Bevorzugen Sie das Senken der effort-Einstellung oder die Verwendung von max_tokens als harte Grenze mit adaptivem Denken.

    Nutzen Sie Denk- und verschachteltes Denken

    Claudes neueste Modelle bieten Denkfähigkeiten, die besonders hilfreich für Aufgaben sind, die Reflexion nach Werkzeugnutzung oder komplexes mehrstufiges Denken beinhalten. Sie können sein anfängliches oder verschachteltes Denken für bessere Ergebnisse lenken.

    Claude Opus 4.6 und Claude Sonnet 4.6 verwenden adaptives Denken (thinking: {type: "adaptive"}), wobei Claude dynamisch entscheidet, wann und wie viel zu denken ist. Claude kalibriert sein Denken basierend auf zwei Faktoren: dem effort-Parameter und der Abfragekomplexität. Höherer Aufwand führt zu mehr Denken, und komplexere Abfragen tun dasselbe. Bei einfacheren Abfragen, die kein Denken erfordern, antwortet das Modell direkt. In internen Evaluationen führt adaptives Denken zuverlässig zu besserer Leistung als erweitertes Denken. Erwägen Sie, zu adaptivem Denken zu wechseln, um die intelligentesten Antworten zu erhalten.

    Verwenden Sie adaptives Denken für Workloads, die agentenähnliches Verhalten erfordern, wie mehrstufige Werkzeugnutzung, komplexe Codierungsaufgaben und langfristige Agenten-Schleifen. Ältere Modelle verwenden manuellen Denkmodus mit budget_tokens.

    Sie können Claudes Denkverhalten lenken:

    Beispiel-Prompt
    Nachdem Sie Werkzeugergebnisse erhalten haben, überprüfen Sie sorgfältig deren Qualität und bestimmen Sie optimale nächste Schritte, bevor Sie fortfahren. Verwenden Sie Ihr Denken, um basierend auf diesen neuen Informationen zu planen und zu iterieren, und ergreifen Sie dann die beste nächste Aktion.

    Das Auslöseverhalten für adaptives Denken ist aufforderbar. Wenn Sie feststellen, dass das Modell häufiger denkt, als Ihnen lieb ist, was bei großen oder komplexen System-Prompts vorkommen kann, fügen Sie Anleitung hinzu, um es zu lenken:

    Beispiel-Prompt
    Erweitertes Denken erhöht die Latenz und sollte nur verwendet werden, wenn es die Antwortqualität sinnvoll verbessert – typischerweise für Probleme, die mehrstufiges Denken erfordern. Im Zweifelsfall antworten Sie direkt.

    Wenn Sie von erweitertem Denken mit budget_tokens migrieren, ersetzen Sie Ihre Denkkonfiguration und verschieben Sie die Budget-Kontrolle zu effort:

    Vorher (erweitertes Denken, ältere Modelle):

    Python
    client.messages.create(
        model="claude-sonnet-4-5-20250929",
        max_tokens=64000,
        thinking={"type": "enabled", "budget_tokens": 32000},
        messages=[{"role": "user", "content": "..."}],
    )

    Nachher (adaptives Denken):

    Python
    client.messages.create(
        model="claude-opus-4-7",
        max_tokens=64000,
        thinking={"type": "adaptive"},
        output_config={"effort": "high"},  # or "max", "xhigh", "medium", "low"
        messages=[{"role": "user", "content": "..."}],
    )

    Wenn Sie kein erweitertes Denken verwenden, sind keine Änderungen erforderlich. Denken ist standardmäßig ausgeschaltet, wenn Sie den thinking-Parameter weglassen.

    • Bevorzugen Sie allgemeine Anweisungen gegenüber vorschreibenden Schritten. Ein Prompt wie „denken Sie gründlich" führt oft zu besserer Argumentation als ein handgeschriebener Schritt-für-Schritt-Plan. Claudes Argumentation übertrifft häufig das, was ein Mensch vorschreiben würde.
    • Multishot-Beispiele funktionieren mit Denken. Verwenden Sie <thinking>-Tags in Ihren Few-Shot-Beispielen, um Claude das Argumentationsmuster zu zeigen. Es wird diesen Stil auf seine eigenen erweiterten Denk-Blöcke verallgemeinern.
    • Manuelles CoT als Fallback. Wenn Denken ausgeschaltet ist, können Sie dennoch Schritt-für-Schritt-Argumentation fördern, indem Sie Claude bitten, das Problem durchzudenken. Verwenden Sie strukturierte Tags wie <thinking> und <answer>, um Argumentation sauber von der endgültigen Ausgabe zu trennen.
    • Bitten Sie Claude, sich selbst zu überprüfen. Fügen Sie etwas wie „Bevor Sie fertig sind, überprüfen Sie Ihre Antwort gegen [Testkriterien]" hinzu. Dies fängt Fehler zuverlässig ab, besonders bei Codierung und Mathematik.
    Wenn erweitertes Denken deaktiviert ist, ist Claude Opus 4.5 besonders empfindlich gegenüber dem Wort „think" und seinen Varianten. Erwägen Sie, Alternativen wie „consider", „evaluate" oder „reason through" in diesen Fällen zu verwenden.

    Weitere Informationen zu Denkfähigkeiten finden Sie unter Erweitertes Denken und Adaptives Denken.

    Agentensysteme

    Langfristige Argumentation und Zustandsverfolgung

    Claudes neueste Modelle zeichnen sich durch langfristige Argumentationsaufgaben mit außergewöhnlichen Zustandsverfolgungsfähigkeiten aus. Claude behält die Orientierung über erweiterte Sitzungen hinweg, indem es sich auf inkrementelle Fortschritte konzentriert und stetige Fortschritte bei einigen wenigen Dingen macht, anstatt alles auf einmal zu versuchen. Diese Fähigkeit entsteht besonders über mehrere Kontextfenster oder Aufgabeniterationen hinweg, wo Claude an einer komplexen Aufgabe arbeiten, den Zustand speichern und mit einem frischen Kontextfenster fortfahren kann.

    Kontextbewusstsein und Multi-Window-Workflows

    Claude 4.6 und Claude 4.5 Modelle verfügen über Kontextbewusstsein, das es dem Modell ermöglicht, sein verbleibendes Kontextfenster (d. h. „Token-Budget") während eines Gesprächs zu verfolgen. Dies ermöglicht Claude, Aufgaben auszuführen und Kontext effektiver zu verwalten, indem es versteht, wie viel Platz es hat.

    Kontextgrenzen verwalten:

    Wenn Sie Claude in einem Agent-Harness verwenden, der Kontext komprimiert oder das Speichern von Kontext in externen Dateien ermöglicht (wie in Claude Code), erwägen Sie, diese Informationen zu Ihrem Prompt hinzuzufügen, damit Claude entsprechend handeln kann. Andernfalls kann Claude natürlicherweise versuchen, die Arbeit zu beenden, wenn es sich dem Kontextlimit nähert. Hier ist ein Beispiel-Prompt:

    Beispiel-Prompt
    Ihr Kontextfenster wird automatisch komprimiert, wenn es sich seinem Limit nähert, sodass Sie unbegrenzt von dort aus weitermachen können, wo Sie aufgehört haben. Daher sollten Sie Aufgaben nicht vorzeitig aufgrund von Token-Budget-Bedenken beenden. Wenn Sie sich Ihrem Token-Budget-Limit nähern, speichern Sie Ihren aktuellen Fortschritt und Zustand im Speicher, bevor das Kontextfenster aktualisiert wird. Seien Sie immer so hartnäckig und autonom wie möglich und führen Sie Aufgaben vollständig aus, auch wenn das Ende Ihres Budgets näher rückt. Beenden Sie niemals künstlich eine Aufgabe vorzeitig, unabhängig vom verbleibenden Kontext.

    Das Memory-Tool passt natürlich zu Kontextbewusstsein für nahtlose Kontextübergänge.

    Multi-Kontextfenster-Workflows

    Für Aufgaben, die sich über mehrere Kontextfenster erstrecken:

    1. Verwenden Sie einen anderen Prompt für das allererste Kontextfenster: Verwenden Sie das erste Kontextfenster, um ein Framework einzurichten (Tests schreiben, Setup-Skripte erstellen), und verwenden Sie dann zukünftige Kontextfenster, um an einer Todo-Liste zu iterieren.

    2. Lassen Sie das Modell Tests in einem strukturierten Format schreiben: Bitten Sie Claude, Tests zu erstellen, bevor Sie mit der Arbeit beginnen, und verfolgen Sie sie in einem strukturierten Format (z. B. tests.json). Dies führt zu besserer langfristiger Fähigkeit zur Iteration. Erinnern Sie Claude an die Wichtigkeit von Tests: „Es ist inakzeptabel, Tests zu entfernen oder zu bearbeiten, da dies zu fehlender oder fehlerhafter Funktionalität führen könnte."

    3. Richten Sie Quality-of-Life-Tools ein: Ermutigen Sie Claude, Setup-Skripte (z. B. init.sh) zu erstellen, um Server elegant zu starten, Test-Suites und Linter auszuführen. Dies verhindert wiederholte Arbeit beim Fortfahren von einem frischen Kontextfenster.

    4. Neu starten vs. Komprimieren: Wenn ein Kontextfenster gelöscht wird, erwägen Sie, mit einem brandneuen Kontextfenster zu beginnen, anstatt Komprimierung zu verwenden. Claudes neueste Modelle sind äußerst effektiv darin, Zustand aus dem lokalen Dateisystem zu entdecken. In einigen Fällen möchten Sie dies möglicherweise gegenüber Komprimierung nutzen. Seien Sie präskriptiv darüber, wie es beginnen sollte:

      • „Rufen Sie pwd auf; Sie können nur Dateien in diesem Verzeichnis lesen und schreiben."
      • „Überprüfen Sie progress.txt, tests.json und die Git-Logs."
      • „Führen Sie manuell einen grundlegenden Integrationtest durch, bevor Sie mit der Implementierung neuer Funktionen fortfahren."
    5. Bereitstellung von Verifizierungstools: Mit zunehmender Länge autonomer Aufgaben muss Claude Korrektheit ohne kontinuierliches menschliches Feedback überprüfen. Tools wie Playwright MCP Server oder Computer-Use-Fähigkeiten zum Testen von UIs sind hilfreich.

    6. Fördern Sie die vollständige Nutzung des Kontexts: Fordern Sie Claude auf, Komponenten effizient zu vervollständigen, bevor Sie fortfahren:

    Beispiel-Prompt
    Dies ist eine sehr lange Aufgabe, daher kann es vorteilhaft sein, Ihre Arbeit klar zu planen. Es wird empfohlen, Ihren gesamten Ausgabekontext für die Aufgabe zu nutzen – stellen Sie nur sicher, dass Sie nicht mit erheblicher nicht committeter Arbeit den Kontext erschöpfen. Arbeiten Sie systematisch weiter, bis Sie diese Aufgabe abgeschlossen haben.

    Best Practices für Zustandsverwaltung

    • Verwenden Sie strukturierte Formate für Zustandsdaten: Wenn Sie strukturierte Informationen verfolgen (wie Testergebnisse oder Aufgabenstatus), verwenden Sie JSON oder andere strukturierte Formate, um Claude zu helfen, Schemaanforderungen zu verstehen
    • Verwenden Sie unstrukturierten Text für Fortschrittsnotizen: Freiformige Fortschrittsnotizen funktionieren gut zum Verfolgen des allgemeinen Fortschritts und Kontexts
    • Verwenden Sie Git für Zustandsverfolgung: Git bietet ein Protokoll darüber, was getan wurde, und Checkpoints, die wiederhergestellt werden können. Claudes neueste Modelle funktionieren besonders gut bei der Verwendung von Git zur Zustandsverfolgung über mehrere Sitzungen hinweg.
    • Betonen Sie inkrementelle Fortschritte: Bitten Sie Claude explizit, seinen Fortschritt zu verfolgen und sich auf inkrementelle Arbeit zu konzentrieren

    Autonomie und Sicherheit ausbalancieren

    Ohne Anleitung kann Claude Opus 4.6 Aktionen durchführen, die schwer rückgängig zu machen sind oder gemeinsame Systeme beeinflussen, wie das Löschen von Dateien, Force-Pushing oder das Posten auf externe Dienste. Wenn Sie möchten, dass Claude Opus 4.6 vor potenziell riskanten Aktionen bestätigt, fügen Sie Anleitung zu Ihrem Prompt hinzu:

    Beispiel-Prompt
    Berücksichtigen Sie die Umkehrbarkeit und mögliche Auswirkungen Ihrer Aktionen. Sie werden ermutigt, lokale, umkehrbare Aktionen wie das Bearbeiten von Dateien oder das Ausführen von Tests durchzuführen, aber für Aktionen, die schwer rückgängig zu machen sind, gemeinsame Systeme beeinflussen oder destruktiv sein könnten, fragen Sie den Benutzer, bevor Sie fortfahren.
    
    Beispiele für Aktionen, die eine Bestätigung rechtfertigen:
    - Destruktive Operationen: Löschen von Dateien oder Branches, Löschen von Datenbanktabellen, rm -rf
    - Schwer rückgängig zu machende Operationen: git push --force, git reset --hard, Amending veröffentlichter Commits
    - Für andere sichtbare Operationen: Code pushen, Kommentare zu PRs/Issues, Senden von Nachrichten, Ändern gemeinsamer Infrastruktur
    
    Wenn Sie auf Hindernisse stoßen, verwenden Sie keine destruktiven Aktionen als Abkürzung. Umgehen Sie beispielsweise nicht Sicherheitsprüfungen (z. B. --no-verify) oder verwerfen Sie unbekannte Dateien, die möglicherweise laufende Arbeiten sind.

    Recherche und Informationsbeschaffung

    Claudes neueste Modelle zeigen außergewöhnliche agentenähnliche Suchfähigkeiten und können Informationen aus mehreren Quellen effektiv finden und synthetisieren. Für optimale Rechercheergebnisse:

    1. Geben Sie klare Erfolgskriterien an: Definieren Sie, was eine erfolgreiche Antwort auf Ihre Recherchefrage ausmacht

    2. Fördern Sie die Quellenverifizierung: Bitten Sie Claude, Informationen über mehrere Quellen hinweg zu überprüfen

    3. Für komplexe Recherchaufgaben verwenden Sie einen strukturierten Ansatz:

    Beispiel-Prompt für komplexe Recherche
    Suchen Sie nach diesen Informationen auf strukturierte Weise. Während Sie Daten sammeln, entwickeln Sie mehrere konkurrierende Hypothesen. Verfolgen Sie Ihre Vertrauensstufen in Ihren Fortschrittsnotizen, um die Kalibrierung zu verbessern. Kritisieren Sie regelmäßig Ihren Ansatz und planen Sie. Aktualisieren Sie eine Hypothesen-Baum- oder Recherche-Notizen-Datei, um Informationen zu persistieren und Transparenz zu bieten. Zerlegen Sie diese komplexe Recherchaufgabe systematisch.

    Dieser strukturierte Ansatz ermöglicht es Claude, praktisch jede Information zu finden und zu synthetisieren und seine Erkenntnisse iterativ zu kritisieren, unabhängig von der Größe des Corpus.

    Subagentenorchestrierung

    Claudes neueste Modelle zeigen erheblich verbesserte native Subagentenorchestrierungsfähigkeiten. Diese Modelle können erkennen, wenn Aufgaben von der Delegierung an spezialisierte Subagenten profitieren würden, und tun dies proaktiv ohne explizite Anweisung.

    Um dieses Verhalten zu nutzen:

    1. Stellen Sie gut definierte Subagententools sicher: Haben Sie Subagententools verfügbar und in Tooldefinitionen beschrieben
    2. Lassen Sie Claude natürlich orchestrieren: Claude wird ohne explizite Anweisung angemessen delegieren
    3. Achten Sie auf Übernutzung: Claude Opus 4.6 hat eine starke Neigung zu Subagenten und kann sie in Situationen spawnen, in denen ein einfacherer, direkter Ansatz ausreichen würde. Beispielsweise kann das Modell Subagenten für Code-Erkundung spawnen, wenn ein direkter Grep-Aufruf schneller und ausreichend ist.

    Wenn Sie übermäßige Subagentennutzung sehen, fügen Sie explizite Anleitung hinzu, wann Subagenten angebracht sind und wann nicht:

    Beispiel-Prompt für Subagentennutzung
    Verwenden Sie Subagenten, wenn Aufgaben parallel ausgeführt werden können, isolierten Kontext erfordern oder unabhängige Workstreams beinhalten, die keinen Zustand teilen müssen. Für einfache Aufgaben, sequenzielle Operationen, Einzeldatei-Bearbeitungen oder Aufgaben, bei denen Sie Kontext über Schritte hinweg beibehalten müssen, arbeiten Sie direkt, anstatt zu delegieren.

    Verketten Sie komplexe Prompts

    Mit adaptivem Denken und Subagentenorchestrierung verarbeitet Claude die meisten mehrstufigen Überlegungen intern. Explizites Prompt-Chaining (Aufteilen einer Aufgabe in sequenzielle API-Aufrufe) ist immer noch nützlich, wenn Sie Zwischenergebnisse überprüfen oder eine bestimmte Pipeline-Struktur erzwingen müssen.

    Das häufigste Chaining-Muster ist Selbstkorrektur: Entwurf generieren → Claude dagegen überprüfen lassen → Claude basierend auf der Überprüfung verfeinern lassen. Jeder Schritt ist ein separater API-Aufruf, sodass Sie an jedem Punkt protokollieren, evaluieren oder verzweigen können.

    Reduzieren Sie die Dateierstellung in agentenähnlicher Codierung

    Claudes neueste Modelle können manchmal neue Dateien für Test- und Iterationszwecke erstellen, besonders bei der Arbeit mit Code. Dieser Ansatz ermöglicht es Claude, Dateien, besonders Python-Skripte, als „temporären Notizblock" zu verwenden, bevor die endgültige Ausgabe gespeichert wird. Die Verwendung temporärer Dateien kann Ergebnisse besonders für agentenähnliche Codierungsanwendungsfälle verbessern.

    Wenn Sie die Netto-Neuerstellung von Dateien minimieren möchten, können Sie Claude anweisen, nach sich selbst aufzuräumen:

    Beispiel-Prompt
    Wenn Sie temporäre neue Dateien, Skripte oder Hilfsdateien zur Iteration erstellen, räumen Sie diese Dateien auf, indem Sie sie am Ende der Aufgabe entfernen.

    Übereifrigkeit

    Claude Opus 4.5 und Claude Opus 4.6 haben eine Tendenz, zu überentwickeln, indem sie zusätzliche Dateien erstellen, unnötige Abstraktionen hinzufügen oder Flexibilität einbauen, die nicht angefordert wurde. Wenn Sie dieses unerwünschte Verhalten sehen, fügen Sie spezifische Anleitung hinzu, um Lösungen minimal zu halten.

    Zum Beispiel:

    Beispiel-Prompt zur Minimierung von Überentwicklung
    Vermeiden Sie Überentwicklung. Nehmen Sie nur Änderungen vor, die direkt angefordert oder eindeutig notwendig sind. Halten Sie Lösungen einfach und fokussiert:
    
    - Umfang: Fügen Sie keine Funktionen hinzu, refaktorieren Sie keinen Code und nehmen Sie keine „Verbesserungen" vor, die über das Angeforderte hinausgehen. Eine Fehlerbehebung erfordert keine Bereinigung des umgebenden Codes. Eine einfache Funktion benötigt keine zusätzliche Konfigurierbarkeit.
    
    - Dokumentation: Fügen Sie keine Docstrings, Kommentare oder Typ-Annotationen zu Code hinzu, den Sie nicht geändert haben. Fügen Sie nur Kommentare hinzu, wo die Logik nicht selbsterklärend ist.
    
    - Defensive Codierung: Fügen Sie keine Fehlerbehandlung, Fallbacks oder Validierung für Szenarien hinzu, die nicht vorkommen können. Vertrauen Sie internem Code und Framework-Garantien. Validieren Sie nur an Systemgrenzen (Benutzereingabe, externe APIs).
    
    - Abstraktionen: Erstellen Sie keine Helfer, Utilities oder Abstraktionen für einmalige Operationen. Entwerfen Sie nicht für hypothetische zukünftige Anforderungen. Die richtige Komplexitätsmenge ist das Minimum, das für die aktuelle Aufgabe erforderlich ist.

    Vermeiden Sie die Fokussierung auf das Bestehen von Tests und Hardcoding

    Claude kann sich manchmal zu sehr auf das Bestehen von Tests konzentrieren, auf Kosten allgemeinerer Lösungen, oder kann Workarounds wie Hilfsskripte für komplexe Refaktorierung verwenden, anstatt Standard-Tools direkt zu verwenden. Um dieses Verhalten zu verhindern und robuste, verallgemeinerbare Lösungen zu gewährleisten:

    Beispiel-Prompt
    Bitte schreiben Sie eine hochwertige, universelle Lösung mit den verfügbaren Standard-Tools. Erstellen Sie keine Hilfsskripte oder Workarounds, um die Aufgabe effizienter zu erfüllen. Implementieren Sie eine Lösung, die für alle gültigen Eingaben korrekt funktioniert, nicht nur für die Testfälle. Hardcoden Sie keine Werte und erstellen Sie keine Lösungen, die nur für spezifische Testeingaben funktionieren. Implementieren Sie stattdessen die tatsächliche Logik, die das Problem allgemein löst.
    
    Konzentrieren Sie sich darauf, die Problemanforderungen zu verstehen und den korrekten Algorithmus zu implementieren. Tests sind da, um Korrektheit zu überprüfen, nicht um die Lösung zu definieren. Bieten Sie eine prinzipielle Implementierung, die Best Practices und Softwaredesign-Prinzipien befolgt.
    
    Wenn die Aufgabe unvernünftig oder nicht machbar ist, oder wenn einer der Tests falsch ist, informieren Sie mich bitte, anstatt sie zu umgehen. Die Lösung sollte robust, wartbar und erweiterbar sein.

    Minimieren Sie Halluzinationen in agentenähnlicher Codierung

    Claudes neueste Modelle sind weniger anfällig für Halluzinationen und geben genauere, fundierte, intelligente Antworten basierend auf dem Code. Um dieses Verhalten noch mehr zu fördern und Halluzinationen zu minimieren:

    Beispiel-Prompt
    <investigate_before_answering>
    Spekulieren Sie niemals über Code, den Sie nicht geöffnet haben. Wenn der Benutzer auf eine bestimmte Datei verweist, MÜSSEN Sie die Datei lesen, bevor Sie antworten. Stellen Sie sicher, dass Sie relevante Dateien UNTERSUCHEN und LESEN, BEVOR Sie Fragen zur Codebasis beantworten. Machen Sie niemals Aussagen über Code, bevor Sie untersuchen, es sei denn, Sie sind sich der korrekten Antwort sicher – geben Sie fundierte und halluzinationsfreie Antworten.
    </investigate_before_answering>

    Fähigkeitsspezifische Tipps

    Verbesserte Visionsfähigkeiten

    Claude Opus 4.5 und Claude Opus 4.6 haben verbesserte Visionsfähigkeiten im Vergleich zu früheren Claude-Modellen. Sie funktionieren besser bei Bildverarbeitungs- und Datenextraktionsaufgaben, besonders wenn mehrere Bilder im Kontext vorhanden sind. Diese Verbesserungen übertragen sich auf Computer Use, wo die Modelle Screenshots und UI-Elemente zuverlässiger interpretieren können. Sie können diese Modelle auch verwenden, um Videos zu analysieren, indem Sie sie in Frames aufteilen.

    Eine Technik, die sich als wirksam erwiesen hat, um die Leistung weiter zu steigern, ist, Claude ein Crop-Tool oder Skill zu geben. Tests haben konsistente Verbesserungen bei Bildbewertungen gezeigt, wenn Claude in der Lage ist, in relevante Bildbereiche „hineinzuzoomen". Anthropic hat ein Cookbook für das Crop-Tool erstellt.

    Frontend-Design

    Claude Opus 4.5 und Claude Opus 4.6 zeichnen sich durch das Erstellen komplexer, realer Webanwendungen mit starkem Frontend-Design aus. Ohne Anleitung können Modelle jedoch zu generischen Mustern greifen, die das schaffen, was Benutzer die „AI Slop"-Ästhetik nennen. Um charakteristische, kreative Frontends zu erstellen, die überraschen und erfreuen:

    Für einen detaillierten Leitfaden zur Verbesserung des Frontend-Designs siehe den Blog-Beitrag über Verbesserung des Frontend-Designs durch Skills.

    Hier ist ein System-Prompt-Snippet, das Sie verwenden können, um besseres Frontend-Design zu fördern:

    Beispiel-Prompt für Frontend-Ästhetik
    <frontend_aesthetics>
    Sie neigen dazu, zu generischen, „on distribution" Ausgaben zu konvergieren. Im Frontend-Design erzeugt dies das, was Benutzer die „AI Slop"-Ästhetik nennen. Vermeiden Sie dies: Erstellen Sie kreative, charakteristische Frontends, die überraschen und erfreuen.
    
    Konzentrieren Sie sich auf:
    - Typografie: Wählen Sie Schriftarten, die schön, einzigartig und interessant sind. Vermeiden Sie generische Schriftarten wie Arial und Inter; wählen Sie stattdessen charakteristische Optionen, die die Frontend-Ästhetik erheben.
    - Farbe & Thema: Verpflichten Sie sich zu einer kohärenten Ästhetik. Verwenden Sie CSS-Variablen für Konsistenz. Dominante Farben mit scharfen Akzenten übertreffen zaghaft verteilte Paletten. Schöpfen Sie aus IDE-Themen und kulturellen Ästhetiken für Inspiration.
    - Bewegung: Verwenden Sie Animationen für Effekte und Mikro-Interaktionen. Priorisieren Sie CSS-only-Lösungen für HTML. Verwenden Sie Motion-Bibliothek für React, wenn verfügbar. Konzentrieren Sie sich auf hochimpaktive Momente: Ein gut orchestriertes Seitenladen mit gestaffelten Reveals (animation-delay) erzeugt mehr Freude als verstreute Mikro-Interaktionen.
    - Hintergründe: Schaffen Sie Atmosphäre und Tiefe, anstatt auf Vollfarben zu setzen. Schichten Sie CSS-Gradienten, verwenden Sie geometrische Muster oder fügen Sie kontextuelle Effekte hinzu, die zur Gesamtästhetik passen.
    
    Vermeiden Sie generische KI-generierte Ästhetiken:
    - Übernutzte Schriftfamilien (Inter, Roboto, Arial, System-Schriftarten)
    - Abgedroschene Farbschemen (besonders lila Gradienten auf weißem Hintergrund)
    - Vorhersehbare Layouts und Komponentenmuster
    - Standardisiertes Design, dem es an kontextspezifischem Charakter mangelt
    
    Interpretieren Sie kreativ und treffen Sie unerwartete Entscheidungen, die sich für den Kontext genuinely designed anfühlen. Variieren Sie zwischen hellen und dunklen Themen, verschiedenen Schriftarten, verschiedenen Ästhetiken. Sie neigen immer noch dazu, bei häufigen Entscheidungen zu konvergieren (Space Grotesk, zum Beispiel) über Generationen hinweg. Vermeiden Sie dies: Es ist kritisch, dass Sie außerhalb der Box denken!
    </frontend_aesthetics>

    Sie können auch auf die vollständige Skill-Definition verweisen.

    Migrationsbedingungen

    Bei der Migration zu Claude 4.6 Modellen von früheren Generationen:

    1. Seien Sie spezifisch über das gewünschte Verhalten: Erwägen Sie, genau zu beschreiben, was Sie in der Ausgabe sehen möchten.

    2. Rahmen Sie Ihre Anweisungen mit Modifiern: Das Hinzufügen von Modifiern, die Claude ermutigen, die Qualität und Detail seiner Ausgabe zu erhöhen, kann Claude's Leistung besser formen. Zum Beispiel, anstatt „Erstellen Sie ein Analytics-Dashboard", verwenden Sie „Erstellen Sie ein Analytics-Dashboard. Fügen Sie so viele relevante Funktionen und Interaktionen wie möglich ein. Gehen Sie über die Grundlagen hinaus, um eine vollständig ausgestattete Implementierung zu erstellen."

    3. Fordern Sie spezifische Funktionen explizit an: Animationen und interaktive Elemente sollten explizit angefordert werden, wenn gewünscht.

    4. Aktualisieren Sie die Denkkonfiguration: Claude 4.6 Modelle verwenden adaptives Denken (thinking: {type: "adaptive"}) anstelle von manuellem Denken mit budget_tokens. Verwenden Sie den effort-Parameter, um die Denktiefe zu kontrollieren.

    5. Migrieren Sie weg von vorausgefüllten Antworten: Vorausgefüllte Antworten auf dem letzten Assistant-Turn sind ab Claude 4.6 Modellen veraltet. Siehe Migrieren weg von vorausgefüllten Antworten für detaillierte Anleitung zu Alternativen.

    6. Tunen Sie Anti-Laziness-Prompting: Wenn Ihre Prompts das Modell zuvor dazu ermutigten, gründlicher zu sein oder Werkzeuge aggressiver zu nutzen, reduzieren Sie diese Anleitung. Claude 4.6 Modelle sind erheblich proaktiver und können bei Anweisungen überauslösen, die für frühere Modelle notwendig waren.

    Für detaillierte Migrationsschritte siehe den Migrationsleitfaden.

    Migrieren von Claude Sonnet 4.5 zu Claude Sonnet 4.6

    Claude Sonnet 4.6 setzt standardmäßig eine Effort-Stufe von high, im Gegensatz zu Claude Sonnet 4.5, das keinen Effort-Parameter hatte. Erwägen Sie, den Effort-Parameter anzupassen, wenn Sie von Claude Sonnet 4.5 zu Claude Sonnet 4.6 migrieren. Wenn nicht explizit gesetzt, können Sie höhere Latenz mit der Standard-Effort-Stufe erleben.

    Empfohlene Effort-Einstellungen:

    • Medium für die meisten Anwendungen
    • Low für hochvolumige oder latenzempfindliche Workloads
    • Setzen Sie ein großes Max-Output-Token-Budget (64k Token empfohlen) bei mittlerem oder hohem Effort, um dem Modell Platz zum Denken und Handeln zu geben

    Wann Opus 4.7 stattdessen verwenden: Für die schwierigsten, längsten Probleme (großflächige Code-Migrationen, tiefe Recherche, erweiterte autonome Arbeit) bleibt Opus 4.7 die richtige Wahl. Sonnet 4.6 ist für Workloads optimiert, bei denen schnelle Umkehrung und Kosteneffizienz am wichtigsten sind.

    Wenn Sie kein erweitertes Denken verwenden

    Wenn Sie kein erweitertes Denken auf Claude Sonnet 4.5 verwenden, können Sie auf Claude Sonnet 4.6 ohne es fortfahren. Sie sollten explizit Effort auf die Stufe setzen, die für Ihren Anwendungsfall angemessen ist. Bei low Effort mit deaktiviertem Denken können Sie ähnliche oder bessere Leistung relativ zu Claude Sonnet 4.5 ohne erweitertes Denken erwarten.

    Python
    client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=8192,
        thinking={"type": "disabled"},
        output_config={"effort": "low"},
        messages=[{"role": "user", "content": "..."}],
    )

    Wenn Sie erweitertes Denken verwenden

    Wenn Sie erweitertes Denken mit budget_tokens auf Claude Sonnet 4.5 verwenden, ist es auf Claude Sonnet 4.6 noch funktionsfähig, wird aber nicht mehr empfohlen. Migrieren Sie zu adaptivem Denken mit dem Effort-Parameter.

    Migrieren zu adaptivem Denken

    Adaptives Denken ist besonders gut für die folgenden Workload-Muster geeignet:

    • Autonome mehrstufige Agenten: Codierungs-Agenten, die Anforderungen in funktionierende Software umwandeln, Datenanalyse-Pipelines und Fehlerfindung, bei denen das Modell unabhängig über viele Schritte läuft. Adaptives Denken ermöglicht es dem Modell, sein Denken pro Schritt zu kalibrieren und über längere Trajektorien auf Kurs zu bleiben. Für diese Workloads beginnen Sie mit high Effort. Wenn Latenz oder Token-Nutzung ein Problem ist, skalieren Sie auf medium herunter.
    • Computer-Use-Agenten: Claude Sonnet 4.6 erreichte beste Genauigkeit bei Computer-Use-Evaluationen mit adaptivem Modus.
    • Bimodale Workloads: eine Mischung aus einfachen und schwierigen Aufgaben, bei denen adaptiv das Denken bei einfachen Abfragen überspringt und bei komplexen tief nachdenkt.

    Wenn Sie adaptives Denken verwenden, evaluieren Sie medium und high Effort auf Ihren Aufgaben. Die richtige Stufe hängt vom Tradeoff Ihrer Workload zwischen Qualität, Latenz und Token-Nutzung ab.

    Python
    client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=64000,
        thinking={"type": "adaptive"},
        output_config={"effort": "high"},
        messages=[{"role": "user", "content": "..."}],
    )
    Behalten Sie budget_tokens während der Migration

    Wenn Sie budget_tokens während der Migration vorübergehend behalten müssen, bietet ein Budget um 16k Token Spielraum für schwierigere Probleme ohne Risiko unkontrollierter Token-Nutzung. Diese Konfiguration ist veraltet und wird in einer zukünftigen Modellversion entfernt.

    Für Codierungs-Anwendungsfälle (agentenähnliche Codierung, Werkzeug-intensive Workflows, Code-Generierung), beginnen Sie mit medium Effort:

    Python
    client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=16384,
        thinking={"type": "enabled", "budget_tokens": 16384},
        output_config={"effort": "medium"},
        messages=[{"role": "user", "content": "..."}],
    )

    Für Chat- und Nicht-Codierungs-Anwendungsfälle (Chat, Inhaltsgenerierung, Suche, Klassifizierung), beginnen Sie mit low Effort:

    Python
    client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=8192,
        thinking={"type": "enabled", "budget_tokens": 16384},
        output_config={"effort": "low"},
        messages=[{"role": "user", "content": "..."}],
    )

    Was this page helpful?

    • Prompting mit Claude Opus 4.7
    • Antwortlänge und Ausführlichkeit
    • Kalibrierung von Effort und Thinking-Tiefe
    • Tool-Nutzungs-Auslösung
    • Benutzerseitige Fortschrittsaktualisierungen
    • Literalere Befolgung von Anweisungen
    • Ton und Schreibstil
    • Kontrolle der Subagenten-Erzeugung
    • Design- und Frontend-Standardwerte
    • Interaktive Coding-Produkte
    • Code-Review-Harnesses
    • Computernutzung
    • Allgemeine Prinzipien
    • Seien Sie klar und direkt
    • Fügen Sie Kontext hinzu, um die Leistung zu verbessern
    • Verwenden Sie Beispiele effektiv
    • Strukturieren Sie Prompts mit XML-Tags
    • Geben Sie Claude eine Rolle
    • Long-Context-Prompting
    • Modell-Selbstwissen
    • Ausgabe und Formatierung
    • Kommunikationsstil und Ausführlichkeit
    • Kontrollieren Sie das Format von Antworten
    • LaTeX-Ausgabe
    • Dokumenterstellung
    • Migration weg von vorausgefüllten Antworten
    • Tool-Nutzung
    • Tool-Nutzung
    • Parallele Werkzeugaufrufe optimieren
    • Denken und Argumentation
    • Überdenken und übermäßige Gründlichkeit
    • Nutzen Sie Denk- und verschachteltes Denken
    • Agentensysteme
    • Langfristige Argumentation und Zustandsverfolgung
    • Autonomie und Sicherheit ausbalancieren
    • Recherche und Informationsbeschaffung
    • Subagentenorchestrierung
    • Verketten Sie komplexe Prompts
    • Reduzieren Sie die Dateierstellung in agentenähnlicher Codierung
    • Übereifrigkeit
    • Vermeiden Sie die Fokussierung auf das Bestehen von Tests und Hardcoding
    • Minimieren Sie Halluzinationen in agentenähnlicher Codierung
    • Fähigkeitsspezifische Tipps
    • Verbesserte Visionsfähigkeiten
    • Frontend-Design
    • Migrationsbedingungen
    • Migrieren von Claude Sonnet 4.5 zu Claude Sonnet 4.6