Dies ist die einzige Referenz für Prompt Engineering mit Claudes neuesten Modellen, einschließlich Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6 und Claude Haiku 4.5. Es behandelt grundlegende Techniken, Ausgabekontrolle, Tool-Nutzung, Thinking und agentenbasierte Systeme. Springen Sie zu dem Abschnitt, der Ihrer Situation entspricht.
Einen Überblick über die Modellmöglichkeiten finden Sie in der Modellübersicht. Weitere Informationen zu den Neuerungen in Claude Opus 4.7 finden Sie unter Neuerungen in Claude Opus 4.7. Migrationsleitfäden finden Sie im Migrationsleitfaden.
Claude Opus 4.7 ist unser fähigstes allgemein verfügbares Modell mit besonderen Stärken bei langfristiger agentenbasierter Arbeit, Knowledge Work, Vision und Memory-Aufgaben. Es funktioniert gut direkt mit bestehenden Claude Opus 4.6-Prompts. Die folgenden Muster behandeln die Verhaltensweisen, die am häufigsten Anpassungen erfordern.
Informationen zu API-Parameteränderungen bei der Migration von Claude Opus 4.6 (Effort-Level, Task-Budgets, Thinking-Konfiguration, Entfernung von Sampling-Parametern und Tokenisierung) finden Sie im Migrationsleitfaden.
Claude Opus 4.7 kalibriert die Antwortlänge danach, wie komplex es die Aufgabe beurteilt, anstatt sich auf eine feste Ausführlichkeit zu verlassen. Dies bedeutet normalerweise kürzere Antworten bei einfachen Abfragen und viel längere bei offenen Analysen.
Wenn Ihr Produkt von einem bestimmten Stil oder einer bestimmten Ausführlichkeit der Ausgabe abhängt, müssen Sie möglicherweise Ihre Prompts anpassen. Um beispielsweise die Ausführlichkeit zu verringern, könnten Sie hinzufügen:
Geben Sie prägnante, fokussierte Antworten. Überspringen Sie nicht wesentliche Kontexte und halten Sie Beispiele minimal.Wenn Sie spezifische Beispiele für Arten von Ausführlichkeit sehen (z. B. Übererklärungen), können Sie zusätzliche Anweisungen in Ihrem Prompt hinzufügen, um diese zu verhindern. Positive Beispiele, die zeigen, wie Claude mit dem angemessenen Maß an Prägnanz kommunizieren kann, sind in der Regel effektiver als negative Beispiele oder Anweisungen, die dem Modell sagen, was es nicht tun soll.
Der Effort-Parameter ermöglicht es Ihnen, Claudes Intelligenz gegenüber Token-Ausgaben abzuwägen und Fähigkeit gegen schnellere Geschwindigkeit und niedrigere Kosten zu tauschen. Beginnen Sie mit dem neuen xhigh Effort-Level für Coding- und agentenbasierte Anwendungsfälle und verwenden Sie mindestens high Effort für die meisten intelligenzempfindlichen Anwendungsfälle. Experimentieren Sie mit anderen Effort-Leveln, um die Token-Nutzung und Intelligenz weiter zu optimieren:
max: Max Effort kann in einigen Anwendungsfällen Leistungsgewinne liefern, kann aber abnehmende Erträge durch erhöhte Token-Nutzung zeigen. Diese Einstellung kann auch manchmal zu Überdenken neigen. Wir empfehlen, Max Effort für intelligenzfordernde Aufgaben zu testen.xhigh (neu): Extra hoher Effort ist die beste Einstellung für die meisten Coding- und agentenbasierten Anwendungsfälle.high: Diese Einstellung balanciert Token-Nutzung und Intelligenz. Für die meisten intelligenzempfindlichen Anwendungsfälle empfehlen wir mindestens high Effort.medium: Gut für kostensensitive Anwendungsfälle, die die Token-Nutzung reduzieren müssen, während sie Intelligenz opfern.low: Reservieren Sie für kurze, begrenzte Aufgaben und latenzempfindliche Workloads, die nicht intelligenzempfindlich sind.Ein bedeutsamer Unterschied zu Claude Opus 4.6 ist, dass Claude Opus 4.7 Effort-Level streng respektiert, besonders am unteren Ende. Bei low und medium beschränkt das Modell seine Arbeit auf das, was gefragt wurde, anstatt darüber hinauszugehen. Dies ist gut für Latenz und Kosten, aber bei mäßig komplexen Aufgaben, die mit low Effort laufen, besteht ein gewisses Risiko von Unterdenken.
Wenn Sie oberflächliches Denken bei komplexen Problemen beobachten, erhöhen Sie den Effort auf high oder xhigh, anstatt es zu umgehen. Wenn Sie den Effort bei low für Latenz halten müssen, fügen Sie gezielt Anleitung hinzu:
Diese Aufgabe beinhaltet mehrstufiges Denken. Denken Sie sorgfältig über das Problem nach, bevor Sie antworten.Wir erwarten, dass Effort für dieses Modell wichtiger ist als für jedes vorherige Opus, und empfehlen, damit aktiv zu experimentieren, wenn Sie upgraden.
Das Auslöseverhalten für adaptives Thinking ist steuerbar. Wenn Sie feststellen, dass das Modell häufiger denkt als gewünscht – was bei großen oder komplexen System-Prompts vorkommen kann – fügen Sie Anleitung hinzu, um es zu steuern. Wie immer sollten Sie die Auswirkung von Prompt-Änderungen auf die Leistung messen. Beispiel:
Thinking erhöht die Latenz und sollte nur verwendet werden, wenn es die Antwortqualität bedeutsam verbessert – typischerweise für Probleme, die mehrstufiges Denken erfordern. Im Zweifelsfall antworten Sie direkt.Umgekehrt, wenn Sie schwierige Workloads bei medium laufen lassen und Unterdenken sehen, ist der erste Hebel, den Effort zu erhöhen. Wenn Sie feinere Kontrolle benötigen, fordern Sie es direkt an.
Wenn Sie Claude Opus 4.7 mit max oder xhigh Effort laufen lassen, setzen Sie ein großes maximales Output-Token-Budget, damit das Modell Platz zum Denken und Handeln über seine Subagenten und Tool-Aufrufe hinweg hat. Wir empfehlen, mit 64k Tokens zu beginnen und von dort aus zu optimieren.
Claude Opus 4.7 hat eine Tendenz, Tools weniger häufig zu verwenden als Claude Opus 4.6 und stattdessen mehr Reasoning zu nutzen. Dies führt in den meisten Fällen zu besseren Ergebnissen. Das Erhöhen der Effort-Einstellung ist jedoch ein nützlicher Hebel, um die Ebene der Tool-Nutzung zu erhöhen, besonders bei Knowledge Work. high oder xhigh Effort-Einstellungen zeigen deutlich mehr Tool-Nutzung bei agentenbasierter Suche und Coding. Für Szenarien, in denen Sie mehr Tool-Nutzung möchten, können Sie auch Ihren Prompt anpassen, um das Modell explizit anzuweisen, wann und wie es seine Tools richtig nutzen soll. Wenn Sie beispielsweise feststellen, dass das Modell Ihre Web-Suchtools nicht nutzt, beschreiben Sie klar, warum und wie es sollte.
Claude Opus 4.7 bietet regelmäßigere, höherwertige Aktualisierungen für den Benutzer während langer agentenbasierter Traces. Wenn Sie Gerüste hinzugefügt haben, um Zwischenstatus-Meldungen zu erzwingen („Nach jedem 3. Tool-Aufruf Fortschritt zusammenfassen"), versuchen Sie, diese zu entfernen. Wenn Sie feststellen, dass die Länge oder der Inhalt von Claude Opus 4.7's benutzerseitigen Aktualisierungen nicht gut auf Ihren Anwendungsfall abgestimmt sind, beschreiben Sie explizit, wie diese Aktualisierungen aussehen sollten, und geben Sie Beispiele.
Claude Opus 4.7 interpretiert Prompts literaler und expliziter als Claude Opus 4.6, besonders bei niedrigeren Effort-Leveln. Es wird eine Anweisung nicht stillschweigend von einem Element auf ein anderes verallgemeinern, und es wird keine Anfragen ableiten, die Sie nicht gestellt haben. Der Vorteil dieses Literalismus ist Präzision und weniger Durcheinander, und es funktioniert generell besser für API-Anwendungsfälle mit sorgfältig abgestimmten Prompts, strukturierter Extraktion und Pipelines, wo Sie vorhersehbares Verhalten möchten. Wenn Sie möchten, dass Claude eine Anweisung breit anwendet, geben Sie den Umfang explizit an (zum Beispiel „Wenden Sie diese Formatierung auf jeden Abschnitt an, nicht nur auf den ersten").
Wie bei jedem neuen Modell kann sich der Prosastil bei längeren Schriften verschieben. Claude Opus 4.7 ist direkter und eigenwilliger, mit weniger validierungsgerichteter Formulierung und weniger Emojis als Claudes wärmerer Stil von Opus 4.6. Wenn Ihr Produkt auf eine bestimmte Stimme angewiesen ist, bewerten Sie Stil-Prompts gegen die neue Baseline neu.
Wenn Ihre Produktstimme beispielsweise wärmer oder gesprächiger ist, fügen Sie hinzu:
Verwenden Sie einen warmen, kooperativen Ton. Bestätigen Sie den Rahmen des Benutzers, bevor Sie antworten.Claude Opus 4.7 neigt dazu, standardmäßig weniger Subagenten zu erzeugen. Dieses Verhalten ist jedoch durch Prompting steuerbar; geben Sie Claude Opus 4.7 explizite Anleitung, wann Subagenten wünschenswert sind. Ein Spielbeispiel für einen Coding-Anwendungsfall:
Erzeugen Sie keinen Subagenten für Arbeit, die Sie direkt in einer einzigen Antwort abschließen können (z. B. Umgestaltung einer Funktion, die Sie bereits sehen können).
Erzeugen Sie mehrere Subagenten in derselben Runde, wenn Sie über Elemente verteilen oder mehrere Dateien lesen.Claude Opus 4.7 hat stärkere Design-Instinkte als Claude Opus 4.6, mit einem konsistenten Standard-Hausstil: warme Creme-/Off-White-Hintergründe (~#F4F1EA), Serif-Display-Typ (Georgia, Fraunces, Playfair), kursive Wort-Akzente und ein Terrakotta-/Bernstein-Akzent. Dies liest sich gut für redaktionelle, Gastgewerbe- und Portfolio-Briefs, wird sich aber für Dashboards, Dev-Tools, Fintech, Healthcare oder Enterprise-Apps falsch anfühlen – und es erscheint auch in Foliendecks sowie Web-UIs.
Dieser Standard ist persistent. Generische Anweisungen („verwenden Sie keine Creme", „machen Sie es sauber und minimal") neigen dazu, das Modell zu einer anderen festen Palette zu verschieben, anstatt Vielfalt zu erzeugen. Zwei Ansätze funktionieren zuverlässig:
1. Geben Sie eine konkrete Alternative an. Das Modell folgt expliziten Spezifikationen präzise:
Entwerfen Sie eine Desktop-Landingpage für eine Nahrungsergänzungsmarke namens AEFRM.
Die visuelle Richtung sollte aus einer kalten monochromen Atmosphäre mit blassem Silbergrau stammen, das allmählich in Blaugrau und nahezu Schwarz übergeht, ähnlich einer nebligen metallischen Oberfläche.
Die Seite sollte sich scharf und kontrolliert anfühlen, mit einem starken Gefühl für Struktur und Zurückhaltung.
Verwenden Sie dieses Tonsystem auf der gesamten Seite, anstatt helle Akzentfarben einzuführen.
Verwenden Sie das hochgeladene Bild im Hero-Design in Schwarz und Weiß.
Das Layout sollte mit klaren horizontalen Abschnitten und einem zentrierten Container mit maximaler Breite aufgebaut sein. Verwenden Sie durchgehend 4px Eckenradius auf Karten, Schaltflächen, Eingaben und Medienrahmen. Ränder sollten großzügig wirken, mit genug Leerraum um jeden Abschnitt, damit die Seite atmen kann.
Die Typografie sollte eine quadratische, eckige serifenlose Schrift mit größerem Buchstabenabstand als üblich verwenden, besonders in Überschriften und Navigation, damit der Text mehr konstruiert und weniger komprimiert wirkt. Überschrifttext kann groß und Großbuchstaben sein, während unterstützender Text kurz und spärlich bleibt. Die Untertexte sollten mit Alumni Sans SC in 4-6px wie winzige kleine Texte in Ecken unten Mitte geschrieben werden.
Für die Struktur beginnen Sie mit einem Hero-Abschnitt, der eine starke Produktaussage, einen kurzen unterstützenden Absatz und einen sauberen Produkt-Platzhalter oder Packshot-Rahmen enthält. Darunter fügen Sie ein Vorteil-Raster mit drei oder vier Blöcken hinzu, dann einen Formulierungs- oder Zutaten-Abschnitt und schließlich einen CTA.
Schaltflächen sollten flach und präzise sein, mit subtilen Hover-Änderungen unter Verwendung von transition: all 160ms ease out, wobei sich Helligkeit und Grenzkontrast leicht verschieben, anstatt dramatische Bewegung zu verwenden.
Farbpalette sollte in diesem Bereich bleiben:
#E9ECEC, #C9D2D4, #8C9A9E, #44545B, #11171B.2. Lassen Sie das Modell Optionen vorschlagen, bevor Sie bauen. Dies bricht den Standard und gibt Benutzern Kontrolle. Wenn Sie sich zuvor auf temperature für Design-Vielfalt verlassen haben, verwenden Sie diesen Ansatz – er erzeugt bedeutsam unterschiedliche Richtungen über Läufe hinweg. Beispiel-Prompt:
Schlagen Sie vor dem Bauen 4 unterschiedliche visuelle Richtungen vor, die auf diesen Brief zugeschnitten sind (jeweils als: bg hex / accent hex / typeface — einzeilige Begründung). Bitten Sie den Benutzer, eine auszuwählen, und implementieren Sie dann nur diese Richtung.Darüber hinaus erfordert Claude Opus 4.7 weniger Frontend-Design-Prompting als vorherige Modelle, um generische Muster zu vermeiden, die Benutzer die „KI-Müll"-Ästhetik nennen. Bei früheren Modellen empfahlen wir einen längeren Prompt-Snippet in unserer Frontend-Design-Fähigkeit. Claude Opus 4.7 generiert jedoch mit minimalerer Prompting-Anleitung charakteristische, kreative Frontends. Dieser Prompt-Snippet funktioniert gut mit den obigen Prompting-Ratschlägen für Vielfalt:
<frontend_aesthetics>
VERWENDEN Sie NIEMALS generische KI-generierte Ästhetik wie übernutzte Schriftfamilien (Inter, Roboto, Arial, System-Schriften), klischeehafte Farbschemen (besonders lila Verläufe auf weißem oder dunklem Hintergrund), vorhersehbare Layouts und Komponentenmuster sowie Cookie-Cutter-Design, dem kontextspezifischer Charakter fehlt. Verwenden Sie einzigartige Schriften, kohärente Farben und Themen sowie Animationen für Effekte und Mikro-Interaktionen.
</frontend_aesthetics>Die Token-Nutzung und das Verhalten von Claude Opus 4.7 können sich zwischen autonomen, asynchronen Coding-Agenten mit einer einzelnen Benutzer-Runde und interaktiven, synchronen Coding-Agenten mit mehreren Benutzer-Runden unterscheiden. Speziell neigt es dazu, mehr Tokens in interaktiven Einstellungen zu verwenden, hauptsächlich weil es nach Benutzer-Runden mehr denkt. Dies kann die langfristige Kohärenz, Befolgung von Anweisungen und Coding-Fähigkeiten in langen, interaktiven Coding-Sitzungen verbessern, kommt aber auch mit mehr Token-Nutzung. Um sowohl Leistung als auch Token-Effizienz in Coding-Produkten zu maximieren, empfehlen wir die Verwendung von xhigh oder high Effort, das Hinzufügen autonomer Funktionen wie eines Auto-Modus und die Reduzierung der Anzahl der erforderlichen menschlichen Interaktionen.
Natürlich ist es bei der Begrenzung der erforderlichen menschlichen Interaktionen wichtig, die Aufgabe, Absicht und relevante Einschränkungen in der ersten menschlichen Runde anzugeben. Die Bereitstellung gut spezifizierter, klarer und genauer Aufgabenbeschreibungen im Voraus kann helfen, Autonomie und Intelligenz zu maximieren und gleichzeitig zusätzliche Token-Nutzung nach Benutzer-Runden zu minimieren. Wir stellen fest, dass Claude Opus 4.7 autonomer ist als vorherige Modelle, dieses Nutzungsmuster hilft, Leistung zu maximieren. Im Gegensatz dazu neigen mehrdeutige oder unterspecifizierte Prompts, die progressiv über mehrere Benutzer-Runden vermittelt werden, dazu, die Token-Effizienz relativ zu reduzieren und manchmal die Leistung.
Claude Opus 4.7 ist bedeutsam besser darin, Bugs zu finden als vorherige Modelle, und hat sowohl höhere Recall als auch Precision in unseren Evals – 11pp besserer Recall in einem unserer schwierigsten Bug-Finding-Evals basierend auf echten Anthropic PRs. Wenn Ihr Code-Review-Harness jedoch für ein früheres Modell abgestimmt wurde, können Sie anfangs niedrigere Recall sehen. Dies ist wahrscheinlich ein Harness-Effekt, keine Fähigkeitsregression. Wenn ein Review-Prompt Dinge sagt wie „berichten Sie nur über hochschwere Probleme", „seien Sie konservativ" oder „nitpicken Sie nicht", kann Claude Opus 4.7 diese Anweisung treuer befolgen als frühere Modelle – es kann den Code genauso gründlich untersuchen, die Bugs identifizieren und dann Erkenntnisse nicht berichten, die es unter Ihrer angegebenen Schwelle beurteilt. Dies kann sich als das Modell zeigen, das die gleiche Untersuchungstiefe durchführt, aber weniger Untersuchungen in gemeldete Erkenntnisse umwandelt, besonders bei Bugs mit niedrigerer Schwere. Precision steigt typischerweise, aber gemessener Recall kann fallen, obwohl die zugrunde liegende Bug-Finding-Fähigkeit des Modells verbessert hat.
Einige empfohlene Prompt-Sprache:
Berichten Sie über jedes Problem, das Sie finden, einschließlich solcher, bei denen Sie unsicher sind oder die Sie als niedrig-schwer einstufen. Filtern Sie nicht nach Wichtigkeit oder Vertrauen in dieser Phase – ein separater Verifizierungsschritt wird das tun. Ihr Ziel hier ist Abdeckung: es ist besser, eine Erkenntnis zu zeigen, die später gefiltert wird, als einen echten Bug stillschweigend zu übersehen. Für jeden Fund geben Sie Ihr Vertrauensniveau und eine geschätzte Schwere an, damit ein nachgelagerter Filter sie einstufen kann.Dieser Prompt kann verwendet werden, ohne einen tatsächlichen zweiten Schritt zu haben, aber das Verschieben der Vertrauensfilterung aus dem Finding-Schritt hilft oft. Wenn Ihr Harness einen separaten Verifizierungs-, Deduplizierungs- oder Ranking-Schritt hat, teilen Sie dem Modell explizit mit, dass sein Job im Finding-Schritt Abdeckung ist, anstatt zu filtern.
Wenn Sie möchten, dass das Modell in einem einzigen Durchgang selbst filtert, seien Sie konkret darüber, wo die Schwelle liegt, anstatt qualitative Begriffe wie „wichtig" zu verwenden – zum Beispiel „berichten Sie über alle Bugs, die zu falschem Verhalten, einem Test-Fehler oder einem irreführenden Ergebnis führen könnten; lassen Sie nur Nits wie reine Stil- oder Benennungspräferenzen weg."
Wir empfehlen, Prompts gegen eine Teilmenge Ihrer Evals oder Testfälle zu iterieren, um Recall- oder F1-Score-Gewinne zu validieren.
Die Computernutzungs-Fähigkeit funktioniert über Auflösungen hinweg, bis zu einer neuen maximalen Auflösung von 2576px / 3,75MP. In unseren Computernutzungs-Tests stellen wir fest, dass das Senden von Bildern bei 1080p ein gutes Gleichgewicht zwischen Leistung und Kosten bietet.
Für besonders kostensensitive Workloads empfehlen wir 720p oder 1366×768 als kostengünstigere Optionen mit starker Leistung. Wir empfehlen, dass Sie Ihre eigenen Tests durchführen, um die idealen Einstellungen für Ihren Anwendungsfall zu finden; das Experimentieren mit Effort-Einstellungen kann auch helfen, das Verhalten des Modells zu optimieren.
Claude reagiert gut auf klare, explizite Anweisungen. Spezifisch zu sein über Ihre gewünschte Ausgabe kann helfen, Ergebnisse zu verbessern. Wenn Sie „über und über hinaus" Verhalten möchten, fordern Sie es explizit an, anstatt sich auf das Modell zu verlassen, um dies aus vagen Prompts abzuleiten.
Denken Sie an Claude als einen brillanten, aber neuen Mitarbeiter, dem der Kontext Ihrer Normen und Workflows fehlt. Je präziser Sie erklären, was Sie möchten, desto besser das Ergebnis.
Goldene Regel: Zeigen Sie Ihren Prompt einem Kollegen mit minimalem Kontext zur Aufgabe und bitten Sie ihn, ihn zu befolgen. Wenn sie verwirrt wären, wird Claude es auch sein.
Das Bereitstellen von Kontext oder Motivation hinter Ihren Anweisungen, z. B. das Erklären an Claude, warum solches Verhalten wichtig ist, kann Claude helfen, Ihre Ziele besser zu verstehen und gezielter zu reagieren.
Claude ist intelligent genug, um aus der Erklärung zu verallgemeinern.
Beispiele sind einer der zuverlässigsten Wege, um Claudes Ausgabeformat, Ton und Struktur zu steuern. Ein paar gut gestaltete Beispiele (bekannt als Few-Shot oder Multishot Prompting) können die Genauigkeit und Konsistenz dramatisch verbessern.
Wenn Sie Beispiele hinzufügen, machen Sie sie:
<example> Tags (mehrere Beispiele in <examples> Tags), damit Claude sie von Anweisungen unterscheiden kann.XML-Tags helfen Claude, komplexe Prompts eindeutig zu analysieren, besonders wenn Ihr Prompt Anweisungen, Kontext, Beispiele und variable Eingaben mischt. Das Umwickeln jeder Art von Inhalt in sein eigenes Tag (z. B. <instructions>, <context>, <input>) reduziert Fehlinterpretationen.
Best Practices:
<documents>, jeweils in <document index="n">).Das Festlegen einer Rolle im System-Prompt konzentriert Claudes Verhalten und Ton auf Ihren Anwendungsfall. Selbst ein einzelner Satz macht einen Unterschied:
import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=1024,
system="You are a helpful coding assistant specializing in Python.",
messages=[
{"role": "user", "content": "How do I sort a list of dictionaries by key?"}
],
)
print(message.content)Wenn Sie mit großen Dokumenten oder datenreichen Eingaben arbeiten (20k+ Tokens), strukturieren Sie Ihren Prompt sorgfältig, um die besten Ergebnisse zu erhalten:
Platzieren Sie Langform-Daten oben: Platzieren Sie Ihre langen Dokumente und Eingaben oben in Ihrem Prompt, über Ihrer Abfrage, Anweisungen und Beispielen. Dies kann die Leistung über alle Modelle hinweg erheblich verbessern.
Strukturieren Sie Dokumentinhalt und Metadaten mit XML-Tags: Wenn Sie mehrere Dokumente verwenden, wickeln Sie jedes Dokument in <document> Tags mit <document_content> und <source> (und anderen Metadaten) Untertags zur Klarheit.
Verankern Sie Antworten in Zitaten: Für Langdokument-Aufgaben bitten Sie Claude, zuerst relevante Teile der Dokumente zu zitieren, bevor es seine Aufgabe ausführt. Dies hilft Claude, durch das Rauschen des restlichen Dokumentinhalts zu schneiden.
Wenn Sie möchten, dass Claude sich selbst in Ihrer Anwendung korrekt identifiziert oder bestimmte API-Strings verwendet:
Der Assistent ist Claude, erstellt von Anthropic. Das aktuelle Modell ist Claude Opus 4.7.Für LLM-gestützte Apps, die Modell-Strings angeben müssen:
Wenn ein LLM benötigt wird, verwenden Sie bitte standardmäßig Claude Opus 4.7, es sei denn, der Benutzer fordert etwas anderes an. Der genaue Modell-String für Claude Opus 4.7 ist claude-opus-4-7.Claudes neueste Modelle haben einen prägnanten und natürlicheren Kommunikationsstil im Vergleich zu früheren Modellen:
Dies bedeutet, dass Claude möglicherweise verbale Zusammenfassungen nach Tool-Aufrufen überspringt und direkt zur nächsten Aktion springt. Wenn Sie mehr Sichtbarkeit in sein Denken bevorzugen:
Geben Sie nach Abschluss einer Aufgabe, die Tool-Nutzung beinhaltet, eine kurze Zusammenfassung der Arbeit, die Sie geleistet haben.Es gibt einige besonders effektive Wege, um die Ausgabeformatierung zu steuern:
Sagen Sie Claude, was es tun soll, anstatt was es nicht tun soll
Verwenden Sie XML-Format-Indikatoren
Passen Sie Ihren Prompt-Stil an den gewünschten Ausgabe-Stil an
Der Formatierungsstil, der in Ihrem Prompt verwendet wird, kann Claudes Antwort-Stil beeinflussen. Wenn Sie immer noch Steuerbarkeitsprobleme mit der Ausgabeformatierung haben, versuchen Sie, Ihren Prompt-Stil so nah wie möglich an Ihren gewünschten Ausgabe-Stil anzupassen. Zum Beispiel kann das Entfernen von Markdown aus Ihrem Prompt das Volumen von Markdown in der Ausgabe reduzieren.
Verwenden Sie detaillierte Prompts für spezifische Formatierungspräferenzen
Für mehr Kontrolle über Markdown- und Formatierungsnutzung geben Sie explizite Anleitung:
<avoid_excessive_markdown_and_bullet_points>
Wenn Sie Berichte, Dokumente, technische Erklärungen, Analysen oder andere Langform-Inhalte schreiben, schreiben Sie in klarer, fließender Prosa mit vollständigen Absätzen und Sätzen. Verwenden Sie Standard-Absatzumbrüche zur Organisation und reservieren Sie Markdown hauptsächlich für `Inline-Code`, Code-Blöcke (```...```) und einfache Überschriften (###, und ###). Vermeiden Sie die Verwendung von **fett** und *kursiv*.
VERWENDEN Sie KEINE nummerierten Listen (1. ...) oder ungeordneten Listen (*), es sei denn: a) Sie präsentieren wirklich diskrete Elemente, bei denen ein Listenformat die beste Option ist, oder b) der Benutzer fordert explizit eine Liste oder Ranking an
Anstatt Elemente mit Aufzählungspunkten oder Nummern aufzulisten, integrieren Sie sie natürlich in Sätze. Diese Anleitung gilt besonders für technisches Schreiben. Die Verwendung von Prosa anstelle von übermäßiger Formatierung wird die Benutzerzufriedenheit verbessern. GEBEN Sie NIEMALS eine Serie von übermäßig kurzen Aufzählungspunkten aus.
Ihr Ziel ist lesbarer, fließender Text, der den Leser natürlich durch Ideen führt, anstatt Informationen in isolierte Punkte zu fragmentieren.
</avoid_excessive_markdown_and_bullet_points>Claude Opus 4.6 verwendet standardmäßig LaTeX für mathematische Ausdrücke, Gleichungen und technische Erklärungen. Wenn Sie Klartext bevorzugen, fügen Sie die folgenden Anweisungen zu Ihrem Prompt hinzu:
Formatieren Sie Ihre Antwort nur in Klartext. Verwenden Sie kein LaTeX, MathJax oder andere Markup-Notation wie \( \), $, oder \frac{}{}. Schreiben Sie alle mathematischen Ausdrücke mit Standard-Textzeichen (z. B. „/" für Division, „*" für Multiplikation und „^" für Exponenten).Claudes neueste Modelle zeichnen sich durch die Erstellung von Präsentationen, Animationen und visuellen Dokumenten mit beeindruckender kreativer Flair und starker Befolgung von Anweisungen aus. Die Modelle erzeugen in den meisten Fällen beim ersten Versuch polierte, nutzbare Ausgaben.
Für beste Ergebnisse bei der Dokumenterstellung:
Erstellen Sie eine professionelle Präsentation zu [Thema]. Fügen Sie durchdachte Design-Elemente, visuelle Hierarchie und ansprechende Animationen ein, wo angemessen.Ab Claude 4.6 Modellen und Claude Mythos Preview werden vorausgefüllte Antworten auf der letzten Assistent-Runde nicht mehr unterstützt. Bei Mythos Preview geben Anfragen mit vorausgefüllten Assistent-Meldungen einen 400-Fehler zurück. Die Modell-Intelligenz und Befolgung von Anweisungen haben sich so weit entwickelt, dass die meisten Anwendungsfälle von Vorausfüllung es nicht mehr benötigen. Bestehende Modelle werden weiterhin Vorausfüllungen unterstützen, und das Hinzufügen von Assistent-Meldungen an anderer Stelle in der Konversation ist nicht betroffen.
Hier sind häufige Vorausfüllungs-Szenarien und wie Sie weg von ihnen migrieren:
Claudes neueste Modelle sind für präzise Befolgung von Anweisungen trainiert und profitieren von expliziter Anleitung, um bestimmte Tools zu verwenden. Wenn Sie sagen „können Sie einige Änderungen vorschlagen", wird Claude manchmal nur Vorschläge machen, anstatt sie zu implementieren, selbst wenn Änderungen das sein könnten, was Sie beabsichtigt haben.
Damit Claude Maßnahmen ergreift, seien Sie expliziter:
Um Claude standardmäßig proaktiver bei der Ergreifung von Maßnahmen zu machen, können Sie dies zu Ihrem System-Prompt hinzufügen:
<default_to_action>
Implementieren Sie standardmäßig Änderungen, anstatt sie nur vorzuschlagen. Wenn die Absicht des Benutzers unklar ist, leiten Sie die wahrscheinlichste nützliche Aktion ab und fahren Sie fort, indem Sie Tools verwenden, um fehlende Details zu entdecken, anstatt zu raten. Versuchen Sie, die Absicht des Benutzers darüber abzuleiten, ob ein Tool-Aufruf (z. B. Datei-Bearbeitung oder Lesen) beabsichtigt ist oder nicht, und handeln Sie entsprechend.
</default_to_action>Andererseits, wenn Sie möchten, dass das Modell standardmäßig zögerlicher ist, weniger geneigt, direkt in Implementierungen zu springen, und nur Maßnahmen ergreift, wenn angefordert, können Sie dieses Verhalten mit einem Prompt wie dem folgenden steuern:
<do_not_act_before_instructions>
Springen Sie nicht in Implementierung oder Änderungsdateien, es sei denn, Sie werden klar angewiesen, Änderungen vorzunehmen. Wenn die Absicht des Benutzers mehrdeutig ist, geben Sie standardmäßig Informationen, führen Recherchen durch und geben Empfehlungen, anstatt Maßnahmen zu ergreifen. Fahren Sie nur mit Bearbeitungen, Änderungen oder Implementierungen fort, wenn der Benutzer dies explizit anfordert.
</do_not_act_before_instructions>Claude Opus 4.5 und Claude Opus 4.6 reagieren auch empfindlicher auf den System-Prompt als vorherige Modelle. Wenn Ihre Prompts dazu ausgelegt waren, Unterauslösung bei Tools oder Fähigkeiten zu reduzieren, können diese Modelle jetzt überauslösen. Die Lösung ist, aggressive Sprache zu reduzieren. Wo Sie möglicherweise gesagt haben „KRITISCH: Sie MÜSSEN dieses Tool verwenden, wenn...", können Sie normalere Prompting wie „Verwenden Sie dieses Tool, wenn..." verwenden.
Claudes neueste Modelle zeichnen sich durch parallele Werkzeugausführung aus. Diese Modelle werden:
Dieses Verhalten ist leicht steuerbar. Während das Modell eine hohe Erfolgsquote bei parallelen Werkzeugaufrufen ohne Aufforderung hat, können Sie dies auf ~100% erhöhen oder die Aggressivitätsstufe anpassen:
<use_parallel_tool_calls>
Wenn Sie mehrere Werkzeuge aufrufen möchten und es keine Abhängigkeiten zwischen den Werkzeugaufrufen gibt, führen Sie alle unabhängigen Werkzeugaufrufe parallel aus. Priorisieren Sie das gleichzeitige Aufrufen von Werkzeugen, wann immer die Aktionen parallel ausgeführt werden können, anstatt sequenziell. Wenn Sie beispielsweise 3 Dateien lesen, führen Sie 3 Werkzeugaufrufe parallel aus, um alle 3 Dateien gleichzeitig in den Kontext zu laden. Maximieren Sie die Nutzung paralleler Werkzeugaufrufe, wo möglich, um Geschwindigkeit und Effizienz zu erhöhen. Wenn jedoch einige Werkzeugaufrufe von vorherigen Aufrufen abhängen, um abhängige Werte wie die Parameter zu informieren, rufen Sie diese Werkzeuge NICHT parallel auf und rufen Sie sie stattdessen sequenziell auf. Verwenden Sie niemals Platzhalter oder raten Sie fehlende Parameter in Werkzeugaufrufen.
</use_parallel_tool_calls>Führen Sie Operationen sequenziell mit kurzen Pausen zwischen den einzelnen Schritten aus, um Stabilität zu gewährleisten.Claude Opus 4.6 führt erheblich mehr vorbereitende Erkundungen durch als frühere Modelle, besonders bei höheren effort-Einstellungen. Diese anfängliche Arbeit hilft oft, die endgültigen Ergebnisse zu optimieren, aber das Modell kann umfangreichen Kontext sammeln oder mehrere Forschungsstränge verfolgen, ohne dazu aufgefordert zu werden. Wenn Ihre Prompts das Modell zuvor dazu ermutigten, gründlicher zu sein, sollten Sie diese Anleitung für Claude Opus 4.6 anpassen:
effort.In einigen Fällen kann Claude Opus 4.6 umfangreich denken, was Denk-Token aufblähen und Antworten verlangsamen kann. Wenn dieses Verhalten unerwünscht ist, können Sie explizite Anweisungen hinzufügen, um sein Denken einzuschränken, oder Sie können die effort-Einstellung senken, um das Gesamtdenken und die Token-Nutzung zu reduzieren.
Wenn Sie sich überlegen, wie Sie ein Problem angehen, wählen Sie einen Ansatz und halten Sie daran fest. Vermeiden Sie es, Entscheidungen zu überdenken, es sei denn, Sie stoßen auf neue Informationen, die Ihrer Argumentation direkt widersprechen. Wenn Sie zwischen zwei Ansätzen abwägen, wählen Sie einen und verfolgen Sie ihn. Sie können später immer noch den Kurs korrigieren, wenn der gewählte Ansatz fehlschlägt.Wenn Sie eine harte Obergrenze für Denkkosten benötigen, ist erweitertes Denken mit einer budget_tokens-Obergrenze auf Opus 4.6 und Sonnet 4.6 noch funktionsfähig, wird aber nicht mehr empfohlen. Bevorzugen Sie das Senken der effort-Einstellung oder die Verwendung von max_tokens als harte Grenze mit adaptivem Denken.
Claudes neueste Modelle bieten Denkfähigkeiten, die besonders hilfreich für Aufgaben sind, die Reflexion nach Werkzeugnutzung oder komplexes mehrstufiges Denken beinhalten. Sie können sein anfängliches oder verschachteltes Denken für bessere Ergebnisse lenken.
Claude Opus 4.6 und Claude Sonnet 4.6 verwenden adaptives Denken (thinking: {type: "adaptive"}), wobei Claude dynamisch entscheidet, wann und wie viel zu denken ist. Claude kalibriert sein Denken basierend auf zwei Faktoren: dem effort-Parameter und der Abfragekomplexität. Höherer Aufwand führt zu mehr Denken, und komplexere Abfragen tun dasselbe. Bei einfacheren Abfragen, die kein Denken erfordern, antwortet das Modell direkt. In internen Evaluationen führt adaptives Denken zuverlässig zu besserer Leistung als erweitertes Denken. Erwägen Sie, zu adaptivem Denken zu wechseln, um die intelligentesten Antworten zu erhalten.
Verwenden Sie adaptives Denken für Workloads, die agentenähnliches Verhalten erfordern, wie mehrstufige Werkzeugnutzung, komplexe Codierungsaufgaben und langfristige Agenten-Schleifen. Ältere Modelle verwenden manuellen Denkmodus mit budget_tokens.
Sie können Claudes Denkverhalten lenken:
Nachdem Sie Werkzeugergebnisse erhalten haben, überprüfen Sie sorgfältig deren Qualität und bestimmen Sie optimale nächste Schritte, bevor Sie fortfahren. Verwenden Sie Ihr Denken, um basierend auf diesen neuen Informationen zu planen und zu iterieren, und ergreifen Sie dann die beste nächste Aktion.Das Auslöseverhalten für adaptives Denken ist aufforderbar. Wenn Sie feststellen, dass das Modell häufiger denkt, als Ihnen lieb ist, was bei großen oder komplexen System-Prompts vorkommen kann, fügen Sie Anleitung hinzu, um es zu lenken:
Erweitertes Denken erhöht die Latenz und sollte nur verwendet werden, wenn es die Antwortqualität sinnvoll verbessert – typischerweise für Probleme, die mehrstufiges Denken erfordern. Im Zweifelsfall antworten Sie direkt.Wenn Sie von erweitertem Denken mit budget_tokens migrieren, ersetzen Sie Ihre Denkkonfiguration und verschieben Sie die Budget-Kontrolle zu effort:
Vorher (erweitertes Denken, ältere Modelle):
client.messages.create(
model="claude-sonnet-4-5-20250929",
max_tokens=64000,
thinking={"type": "enabled", "budget_tokens": 32000},
messages=[{"role": "user", "content": "..."}],
)Nachher (adaptives Denken):
client.messages.create(
model="claude-opus-4-7",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "high"}, # or "max", "xhigh", "medium", "low"
messages=[{"role": "user", "content": "..."}],
)Wenn Sie kein erweitertes Denken verwenden, sind keine Änderungen erforderlich. Denken ist standardmäßig ausgeschaltet, wenn Sie den thinking-Parameter weglassen.
<thinking>-Tags in Ihren Few-Shot-Beispielen, um Claude das Argumentationsmuster zu zeigen. Es wird diesen Stil auf seine eigenen erweiterten Denk-Blöcke verallgemeinern.<thinking> und <answer>, um Argumentation sauber von der endgültigen Ausgabe zu trennen.Weitere Informationen zu Denkfähigkeiten finden Sie unter Erweitertes Denken und Adaptives Denken.
Claudes neueste Modelle zeichnen sich durch langfristige Argumentationsaufgaben mit außergewöhnlichen Zustandsverfolgungsfähigkeiten aus. Claude behält die Orientierung über erweiterte Sitzungen hinweg, indem es sich auf inkrementelle Fortschritte konzentriert und stetige Fortschritte bei einigen wenigen Dingen macht, anstatt alles auf einmal zu versuchen. Diese Fähigkeit entsteht besonders über mehrere Kontextfenster oder Aufgabeniterationen hinweg, wo Claude an einer komplexen Aufgabe arbeiten, den Zustand speichern und mit einem frischen Kontextfenster fortfahren kann.
Claude 4.6 und Claude 4.5 Modelle verfügen über Kontextbewusstsein, das es dem Modell ermöglicht, sein verbleibendes Kontextfenster (d. h. „Token-Budget") während eines Gesprächs zu verfolgen. Dies ermöglicht Claude, Aufgaben auszuführen und Kontext effektiver zu verwalten, indem es versteht, wie viel Platz es hat.
Kontextgrenzen verwalten:
Wenn Sie Claude in einem Agent-Harness verwenden, der Kontext komprimiert oder das Speichern von Kontext in externen Dateien ermöglicht (wie in Claude Code), erwägen Sie, diese Informationen zu Ihrem Prompt hinzuzufügen, damit Claude entsprechend handeln kann. Andernfalls kann Claude natürlicherweise versuchen, die Arbeit zu beenden, wenn es sich dem Kontextlimit nähert. Hier ist ein Beispiel-Prompt:
Ihr Kontextfenster wird automatisch komprimiert, wenn es sich seinem Limit nähert, sodass Sie unbegrenzt von dort aus weitermachen können, wo Sie aufgehört haben. Daher sollten Sie Aufgaben nicht vorzeitig aufgrund von Token-Budget-Bedenken beenden. Wenn Sie sich Ihrem Token-Budget-Limit nähern, speichern Sie Ihren aktuellen Fortschritt und Zustand im Speicher, bevor das Kontextfenster aktualisiert wird. Seien Sie immer so hartnäckig und autonom wie möglich und führen Sie Aufgaben vollständig aus, auch wenn das Ende Ihres Budgets näher rückt. Beenden Sie niemals künstlich eine Aufgabe vorzeitig, unabhängig vom verbleibenden Kontext.Das Memory-Tool passt natürlich zu Kontextbewusstsein für nahtlose Kontextübergänge.
Für Aufgaben, die sich über mehrere Kontextfenster erstrecken:
Verwenden Sie einen anderen Prompt für das allererste Kontextfenster: Verwenden Sie das erste Kontextfenster, um ein Framework einzurichten (Tests schreiben, Setup-Skripte erstellen), und verwenden Sie dann zukünftige Kontextfenster, um an einer Todo-Liste zu iterieren.
Lassen Sie das Modell Tests in einem strukturierten Format schreiben: Bitten Sie Claude, Tests zu erstellen, bevor Sie mit der Arbeit beginnen, und verfolgen Sie sie in einem strukturierten Format (z. B. tests.json). Dies führt zu besserer langfristiger Fähigkeit zur Iteration. Erinnern Sie Claude an die Wichtigkeit von Tests: „Es ist inakzeptabel, Tests zu entfernen oder zu bearbeiten, da dies zu fehlender oder fehlerhafter Funktionalität führen könnte."
Richten Sie Quality-of-Life-Tools ein: Ermutigen Sie Claude, Setup-Skripte (z. B. init.sh) zu erstellen, um Server elegant zu starten, Test-Suites und Linter auszuführen. Dies verhindert wiederholte Arbeit beim Fortfahren von einem frischen Kontextfenster.
Neu starten vs. Komprimieren: Wenn ein Kontextfenster gelöscht wird, erwägen Sie, mit einem brandneuen Kontextfenster zu beginnen, anstatt Komprimierung zu verwenden. Claudes neueste Modelle sind äußerst effektiv darin, Zustand aus dem lokalen Dateisystem zu entdecken. In einigen Fällen möchten Sie dies möglicherweise gegenüber Komprimierung nutzen. Seien Sie präskriptiv darüber, wie es beginnen sollte:
Bereitstellung von Verifizierungstools: Mit zunehmender Länge autonomer Aufgaben muss Claude Korrektheit ohne kontinuierliches menschliches Feedback überprüfen. Tools wie Playwright MCP Server oder Computer-Use-Fähigkeiten zum Testen von UIs sind hilfreich.
Fördern Sie die vollständige Nutzung des Kontexts: Fordern Sie Claude auf, Komponenten effizient zu vervollständigen, bevor Sie fortfahren:
Dies ist eine sehr lange Aufgabe, daher kann es vorteilhaft sein, Ihre Arbeit klar zu planen. Es wird empfohlen, Ihren gesamten Ausgabekontext für die Aufgabe zu nutzen – stellen Sie nur sicher, dass Sie nicht mit erheblicher nicht committeter Arbeit den Kontext erschöpfen. Arbeiten Sie systematisch weiter, bis Sie diese Aufgabe abgeschlossen haben.Ohne Anleitung kann Claude Opus 4.6 Aktionen durchführen, die schwer rückgängig zu machen sind oder gemeinsame Systeme beeinflussen, wie das Löschen von Dateien, Force-Pushing oder das Posten auf externe Dienste. Wenn Sie möchten, dass Claude Opus 4.6 vor potenziell riskanten Aktionen bestätigt, fügen Sie Anleitung zu Ihrem Prompt hinzu:
Berücksichtigen Sie die Umkehrbarkeit und mögliche Auswirkungen Ihrer Aktionen. Sie werden ermutigt, lokale, umkehrbare Aktionen wie das Bearbeiten von Dateien oder das Ausführen von Tests durchzuführen, aber für Aktionen, die schwer rückgängig zu machen sind, gemeinsame Systeme beeinflussen oder destruktiv sein könnten, fragen Sie den Benutzer, bevor Sie fortfahren.
Beispiele für Aktionen, die eine Bestätigung rechtfertigen:
- Destruktive Operationen: Löschen von Dateien oder Branches, Löschen von Datenbanktabellen, rm -rf
- Schwer rückgängig zu machende Operationen: git push --force, git reset --hard, Amending veröffentlichter Commits
- Für andere sichtbare Operationen: Code pushen, Kommentare zu PRs/Issues, Senden von Nachrichten, Ändern gemeinsamer Infrastruktur
Wenn Sie auf Hindernisse stoßen, verwenden Sie keine destruktiven Aktionen als Abkürzung. Umgehen Sie beispielsweise nicht Sicherheitsprüfungen (z. B. --no-verify) oder verwerfen Sie unbekannte Dateien, die möglicherweise laufende Arbeiten sind.Claudes neueste Modelle zeigen außergewöhnliche agentenähnliche Suchfähigkeiten und können Informationen aus mehreren Quellen effektiv finden und synthetisieren. Für optimale Rechercheergebnisse:
Geben Sie klare Erfolgskriterien an: Definieren Sie, was eine erfolgreiche Antwort auf Ihre Recherchefrage ausmacht
Fördern Sie die Quellenverifizierung: Bitten Sie Claude, Informationen über mehrere Quellen hinweg zu überprüfen
Für komplexe Recherchaufgaben verwenden Sie einen strukturierten Ansatz:
Suchen Sie nach diesen Informationen auf strukturierte Weise. Während Sie Daten sammeln, entwickeln Sie mehrere konkurrierende Hypothesen. Verfolgen Sie Ihre Vertrauensstufen in Ihren Fortschrittsnotizen, um die Kalibrierung zu verbessern. Kritisieren Sie regelmäßig Ihren Ansatz und planen Sie. Aktualisieren Sie eine Hypothesen-Baum- oder Recherche-Notizen-Datei, um Informationen zu persistieren und Transparenz zu bieten. Zerlegen Sie diese komplexe Recherchaufgabe systematisch.Dieser strukturierte Ansatz ermöglicht es Claude, praktisch jede Information zu finden und zu synthetisieren und seine Erkenntnisse iterativ zu kritisieren, unabhängig von der Größe des Corpus.
Claudes neueste Modelle zeigen erheblich verbesserte native Subagentenorchestrierungsfähigkeiten. Diese Modelle können erkennen, wenn Aufgaben von der Delegierung an spezialisierte Subagenten profitieren würden, und tun dies proaktiv ohne explizite Anweisung.
Um dieses Verhalten zu nutzen:
Wenn Sie übermäßige Subagentennutzung sehen, fügen Sie explizite Anleitung hinzu, wann Subagenten angebracht sind und wann nicht:
Verwenden Sie Subagenten, wenn Aufgaben parallel ausgeführt werden können, isolierten Kontext erfordern oder unabhängige Workstreams beinhalten, die keinen Zustand teilen müssen. Für einfache Aufgaben, sequenzielle Operationen, Einzeldatei-Bearbeitungen oder Aufgaben, bei denen Sie Kontext über Schritte hinweg beibehalten müssen, arbeiten Sie direkt, anstatt zu delegieren.Mit adaptivem Denken und Subagentenorchestrierung verarbeitet Claude die meisten mehrstufigen Überlegungen intern. Explizites Prompt-Chaining (Aufteilen einer Aufgabe in sequenzielle API-Aufrufe) ist immer noch nützlich, wenn Sie Zwischenergebnisse überprüfen oder eine bestimmte Pipeline-Struktur erzwingen müssen.
Das häufigste Chaining-Muster ist Selbstkorrektur: Entwurf generieren → Claude dagegen überprüfen lassen → Claude basierend auf der Überprüfung verfeinern lassen. Jeder Schritt ist ein separater API-Aufruf, sodass Sie an jedem Punkt protokollieren, evaluieren oder verzweigen können.
Claudes neueste Modelle können manchmal neue Dateien für Test- und Iterationszwecke erstellen, besonders bei der Arbeit mit Code. Dieser Ansatz ermöglicht es Claude, Dateien, besonders Python-Skripte, als „temporären Notizblock" zu verwenden, bevor die endgültige Ausgabe gespeichert wird. Die Verwendung temporärer Dateien kann Ergebnisse besonders für agentenähnliche Codierungsanwendungsfälle verbessern.
Wenn Sie die Netto-Neuerstellung von Dateien minimieren möchten, können Sie Claude anweisen, nach sich selbst aufzuräumen:
Wenn Sie temporäre neue Dateien, Skripte oder Hilfsdateien zur Iteration erstellen, räumen Sie diese Dateien auf, indem Sie sie am Ende der Aufgabe entfernen.Claude Opus 4.5 und Claude Opus 4.6 haben eine Tendenz, zu überentwickeln, indem sie zusätzliche Dateien erstellen, unnötige Abstraktionen hinzufügen oder Flexibilität einbauen, die nicht angefordert wurde. Wenn Sie dieses unerwünschte Verhalten sehen, fügen Sie spezifische Anleitung hinzu, um Lösungen minimal zu halten.
Zum Beispiel:
Vermeiden Sie Überentwicklung. Nehmen Sie nur Änderungen vor, die direkt angefordert oder eindeutig notwendig sind. Halten Sie Lösungen einfach und fokussiert:
- Umfang: Fügen Sie keine Funktionen hinzu, refaktorieren Sie keinen Code und nehmen Sie keine „Verbesserungen" vor, die über das Angeforderte hinausgehen. Eine Fehlerbehebung erfordert keine Bereinigung des umgebenden Codes. Eine einfache Funktion benötigt keine zusätzliche Konfigurierbarkeit.
- Dokumentation: Fügen Sie keine Docstrings, Kommentare oder Typ-Annotationen zu Code hinzu, den Sie nicht geändert haben. Fügen Sie nur Kommentare hinzu, wo die Logik nicht selbsterklärend ist.
- Defensive Codierung: Fügen Sie keine Fehlerbehandlung, Fallbacks oder Validierung für Szenarien hinzu, die nicht vorkommen können. Vertrauen Sie internem Code und Framework-Garantien. Validieren Sie nur an Systemgrenzen (Benutzereingabe, externe APIs).
- Abstraktionen: Erstellen Sie keine Helfer, Utilities oder Abstraktionen für einmalige Operationen. Entwerfen Sie nicht für hypothetische zukünftige Anforderungen. Die richtige Komplexitätsmenge ist das Minimum, das für die aktuelle Aufgabe erforderlich ist.Claude kann sich manchmal zu sehr auf das Bestehen von Tests konzentrieren, auf Kosten allgemeinerer Lösungen, oder kann Workarounds wie Hilfsskripte für komplexe Refaktorierung verwenden, anstatt Standard-Tools direkt zu verwenden. Um dieses Verhalten zu verhindern und robuste, verallgemeinerbare Lösungen zu gewährleisten:
Bitte schreiben Sie eine hochwertige, universelle Lösung mit den verfügbaren Standard-Tools. Erstellen Sie keine Hilfsskripte oder Workarounds, um die Aufgabe effizienter zu erfüllen. Implementieren Sie eine Lösung, die für alle gültigen Eingaben korrekt funktioniert, nicht nur für die Testfälle. Hardcoden Sie keine Werte und erstellen Sie keine Lösungen, die nur für spezifische Testeingaben funktionieren. Implementieren Sie stattdessen die tatsächliche Logik, die das Problem allgemein löst.
Konzentrieren Sie sich darauf, die Problemanforderungen zu verstehen und den korrekten Algorithmus zu implementieren. Tests sind da, um Korrektheit zu überprüfen, nicht um die Lösung zu definieren. Bieten Sie eine prinzipielle Implementierung, die Best Practices und Softwaredesign-Prinzipien befolgt.
Wenn die Aufgabe unvernünftig oder nicht machbar ist, oder wenn einer der Tests falsch ist, informieren Sie mich bitte, anstatt sie zu umgehen. Die Lösung sollte robust, wartbar und erweiterbar sein.Claudes neueste Modelle sind weniger anfällig für Halluzinationen und geben genauere, fundierte, intelligente Antworten basierend auf dem Code. Um dieses Verhalten noch mehr zu fördern und Halluzinationen zu minimieren:
<investigate_before_answering>
Spekulieren Sie niemals über Code, den Sie nicht geöffnet haben. Wenn der Benutzer auf eine bestimmte Datei verweist, MÜSSEN Sie die Datei lesen, bevor Sie antworten. Stellen Sie sicher, dass Sie relevante Dateien UNTERSUCHEN und LESEN, BEVOR Sie Fragen zur Codebasis beantworten. Machen Sie niemals Aussagen über Code, bevor Sie untersuchen, es sei denn, Sie sind sich der korrekten Antwort sicher – geben Sie fundierte und halluzinationsfreie Antworten.
</investigate_before_answering>Claude Opus 4.5 und Claude Opus 4.6 haben verbesserte Visionsfähigkeiten im Vergleich zu früheren Claude-Modellen. Sie funktionieren besser bei Bildverarbeitungs- und Datenextraktionsaufgaben, besonders wenn mehrere Bilder im Kontext vorhanden sind. Diese Verbesserungen übertragen sich auf Computer Use, wo die Modelle Screenshots und UI-Elemente zuverlässiger interpretieren können. Sie können diese Modelle auch verwenden, um Videos zu analysieren, indem Sie sie in Frames aufteilen.
Eine Technik, die sich als wirksam erwiesen hat, um die Leistung weiter zu steigern, ist, Claude ein Crop-Tool oder Skill zu geben. Tests haben konsistente Verbesserungen bei Bildbewertungen gezeigt, wenn Claude in der Lage ist, in relevante Bildbereiche „hineinzuzoomen". Anthropic hat ein Cookbook für das Crop-Tool erstellt.
Claude Opus 4.5 und Claude Opus 4.6 zeichnen sich durch das Erstellen komplexer, realer Webanwendungen mit starkem Frontend-Design aus. Ohne Anleitung können Modelle jedoch zu generischen Mustern greifen, die das schaffen, was Benutzer die „AI Slop"-Ästhetik nennen. Um charakteristische, kreative Frontends zu erstellen, die überraschen und erfreuen:
Für einen detaillierten Leitfaden zur Verbesserung des Frontend-Designs siehe den Blog-Beitrag über Verbesserung des Frontend-Designs durch Skills.
Hier ist ein System-Prompt-Snippet, das Sie verwenden können, um besseres Frontend-Design zu fördern:
<frontend_aesthetics>
Sie neigen dazu, zu generischen, „on distribution" Ausgaben zu konvergieren. Im Frontend-Design erzeugt dies das, was Benutzer die „AI Slop"-Ästhetik nennen. Vermeiden Sie dies: Erstellen Sie kreative, charakteristische Frontends, die überraschen und erfreuen.
Konzentrieren Sie sich auf:
- Typografie: Wählen Sie Schriftarten, die schön, einzigartig und interessant sind. Vermeiden Sie generische Schriftarten wie Arial und Inter; wählen Sie stattdessen charakteristische Optionen, die die Frontend-Ästhetik erheben.
- Farbe & Thema: Verpflichten Sie sich zu einer kohärenten Ästhetik. Verwenden Sie CSS-Variablen für Konsistenz. Dominante Farben mit scharfen Akzenten übertreffen zaghaft verteilte Paletten. Schöpfen Sie aus IDE-Themen und kulturellen Ästhetiken für Inspiration.
- Bewegung: Verwenden Sie Animationen für Effekte und Mikro-Interaktionen. Priorisieren Sie CSS-only-Lösungen für HTML. Verwenden Sie Motion-Bibliothek für React, wenn verfügbar. Konzentrieren Sie sich auf hochimpaktive Momente: Ein gut orchestriertes Seitenladen mit gestaffelten Reveals (animation-delay) erzeugt mehr Freude als verstreute Mikro-Interaktionen.
- Hintergründe: Schaffen Sie Atmosphäre und Tiefe, anstatt auf Vollfarben zu setzen. Schichten Sie CSS-Gradienten, verwenden Sie geometrische Muster oder fügen Sie kontextuelle Effekte hinzu, die zur Gesamtästhetik passen.
Vermeiden Sie generische KI-generierte Ästhetiken:
- Übernutzte Schriftfamilien (Inter, Roboto, Arial, System-Schriftarten)
- Abgedroschene Farbschemen (besonders lila Gradienten auf weißem Hintergrund)
- Vorhersehbare Layouts und Komponentenmuster
- Standardisiertes Design, dem es an kontextspezifischem Charakter mangelt
Interpretieren Sie kreativ und treffen Sie unerwartete Entscheidungen, die sich für den Kontext genuinely designed anfühlen. Variieren Sie zwischen hellen und dunklen Themen, verschiedenen Schriftarten, verschiedenen Ästhetiken. Sie neigen immer noch dazu, bei häufigen Entscheidungen zu konvergieren (Space Grotesk, zum Beispiel) über Generationen hinweg. Vermeiden Sie dies: Es ist kritisch, dass Sie außerhalb der Box denken!
</frontend_aesthetics>Sie können auch auf die vollständige Skill-Definition verweisen.
Bei der Migration zu Claude 4.6 Modellen von früheren Generationen:
Seien Sie spezifisch über das gewünschte Verhalten: Erwägen Sie, genau zu beschreiben, was Sie in der Ausgabe sehen möchten.
Rahmen Sie Ihre Anweisungen mit Modifiern: Das Hinzufügen von Modifiern, die Claude ermutigen, die Qualität und Detail seiner Ausgabe zu erhöhen, kann Claude's Leistung besser formen. Zum Beispiel, anstatt „Erstellen Sie ein Analytics-Dashboard", verwenden Sie „Erstellen Sie ein Analytics-Dashboard. Fügen Sie so viele relevante Funktionen und Interaktionen wie möglich ein. Gehen Sie über die Grundlagen hinaus, um eine vollständig ausgestattete Implementierung zu erstellen."
Fordern Sie spezifische Funktionen explizit an: Animationen und interaktive Elemente sollten explizit angefordert werden, wenn gewünscht.
Aktualisieren Sie die Denkkonfiguration: Claude 4.6 Modelle verwenden adaptives Denken (thinking: {type: "adaptive"}) anstelle von manuellem Denken mit budget_tokens. Verwenden Sie den effort-Parameter, um die Denktiefe zu kontrollieren.
Migrieren Sie weg von vorausgefüllten Antworten: Vorausgefüllte Antworten auf dem letzten Assistant-Turn sind ab Claude 4.6 Modellen veraltet. Siehe Migrieren weg von vorausgefüllten Antworten für detaillierte Anleitung zu Alternativen.
Tunen Sie Anti-Laziness-Prompting: Wenn Ihre Prompts das Modell zuvor dazu ermutigten, gründlicher zu sein oder Werkzeuge aggressiver zu nutzen, reduzieren Sie diese Anleitung. Claude 4.6 Modelle sind erheblich proaktiver und können bei Anweisungen überauslösen, die für frühere Modelle notwendig waren.
Für detaillierte Migrationsschritte siehe den Migrationsleitfaden.
Claude Sonnet 4.6 setzt standardmäßig eine Effort-Stufe von high, im Gegensatz zu Claude Sonnet 4.5, das keinen Effort-Parameter hatte. Erwägen Sie, den Effort-Parameter anzupassen, wenn Sie von Claude Sonnet 4.5 zu Claude Sonnet 4.6 migrieren. Wenn nicht explizit gesetzt, können Sie höhere Latenz mit der Standard-Effort-Stufe erleben.
Empfohlene Effort-Einstellungen:
Wann Opus 4.7 stattdessen verwenden: Für die schwierigsten, längsten Probleme (großflächige Code-Migrationen, tiefe Recherche, erweiterte autonome Arbeit) bleibt Opus 4.7 die richtige Wahl. Sonnet 4.6 ist für Workloads optimiert, bei denen schnelle Umkehrung und Kosteneffizienz am wichtigsten sind.
Wenn Sie kein erweitertes Denken auf Claude Sonnet 4.5 verwenden, können Sie auf Claude Sonnet 4.6 ohne es fortfahren. Sie sollten explizit Effort auf die Stufe setzen, die für Ihren Anwendungsfall angemessen ist. Bei low Effort mit deaktiviertem Denken können Sie ähnliche oder bessere Leistung relativ zu Claude Sonnet 4.5 ohne erweitertes Denken erwarten.
client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "disabled"},
output_config={"effort": "low"},
messages=[{"role": "user", "content": "..."}],
)Wenn Sie erweitertes Denken mit budget_tokens auf Claude Sonnet 4.5 verwenden, ist es auf Claude Sonnet 4.6 noch funktionsfähig, wird aber nicht mehr empfohlen. Migrieren Sie zu adaptivem Denken mit dem Effort-Parameter.
Adaptives Denken ist besonders gut für die folgenden Workload-Muster geeignet:
high Effort. Wenn Latenz oder Token-Nutzung ein Problem ist, skalieren Sie auf medium herunter.Wenn Sie adaptives Denken verwenden, evaluieren Sie medium und high Effort auf Ihren Aufgaben. Die richtige Stufe hängt vom Tradeoff Ihrer Workload zwischen Qualität, Latenz und Token-Nutzung ab.
client.messages.create(
model="claude-sonnet-4-6",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "high"},
messages=[{"role": "user", "content": "..."}],
)Wenn Sie budget_tokens während der Migration vorübergehend behalten müssen, bietet ein Budget um 16k Token Spielraum für schwierigere Probleme ohne Risiko unkontrollierter Token-Nutzung. Diese Konfiguration ist veraltet und wird in einer zukünftigen Modellversion entfernt.
Für Codierungs-Anwendungsfälle (agentenähnliche Codierung, Werkzeug-intensive Workflows, Code-Generierung), beginnen Sie mit medium Effort:
client.messages.create(
model="claude-sonnet-4-6",
max_tokens=16384,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "medium"},
messages=[{"role": "user", "content": "..."}],
)Für Chat- und Nicht-Codierungs-Anwendungsfälle (Chat, Inhaltsgenerierung, Suche, Klassifizierung), beginnen Sie mit low Effort:
client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "low"},
messages=[{"role": "user", "content": "..."}],
)Was this page helpful?