Loading...
  • Erstellen
  • Admin
  • Modelle & Preise
  • Client-SDKs
  • API-Referenz
Search...
⌘K
Log in
Das Evaluierungstool in der Console verwenden
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Erstellen/Testen und evaluieren

Verwendung des Evaluierungstools

Die Claude Console verfügt über ein Evaluierungstool, mit dem Sie Ihre Prompts unter verschiedenen Szenarien testen können.

Was this page helpful?

  • Zugriff auf die Evaluierungsfunktion
  • Prompts generieren
  • Erstellen von Testfällen
  • Tipps für effektive Evaluierung
  • Verstehen und Vergleichen von Ergebnissen

Zugriff auf die Evaluierungsfunktion

Um mit dem Evaluierungstool zu beginnen:

  1. Öffnen Sie die Claude Console und navigieren Sie zum Prompt-Editor.
  2. Nachdem Sie Ihren Prompt verfasst haben, suchen Sie nach der Registerkarte „Evaluate" (Evaluieren) oben auf dem Bildschirm.

Zugriff auf die Evaluierungsfunktion

Stellen Sie sicher, dass Ihr Prompt mindestens 1-2 dynamische Variablen mit der Doppelklammer-Syntax enthält: {{variable}}. Dies ist erforderlich, um Eval-Testsets zu erstellen.

Prompts generieren

Die Console bietet einen integrierten Prompt-Generator, der von Claude Opus 4.1 unterstützt wird:

  1. 1

    Klicken Sie auf „Generate Prompt“

    Wenn Sie auf das Hilfstool „Generate Prompt" klicken, wird ein Modal geöffnet, in dem Sie Ihre Aufgabeninformationen eingeben können.

  2. 2

    Beschreiben Sie Ihre Aufgabe

    Beschreiben Sie Ihre gewünschte Aufgabe (z. B. „Triage eingehender Kundenunterstützungsanfragen") mit so viel oder so wenig Detail wie gewünscht. Je mehr Kontext Sie einbeziehen, desto besser kann Claude seinen generierten Prompt auf Ihre spezifischen Anforderungen abstimmen.

  3. 3

    Generieren Sie Ihren Prompt

    Wenn Sie auf die orangefarbene Schaltfläche „Generate Prompt" unten klicken, generiert Claude einen hochwertigen Prompt für Sie. Sie können diese Prompts dann mithilfe des Evaluierungsbildschirms in der Console weiter verbessern.

Diese Funktion macht es einfacher, Prompts mit der entsprechenden Variablensyntax für die Evaluierung zu erstellen.

Prompt-Generator

Erstellen von Testfällen

Wenn Sie auf den Evaluierungsbildschirm zugreifen, haben Sie mehrere Optionen zum Erstellen von Testfällen:

  1. Klicken Sie auf die Schaltfläche „+ Add Row" (+ Zeile hinzufügen) unten links, um einen Fall manuell hinzuzufügen.
  2. Verwenden Sie die Funktion „Generate Test Case" (Testfall generieren), um Claude automatisch Testfälle für Sie zu generieren.
  3. Importieren Sie Testfälle aus einer CSV-Datei.

So verwenden Sie die Funktion „Generate Test Case":

  1. 1

    Klicken Sie auf „Generate Test Case“

    Claude generiert Testfälle für Sie, eine Zeile nach der anderen, jedes Mal wenn Sie auf die Schaltfläche klicken.

  2. 2

    Bearbeiten Sie die Generierungslogik (optional)

    Sie können auch die Testfall-Generierungslogik bearbeiten, indem Sie auf den Pfeil-Dropdown rechts neben der Schaltfläche „Generate Test Case" klicken und dann auf „Show generation logic" (Generierungslogik anzeigen) oben im Fenster „Variables" (Variablen), das sich öffnet. Möglicherweise müssen Sie auf „Generate" oben rechts in diesem Fenster klicken, um die anfängliche Generierungslogik zu füllen.

    Durch das Bearbeiten können Sie die Testfälle, die Claude generiert, anpassen und optimieren, um eine größere Präzision und Spezifität zu erreichen.

Hier ist ein Beispiel eines gefüllten Evaluierungsbildschirms mit mehreren Testfällen:

Gefüllter Evaluierungsbildschirm

Wenn Sie Ihren ursprünglichen Prompt-Text aktualisieren, können Sie die gesamte Eval-Suite gegen den neuen Prompt erneut ausführen, um zu sehen, wie Änderungen die Leistung über alle Testfälle hinweg beeinflussen.

Tipps für effektive Evaluierung

Verwenden Sie das Hilfstool „Generate a prompt" in der Console, um schnell Prompts mit der entsprechenden Variablensyntax für die Evaluierung zu erstellen.

Verstehen und Vergleichen von Ergebnissen

Das Evaluierungstool bietet mehrere Funktionen, um Ihnen bei der Verfeinerung Ihrer Prompts zu helfen:

  1. Nebeneinander-Vergleich: Vergleichen Sie die Ausgaben von zwei oder mehr Prompts, um die Auswirkungen Ihrer Änderungen schnell zu sehen.
  2. Qualitätsbewertung: Bewerten Sie die Antwortqualität auf einer 5-Punkte-Skala, um Verbesserungen der Antwortqualität pro Prompt zu verfolgen.
  3. Prompt-Versionierung: Erstellen Sie neue Versionen Ihres Prompts und führen Sie die Testsuite erneut aus, um schnell zu iterieren und Ergebnisse zu verbessern.

Durch die Überprüfung von Ergebnissen über Testfälle hinweg und den Vergleich verschiedener Prompt-Versionen können Sie Muster erkennen und fundierte Anpassungen an Ihrem Prompt effizienter vornehmen.

Beginnen Sie noch heute mit der Evaluierung Ihrer Prompts, um robustere KI-Anwendungen mit Claude zu erstellen!