Loading...
    • Bangun
    • Admin
    • Model & harga
    • Client SDK
    • Referensi API
    Search...
    ⌘K
    Log in
    Menggunakan Alat Evaluasi di Console
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Bangun/Uji dan evaluasi

    Menggunakan Alat Evaluasi

    Claude Console menampilkan Alat Evaluasi yang memungkinkan Anda menguji prompt Anda dalam berbagai skenario.

    Mengakses Fitur Evaluasi

    Untuk memulai dengan alat Evaluasi:

    1. Buka Claude Console dan navigasikan ke editor prompt.
    2. Setelah menyusun prompt Anda, cari tab 'Evaluate' di bagian atas layar.

    Mengakses Fitur Evaluasi

    Pastikan prompt Anda mencakup setidaknya 1-2 variabel dinamis menggunakan sintaks kurung kurawal ganda: {{variable}}. Ini diperlukan untuk membuat set tes eval.

    Menghasilkan Prompt

    Console menawarkan pembuat prompt bawaan yang didukung oleh Claude Opus 4.1:

    1. 1

      Klik 'Generate Prompt'

      Mengklik alat pembantu 'Generate Prompt' akan membuka modal yang memungkinkan Anda memasukkan informasi tugas Anda.

    2. 2

      Jelaskan tugas Anda

      Jelaskan tugas yang diinginkan (misalnya, "Triage permintaan dukungan pelanggan masuk") dengan detail sebanyak atau sesedikit yang Anda inginkan. Semakin banyak konteks yang Anda sertakan, semakin banyak Claude dapat menyesuaikan prompt yang dihasilkan dengan kebutuhan spesifik Anda.

    3. 3

      Hasilkan prompt Anda

      Mengklik tombol 'Generate Prompt' oranye di bagian bawah akan membuat Claude menghasilkan prompt berkualitas tinggi untuk Anda. Anda kemudian dapat meningkatkan prompt tersebut menggunakan layar Evaluasi di Console.

    Fitur ini memudahkan untuk membuat prompt dengan sintaks variabel yang sesuai untuk evaluasi.

    Pembuat Prompt

    Membuat Kasus Uji

    Ketika Anda mengakses layar Evaluasi, Anda memiliki beberapa opsi untuk membuat kasus uji:

    1. Klik tombol '+ Add Row' di bagian bawah kiri untuk menambahkan kasus secara manual.
    2. Gunakan fitur 'Generate Test Case' untuk membuat Claude secara otomatis menghasilkan kasus uji untuk Anda.
    3. Impor kasus uji dari file CSV.

    Untuk menggunakan fitur 'Generate Test Case':

    1. 1

      Klik pada 'Generate Test Case'

      Claude akan menghasilkan kasus uji untuk Anda, satu baris setiap kali Anda mengklik tombol.

    2. 2

      Edit logika generasi (opsional)

      Anda juga dapat mengedit logika generasi kasus uji dengan mengklik panah dropdown di sebelah kanan tombol 'Generate Test Case', kemudian pada 'Show generation logic' di bagian atas jendela Variabel yang muncul. Anda mungkin harus mengklik `Generate' di bagian atas kanan jendela ini untuk mengisi logika generasi awal.

      Mengedit ini memungkinkan Anda menyesuaikan dan menyempurnakan kasus uji yang dihasilkan Claude dengan presisi dan spesifisitas yang lebih besar.

    Berikut adalah contoh layar Evaluasi yang terisi dengan beberapa kasus uji:

    Layar Evaluasi Terisi

    Jika Anda memperbarui teks prompt asli Anda, Anda dapat menjalankan kembali seluruh suite eval terhadap prompt baru untuk melihat bagaimana perubahan mempengaruhi kinerja di semua kasus uji.

    Tips untuk Evaluasi yang Efektif

    Gunakan alat pembantu 'Generate a prompt' di Console untuk dengan cepat membuat prompt dengan sintaks variabel yang sesuai untuk evaluasi.

    Memahami dan membandingkan hasil

    Alat Evaluasi menawarkan beberapa fitur untuk membantu Anda menyempurnakan prompt Anda:

    1. Perbandingan berdampingan: Bandingkan output dari dua atau lebih prompt untuk dengan cepat melihat dampak perubahan Anda.
    2. Penilaian kualitas: Nilai kualitas respons pada skala 5 poin untuk melacak peningkatan kualitas respons per prompt.
    3. Versioning prompt: Buat versi baru prompt Anda dan jalankan kembali suite tes untuk dengan cepat melakukan iterasi dan meningkatkan hasil.

    Dengan meninjau hasil di seluruh kasus uji dan membandingkan versi prompt yang berbeda, Anda dapat mendeteksi pola dan membuat penyesuaian yang tepat pada prompt Anda dengan lebih efisien.

    Mulai evaluasi prompt Anda hari ini untuk membangun aplikasi AI yang lebih robust dengan Claude!

    Was this page helpful?

    • Mengakses Fitur Evaluasi
    • Menghasilkan Prompt
    • Membuat Kasus Uji
    • Tips untuk Evaluasi yang Efektif
    • Memahami dan membandingkan hasil