Loading...
    • Panduan Pengembang
    • Referensi API
    • MCP
    • Sumber daya
    • Catatan Rilis
    Search...
    ⌘K
    Langkah pertama
    Pengenalan ClaudeMulai cepat
    Model & harga
    Ikhtisar modelMemilih modelYang baru di Claude 4.5Migrasi ke Claude 4.5Penghentian modelHarga
    Bangun dengan Claude
    Ikhtisar fiturMenggunakan Messages APIJendela konteksPraktik terbaik prompting
    Kemampuan
    Prompt cachingPengeditan konteksExtended thinkingUpayaStreaming MessagesPemrosesan batchKutipanDukungan multibahasaPenghitungan tokenEmbeddingsVisiDukungan PDFFiles APIHasil pencarianOutput terstruktur
    Alat
    IkhtisarCara mengimplementasikan penggunaan alatStreaming alat berbutir halusAlat BashAlat eksekusi kodePemanggilan alat terprogramAlat penggunaan komputerAlat editor teksAlat pengambilan webAlat pencarian webAlat memoriAlat pencarian alat
    Keterampilan Agen
    IkhtisarMulai cepatPraktik terbaikMenggunakan Keterampilan dengan API
    Agent SDK
    IkhtisarMulai cepatTypeScript SDKTypeScript V2 (pratinjau)Python SDKPanduan Migrasi
    MCP di API
    Konektor MCPServer MCP jarak jauh
    Claude di platform pihak ketiga
    Amazon BedrockMicrosoft FoundryVertex AI
    Rekayasa prompt
    IkhtisarGenerator promptGunakan template promptPenyempurna promptJadilah jelas dan langsungGunakan contoh (multishot prompting)Biarkan Claude berpikir (CoT)Gunakan tag XMLBerikan Claude peran (prompt sistem)Isi sebelumnya respons ClaudeRantai prompt kompleksTips konteks panjangTips extended thinking
    Uji & evaluasi
    Tentukan kriteria kesuksesanKembangkan kasus ujiMenggunakan Alat EvaluasiMengurangi latensi
    Perkuat penjaga
    Kurangi halusinasiTingkatkan konsistensi outputMitigasi jailbreakStreaming penolakanKurangi kebocoran promptJaga Claude tetap dalam karakter
    Administrasi dan pemantauan
    Ikhtisar Admin APIAPI Penggunaan dan BiayaClaude Code Analytics API
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Kemampuan

    Effort

    Kontrol berapa banyak token yang digunakan Claude saat merespons dengan parameter effort, menukar antara kelengkapan respons dan efisiensi token.

    Parameter effort memungkinkan Anda mengontrol seberapa bersemangat Claude dalam menghabiskan token saat merespons permintaan. Ini memberi Anda kemampuan untuk menukar antara kelengkapan respons dan efisiensi token, semuanya dengan satu model.

    Parameter effort saat ini dalam beta dan hanya didukung oleh Claude Opus 4.5.

    Anda harus menyertakan beta header effort-2025-11-24 saat menggunakan fitur ini.

    Cara kerja effort

    Secara default, Claude menggunakan effort maksimum—menghabiskan sebanyak token yang diperlukan untuk hasil terbaik yang mungkin. Dengan menurunkan tingkat effort, Anda dapat menginstruksikan Claude untuk lebih konservatif dengan penggunaan token, mengoptimalkan kecepatan dan biaya sambil menerima beberapa pengurangan dalam kemampuan.

    Mengatur effort ke "high" menghasilkan perilaku yang persis sama dengan menghilangkan parameter effort sepenuhnya.

    Parameter effort mempengaruhi semua token dalam respons, termasuk:

    • Respons teks dan penjelasan
    • Panggilan alat dan argumen fungsi
    • Pemikiran yang diperluas (saat diaktifkan)

    Pendekatan ini memiliki dua keuntungan utama:

    1. Tidak memerlukan pemikiran untuk diaktifkan agar dapat menggunakannya.
    • Cara kerja effort
    • Tingkat effort
    • Penggunaan dasar
    • Kapan saya harus menyesuaikan parameter effort?
    • Effort dengan penggunaan alat
    • Effort dengan pemikiran yang diperluas
    • Praktik terbaik
  1. Dapat mempengaruhi semua pengeluaran token termasuk panggilan alat. Misalnya, effort yang lebih rendah berarti Claude membuat lebih sedikit panggilan alat. Ini memberikan tingkat kontrol yang jauh lebih besar atas efisiensi.
  2. Tingkat effort

    LevelDeskripsiKasus penggunaan umum
    highKemampuan maksimum. Claude menggunakan sebanyak token yang diperlukan untuk hasil terbaik yang mungkin. Setara dengan tidak mengatur parameter.Penalaran kompleks, masalah coding yang sulit, tugas agentic
    mediumPendekatan seimbang dengan penghematan token sedang.Tugas agentic yang memerlukan keseimbangan kecepatan, biaya, dan kinerja
    lowPaling efisien. Penghematan token yang signifikan dengan beberapa pengurangan kemampuan.Tugas yang lebih sederhana yang membutuhkan kecepatan terbaik dan biaya terendah, seperti subagents

    Penggunaan dasar

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.beta.messages.create(
        model="claude-opus-4-5-20251101",
        betas=["effort-2025-11-24"],
        max_tokens=4096,
        messages=[{
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures"
        }],
        output_config={
            "effort": "medium"
        }
    )
    
    print(response.content[0].text)

    Kapan saya harus menyesuaikan parameter effort?

    • Gunakan high effort (default) ketika Anda membutuhkan pekerjaan terbaik Claude—penalaran kompleks, analisis bernuansa, masalah coding yang sulit, atau tugas apa pun di mana kualitas adalah prioritas utama.
    • Gunakan medium effort sebagai opsi seimbang ketika Anda menginginkan kinerja solid tanpa pengeluaran token penuh dari high effort.
    • Gunakan low effort ketika Anda mengoptimalkan untuk kecepatan (karena Claude menjawab dengan lebih sedikit token) atau biaya—misalnya, tugas klasifikasi sederhana, pencarian cepat, atau kasus penggunaan volume tinggi di mana peningkatan kualitas marginal tidak membenarkan latensi atau pengeluaran tambahan.

    Effort dengan penggunaan alat

    Saat menggunakan alat, parameter effort mempengaruhi penjelasan di sekitar panggilan alat dan panggilan alat itu sendiri. Tingkat effort yang lebih rendah cenderung:

    • Menggabungkan beberapa operasi menjadi lebih sedikit panggilan alat
    • Membuat lebih sedikit panggilan alat
    • Melanjutkan langsung ke tindakan tanpa pembukaan
    • Menggunakan pesan konfirmasi yang ringkas setelah penyelesaian

    Tingkat effort yang lebih tinggi mungkin:

    • Membuat lebih banyak panggilan alat
    • Menjelaskan rencana sebelum mengambil tindakan
    • Memberikan ringkasan perubahan yang terperinci
    • Menyertakan komentar kode yang lebih komprehensif

    Effort dengan pemikiran yang diperluas

    Parameter effort bekerja bersama dengan anggaran token pemikiran ketika pemikiran yang diperluas diaktifkan. Kedua kontrol ini melayani tujuan yang berbeda:

    • Parameter effort: Mengontrol bagaimana Claude menghabiskan semua token—termasuk token pemikiran, respons teks, dan panggilan alat
    • Anggaran token pemikiran: Menetapkan batas maksimum pada token pemikiran secara khusus

    Parameter effort dapat digunakan dengan atau tanpa pemikiran yang diperluas diaktifkan. Ketika keduanya dikonfigurasi:

    1. Pertama tentukan tingkat effort yang sesuai untuk tugas Anda
    2. Kemudian atur anggaran token pemikiran berdasarkan kompleksitas tugas

    Untuk kinerja terbaik pada tugas penalaran kompleks, gunakan high effort (default) dengan anggaran token pemikiran yang tinggi. Ini memungkinkan Claude untuk berpikir secara menyeluruh dan memberikan respons yang komprehensif.

    Praktik terbaik

    1. Mulai dengan high: Gunakan tingkat effort yang lebih rendah untuk menukar kinerja dengan efisiensi token.
    2. Gunakan low untuk tugas yang sensitif terhadap kecepatan atau sederhana: Ketika latensi penting atau tugas sederhana, low effort dapat secara signifikan mengurangi waktu respons dan biaya.
    3. Uji kasus penggunaan Anda: Dampak tingkat effort bervariasi menurut jenis tugas. Evaluasi kinerja pada kasus penggunaan spesifik Anda sebelum menerapkan.
    4. Pertimbangkan effort dinamis: Sesuaikan effort berdasarkan kompleksitas tugas. Kueri sederhana mungkin memerlukan low effort sementara coding agentic dan penalaran kompleks mendapat manfaat dari high effort.