Loading...
  • Bangun
  • Admin
  • Model & harga
  • Client SDK
  • Referensi API
Search...
⌘K
Log in
Upaya
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Bangun/Kemampuan model

Effort

Kontrol berapa banyak token yang digunakan Claude saat merespons dengan parameter effort, menukar antara kelengkapan respons dan efisiensi token.

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

Parameter effort memungkinkan Anda mengontrol seberapa bersemangat Claude dalam menghabiskan token saat merespons permintaan. Ini memberi Anda kemampuan untuk menukar antara kelengkapan respons dan efisiensi token, semuanya dengan satu model. Parameter effort secara umum tersedia di semua model yang didukung tanpa memerlukan header beta.

Parameter effort didukung oleh Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6, dan Claude Opus 4.5.

Untuk Claude Opus 4.6 dan Sonnet 4.6, effort menggantikan budget_tokens sebagai cara yang direkomendasikan untuk mengontrol kedalaman pemikiran. Gabungkan effort dengan adaptive thinking (thinking: {type: "adaptive"}) untuk pengalaman terbaik. Meskipun budget_tokens masih diterima di Opus 4.6 dan Sonnet 4.6, ini sudah usang dan akan dihapus dalam rilis model di masa depan. Pada effort high (default) dan max, Claude hampir selalu akan berpikir. Pada tingkat effort yang lebih rendah, mungkin akan melewati pemikiran untuk masalah yang lebih sederhana.

Cara effort bekerja

Secara default, Claude menggunakan high effort, menghabiskan sebanyak token yang diperlukan untuk hasil yang sangat baik. Anda dapat menaikkan tingkat effort ke max untuk kemampuan tertinggi yang mutlak, atau menurunkannya untuk lebih konservatif dengan penggunaan token, mengoptimalkan kecepatan dan biaya sambil menerima beberapa pengurangan dalam kemampuan.

Mengatur effort ke "high" menghasilkan perilaku yang persis sama dengan menghilangkan parameter effort sepenuhnya.

Parameter effort mempengaruhi semua token dalam respons, termasuk:

  • Respons teks dan penjelasan
  • Panggilan alat dan argumen fungsi
  • Pemikiran yang diperluas (ketika diaktifkan)

Pendekatan ini memiliki dua keuntungan utama:

  1. Tidak memerlukan pemikiran untuk diaktifkan agar dapat menggunakannya.
  2. Dapat mempengaruhi semua pengeluaran token termasuk panggilan alat. Misalnya, effort yang lebih rendah berarti Claude membuat lebih sedikit panggilan alat. Ini memberikan tingkat kontrol yang jauh lebih besar atas efisiensi.

Tingkat effort

LevelDeskripsiKasus penggunaan umum
maxKemampuan maksimum mutlak tanpa batasan pada pengeluaran token. Tersedia di Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, dan Claude Sonnet 4.6.Tugas yang memerlukan penalaran paling mendalam dan analisis paling menyeluruh
xhighKemampuan yang diperluas untuk pekerjaan jangka panjang. Tersedia di Claude Opus 4.7.Tugas agentic dan coding yang berjalan lama (lebih dari 30 menit) dengan anggaran token dalam jutaan
highKemampuan tinggi. Setara dengan tidak mengatur parameter.Penalaran kompleks, masalah coding yang sulit, tugas agentic
mediumPendekatan seimbang dengan penghematan token moderat.Tugas agentic yang memerlukan keseimbangan kecepatan, biaya, dan kinerja
lowPaling efisien. Penghematan token signifikan dengan beberapa pengurangan kemampuan.Tugas yang lebih sederhana yang membutuhkan kecepatan terbaik dan biaya terendah, seperti subagents

Effort adalah sinyal perilaku, bukan anggaran token yang ketat. Pada tingkat effort yang lebih rendah, Claude masih akan berpikir pada masalah yang cukup sulit, tetapi akan berpikir lebih sedikit daripada yang akan dilakukan pada tingkat effort yang lebih tinggi untuk masalah yang sama.

Tingkat effort yang direkomendasikan untuk Sonnet 4.6

Sonnet 4.6 default ke effort high. Atur effort secara eksplisit saat menggunakan Sonnet 4.6 untuk menghindari latensi yang tidak terduga:

  • Medium effort (default yang direkomendasikan): Keseimbangan terbaik antara kecepatan, biaya, dan kinerja untuk sebagian besar aplikasi. Cocok untuk coding agentic, alur kerja yang kaya alat, dan pembuatan kode.
  • Low effort: Untuk beban kerja dengan volume tinggi atau sensitif latensi. Cocok untuk chat dan kasus penggunaan non-coding di mana turnaround yang lebih cepat diprioritaskan.
  • High effort: Untuk tugas yang memerlukan intelijen maksimum dari Sonnet 4.6.
  • Max effort: Untuk tugas yang memerlukan kemampuan tertinggi yang mutlak tanpa batasan pada pengeluaran token.

Tingkat effort yang direkomendasikan untuk Claude Opus 4.7

Mulai dengan xhigh untuk kasus penggunaan coding dan agentic, dan gunakan high sebagai minimum untuk sebagian besar beban kerja yang sensitif terhadap intelijen. Turun ke medium untuk beban kerja yang sensitif terhadap biaya, atau naik ke max hanya ketika eval Anda menunjukkan ruang kepala yang terukur di xhigh.

Default API adalah high. Untuk menggunakan xhigh, atur effort secara eksplisit; nilai yang Anda berikan menggantikan default.

EffortPanduan untuk Claude Opus 4.7
lowEfisien, tetapi terbaik untuk tugas yang singkat dan terbatas. Pasangkan low dengan daftar periksa eksplisit jika tugas Anda memiliki beberapa bagian.
mediumPengganti untuk alur kerja rata-rata di mana Anda menginginkan hasil yang baik sambil mengurangi biaya.
highKasus penggunaan lanjutan yang masih memerlukan keseimbangan intelijen dan konsumsi token. Ini sering kali menjadi sweet spot yang menyeimbangkan kualitas dan efisiensi token.
xhighTitik awal yang direkomendasikan untuk pekerjaan coding dan agentic, dan untuk tugas eksplorasi seperti panggilan alat berulang, pencarian web terperinci, dan pencarian basis pengetahuan. Harapkan penggunaan token yang jauh lebih tinggi daripada high.
maxCadangkan untuk masalah perbatasan yang benar-benar asli. Pada sebagian besar beban kerja max menambah biaya signifikan untuk keuntungan kualitas yang relatif kecil, dan pada beberapa tugas output terstruktur atau kurang sensitif terhadap intelijen, dapat menyebabkan overthinking.

Claude Opus 4.7 juga menghormati tingkat effort lebih ketat daripada Claude Opus 4.6, terutama di low dan medium. Pada tingkat effort yang lebih rendah, model membatasi pekerjaan ke apa yang diminta daripada melampaui. Jika Anda mengamati penalaran dangkal pada masalah kompleks dengan Claude Opus 4.7, naikkan effort daripada meminta di sekitarnya. Jika Anda harus menjaga effort tetap rendah untuk latensi, tambahkan panduan yang ditargetkan seperti "Tugas ini melibatkan penalaran multi-langkah. Pikirkan dengan hati-hati sebelum merespons."

Saat menjalankan Claude Opus 4.7 pada effort xhigh atau max, atur max_tokens yang besar sehingga model memiliki ruang untuk berpikir dan bertindak di seluruh subagents dan panggilan alat. Mulai dari 64k token dan menyesuaikan dari sana adalah default yang masuk akal.

Penggunaan dasar

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures",
        }
    ],
    output_config={"effort": "medium"},
)

print(response.content[0].text)

Kapan menyesuaikan parameter effort

  • Gunakan max effort ketika Anda memerlukan kemampuan tertinggi yang mutlak tanpa batasan: penalaran paling menyeluruh dan analisis paling mendalam. Tersedia di Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, dan Claude Sonnet 4.6.
  • Gunakan xhigh effort untuk pekerjaan coding lanjutan dan agentic kompleks yang memerlukan eksplorasi yang diperluas, seperti panggilan alat berulang dan pencarian terperinci. Tersedia di Claude Opus 4.7.
  • Gunakan high effort (default) ketika Anda memerlukan pekerjaan terbaik Claude: penalaran kompleks, analisis bernuansa, masalah coding yang sulit, atau tugas apa pun di mana kualitas adalah prioritas utama.
  • Gunakan medium effort sebagai opsi seimbang ketika Anda menginginkan kinerja solid tanpa pengeluaran token penuh dari high effort.
  • Gunakan low effort ketika Anda mengoptimalkan untuk kecepatan (karena Claude menjawab dengan lebih sedikit token) atau biaya. Misalnya, tugas klasifikasi sederhana, pencarian cepat, atau kasus penggunaan volume tinggi di mana peningkatan kualitas marginal tidak membenarkan latensi atau pengeluaran tambahan.

Effort dengan penggunaan alat

Saat menggunakan alat, parameter effort mempengaruhi penjelasan di sekitar panggilan alat dan panggilan alat itu sendiri. Tingkat effort yang lebih rendah cenderung:

  • Menggabungkan beberapa operasi menjadi lebih sedikit panggilan alat
  • Membuat lebih sedikit panggilan alat
  • Melanjutkan langsung ke tindakan tanpa pembukaan
  • Menggunakan pesan konfirmasi yang ringkas setelah penyelesaian

Tingkat effort yang lebih tinggi mungkin:

  • Membuat lebih banyak panggilan alat
  • Menjelaskan rencana sebelum mengambil tindakan
  • Memberikan ringkasan perubahan yang terperinci
  • Menyertakan komentar kode yang lebih komprehensif

Effort dengan pemikiran yang diperluas

Parameter effort bekerja bersama pemikiran yang diperluas. Perilakunya tergantung pada model:

  • Claude Mythos Preview menggunakan adaptive thinking secara default (tidak ada konfigurasi thinking yang diperlukan). thinking: {type: "disabled"} ditolak. Effort mengontrol kedalaman pemikiran dengan cara yang sama seperti di Opus 4.7 dan Opus 4.6.
  • Claude Opus 4.7 menggunakan adaptive thinking (thinking: {type: "adaptive"}), di mana effort adalah kontrol yang direkomendasikan untuk kedalaman pemikiran. Pemikiran yang diperluas manual (thinking: {type: "enabled", budget_tokens: N}) tidak lagi didukung di Opus 4.7; gunakan adaptive thinking dengan effort sebagai gantinya. Pada effort high, xhigh, dan max, Claude hampir selalu berpikir mendalam. Pada tingkat yang lebih rendah, mungkin akan melewati pemikiran untuk masalah yang lebih sederhana.
  • Claude Opus 4.6 menggunakan adaptive thinking (thinking: {type: "adaptive"}), di mana effort adalah kontrol yang direkomendasikan untuk kedalaman pemikiran. Meskipun budget_tokens masih diterima di Opus 4.6, ini sudah usang dan akan dihapus dalam rilis di masa depan. Pada effort high dan max, Claude hampir selalu berpikir mendalam. Pada tingkat yang lebih rendah, mungkin akan melewati pemikiran untuk masalah yang lebih sederhana.
  • Claude Sonnet 4.6 menggunakan adaptive thinking (di mana effort mengontrol kedalaman pemikiran). Pemikiran manual dengan interleaved mode (thinking: {type: "enabled", budget_tokens: N}) masih berfungsi tetapi sudah usang.
  • Claude Opus 4.5 dan model Claude 4 lainnya menggunakan pemikiran manual (thinking: {type: "enabled", budget_tokens: N}), di mana effort bekerja bersama anggaran token pemikiran. Atur tingkat effort untuk tugas Anda, kemudian atur anggaran token pemikiran berdasarkan kompleksitas tugas.

Parameter effort dapat digunakan dengan atau tanpa pemikiran yang diperluas diaktifkan. Ketika digunakan tanpa pemikiran, itu masih mengontrol pengeluaran token keseluruhan untuk respons teks dan panggilan alat.

Praktik terbaik

  1. Atur effort secara eksplisit: API default ke high, tetapi titik awal yang tepat tergantung pada model dan beban kerja Anda.
  2. Gunakan low untuk tugas yang sensitif terhadap kecepatan atau sederhana: Ketika latensi penting atau tugas sederhana, low effort dapat secara signifikan mengurangi waktu respons dan biaya.
  3. Uji kasus penggunaan Anda: Dampak tingkat effort bervariasi menurut jenis tugas. Evaluasi kinerja pada kasus penggunaan spesifik Anda sebelum melakukan deployment.
  4. Pertimbangkan effort dinamis: Sesuaikan effort berdasarkan kompleksitas tugas. Kueri sederhana mungkin memerlukan low effort sementara coding agentic dan penalaran kompleks mendapat manfaat dari high effort.

Was this page helpful?

  • Cara effort bekerja
  • Tingkat effort
  • Tingkat effort yang direkomendasikan untuk Sonnet 4.6
  • Tingkat effort yang direkomendasikan untuk Claude Opus 4.7
  • Penggunaan dasar
  • Kapan menyesuaikan parameter effort
  • Effort dengan penggunaan alat
  • Effort dengan pemikiran yang diperluas
  • Praktik terbaik