Effort
Parameter effort memungkinkan Anda mengontrol seberapa bersemangat Claude dalam menghabiskan token saat merespons permintaan. Ini memberi Anda kemampuan untuk menukar antara kelengkapan respons dan efisiensi token, semuanya dengan satu model.
Parameter effort saat ini dalam beta dan hanya didukung oleh Claude Opus 4.5.
Anda harus menyertakan header beta effort-2025-11-24 saat menggunakan fitur ini.
Cara kerja effort
Secara default, Claude menggunakan effort maksimum—menghabiskan sebanyak token yang diperlukan untuk memberikan respons yang menyeluruh. Dengan menurunkan tingkat effort, Anda dapat menginstruksikan Claude untuk lebih konservatif dengan penggunaan token, memperlakukan token sebagai sumber daya yang lebih mahal.
Mengatur effort ke "high" menghasilkan perilaku yang persis sama dengan menghilangkan parameter effort sepenuhnya.
Parameter effort mempengaruhi semua token dalam respons, termasuk:
- Respons teks dan penjelasan
- Panggilan alat dan argumen fungsi
- Pemikiran yang diperluas (saat diaktifkan)
Tingkat effort
| Level | Deskripsi | Kasus penggunaan umum |
|---|---|---|
high | Kelengkapan maksimum—Claude menggunakan sebanyak token yang diperlukan. Setara dengan tidak mengatur parameter. | Analisis kompleks, penjelasan terperinci, konten edukatif |
medium | Pendekatan seimbang dengan penghematan token moderat. | Sebagian besar kasus penggunaan produksi, aplikasi yang sadar biaya |
low | Respons paling efisien token. | Otomasi volume tinggi, kueri sederhana, saat respons diproses secara terprogram |
Penggunaan dasar
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)Parameter effort terutama mengontrol verbositas output dan kedalaman penjelasan, bukan kebenaran respons. Claude melakukan penalaran internal yang serupa terlepas dari tingkat effort tetapi menyesuaikan berapa banyak penalaran tersebut yang muncul dalam output.
Respons effort rendah
- Jawaban dinyatakan langsung dengan penjelasan minimal
- Respons ringkas dan efisien (1-2 kalimat konteks)
- Rumus ditampilkan tetapi tidak diturunkan
- Mengasumsikan pembaca dapat memverifikasi jawaban
- Konfirmasi singkat untuk penggunaan alat ("Selesai.", "Diperbaiki.")
Respons effort sedang
- Konteks singkat sebelum jawaban
- Justifikasi ringkas dengan langkah-langkah perantara kunci
- Mungkin menyertakan satu contoh yang dikerjakan
- Masih fokus pada efisiensi
Respons effort tinggi
- Terstruktur dengan header bagian
- Pengaturan masalah dan definisi variabel
- Proses solusi langkah demi langkah
- Verifikasi dan pemeriksaan akal sehat
- Format markdown yang kaya
Kasus penggunaan
Kapan menggunakan effort rendah
- Optimasi kecepatan: Jumlah token yang lebih rendah berarti waktu respons yang lebih cepat, bermanfaat untuk aplikasi yang sensitif terhadap latensi
- Pipeline otomatis: Saat respons diproses oleh kode daripada dibaca oleh manusia
- Aplikasi volume tinggi: Kurangi biaya pada kueri rutin dan sederhana
- Pengguna berpengalaman: Saat pengguna tidak memerlukan penjelasan terperinci
- Konfirmasi cepat: Respons ya/tidak atau status sederhana
Kapan menggunakan effort sedang
- API produksi: Keseimbangan kejelasan dan efisiensi biaya
- Aplikasi yang menghadap pengguna: Cukup konteks tanpa verbositas berlebihan
- Penerapan yang sadar biaya: Penghematan signifikan dengan dampak kualitas minimal
Kapan menggunakan effort tinggi (atau tidak ada parameter effort)
- Analisis kompleks: Saat kelengkapan sangat penting
- Konten edukatif: Saat pengguna perlu memahami penalaran
- Dokumentasi: Saat respons berfungsi sebagai materi referensi
- Debugging: Saat penjelasan terperinci membantu mengidentifikasi masalah
Effort dengan penggunaan alat
Saat menggunakan alat, parameter effort mempengaruhi penjelasan di sekitar panggilan alat dan panggilan alat itu sendiri. Tingkat effort yang lebih rendah cenderung:
- Menggabungkan beberapa operasi menjadi lebih sedikit panggilan alat
- Melanjutkan langsung ke tindakan tanpa pembukaan
- Menggunakan pesan konfirmasi singkat setelah penyelesaian
Tingkat effort yang lebih tinggi mungkin:
- Menjelaskan rencana sebelum mengambil tindakan
- Memberikan ringkasan perubahan yang terperinci
- Menyertakan komentar kode yang lebih komprehensif
Effort dengan pemikiran yang diperluas
Parameter effort bekerja bersama dengan anggaran token pemikiran saat pemikiran yang diperluas diaktifkan. Dua kontrol ini melayani tujuan yang berbeda:
- Parameter effort: Mengontrol bagaimana Claude menghabiskan semua token—termasuk token pemikiran, respons teks, dan panggilan alat
- Anggaran token pemikiran: Menetapkan batas maksimum pada token pemikiran secara khusus
Parameter effort dapat digunakan dengan atau tanpa pemikiran yang diperluas diaktifkan. Saat keduanya dikonfigurasi:
- Pertama tentukan tingkat effort yang sesuai untuk tugas Anda
- Kemudian atur anggaran token pemikiran berdasarkan kompleksitas tugas
Untuk kinerja terbaik pada tugas penalaran kompleks, gunakan effort tinggi (default) dengan anggaran token pemikiran tinggi. Ini memungkinkan Claude untuk berpikir secara menyeluruh dan memberikan respons yang komprehensif.
Praktik terbaik
-
Mulai dengan sedang: Untuk sebagian besar aplikasi, effort sedang memberikan keseimbangan yang baik antara kualitas dan efisiensi.
-
Gunakan rendah untuk otomasi: Saat respons dikonsumsi oleh kode daripada manusia, effort rendah dapat secara signifikan mengurangi biaya tanpa mempengaruhi kebenaran.
-
Uji kasus penggunaan Anda: Dampak tingkat effort bervariasi menurut jenis tugas. Evaluasi kinerja pada kasus penggunaan spesifik Anda sebelum menerapkan.
-
Pantau kualitas: Meskipun kebenaran umumnya dipertahankan di seluruh tingkat effort, kualitas penjelasan bervariasi. Pastikan tingkat yang Anda pilih memenuhi kebutuhan pengguna Anda.
-
Pertimbangkan effort dinamis: Sesuaikan effort berdasarkan kompleksitas tugas atau preferensi pengguna. Kueri sederhana mungkin memerlukan effort rendah sementara analisis kompleks mendapat manfaat dari effort tinggi.