Parameter effort memungkinkan Anda mengontrol seberapa bersemangat Claude dalam menghabiskan token saat merespons permintaan. Ini memberi Anda kemampuan untuk menukar antara kelengkapan respons dan efisiensi token, semuanya dengan satu model.
Parameter effort saat ini dalam beta dan hanya didukung oleh Claude Opus 4.5.
Anda harus menyertakan beta header effort-2025-11-24 saat menggunakan fitur ini.
Secara default, Claude menggunakan effort maksimum—menghabiskan sebanyak token yang diperlukan untuk hasil terbaik yang mungkin. Dengan menurunkan tingkat effort, Anda dapat menginstruksikan Claude untuk lebih konservatif dengan penggunaan token, mengoptimalkan kecepatan dan biaya sambil menerima beberapa pengurangan dalam kemampuan.
Mengatur effort ke "high" menghasilkan perilaku yang persis sama dengan menghilangkan parameter effort sepenuhnya.
Parameter effort mempengaruhi semua token dalam respons, termasuk:
Pendekatan ini memiliki dua keuntungan utama:
| Level | Deskripsi | Kasus penggunaan umum |
|---|---|---|
high | Kemampuan maksimum. Claude menggunakan sebanyak token yang diperlukan untuk hasil terbaik yang mungkin. Setara dengan tidak mengatur parameter. | Penalaran kompleks, masalah coding yang sulit, tugas agentic |
medium | Pendekatan seimbang dengan penghematan token sedang. | Tugas agentic yang memerlukan keseimbangan kecepatan, biaya, dan kinerja |
low | Paling efisien. Penghematan token yang signifikan dengan beberapa pengurangan kemampuan. | Tugas yang lebih sederhana yang membutuhkan kecepatan terbaik dan biaya terendah, seperti subagents |
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)Saat menggunakan alat, parameter effort mempengaruhi penjelasan di sekitar panggilan alat dan panggilan alat itu sendiri. Tingkat effort yang lebih rendah cenderung:
Tingkat effort yang lebih tinggi mungkin:
Parameter effort bekerja bersama dengan anggaran token pemikiran ketika pemikiran yang diperluas diaktifkan. Kedua kontrol ini melayani tujuan yang berbeda:
Parameter effort dapat digunakan dengan atau tanpa pemikiran yang diperluas diaktifkan. Ketika keduanya dikonfigurasi:
Untuk kinerja terbaik pada tugas penalaran kompleks, gunakan high effort (default) dengan anggaran token pemikiran yang tinggi. Ini memungkinkan Claude untuk berpikir secara menyeluruh dan memberikan respons yang komprehensif.