Claude 4.6 mewakili generasi berikutnya dari model Claude, membawa kemampuan baru yang signifikan dan peningkatan API. Halaman ini merangkum semua fitur baru yang tersedia saat peluncuran.
| Model | API model ID | Deskripsi |
|---|---|---|
| Claude Opus 4.6 | claude-opus-4-6 | Model paling cerdas kami untuk membangun agen dan coding |
Claude Opus 4.6 mendukung jendela konteks 200K (dengan jendela konteks token 1M tersedia dalam beta), token output maksimal 128K, pemikiran yang diperluas, dan semua fitur Claude API yang ada.
Untuk harga lengkap dan spesifikasi, lihat gambaran umum model.
Pemikiran adaptif (thinking: {type: "adaptive"}) adalah mode pemikiran yang direkomendasikan untuk Opus 4.6. Claude secara dinamis memutuskan kapan dan berapa banyak untuk berpikir. Pada tingkat upaya default (high), Claude hampir selalu akan berpikir. Pada tingkat upaya yang lebih rendah, mungkin melewati pemikiran untuk masalah yang lebih sederhana.
thinking: {type: "enabled"} dan budget_tokens adalah deprecated pada Opus 4.6. Mereka tetap berfungsi tetapi akan dihapus dalam rilis model di masa depan. Gunakan pemikiran adaptif dan parameter upaya untuk mengontrol kedalaman pemikiran sebagai gantinya. Pemikiran adaptif juga secara otomatis mengaktifkan pemikiran yang tersisip.
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
messages=[{"role": "user", "content": "Solve this complex problem..."}]
)Parameter upaya sekarang tersedia secara umum (tidak diperlukan header beta). Tingkat upaya max baru memberikan kemampuan tertinggi mutlak pada Opus 4.6. Gabungkan upaya dengan pemikiran adaptif untuk pertukaran biaya-kualitas yang optimal.
Compaction menyediakan ringkasan konteks otomatis di sisi server, memungkinkan percakapan yang efektif tak terbatas. Ketika konteks mendekati batas jendela, API secara otomatis merangkum bagian-bagian sebelumnya dari percakapan.
Fine-grained tool streaming sekarang tersedia secara umum di semua model dan platform. Tidak diperlukan header beta.
Opus 4.6 mendukung hingga 128K token output, menggandakan batas sebelumnya 64K. Ini memungkinkan anggaran pemikiran yang lebih panjang dan respons yang lebih komprehensif. SDK memerlukan streaming untuk permintaan dengan nilai max_tokens besar untuk menghindari timeout HTTP. Jika Anda tidak perlu memproses acara secara bertahap, gunakan .stream() dengan .get_final_message() untuk mendapatkan respons lengkap — lihat Streaming Messages untuk detail.
Kontrol residensi data memungkinkan Anda menentukan di mana inferensi model berjalan menggunakan parameter inference_geo. Anda dapat memilih routing "global" (default) atau "us" per permintaan. Inferensi hanya AS dikenakan harga 1,1x pada Claude Opus 4.6 dan model yang lebih baru.
type: "enabled" dan budget_tokensthinking: {type: "enabled", budget_tokens: N} adalah deprecated pada Opus 4.6. Ini tetap berfungsi tetapi akan dihapus dalam rilis model di masa depan. Migrasi ke thinking: {type: "adaptive"} dengan parameter upaya.
interleaved-thinking-2025-05-14Header beta interleaved-thinking-2025-05-14 adalah deprecated pada Opus 4.6. Ini dengan aman diabaikan jika disertakan, tetapi tidak lagi diperlukan. Pemikiran adaptif secara otomatis mengaktifkan pemikiran yang tersisip. Hapus betas=["interleaved-thinking-2025-05-14"] dari permintaan Anda saat menggunakan Opus 4.6.
output_formatParameter output_format untuk structured outputs telah dipindahkan ke output_config.format. Parameter lama tetap berfungsi tetapi deprecated dan akan dihapus dalam rilis model di masa depan.
# Before
response = client.messages.create(
output_format={"type": "json_schema", "schema": {...}},
...
)
# After
response = client.messages.create(
output_config={"format": {"type": "json_schema", "schema": {...}}},
...
)Prefilling pesan asisten (prefill giliran asisten terakhir) tidak didukung pada Opus 4.6. Permintaan dengan pesan asisten yang sudah diisi sebelumnya mengembalikan kesalahan 400.
Alternatif:
output_config.format untuk output JSONOpus 4.6 mungkin menghasilkan escaping string JSON yang sedikit berbeda dalam argumen panggilan tool (misalnya, penanganan Unicode escapes atau forward slash escaping yang berbeda). Parser JSON standar menangani perbedaan ini secara otomatis. Jika Anda mengurai input panggilan tool sebagai string mentah daripada menggunakan json.loads() atau JSON.parse(), verifikasi logika parsing Anda masih berfungsi.
Untuk instruksi migrasi langkah demi langkah, lihat Migrasi ke Claude 4.6.
Pelajari cara menggunakan mode pemikiran adaptif.
Bandingkan semua model Claude.
Jelajahi compaction konteks di sisi server.
Instruksi migrasi langkah demi langkah.
Was this page helpful?