Claude Sonnet 5 adalah generasi berikutnya dari keluarga model Sonnet milik Anthropic. Ini adalah peningkatan langsung (drop-in upgrade) untuk Claude Sonnet 4.6 dengan tiga perubahan perilaku: adaptive thinking (pemikiran adaptif) aktif secara default, pemikiran diperpanjang manual sekarang mengembalikan error 400 (fitur ini sudah di-deprecate pada Claude Sonnet 4.6), dan mengatur parameter sampling (temperature, top_p, top_k) ke nilai non-default akan mengembalikan error 400. Halaman ini merangkum semua yang baru pada saat peluncuran, termasuk tokenizer baru.
| Model | ID model API | Deskripsi |
|---|---|---|
| Claude Sonnet 5 | claude-sonnet-5 | Kombinasi terbaik antara kecepatan dan kecerdasan |
Claude Sonnet 5 mendukung jendela konteks 1 juta token secara default (1 juta token adalah nilai default sekaligus maksimum; tidak ada varian konteks yang lebih kecil), output maksimum 128k token, adaptive thinking, dan kumpulan alat serta fitur platform yang sama dengan Claude Sonnet 4.6, kecuali Priority Tier, yang tidak tersedia pada Claude Sonnet 5.
Untuk harga dan spesifikasi lengkap, lihat ikhtisar model.
Pada Claude Sonnet 4.6, permintaan tanpa field thinking berjalan tanpa pemikiran. Pada Claude Sonnet 5, permintaan yang sama berjalan dengan adaptive thinking. Untuk menonaktifkan pemikiran, kirimkan thinking: {type: "disabled"}. Karena max_tokens adalah batas keras pada total output (pemikiran ditambah teks respons), tinjau kembali nilainya untuk beban kerja yang sebelumnya berjalan tanpa pemikiran pada Claude Sonnet 4.6.
Mengatur temperature, top_p, atau top_k ke nilai non-default akan mengembalikan error 400. Hapus parameter ini saat melakukan migrasi; nilai default (atau menghilangkan parameter) tetap diterima. Gunakan instruksi prompt sistem untuk memandu perilaku model. Ini baru untuk model kelas Sonnet; batasan yang sama sebelumnya diperkenalkan pada Claude Opus 4.7.
Pemikiran diperpanjang manual (thinking: {type: "enabled", budget_tokens: N}) sudah di-deprecate pada Claude Sonnet 4.6; pada Claude Sonnet 5 fitur ini dihapus dan mengembalikan error 400, sama seperti pada Claude Opus 4.8 dan Claude Opus 4.7. Gunakan adaptive thinking dengan parameter effort sebagai gantinya.
# Tidak didukung pada Claude Sonnet 5 (mengembalikan 400)
thinking = {"type": "enabled", "budget_tokens": 32000}
# Gunakan ini sebagai gantinya
thinking = {"type": "adaptive"}Claude Sonnet 5 menggunakan tokenizer baru. Teks input yang sama menghasilkan sekitar 30% lebih banyak token dibandingkan pada Claude Sonnet 4.6. Ini bukan perubahan API: permintaan, respons, dan event streaming mempertahankan bentuk yang sama, dan tidak diperlukan perubahan kode.
Perubahan ini memengaruhi apa pun yang Anda ukur atau anggarkan dalam token:
usage dan hasil penghitungan token untuk teks yang sama lebih tinggi dibandingkan pada Claude Sonnet 4.6. Jangan gunakan kembali hitungan yang diukur terhadap model sebelumnya; hitung ulang terhadap Claude Sonnet 5.max_tokens: batas output yang disetel untuk Claude Sonnet 4.6 mungkin memotong output yang setara pada Claude Sonnet 5. Tinjau kembali batas yang ukurannya mendekati panjang output yang Anda harapkan.Batasan ini tidak berubah dari Claude Sonnet 4.6. Selain tiga perubahan perilaku (lihat Panduan migrasi), kode yang sudah berjalan pada Claude Sonnet 4.6 tidak memerlukan perubahan lain.
Melakukan prefilling pada pesan asisten akan mengembalikan error 400, tidak berubah dari Claude Sonnet 4.6. Gunakan structured outputs (output terstruktur), instruksi prompt sistem, atau output_config.format sebagai gantinya.
Claude Sonnet 5 adalah peningkatan kemampuan dibandingkan Claude Sonnet 4.6 dengan harga yang sama. Ini juga merupakan opsi untuk beban kerja yang membutuhkan kemampuan lebih dari yang disediakan Claude Sonnet 4.6 tanpa harus beralih ke model kelas Opus.
Peningkatan terbesar dibandingkan Claude Sonnet 4.6 ada pada tugas coding dan agentic. Untuk hasil benchmark, lihat Transparency Hub Anthropic.
Claude Sonnet 5 adalah model tingkat Sonnet pertama dengan pengamanan keamanan siber real-time. Permintaan yang melibatkan topik keamanan siber yang dilarang atau berisiko tinggi mungkin ditolak. Penolakan dikembalikan sebagai respons HTTP 200 yang berhasil dengan stop_reason: "refusal", bukan sebagai error. Lihat Safeguards, warnings, and appeals untuk latar belakangnya.
Claude Sonnet 5 dihargai $3 per juta token input dan $15 per juta token output, tidak berubah dari Claude Sonnet 4.6. Karena tokenizer baru menghasilkan sekitar 30% lebih banyak token untuk teks yang sama, biaya permintaan yang setara dapat berbeda dari Claude Sonnet 4.6 meskipun harga per token tidak berubah.
Harga perkenalan sebesar $2/$10 per juta token input/output berlaku hingga 31 Agustus 2026, setelah itu harga standar sebesar $3/$15 per juta token input/output akan berlaku.
Lihat Harga untuk harga lengkap, termasuk tarif batch processing dan caching prompt.
Pada saat peluncuran, Claude Sonnet 5 tersedia di:
InvokeModel dan Converse).Claude Sonnet 5 mendukung zero data retention (retensi data nol) untuk organisasi dengan perjanjian ZDR.
Claude Sonnet 5 adalah pengganti langsung (drop-in replacement) untuk Claude Sonnet 4.6. Perbarui ID model Anda:
model = "claude-sonnet-4-6" # Before
model = "claude-sonnet-5" # AfterKemudian tinjau hal-hal berikut:
max_tokens yang ukurannya mendekati panjang output yang Anda harapkan.budget_tokens, migrasikan ke adaptive thinking. Pemikiran diperpanjang manual (thinking: {type: "enabled"}) tidak didukung dan mengembalikan error 400.temperature, top_p, top_k) ke nilai non-default akan mengembalikan error 400; hapus parameter tersebut saat melakukan migrasi. Definisi alat dan bentuk respons tidak berubah, dan prefilling pesan asisten sudah tidak didukung pada Claude Sonnet 4.6.Lihat bagian Claude Sonnet 5 dalam panduan migrasi untuk detailnya.
Spesifikasi dan harga lengkap untuk semua model Claude saat ini.
Ukur prompt Anda dengan tokenizer baru sebelum Anda melakukan migrasi.
Mode pemikiran aktif yang direkomendasikan pada Claude Sonnet 5.
Cara kerja jendela konteks 1 juta token.
Harga lengkap, termasuk tarif batch processing dan caching prompt.
Was this page helpful?