Model & hargaModel

Apa yang baru di Claude Sonnet 5

Ikhtisar fitur baru dan perubahan perilaku di Claude Sonnet 5.

Claude Sonnet 5 adalah generasi berikutnya dari keluarga model Sonnet milik Anthropic. Ini adalah peningkatan langsung (drop-in upgrade) untuk Claude Sonnet 4.6 dengan tiga perubahan perilaku: adaptive thinking (pemikiran adaptif) aktif secara default, pemikiran diperpanjang manual sekarang mengembalikan error 400 (fitur ini sudah di-deprecate pada Claude Sonnet 4.6), dan mengatur parameter sampling (temperature, top_p, top_k) ke nilai non-default akan mengembalikan error 400. Halaman ini merangkum semua yang baru pada saat peluncuran, termasuk tokenizer baru.

Model baru

Model	ID model API	Deskripsi
Claude Sonnet 5	`claude-sonnet-5`	Kombinasi terbaik antara kecepatan dan kecerdasan

Claude Sonnet 5 mendukung jendela konteks 1 juta token secara default (1 juta token adalah nilai default sekaligus maksimum; tidak ada varian konteks yang lebih kecil), output maksimum 128k token, adaptive thinking, dan kumpulan alat serta fitur platform yang sama dengan Claude Sonnet 4.6, kecuali Priority Tier, yang tidak tersedia pada Claude Sonnet 5.

Untuk harga dan spesifikasi lengkap, lihat ikhtisar model.

Perubahan perilaku

Adaptive thinking aktif secara default

Pada Claude Sonnet 4.6, permintaan tanpa field thinking berjalan tanpa pemikiran. Pada Claude Sonnet 5, permintaan yang sama berjalan dengan adaptive thinking. Untuk menonaktifkan pemikiran, kirimkan thinking: {type: "disabled"}. Karena max_tokens adalah batas keras pada total output (pemikiran ditambah teks respons), tinjau kembali nilainya untuk beban kerja yang sebelumnya berjalan tanpa pemikiran pada Claude Sonnet 4.6.

Parameter sampling tidak diterima

Mengatur temperature, top_p, atau top_k ke nilai non-default akan mengembalikan error 400. Hapus parameter ini saat melakukan migrasi; nilai default (atau menghilangkan parameter) tetap diterima. Gunakan instruksi prompt sistem untuk memandu perilaku model. Ini baru untuk model kelas Sonnet; batasan yang sama sebelumnya diperkenalkan pada Claude Opus 4.7.

Pemikiran diperpanjang manual dihapus

Pemikiran diperpanjang manual (thinking: {type: "enabled", budget_tokens: N}) sudah di-deprecate pada Claude Sonnet 4.6; pada Claude Sonnet 5 fitur ini dihapus dan mengembalikan error 400, sama seperti pada Claude Opus 4.8 dan Claude Opus 4.7. Gunakan adaptive thinking dengan parameter effort sebagai gantinya.

Python

# Tidak didukung pada Claude Sonnet 5 (mengembalikan 400)
thinking = {"type": "enabled", "budget_tokens": 32000}

# Gunakan ini sebagai gantinya
thinking = {"type": "adaptive"}

Tokenizer baru

Claude Sonnet 5 menggunakan tokenizer baru. Teks input yang sama menghasilkan sekitar 30% lebih banyak token dibandingkan pada Claude Sonnet 4.6. Ini bukan perubahan API: permintaan, respons, dan event streaming mempertahankan bentuk yang sama, dan tidak diperlukan perubahan kode.

Perubahan ini memengaruhi apa pun yang Anda ukur atau anggarkan dalam token:

Jumlah token: field usage dan hasil penghitungan token untuk teks yang sama lebih tinggi dibandingkan pada Claude Sonnet 4.6. Jangan gunakan kembali hitungan yang diukur terhadap model sebelumnya; hitung ulang terhadap Claude Sonnet 5.
Kapasitas jendela konteks dalam satuan teks: jendela konteks adalah 1 juta token, tetapi setiap token rata-rata mencakup lebih sedikit teks, sehingga jendela yang sama menampung lebih sedikit teks dibandingkan pada Claude Sonnet 4.6.
Anggaran max_tokens: batas output yang disetel untuk Claude Sonnet 4.6 mungkin memotong output yang setara pada Claude Sonnet 5. Tinjau kembali batas yang ukurannya mendekati panjang output yang Anda harapkan.
Biaya per permintaan: harga per token tidak berubah (lihat Harga), tetapi karena teks yang sama menghasilkan lebih banyak token, biaya permintaan yang setara dapat berbeda dari Claude Sonnet 4.6.

Batasan API yang diwarisi dari Claude Sonnet 4.6

Batasan ini tidak berubah dari Claude Sonnet 4.6. Selain tiga perubahan perilaku (lihat Panduan migrasi), kode yang sudah berjalan pada Claude Sonnet 4.6 tidak memerlukan perubahan lain.

Prefilling pesan asisten tidak didukung

Melakukan prefilling pada pesan asisten akan mengembalikan error 400, tidak berubah dari Claude Sonnet 4.6. Gunakan structured outputs (output terstruktur), instruksi prompt sistem, atau output_config.format sebagai gantinya.

Peningkatan kemampuan

Claude Sonnet 5 adalah peningkatan kemampuan dibandingkan Claude Sonnet 4.6 dengan harga yang sama. Ini juga merupakan opsi untuk beban kerja yang membutuhkan kemampuan lebih dari yang disediakan Claude Sonnet 4.6 tanpa harus beralih ke model kelas Opus.

Peningkatan terbesar dibandingkan Claude Sonnet 4.6 ada pada tugas coding dan agentic. Untuk hasil benchmark, lihat Transparency Hub Anthropic.

Pengamanan keamanan siber

Claude Sonnet 5 adalah model tingkat Sonnet pertama dengan pengamanan keamanan siber real-time. Permintaan yang melibatkan topik keamanan siber yang dilarang atau berisiko tinggi mungkin ditolak. Penolakan dikembalikan sebagai respons HTTP 200 yang berhasil dengan stop_reason: "refusal", bukan sebagai error. Lihat Safeguards, warnings, and appeals untuk latar belakangnya.

Harga

Claude Sonnet 5 dihargai $3 per juta token input dan $15 per juta token output, tidak berubah dari Claude Sonnet 4.6. Karena tokenizer baru menghasilkan sekitar 30% lebih banyak token untuk teks yang sama, biaya permintaan yang setara dapat berbeda dari Claude Sonnet 4.6 meskipun harga per token tidak berubah.

Harga perkenalan sebesar $2/$10 per juta token input/output berlaku hingga 31 Agustus 2026, setelah itu harga standar sebesar $3/$15 per juta token input/output akan berlaku.

Lihat Harga untuk harga lengkap, termasuk tarif batch processing dan caching prompt.

Ketersediaan

Pada saat peluncuran, Claude Sonnet 5 tersedia di:

Claude API: tersedia untuk semua pelanggan.
AWS: tersedia melalui Claude in Amazon Bedrock dan Claude Platform on AWS. Claude Sonnet 5 tidak tersedia di Claude on Amazon Bedrock (legacy) (API InvokeModel dan Converse).
Google Cloud: tersedia melalui Claude on Google Cloud.
Microsoft Foundry (pratinjau): tersedia melalui Claude in Microsoft Foundry.

Claude Sonnet 5 mendukung zero data retention (retensi data nol) untuk organisasi dengan perjanjian ZDR.

Panduan migrasi

Claude Sonnet 5 adalah pengganti langsung (drop-in replacement) untuk Claude Sonnet 4.6. Perbarui ID model Anda:

model = "claude-sonnet-4-6"  # Before
model = "claude-sonnet-5"  # After

Kemudian tinjau hal-hal berikut:

Anggaran dan jumlah token: tokenizer baru menghasilkan sekitar 30% lebih banyak token untuk teks yang sama. Hitung ulang prompt dengan penghitungan token, dan tinjau kembali batas max_tokens yang ukurannya mendekati panjang output yang Anda harapkan.
Pemikiran diperpanjang: jika Anda masih mengatur budget_tokens, migrasikan ke adaptive thinking. Pemikiran diperpanjang manual (thinking: {type: "enabled"}) tidak didukung dan mengembalikan error 400.
Parameter sampling: permintaan yang mengatur parameter sampling (temperature, top_p, top_k) ke nilai non-default akan mengembalikan error 400; hapus parameter tersebut saat melakukan migrasi. Definisi alat dan bentuk respons tidak berubah, dan prefilling pesan asisten sudah tidak didukung pada Claude Sonnet 4.6.

Lihat bagian Claude Sonnet 5 dalam panduan migrasi untuk detailnya.

Langkah selanjutnya

Ikhtisar model

Spesifikasi dan harga lengkap untuk semua model Claude saat ini.

Penghitungan token

Ukur prompt Anda dengan tokenizer baru sebelum Anda melakukan migrasi.

Adaptive thinking

Mode pemikiran aktif yang direkomendasikan pada Claude Sonnet 5.

Jendela konteks

Cara kerja jendela konteks 1 juta token.

Harga

Harga lengkap, termasuk tarif batch processing dan caching prompt.

Was this page helpful?

Model & hargaModel

Apa yang baru di Claude Sonnet 5

Ikhtisar fitur baru dan perubahan perilaku di Claude Sonnet 5.

Model baru

Model	ID model API	Deskripsi
Claude Sonnet 5	`claude-sonnet-5`	Kombinasi terbaik antara kecepatan dan kecerdasan

Untuk harga dan spesifikasi lengkap, lihat ikhtisar model.

Perubahan perilaku

Adaptive thinking aktif secara default

Parameter sampling tidak diterima

Pemikiran diperpanjang manual dihapus

Python

# Tidak didukung pada Claude Sonnet 5 (mengembalikan 400)
thinking = {"type": "enabled", "budget_tokens": 32000}

# Gunakan ini sebagai gantinya
thinking = {"type": "adaptive"}

Tokenizer baru

Perubahan ini memengaruhi apa pun yang Anda ukur atau anggarkan dalam token:

Jumlah token: field usage dan hasil penghitungan token untuk teks yang sama lebih tinggi dibandingkan pada Claude Sonnet 4.6. Jangan gunakan kembali hitungan yang diukur terhadap model sebelumnya; hitung ulang terhadap Claude Sonnet 5.
Kapasitas jendela konteks dalam satuan teks: jendela konteks adalah 1 juta token, tetapi setiap token rata-rata mencakup lebih sedikit teks, sehingga jendela yang sama menampung lebih sedikit teks dibandingkan pada Claude Sonnet 4.6.
Anggaran max_tokens: batas output yang disetel untuk Claude Sonnet 4.6 mungkin memotong output yang setara pada Claude Sonnet 5. Tinjau kembali batas yang ukurannya mendekati panjang output yang Anda harapkan.
Biaya per permintaan: harga per token tidak berubah (lihat Harga), tetapi karena teks yang sama menghasilkan lebih banyak token, biaya permintaan yang setara dapat berbeda dari Claude Sonnet 4.6.

Batasan API yang diwarisi dari Claude Sonnet 4.6

Batasan ini tidak berubah dari Claude Sonnet 4.6. Selain tiga perubahan perilaku (lihat Panduan migrasi), kode yang sudah berjalan pada Claude Sonnet 4.6 tidak memerlukan perubahan lain.

Prefilling pesan asisten tidak didukung

Peningkatan kemampuan

Peningkatan terbesar dibandingkan Claude Sonnet 4.6 ada pada tugas coding dan agentic. Untuk hasil benchmark, lihat Transparency Hub Anthropic.

Pengamanan keamanan siber

Harga

Harga perkenalan sebesar $2/$10 per juta token input/output berlaku hingga 31 Agustus 2026, setelah itu harga standar sebesar $3/$15 per juta token input/output akan berlaku.

Lihat Harga untuk harga lengkap, termasuk tarif batch processing dan caching prompt.

Ketersediaan

Pada saat peluncuran, Claude Sonnet 5 tersedia di:

Claude API: tersedia untuk semua pelanggan.
AWS: tersedia melalui Claude in Amazon Bedrock dan Claude Platform on AWS. Claude Sonnet 5 tidak tersedia di Claude on Amazon Bedrock (legacy) (API InvokeModel dan Converse).
Google Cloud: tersedia melalui Claude on Google Cloud.
Microsoft Foundry (pratinjau): tersedia melalui Claude in Microsoft Foundry.

Claude Sonnet 5 mendukung zero data retention (retensi data nol) untuk organisasi dengan perjanjian ZDR.

Panduan migrasi

Claude Sonnet 5 adalah pengganti langsung (drop-in replacement) untuk Claude Sonnet 4.6. Perbarui ID model Anda:

model = "claude-sonnet-4-6"  # Before
model = "claude-sonnet-5"  # After

Kemudian tinjau hal-hal berikut:

Anggaran dan jumlah token: tokenizer baru menghasilkan sekitar 30% lebih banyak token untuk teks yang sama. Hitung ulang prompt dengan penghitungan token, dan tinjau kembali batas max_tokens yang ukurannya mendekati panjang output yang Anda harapkan.
Pemikiran diperpanjang: jika Anda masih mengatur budget_tokens, migrasikan ke adaptive thinking. Pemikiran diperpanjang manual (thinking: {type: "enabled"}) tidak didukung dan mengembalikan error 400.
Parameter sampling: permintaan yang mengatur parameter sampling (temperature, top_p, top_k) ke nilai non-default akan mengembalikan error 400; hapus parameter tersebut saat melakukan migrasi. Definisi alat dan bentuk respons tidak berubah, dan prefilling pesan asisten sudah tidak didukung pada Claude Sonnet 4.6.

Lihat bagian Claude Sonnet 5 dalam panduan migrasi untuk detailnya.

Langkah selanjutnya

Ikhtisar model

Spesifikasi dan harga lengkap untuk semua model Claude saat ini.

Penghitungan token

Ukur prompt Anda dengan tokenizer baru sebelum Anda melakukan migrasi.

Adaptive thinking

Mode pemikiran aktif yang direkomendasikan pada Claude Sonnet 5.

Jendela konteks

Cara kerja jendela konteks 1 juta token.

Harga

Harga lengkap, termasuk tarif batch processing dan caching prompt.

Was this page helpful?

Model baru

Perubahan perilaku

Adaptive thinking aktif secara default

Parameter sampling tidak diterima

Pemikiran diperpanjang manual dihapus

Tokenizer baru

Batasan API yang diwarisi dari Claude Sonnet 4.6

Prefilling pesan asisten tidak didukung

Peningkatan kemampuan

Pengamanan keamanan siber

Harga

Ketersediaan

Panduan migrasi

Langkah selanjutnya

Model baru

Perubahan perilaku

Adaptive thinking aktif secara default

Parameter sampling tidak diterima

Pemikiran diperpanjang manual dihapus

Tokenizer baru

Batasan API yang diwarisi dari Claude Sonnet 4.6

Prefilling pesan asisten tidak didukung

Peningkatan kemampuan

Pengamanan keamanan siber

Harga

Ketersediaan

Panduan migrasi

Langkah selanjutnya

Model baru

Perubahan perilaku

Adaptive thinking aktif secara default

Parameter sampling tidak diterima

Pemikiran diperpanjang manual dihapus

Tokenizer baru

Batasan API yang diwarisi dari Claude Sonnet 4.6

Prefilling pesan asisten tidak didukung

Peningkatan kemampuan

Pengamanan keamanan siber

Harga

Ketersediaan

Panduan migrasi

Langkah selanjutnya

Model baru

Perubahan perilaku

Adaptive thinking aktif secara default

Parameter sampling tidak diterima

Pemikiran diperpanjang manual dihapus

Tokenizer baru

Batasan API yang diwarisi dari Claude Sonnet 4.6

Prefilling pesan asisten tidak didukung

Peningkatan kemampuan

Pengamanan keamanan siber

Harga

Ketersediaan

Panduan migrasi

Langkah selanjutnya