Model & hargaModel

Apa yang baru di Claude Opus 4.8

Ikhtisar fitur baru dan perubahan perilaku di Claude Opus 4.8.

Claude Opus 4.8 adalah model tingkat Opus paling mumpuni dari Anthropic. Model ini dibangun di atas Claude Opus 4.7. Halaman ini merangkum semua yang baru saat peluncuran, termasuk "fast mode" (mode cepat) sebagai pratinjau riset di Claude API dan panjang prompt minimum yang dapat di-cache yang lebih rendah, yaitu 1.024 token.

Model baru

Model	ID model API	Deskripsi
Claude Opus 4.8	claude-opus-4-8	Model tingkat Opus paling mumpuni dari Anthropic untuk penalaran kompleks, pengodean agentik jangka panjang, dan pekerjaan dengan otonomi tinggi

Claude Opus 4.8 mendukung jendela konteks 1 juta token secara default di Claude API, Amazon Bedrock, dan Vertex AI (200 ribu di Microsoft Foundry), 128 ribu token output maksimum, adaptive thinking, serta rangkaian alat dan fitur platform yang sama dengan Claude Opus 4.7.

Untuk harga dan spesifikasi lengkap, lihat ikhtisar model.

Fitur baru

Pesan sistem di tengah percakapan

Claude Opus 4.8 menerima pesan role: "system" tepat setelah giliran pengguna dalam array messages (tunduk pada aturan penempatan). Ini memungkinkan Anda menambahkan instruksi yang diperbarui di bagian akhir percakapan yang berjalan lama tanpa mengulang seluruh prompt sistem, sehingga mempertahankan cache hit caching prompt pada giliran-giliran sebelumnya dan mengurangi biaya input pada loop agentik. Tidak diperlukan header beta. Lihat Pesan sistem di tengah percakapan untuk detail penggunaan.

Detail stop penolakan

Objek stop_details pada respons penolakan (tersedia sejak Claude Opus 4.7) kini didokumentasikan secara publik. Ketika Claude menolak untuk menyelesaikan permintaan, objek ini menjelaskan kategori penolakan, sebagai tambahan dari stop reason refusal yang sudah ada, sehingga memudahkan aplikasi Anda untuk membedakan berbagai kelas permintaan yang ditolak dan mengarahkan pengguna ke langkah berikutnya yang tepat. Tidak diperlukan header beta. Lihat Menangani stop reason untuk daftar kategori dan panduan penanganannya.

Default effort

Nilai default parameter effort pada Claude Opus 4.8 adalah high di semua permukaan, termasuk Claude API dan Claude Code. Jika Anda sudah menetapkan effort secara eksplisit saat ini, pengaturan Anda tidak berubah. Lihat Effort untuk panduan per tingkat.

Fast mode

Fast mode kini tersedia untuk Claude Opus 4.8 sebagai pratinjau riset di Claude API. Tetapkan speed: "fast" untuk mendapatkan hingga 2,5x lebih banyak token output per detik dari model yang sama dengan harga premium. Lihat Fast mode untuk akses, model yang didukung, dan harga.

Minimum caching prompt yang lebih rendah

Panjang prompt minimum yang dapat di-cache pada Claude Opus 4.8 adalah 1.024 token, lebih rendah daripada Claude Opus 4.7. Prompt yang sebelumnya terlalu pendek untuk di-cache pada Claude Opus 4.7 kini dapat membuat entri cache tanpa perubahan kode. Lihat Caching prompt untuk nilai minimum per model.

Batasan API yang diwarisi dari Claude Opus 4.7

Batasan ini tidak berubah dari Claude Opus 4.7, sehingga kode yang sudah berjalan di Claude Opus 4.7 tidak memerlukan perubahan. Batasan ini hanya berlaku untuk Messages API; Claude Managed Agents tidak terpengaruh.

Parameter sampling tidak didukung

Menetapkan temperature, top_p, atau top_k ke nilai non-default akan mengembalikan error 400 pada Claude Opus 4.8, sama seperti pada Claude Opus 4.7. Hilangkan parameter ini dan gunakan prompting untuk memandu perilaku model.

Adaptive thinking adalah satu-satunya mode thinking

Seperti Claude Opus 4.7, Claude Opus 4.8 tidak mendukung anggaran pemikiran diperpanjang. Menetapkan thinking: {"type": "enabled", "budget_tokens": N} akan mengembalikan error 400. Gunakan adaptive thinking dan parameter effort untuk mengontrol kedalaman pemikiran.

Python

# Sebelum (Opus 4.6 atau lebih awal)
thinking = {"type": "enabled", "budget_tokens": 32000}

# Sesudah (Opus 4.7 dan lebih baru)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}

Peningkatan kemampuan

Area peningkatan

Dibandingkan dengan Claude Opus 4.7, Claude Opus 4.8 menargetkan peningkatan perilaku dalam:

Pengodean agentik jangka panjang, termasuk penanganan konteks panjang yang lebih baik, lebih sedikit pemadatan, dan pemulihan pemadatan yang lebih baik.
Kalibrasi effort penalaran, dengan perilaku yang lebih andal di setiap tingkat effort di berbagai domain.
Pemicuan alat, dengan lebih sedikit kasus melewatkan pemanggilan alat yang diperlukan oleh tugas.

Adaptive thinking

Dengan adaptive thinking diaktifkan, Claude Opus 4.8 memicu penalaran hanya ketika model menilai bahwa giliran tersebut membutuhkannya. Pada pencarian sederhana dan langkah agentik singkat, model merespons secara langsung; pada masalah multi-langkah yang kompleks, model bernalar sebelum menjawab. Ini mengurangi token pemikiran yang terbuang pada beban kerja bimodal dibandingkan dengan Claude Opus 4.7 pada tingkat effort yang sama. Seperti pada Claude Opus 4.7, thinking dinonaktifkan kecuali Anda secara eksplisit menetapkan thinking: {type: "adaptive"} dalam permintaan Anda.

Perubahan perilaku

Ini bukan perubahan yang merusak API tetapi mungkin memerlukan pembaruan prompt. Lihat Migrasi ke Claude Opus 4.8 untuk panduan lengkap.

Lebih sedikit token pemikiran yang terbuang pada tingkat effort yang sama ketika adaptive thinking diaktifkan, karena model memutuskan per giliran apakah akan berpikir.
Pemicuan alat yang lebih baik. Model lebih kecil kemungkinannya untuk melewatkan pemanggilan alat yang diperlukan oleh tugas, masalah yang dilaporkan oleh beberapa pengguna pada Claude Opus 4.7.
Penanganan pemadatan dan kualitas konteks panjang yang lebih baik. Jejak agentik yang panjang tetap pada jalurnya dengan lebih sedikit penyimpangan setelah pemadatan.

Panduan migrasi

Untuk instruksi migrasi langkah demi langkah dan daftar periksa migrasi lengkap, lihat Migrasi ke Claude Opus 4.8. Jika Anda menggunakan Claude Code atau Agent SDK, skill Claude API dapat menerapkan langkah-langkah migrasi ini ke basis kode Anda secara otomatis.

Langkah berikutnya

Panduan migrasi

Instruksi upgrade langkah demi langkah dari Claude Opus 4.7.

Effort

Panduan effort per tingkat, termasuk default baru.

Adaptive thinking

Satu-satunya mode thinking-on yang didukung pada Claude Opus 4.8.

Caching prompt

Bagaimana pesan sistem di tengah percakapan mempertahankan cache hit.

Menangani stop reason

Detail stop penolakan dan cara menanganinya.

Fast mode

Kecepatan output lebih tinggi dengan harga premium.

Was this page helpful?

Model & hargaModel

Apa yang baru di Claude Opus 4.8

Ikhtisar fitur baru dan perubahan perilaku di Claude Opus 4.8.

Model baru

Model	ID model API	Deskripsi
Claude Opus 4.8	claude-opus-4-8	Model tingkat Opus paling mumpuni dari Anthropic untuk penalaran kompleks, pengodean agentik jangka panjang, dan pekerjaan dengan otonomi tinggi

Untuk harga dan spesifikasi lengkap, lihat ikhtisar model.

Fitur baru

Pesan sistem di tengah percakapan

Detail stop penolakan

Default effort

Fast mode

Minimum caching prompt yang lebih rendah

Batasan API yang diwarisi dari Claude Opus 4.7

Parameter sampling tidak didukung

Adaptive thinking adalah satu-satunya mode thinking

Python

# Sebelum (Opus 4.6 atau lebih awal)
thinking = {"type": "enabled", "budget_tokens": 32000}

# Sesudah (Opus 4.7 dan lebih baru)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}

Peningkatan kemampuan

Area peningkatan

Dibandingkan dengan Claude Opus 4.7, Claude Opus 4.8 menargetkan peningkatan perilaku dalam:

Pengodean agentik jangka panjang, termasuk penanganan konteks panjang yang lebih baik, lebih sedikit pemadatan, dan pemulihan pemadatan yang lebih baik.
Kalibrasi effort penalaran, dengan perilaku yang lebih andal di setiap tingkat effort di berbagai domain.
Pemicuan alat, dengan lebih sedikit kasus melewatkan pemanggilan alat yang diperlukan oleh tugas.

Adaptive thinking

Perubahan perilaku

Ini bukan perubahan yang merusak API tetapi mungkin memerlukan pembaruan prompt. Lihat Migrasi ke Claude Opus 4.8 untuk panduan lengkap.

Lebih sedikit token pemikiran yang terbuang pada tingkat effort yang sama ketika adaptive thinking diaktifkan, karena model memutuskan per giliran apakah akan berpikir.
Pemicuan alat yang lebih baik. Model lebih kecil kemungkinannya untuk melewatkan pemanggilan alat yang diperlukan oleh tugas, masalah yang dilaporkan oleh beberapa pengguna pada Claude Opus 4.7.
Penanganan pemadatan dan kualitas konteks panjang yang lebih baik. Jejak agentik yang panjang tetap pada jalurnya dengan lebih sedikit penyimpangan setelah pemadatan.

Panduan migrasi

Langkah berikutnya

Panduan migrasi

Instruksi upgrade langkah demi langkah dari Claude Opus 4.7.

Effort

Panduan effort per tingkat, termasuk default baru.

Adaptive thinking

Satu-satunya mode thinking-on yang didukung pada Claude Opus 4.8.

Caching prompt

Bagaimana pesan sistem di tengah percakapan mempertahankan cache hit.

Menangani stop reason

Detail stop penolakan dan cara menanganinya.

Fast mode

Kecepatan output lebih tinggi dengan harga premium.

Was this page helpful?

Model baru

Fitur baru

Pesan sistem di tengah percakapan

Detail stop penolakan

Default effort

Fast mode

Minimum caching prompt yang lebih rendah

Batasan API yang diwarisi dari Claude Opus 4.7

Parameter sampling tidak didukung

Adaptive thinking adalah satu-satunya mode thinking

Peningkatan kemampuan

Area peningkatan

Adaptive thinking

Perubahan perilaku

Panduan migrasi

Langkah berikutnya

Model baru

Fitur baru

Pesan sistem di tengah percakapan

Detail stop penolakan

Default effort

Fast mode

Minimum caching prompt yang lebih rendah

Batasan API yang diwarisi dari Claude Opus 4.7

Parameter sampling tidak didukung

Adaptive thinking adalah satu-satunya mode thinking

Peningkatan kemampuan

Area peningkatan

Adaptive thinking

Perubahan perilaku

Panduan migrasi

Langkah berikutnya

Model baru

Fitur baru

Pesan sistem di tengah percakapan

Detail stop penolakan

Default effort

Fast mode

Minimum caching prompt yang lebih rendah

Batasan API yang diwarisi dari Claude Opus 4.7

Parameter sampling tidak didukung

Adaptive thinking adalah satu-satunya mode thinking

Peningkatan kemampuan

Area peningkatan

Adaptive thinking

Perubahan perilaku

Panduan migrasi

Langkah berikutnya

Model baru

Fitur baru

Pesan sistem di tengah percakapan

Detail stop penolakan

Default effort

Fast mode

Minimum caching prompt yang lebih rendah

Batasan API yang diwarisi dari Claude Opus 4.7

Parameter sampling tidak didukung

Adaptive thinking adalah satu-satunya mode thinking

Peningkatan kemampuan

Area peningkatan

Adaptive thinking

Perubahan perilaku

Panduan migrasi

Langkah berikutnya