Claude Opus 4.8 adalah model tingkat Opus paling mumpuni dari Anthropic. Model ini dibangun di atas Claude Opus 4.7. Halaman ini merangkum semua yang baru saat peluncuran, termasuk "fast mode" (mode cepat) sebagai pratinjau riset di Claude API dan panjang prompt minimum yang dapat di-cache yang lebih rendah, yaitu 1.024 token.
| Model | ID model API | Deskripsi |
|---|---|---|
| Claude Opus 4.8 | claude-opus-4-8 | Model tingkat Opus paling mumpuni dari Anthropic untuk penalaran kompleks, pengodean agentik jangka panjang, dan pekerjaan dengan otonomi tinggi |
Claude Opus 4.8 mendukung jendela konteks 1 juta token secara default di Claude API, Amazon Bedrock, dan Vertex AI (200 ribu di Microsoft Foundry), 128 ribu token output maksimum, adaptive thinking, serta rangkaian alat dan fitur platform yang sama dengan Claude Opus 4.7.
Untuk harga dan spesifikasi lengkap, lihat ikhtisar model.
Claude Opus 4.8 menerima pesan role: "system" tepat setelah giliran pengguna dalam array messages (tunduk pada aturan penempatan). Ini memungkinkan Anda menambahkan instruksi yang diperbarui di bagian akhir percakapan yang berjalan lama tanpa mengulang seluruh prompt sistem, sehingga mempertahankan cache hit caching prompt pada giliran-giliran sebelumnya dan mengurangi biaya input pada loop agentik. Tidak diperlukan header beta. Lihat Pesan sistem di tengah percakapan untuk detail penggunaan.
Objek stop_details pada respons penolakan (tersedia sejak Claude Opus 4.7) kini didokumentasikan secara publik. Ketika Claude menolak untuk menyelesaikan permintaan, objek ini menjelaskan kategori penolakan, sebagai tambahan dari stop reason refusal yang sudah ada, sehingga memudahkan aplikasi Anda untuk membedakan berbagai kelas permintaan yang ditolak dan mengarahkan pengguna ke langkah berikutnya yang tepat. Tidak diperlukan header beta. Lihat Menangani stop reason untuk daftar kategori dan panduan penanganannya.
Nilai default parameter effort pada Claude Opus 4.8 adalah high di semua permukaan, termasuk Claude API dan Claude Code. Jika Anda sudah menetapkan effort secara eksplisit saat ini, pengaturan Anda tidak berubah. Lihat Effort untuk panduan per tingkat.
Fast mode kini tersedia untuk Claude Opus 4.8 sebagai pratinjau riset di Claude API. Tetapkan speed: "fast" untuk mendapatkan hingga 2,5x lebih banyak token output per detik dari model yang sama dengan harga premium. Lihat Fast mode untuk akses, model yang didukung, dan harga.
Panjang prompt minimum yang dapat di-cache pada Claude Opus 4.8 adalah 1.024 token, lebih rendah daripada Claude Opus 4.7. Prompt yang sebelumnya terlalu pendek untuk di-cache pada Claude Opus 4.7 kini dapat membuat entri cache tanpa perubahan kode. Lihat Caching prompt untuk nilai minimum per model.
Batasan ini tidak berubah dari Claude Opus 4.7, sehingga kode yang sudah berjalan di Claude Opus 4.7 tidak memerlukan perubahan. Batasan ini hanya berlaku untuk Messages API; Claude Managed Agents tidak terpengaruh.
Menetapkan temperature, top_p, atau top_k ke nilai non-default akan mengembalikan error 400 pada Claude Opus 4.8, sama seperti pada Claude Opus 4.7. Hilangkan parameter ini dan gunakan prompting untuk memandu perilaku model.
Seperti Claude Opus 4.7, Claude Opus 4.8 tidak mendukung anggaran pemikiran diperpanjang. Menetapkan thinking: {"type": "enabled", "budget_tokens": N} akan mengembalikan error 400. Gunakan adaptive thinking dan parameter effort untuk mengontrol kedalaman pemikiran.
# Sebelum (Opus 4.6 atau lebih awal)
thinking = {"type": "enabled", "budget_tokens": 32000}
# Sesudah (Opus 4.7 dan lebih baru)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}Dibandingkan dengan Claude Opus 4.7, Claude Opus 4.8 menargetkan peningkatan perilaku dalam:
Dengan adaptive thinking diaktifkan, Claude Opus 4.8 memicu penalaran hanya ketika model menilai bahwa giliran tersebut membutuhkannya. Pada pencarian sederhana dan langkah agentik singkat, model merespons secara langsung; pada masalah multi-langkah yang kompleks, model bernalar sebelum menjawab. Ini mengurangi token pemikiran yang terbuang pada beban kerja bimodal dibandingkan dengan Claude Opus 4.7 pada tingkat effort yang sama. Seperti pada Claude Opus 4.7, thinking dinonaktifkan kecuali Anda secara eksplisit menetapkan thinking: {type: "adaptive"} dalam permintaan Anda.
Ini bukan perubahan yang merusak API tetapi mungkin memerlukan pembaruan prompt. Lihat Migrasi ke Claude Opus 4.8 untuk panduan lengkap.
Untuk instruksi migrasi langkah demi langkah dan daftar periksa migrasi lengkap, lihat Migrasi ke Claude Opus 4.8. Jika Anda menggunakan Claude Code atau Agent SDK, skill Claude API dapat menerapkan langkah-langkah migrasi ini ke basis kode Anda secara otomatis.
Instruksi upgrade langkah demi langkah dari Claude Opus 4.7.
Panduan effort per tingkat, termasuk default baru.
Satu-satunya mode thinking-on yang didukung pada Claude Opus 4.8.
Bagaimana pesan sistem di tengah percakapan mempertahankan cache hit.
Detail stop penolakan dan cara menanganinya.
Kecepatan output lebih tinggi dengan harga premium.
Was this page helpful?