Panduan ini membahas migrasi kode Messages API. Jika Anda menggunakan Claude Managed Agents, tidak ada perubahan yang diperlukan selain memperbarui nama model.
Otomatiskan migrasi Anda dengan skill Claude API. Di Claude Code, jalankan /claude-api migrate untuk memanggil skill Claude API bawaan. Skill ini berfungsi untuk model target mana pun di halaman ini:
/claude-api migrate this project to claude-opus-4-8Skill ini menerapkan penggantian ID model dan, sesuai kebutuhan, perubahan parameter yang bersifat breaking, penggantian prefill, dan kalibrasi effort untuk model target Anda di seluruh basis kode, lalu menghasilkan daftar periksa item yang perlu diverifikasi secara manual. Skill ini meminta Anda untuk mengonfirmasi cakupan migrasi (seluruh direktori kerja, subdirektori, atau daftar file tertentu) sebelum mengedit file apa pun. Skill ini juga mendeteksi klien Amazon Bedrock, Google Cloud, Claude Platform on AWS, dan Microsoft Foundry serta menyesuaikan format ID model dan perubahan fitur untuk setiap platform.
Claude Mythos 5 adalah penerus dengan akses terbatas dari Claude Mythos Preview, pratinjau riset yang hanya tersedia melalui undangan. Untuk model yang tersedia secara umum dengan kemampuan yang sama, lihat Claude Fable 5.
Migrasi sebagian besar bersifat drop-in. Claude Mythos 5 menggunakan Messages API yang sama dan pola penggunaan alat yang sama seperti Claude Mythos Preview, dan jumlah token kurang lebih tidak berubah karena kedua model menggunakan tokenizer yang sama. Perubahan utama yang perlu diperiksa adalah fitur-fitur yang tidak lagi tersedia (tercantum di bagian berikutnya) dan output thinking.
Untuk jadwal penghentian Claude Mythos Preview, lihat Penghentian model.
model = "claude-mythos-preview" # Before
model = "claude-mythos-5" # AfterPemikiran diperpanjang dan anggaran token thinking: Pemikiran diperpanjang manual (thinking: {type: "enabled", budget_tokens: N}) tidak didukung pada claude-mythos-5 dan mengembalikan error 400. Adaptive thinking selalu aktif: model menentukan kapan dan seberapa banyak berpikir pada setiap permintaan, dan tidak ada konfigurasi thinking yang diperlukan. thinking: {type: "disabled"} mengembalikan error. budget_tokens tidak memiliki pengganti langsung: thinking bersifat adaptif, dan parameter effort adalah kontrol tingkat output yang terpisah, bukan anggaran thinking.
Sebelum (Claude Mythos Preview):
client.messages.create(
model="claude-mythos-preview",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 10000},
messages=[{"role": "user", "content": "..."}],
)Sesudah (Claude Mythos 5):
client.messages.create(
model="claude-mythos-5",
max_tokens=16000,
messages=[{"role": "user", "content": "..."}],
)Prefill asisten: Mengisi awal (prefill) pesan asisten tidak didukung pada claude-mythos-5 dan mengembalikan error 400, sama seperti pada Claude Mythos Preview. Gunakan instruksi prompt sistem sebagai gantinya.
Output thinking: Pada claude-mythos-5, rantai pemikiran mentah tidak pernah dikembalikan, tetapi blok thinking tetap membawa teks ringkasan yang dapat dibaca ketika thinking.display diatur ke summarized. Kirim kembali blok thinking tanpa perubahan saat melanjutkan percakapan pada model yang sama. Lihat Output thinking pada Claude Fable 5 dan Claude Mythos 5.
claude-mythos-5 menggunakan tokenizer yang sama dengan claude-mythos-preview (tokenizer yang diperkenalkan dengan Claude Opus 4.7). Jumlah token kurang lebih tidak berubah saat bermigrasi dari claude-mythos-preview. Dibandingkan dengan model sebelum Claude Opus 4.7, konten yang sama dapat ditokenisasi menjadi sekitar 30% lebih banyak token, bervariasi berdasarkan konten dan bentuk beban kerja.
/v1/messages/count_tokens mengembalikan nilai yang kurang lebih tidak berubah untuk claude-mythos-5 dibandingkan dengan claude-mythos-preview. Tetapkan ulang baseline biaya dan latensi pada beban kerja Anda sendiri.
claude-mythos-preview ke claude-mythos-5.thinking: {type: "enabled", budget_tokens: N}). Adaptive thinking selalu aktif, dan tidak ada field thinking yang diperlukan.thinking: {type: "disabled"} apa pun. Menonaktifkan thinking mengembalikan error pada claude-mythos-5.budget_tokens. Parameter ini tidak memiliki pengganti langsung: thinking bersifat adaptif, dan parameter effort adalah kontrol tingkat output yang terpisah, bukan anggaran thinking.thinking memperlakukannya sebagai teks tampilan saja dan mengirim kembali blok thinking tanpa perubahan saat melanjutkan pada model yang sama. thinking.display secara default adalah "omitted" pada claude-mythos-5, sama seperti pada Claude Mythos Preview; atur display: "summarized" untuk menerima ringkasan yang dapat dibaca. Lihat Output thinking pada Claude Fable 5 dan Claude Mythos 5.thinking dan redacted_thinking dari giliran asisten sebelumnya terlebih dahulu. Blok thinking dari claude-mythos-5 terikat pada model yang menghasilkannya, dan model selain Claude Fable 5 dan Claude Mythos 5 mengabaikannya secara diam-diam. Menghapusnya menjaga permintaan lintas model tetap minimal dan seragam.claude-mythos-preview.Claude Fable 5 adalah model Anthropic paling mumpuni yang dirilis secara luas, tersedia secara umum di Claude API, Claude Platform on AWS, Amazon Bedrock, Google Cloud, dan Microsoft Foundry.
Migrasi sebagian besar bersifat drop-in. Claude Fable 5 menggunakan Messages API yang sama dan pola penggunaan alat yang sama seperti Claude Opus 4.8. Model ini mendukung jendela konteks 1 juta token yang sama secara default dan 128k token output maksimum yang sama. Jumlah token kurang lebih tidak berubah karena kedua model menggunakan tokenizer yang sama.
Perubahan utama yang perlu diperiksa adalah adaptive thinking yang selalu aktif, output thinking, penolakan oleh safety classifier, dan harga. Sebelum Anda bermigrasi membahas harga dan retensi data; Apa yang berubah membahas sisanya.
Claude Fable 5 dihargai $10 per juta token input dan $50 per juta token output, dibandingkan dengan $5 dan $25 untuk Claude Opus 4.8. Lihat Harga Claude untuk detailnya.
Claude Fable 5 memerlukan retensi data 30 hari dan tidak tersedia di bawah pengaturan "zero data retention" (retensi data nol), atau ZDR; model ini ditetapkan sebagai Covered Model. Pada Claude API, permintaan dari organisasi yang konfigurasi retensi datanya tidak memenuhi persyaratan ini mengembalikan 400 invalid_request_error. Organisasi dengan pengaturan ZDR harus menghubungi tim akun Anthropic mereka untuk membahas konfigurasi retensi data; Claude Opus 4.8 tetap tersedia di bawah ZDR. Sebagai alternatif, Anda dapat mengonfigurasi retensi data per workspace. Persyaratan retensi data 30 hari berlaku di setiap platform tempat Claude Fable 5 ditawarkan; lihat Persyaratan retensi data khusus model untuk detail per platform.
Jika kode Anda berada di Claude Opus 4.7 atau lebih lama, terapkan terlebih dahulu Bermigrasi dari Claude Opus 4.7 ke Claude Opus 4.8 dan, untuk model yang lebih lama dari Claude Opus 4.7, langkah-langkah migrasi Claude Opus 4.7. Bagian-bagian tersebut membahas perubahan yang bersifat breaking (parameter sampling ditolak, pemikiran diperpanjang manual ditolak, prefill dihapus, tokenizer baru) yang tidak diulang di bagian ini.
model = "claude-opus-4-8" # Before
model = "claude-fable-5" # AfterItem-item di bagian ini menjelaskan perbedaan API dan perilaku yang perlu diperiksa setelah Anda mengganti ID model.
Adaptive thinking selalu aktif: Adaptive thinking adalah satu-satunya mode thinking pada claude-fable-5. Model menentukan kapan dan seberapa banyak berpikir pada setiap permintaan, dan tidak ada konfigurasi thinking yang diperlukan. thinking: {type: "disabled"} mengembalikan error. Gunakan parameter effort untuk mengontrol kedalaman thinking.
Perubahan perilaku yang perlu diperiksa: pada Claude Opus 4.8, permintaan tanpa field thinking berjalan tanpa thinking; pada claude-fable-5, permintaan yang sama tersebut berjalan dengan adaptive thinking. max_tokens tetap menjadi batas keras pada total output, thinking ditambah teks respons, jadi tinjau kembali untuk beban kerja yang berjalan tanpa thinking pada Claude Opus 4.8. Lihat Kontrol biaya.
Sebelum (Claude Opus 4.8):
client.messages.create(
model="claude-opus-4-8",
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": "high"},
messages=[{"role": "user", "content": "..."}],
)Sesudah (Claude Fable 5):
client.messages.create(
model="claude-fable-5",
max_tokens=16000,
output_config={"effort": "high"},
messages=[{"role": "user", "content": "..."}],
)Pemikiran diperpanjang dan anggaran thinking (tidak berubah): Pemikiran diperpanjang manual (thinking: {type: "enabled", budget_tokens: N}) tidak didukung pada claude-fable-5 dan mengembalikan error 400, sama seperti pada Claude Opus 4.8. budget_tokens tidak memiliki pengganti langsung: thinking bersifat adaptif, dan parameter effort adalah kontrol tingkat output yang terpisah, bukan anggaran thinking.
Prefill asisten (tidak berubah): Mengisi awal (prefill) pesan asisten tidak didukung pada claude-fable-5 dan mengembalikan error 400, sama seperti pada Claude Opus 4.8. Gunakan instruksi prompt sistem sebagai gantinya.
Output thinking: Pada claude-fable-5, rantai pemikiran mentah tidak pernah dikembalikan, tetapi blok thinking tetap membawa teks ringkasan yang dapat dibaca ketika thinking.display diatur ke summarized. Kirim kembali blok thinking tanpa perubahan saat melanjutkan percakapan pada model yang sama. Lihat Output thinking pada Claude Fable 5 dan Claude Mythos 5.
Safety classifier dan stop reason refusal: claude-fable-5 menjalankan safety classifier pada permintaan dan selama pembuatan respons. Ketika classifier menolak permintaan, Messages API mengembalikan stop_reason: "refusal" sebagai respons HTTP 200 yang berhasil, bukan error. Field stop_details.category melaporkan classifier mana yang terpicu, dengan kategori seperti "cyber", "bio", dan "reasoning_extraction", atau null ketika penolakan tidak dipetakan ke kategori bernama. Lihat tabel kategori penolakan untuk daftar lengkapnya.
Anda tidak ditagih untuk token input dari permintaan yang ditolak sebelum output apa pun dihasilkan. Ketika classifier terpicu di tengah stream, input dan output yang sudah di-stream ditagih; buang output parsial tersebut.
Untuk menjalankan ulang permintaan yang ditolak pada model lain secara otomatis, berikan parameter opt-in fallbacks, yang masih dalam tahap beta di Claude API dan Claude Platform on AWS. Parameter ini tidak tersedia di Message Batches API atau di Amazon Bedrock, Google Cloud, dan Microsoft Foundry; pada ketiga platform tersebut, jalankan retry di sisi klien atau gunakan middleware refusal-fallback SDK. Lihat Menangani stop reason.
Mulai dengan effort high: Default parameter effort tetap high. Pada Claude Opus 4.8, rekomendasi untuk pekerjaan coding dan otonomi tinggi adalah mengatur xhigh secara eksplisit. Pada claude-fable-5, gunakan high sebagai default untuk sebagian besar tugas dan simpan xhigh untuk beban kerja yang paling sensitif terhadap kapabilitas. Pengaturan effort yang lebih rendah pada claude-fable-5 tetap berkinerja baik dan sering kali melampaui kinerja xhigh pada model sebelumnya. Kurangi effort jika tugas selesai tetapi memakan waktu lebih lama dari yang diperlukan. Lihat Prompting Claude Fable 5.
Minimum caching prompt lebih rendah: Panjang prompt minimum yang dapat di-cache pada claude-fable-5 adalah 512 token, lebih rendah dari 1.024 token pada Claude Opus 4.8. Prompt yang terlalu pendek untuk di-cache pada Claude Opus 4.8 sekarang dapat membuat entri cache, tanpa perubahan kode yang diperlukan. Pada Amazon Bedrock, minimum untuk claude-fable-5 adalah 1.024 token. Lihat Caching prompt untuk minimum per model.
claude-fable-5 memerlukan retensi data 30 hari dan, pada Claude API, mengembalikan 400 invalid_request_error jika tidak terpenuhi. Lihat Persyaratan retensi data khusus model.claude-opus-4-8 ke claude-fable-5.thinking: {type: "disabled"} apa pun. Menonaktifkan thinking mengembalikan error pada claude-fable-5, dan permintaan tanpa field thinking berjalan dengan adaptive thinking.claude-fable-5.thinking memperlakukannya sebagai teks tampilan saja dan mengirim kembali blok thinking tanpa perubahan saat melanjutkan pada model yang sama. thinking.display secara default adalah "omitted" pada claude-fable-5, sama seperti pada Claude Opus 4.8; atur display: "summarized" untuk menerima ringkasan yang dapat dibaca. Lihat Output thinking pada Claude Fable 5 dan Claude Mythos 5.thinking dan redacted_thinking dari giliran asisten sebelumnya terlebih dahulu. Blok thinking dari claude-fable-5 terikat pada model yang menghasilkannya, dan model selain Claude Fable 5 dan Claude Mythos 5 mengabaikannya secara diam-diam. Menghapusnya menjaga permintaan lintas model tetap minimal dan seragam. Pengecualiannya adalah menukarkan kredit fallback, yang memerlukan body permintaan yang di-echo sesuai aturan persis fitur tersebut.stop_reason: "refusal" dan baca field stop_details.category. Untuk menjalankan ulang permintaan yang ditolak pada model lain secara otomatis, pertimbangkan parameter opt-in fallbacks (beta). Lihat Menangani stop reason.effort Anda. Mulai dengan high untuk sebagian besar tugas, termasuk beban kerja yang berjalan pada xhigh di Claude Opus 4.8.claude-opus-4-8; harga per token berbeda.Claude Opus 4.8 dibangun untuk coding agentic yang kompleks dan pekerjaan enterprise. Model ini dibangun di atas Claude Opus 4.7.
Claude Opus 4.8 seharusnya memiliki kinerja out-of-the-box yang kuat pada prompt dan eval Claude Opus 4.7 yang sudah ada. Tidak ada perubahan API yang bersifat breaking untuk kode yang sudah berjalan di Claude Opus 4.7. Model ini mendukung set fitur yang sama seperti Claude Opus 4.7, termasuk jendela konteks 1 juta token, 128k token output maksimum, adaptive thinking, caching prompt, pemrosesan batch, Files API, dukungan PDF, vision, dan set lengkap alat sisi server dan sisi klien. Model ini juga menambahkan pesan sistem di tengah percakapan dan mendokumentasikan secara publik detail stop penolakan.
Jika kode Anda berada di Claude Opus 4.6 atau lebih lama, terapkan juga langkah-langkah migrasi Claude Opus 4.7 di bawah sebelum meningkatkan ke Claude Opus 4.8. Langkah-langkah tersebut mencakup perubahan yang bersifat breaking (parameter sampling ditolak, pemikiran diperpanjang manual ditolak, tokenizer baru) yang tidak dicakup oleh peningkatan ke 4.8 saja.
# Migrasi Opus
model = "claude-opus-4-7" # Before
model = "claude-opus-4-8" # AfterIni bukan perubahan yang bersifat breaking. Kode yang berjalan di Claude Opus 4.7 terus berfungsi tanpa perubahan di Claude Opus 4.8. Item-item di bawah ini menjelaskan perbedaan perilaku yang perlu diperiksa setelah Anda mengganti ID model.
Parameter sampling (tidak berubah): Mengatur temperature, top_p, atau top_k ke nilai non-default mengembalikan error 400 pada Claude Opus 4.8, sama seperti pada Claude Opus 4.7. Tipe permintaan SDK masih mendefinisikan field-field ini untuk kompatibilitas dengan model sebelumnya, sehingga kode yang mengaturnya lolos type-check, tetapi API menolak permintaan di sisi server. Jika Anda menghapus parameter ini saat bermigrasi ke Opus 4.7, tidak ada perubahan lebih lanjut yang diperlukan.
Default effort adalah high: Default parameter effort pada Claude Opus 4.8 adalah high di semua permukaan, termasuk Claude Code dan Messages API. Jika Anda sudah mengatur effort secara eksplisit, pengaturan Anda tidak berubah. Untuk pekerjaan coding dan otonomi tinggi, atur xhigh secara eksplisit. Evaluasi ulang pengaturan effort Anda terhadap anggaran latensi dan biaya Anda.
Jendela konteks 1 juta adalah default: Claude Opus 4.8 menyajikan jendela konteks 1 juta token penuh secara default tanpa header beta dan tanpa premium konteks panjang. Jika klien Anda mengirimkan header beta jendela konteks untuk kompatibilitas dengan model lama, Anda dapat menghapusnya pada Claude Opus 4.8.
Pesan sistem di tengah percakapan: Claude Opus 4.8 menerima pesan role: "system" segera setelah giliran pengguna dalam array messages (tunduk pada aturan penempatan). Gunakan field system tingkat atas untuk instruksi yang berlaku sejak awal. Model sebelumnya, termasuk Claude Opus 4.7, menolak role: "system" dalam messages dengan error 400. Jika Anda memelihara jalur kode yang membangun ulang seluruh riwayat pesan untuk memperbarui instruksi, Anda dapat menyederhanakannya dan mempertahankan hit cache prompt pada giliran sebelumnya.
Detail stop penolakan: Objek stop_details pada respons penolakan (tersedia sejak Claude Opus 4.7) sekarang didokumentasikan secara publik. Ketika model menolak permintaan, objek ini mengidentifikasi kategori penolakan, selain stop reason refusal yang sudah ada. Tidak ada header beta yang diperlukan, dan tidak ada opt-out. Lihat Menangani stop reason.
Minimum caching prompt lebih rendah: Panjang prompt minimum yang dapat di-cache pada Claude Opus 4.8 adalah 1.024 token, lebih rendah dari pada Claude Opus 4.7. Prompt yang terlalu pendek untuk di-cache pada Claude Opus 4.7 sekarang dapat membuat entri cache, tanpa perubahan kode yang diperlukan. Lihat Caching prompt untuk minimum per model.
Tingkat effort dikalibrasi ulang: Alokasi token di balik setiap tingkat effort berubah pada Claude Opus 4.8 dibandingkan dengan Claude Opus 4.7: medium memungkinkan thinking yang sedikit lebih banyak, high sedikit lebih sedikit, dan xhigh jauh lebih banyak. Jika Anda menyetel tingkat effort terhadap biaya atau latensi Claude Opus 4.7, tetapkan ulang baseline pada tingkat yang sama sebelum menyesuaikannya. Lihat Effort.
claude-opus-4-7 ke claude-opus-4-8 (atau perbarui alias).effort Anda. Default adalah high di semua permukaan; untuk pekerjaan coding dan otonomi tinggi, atur xhigh secara eksplisit.stop_details pada penolakan (tersedia sejak Claude Opus 4.7; sekarang didokumentasikan secara publik).Claude Opus 4.7 sangat otonom dan berkinerja sangat baik pada pekerjaan agentic jangka panjang, pekerjaan pengetahuan, tugas vision, dan tugas memori.
Claude Opus 4.7 seharusnya memiliki kinerja out-of-the-box yang kuat pada prompt dan eval Claude Opus 4.6 yang sudah ada dengan harga $5 / $25 per MTok yang sama, tetapi ada beberapa perubahan perilaku dan API yang perlu diketahui saat Anda bermigrasi. Model ini mendukung set fitur yang sama seperti Claude Opus 4.6, termasuk:
# Migrasi Opus
model = "claude-opus-4-6" # Before
model = "claude-opus-4-7" # AfterPemikiran diperpanjang dihapus: thinking: {type: "enabled", budget_tokens: N} tidak lagi didukung pada Claude Opus 4.7 atau model yang lebih baru dan mengembalikan error 400. Beralihlah ke adaptive thinking (thinking: {type: "adaptive"}) dan gunakan parameter effort untuk mengontrol kedalaman thinking. Adaptive thinking nonaktif secara default pada Claude Opus 4.7: permintaan tanpa field thinking berjalan tanpa thinking, sesuai dengan perilaku Opus 4.6. Atur thinking: {type: "adaptive"} secara eksplisit untuk mengaktifkannya.
Sebelum (Claude Opus 4.6):
client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 10000},
messages=[{"role": "user", "content": "..."}],
)Sesudah (Claude Opus 4.7):
client.messages.create(
model="claude-opus-4-7",
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": "high"}, # or "max", "xhigh", "medium", "low"
messages=[{"role": "user", "content": "..."}],
)Adaptive thinking dapat diarahkan melalui prompting. Untuk panduan tentang penyetelan ketika model berpikir terlalu banyak atau terlalu sedikit, lihat Mengkalibrasi effort dan kedalaman thinking.
Parameter sampling dihapus: Mengatur temperature, top_p, atau top_k ke nilai non-default apa pun pada Claude Opus 4.7 mengembalikan error 400. Jalur migrasi paling aman adalah menghilangkan parameter ini sepenuhnya dari payload permintaan. Prompting adalah cara yang direkomendasikan untuk memandu perilaku model pada Claude Opus 4.7. Jika Anda menggunakan temperature = 0 untuk determinisme, perhatikan bahwa hal itu tidak pernah menjamin output yang identik pada model sebelumnya.
Konten thinking dihilangkan secara default: Blok thinking masih muncul dalam stream respons pada Claude Opus 4.7, tetapi field thinking-nya kosong kecuali Anda secara eksplisit memilih untuk menampilkannya. Ini adalah perubahan diam-diam dari Claude Opus 4.6, di mana default-nya adalah mengembalikan teks thinking yang diringkas. Untuk mengembalikan konten thinking yang diringkas pada Claude Opus 4.7, atur thinking.display ke "summarized":
thinking = {
"type": "adaptive",
"display": "summarized",
}Default-nya adalah "omitted" pada Claude Opus 4.7. Jika produk Anda melakukan streaming penalaran ke pengguna, default baru ini muncul sebagai jeda panjang sebelum output dimulai; atur display: "summarized" untuk mengembalikan progres yang terlihat selama thinking. Lihat Pemikiran diperpanjang untuk detailnya.
Penghitungan token yang diperbarui: Claude Opus 4.7 menggunakan tokenizer baru, yang berkontribusi pada peningkatan kinerjanya pada berbagai tugas. Tokenizer baru dapat menggunakan sekitar 1x hingga 1,35x lebih banyak token saat memproses teks dibandingkan dengan model sebelumnya (hingga ~35% lebih banyak, bervariasi berdasarkan konten).
/v1/messages/count_tokens akan mengembalikan jumlah token yang berbeda untuk Claude Opus 4.7 dibandingkan dengan Claude Opus 4.6. Efisiensi token dapat bervariasi berdasarkan bentuk beban kerja.
Intervensi prompting, task_budget, dan effort dapat membantu mengontrol biaya dan memastikan penggunaan token yang sesuai. Kontrol-kontrol ini mungkin mengorbankan kecerdasan model. Perbarui parameter max_tokens Anda untuk memberikan ruang tambahan, termasuk pemicu pemadatan. Claude Opus 4.7 menyediakan jendela konteks 1 juta dengan harga API standar tanpa premium konteks panjang.
Penghapusan prefill (dibawa dari Opus 4.6): Mengisi awal (prefill) pesan asisten mengembalikan error 400 pada Claude Opus 4.7. Gunakan output terstruktur, instruksi prompt sistem, atau output_config.format sebagai gantinya.
Parameter effort memungkinkan Anda menyetel kecerdasan Claude vs. pengeluaran token, menukar kapabilitas dengan kecepatan yang lebih cepat dan biaya yang lebih rendah. Mulai dengan tingkat effort xhigh yang baru untuk kasus penggunaan coding dan agentic, dan gunakan minimal effort high untuk sebagian besar kasus penggunaan yang sensitif terhadap kecerdasan. Bereksperimenlah dengan tingkat effort lain untuk lebih menyetel penggunaan token dan kecerdasan:
max: Effort maksimum dapat memberikan peningkatan kinerja dalam beberapa kasus penggunaan, tetapi mungkin menunjukkan hasil yang semakin berkurang dari peningkatan penggunaan token. Pengaturan ini juga terkadang rentan terhadap overthinking. Uji effort maksimum untuk tugas yang menuntut kecerdasan.xhigh (baru): Effort ekstra tinggi adalah pengaturan terbaik untuk sebagian besar kasus penggunaan coding dan agentic.high: Pengaturan ini menyeimbangkan penggunaan token dan kecerdasan. Untuk sebagian besar kasus penggunaan yang sensitif terhadap kecerdasan, gunakan minimal effort high.medium: Baik untuk kasus penggunaan yang sensitif terhadap biaya yang perlu mengurangi penggunaan token sambil mengorbankan kecerdasan.low: Simpan untuk tugas pendek dengan cakupan terbatas dan beban kerja yang sensitif terhadap latensi yang tidak sensitif terhadap kecerdasan.Effort lebih penting untuk model ini dibandingkan Opus sebelumnya mana pun. Bereksperimenlah dengannya secara aktif saat Anda melakukan upgrade.
Claude Opus 4.7 memiliki beberapa perbedaan perilaku dari Claude Opus 4.6 yang bukan merupakan perubahan yang merusak API tetapi mungkin memerlukan pembaruan prompt atau penghapusan scaffolding.
Panjang respons bervariasi berdasarkan kasus penggunaan: Claude Opus 4.7 mengkalibrasi panjang respons berdasarkan seberapa kompleks model menilai tugas tersebut, alih-alih menggunakan tingkat verbositas tetap secara default. Ini biasanya berarti jawaban yang lebih pendek untuk pencarian sederhana dan jawaban yang jauh lebih panjang untuk analisis terbuka.
Jika produk Anda bergantung pada gaya atau verbositas output tertentu, Anda mungkin perlu menyesuaikan prompt Anda. Misalnya, untuk mengurangi verbositas, tambahkan: "Provide concise, focused responses. Skip non-essential context, and keep examples minimal." Jika Anda melihat jenis penjelasan berlebihan tertentu, tambahkan instruksi yang ditargetkan dalam prompt Anda untuk mencegahnya.
Contoh positif yang menunjukkan bagaimana Claude dapat berkomunikasi dengan tingkat keringkasan yang sesuai cenderung lebih efektif daripada contoh negatif atau instruksi yang memberi tahu model apa yang tidak boleh dilakukan.
Mengikuti instruksi secara lebih harfiah: Claude Opus 4.7 menafsirkan prompt secara lebih harfiah dan eksplisit daripada Claude Opus 4.6, terutama pada tingkat effort yang lebih rendah. Model tidak akan secara diam-diam menggeneralisasi instruksi dari satu item ke item lain, dan tidak akan menyimpulkan permintaan yang tidak Anda buat. Sisi positif dari literalisme ini adalah presisi dan lebih sedikit bolak-balik. Model umumnya berkinerja lebih baik untuk kasus penggunaan API dengan prompt yang disetel dengan cermat, ekstraksi terstruktur, dan pipeline di mana Anda menginginkan perilaku yang dapat diprediksi. Peninjauan prompt dan harness mungkin sangat membantu untuk migrasi ke Claude Opus 4.7.
Nada yang lebih langsung: Seperti halnya model baru lainnya, gaya prosa pada penulisan panjang mungkin bergeser. Claude Opus 4.7 lebih langsung dan berpendapat, dengan lebih sedikit frasa yang berorientasi validasi dan lebih sedikit emoji dibandingkan gaya Claude Opus 4.6 yang lebih hangat. Jika produk Anda bergantung pada suara tertentu, evaluasi ulang prompt gaya terhadap baseline baru.
Pembaruan progres bawaan dalam jejak agentik: Claude Opus 4.7 memberikan pembaruan yang lebih teratur dan berkualitas lebih tinggi kepada pengguna sepanjang jejak agentik yang panjang. Jika Anda telah menambahkan scaffolding untuk memaksa pesan status sementara ("After every 3 tool calls, summarize progress"), coba hapus. Jika Anda menemukan bahwa panjang atau isi pembaruan yang ditampilkan kepada pengguna dari Claude Opus 4.7 tidak terkalibrasi dengan baik untuk kasus penggunaan Anda, jelaskan secara eksplisit seperti apa pembaruan ini seharusnya dalam prompt dan berikan contoh.
Lebih sedikit subagent yang dibuat secara default: Claude Opus 4.7 cenderung membuat lebih sedikit subagent secara default. Namun, perilaku ini dapat diarahkan melalui prompting; berikan Claude Opus 4.7 panduan eksplisit tentang kapan subagent diinginkan.
Kalibrasi effort yang lebih ketat: Berubah secara signifikan dari Claude Opus 4.6, Claude Opus 4.7 mematuhi tingkat effort secara ketat, terutama pada tingkat rendah. Pada low dan medium, model membatasi cakupan pekerjaannya pada apa yang diminta alih-alih melampaui ekspektasi.
Ini baik untuk latensi dan biaya, tetapi pada tugas yang cukup kompleks yang berjalan pada effort low ada risiko pemikiran yang kurang mendalam. Jika Anda mengamati penalaran yang dangkal pada masalah kompleks, naikkan effort ke high atau xhigh alih-alih mengatasinya melalui prompting.
Jika Anda perlu mempertahankan effort pada low untuk latensi, tambahkan panduan yang ditargetkan: "This task involves multi-step reasoning. Think carefully through the problem before responding." Lihat Tingkat effort yang direkomendasikan untuk Claude Opus 4.7.
Lebih sedikit pemanggilan alat secara default: Claude Opus 4.7 memiliki kecenderungan untuk menggunakan alat lebih jarang daripada Claude Opus 4.6 dan lebih banyak menggunakan penalaran. Ini menghasilkan hasil yang lebih baik dalam sebagian besar kasus.
Untuk meningkatkan penggunaan alat, naikkan pengaturan effort. Pengaturan effort high atau xhigh menunjukkan penggunaan alat yang jauh lebih banyak dalam pencarian agentik dan coding. Anda juga dapat menyesuaikan prompt Anda untuk secara eksplisit menginstruksikan model tentang kapan dan bagaimana menggunakan alatnya dengan benar.
Pengamanan keamanan siber real-time: Baru ditambahkan di Claude Opus 4.7, permintaan yang melibatkan topik terlarang atau berisiko tinggi dapat menyebabkan penolakan. Untuk pekerjaan keamanan yang sah seperti penetration testing, penelitian kerentanan, atau red-teaming, ajukan permohonan ke Cyber Verification Program untuk meminta pengurangan pembatasan. Lihat Safeguards, warnings, and appeals untuk latar belakang.
Dukungan gambar resolusi tinggi: Claude Opus 4.7 adalah model Claude pertama dengan dukungan gambar resolusi tinggi. Resolusi gambar maksimum adalah 2576 piksel pada sisi panjang, naik dari 1568 piksel pada model sebelumnya. Ini membuka peningkatan pada beban kerja yang berat pada visi dan sangat berharga untuk computer use, pemahaman screenshot, dan analisis dokumen.
Dukungan resolusi tinggi bersifat otomatis dan tidak memerlukan header beta atau opt-in di sisi klien. Dua hal yang perlu direncanakan:
max_tokens dan ekspektasi biaya untuk beban kerja yang berat pada gambar, atau lakukan downsample sebelum mengirim jika Anda tidak memerlukan fidelitas tambahan.Lihat Dukungan gambar resolusi tinggi pada Claude Opus 4.7 untuk detailnya.
Ini tidak wajib tetapi akan meningkatkan pengalaman Anda:
Evaluasi ulang max_tokens: Karena teks yang sama menghasilkan jumlah token yang lebih tinggi pada Claude Opus 4.7, perbarui parameter max_tokens Anda untuk memberikan ruang tambahan, termasuk pemicu compaction. Intervensi prompting, task_budget, dan effort dapat membantu mengontrol biaya dan memastikan penggunaan token yang sesuai.
Audit ekspektasi jumlah token: Setiap jalur kode yang memperkirakan token di sisi klien atau mengasumsikan rasio token-ke-karakter tetap harus diuji ulang terhadap Claude Opus 4.7. Gunakan endpoint Token counting untuk memverifikasi.
Adopsi task budgets (beta): Claude Opus 4.7 memperkenalkan task budgets. Budget ini memungkinkan Anda memberi tahu Claude berapa banyak token yang dimilikinya untuk satu loop agentik penuh, termasuk thinking, pemanggilan alat, hasil alat, dan output akhir. Model melihat hitungan mundur yang berjalan dan menggunakannya untuk memprioritaskan pekerjaan dan menyelesaikan tugas dengan baik saat budget dikonsumsi. Untuk menggunakannya, atur header beta task-budgets-2026-03-13 dan tambahkan yang berikut ke output config Anda:
output_config = {
"effort": "high",
"task_budget": {"type": "tokens", "total": 128000},
}Anda mungkin perlu bereksperimen dengan task budget yang berbeda untuk kasus penggunaan Anda. Jika model diberi task budget yang terlalu ketat, model mungkin menyelesaikan tugas dengan kurang menyeluruh, dengan merujuk budget-nya sebagai kendala.
Untuk tugas agentik terbuka di mana kualitas lebih penting daripada kecepatan, jangan atur task budget. Cadangkan task budget untuk beban kerja di mana Anda memerlukan model untuk membatasi cakupan pekerjaannya pada alokasi token. Nilai minimum untuk task budget adalah 20k token.
Task budget bukan batas keras; ini adalah saran yang disadari oleh model. Ini berbeda dari max_tokens:
task_budget: batas advisori di seluruh loop agentik penuh. Model melihatnya dan menggunakannya untuk mengatur kecepatannya sendiri.max_tokens: batas keras per-permintaan pada token yang dihasilkan. Ini tidak diteruskan ke model, sehingga model tidak menyadarinya.Gunakan task_budget ketika Anda ingin model memoderasi dirinya sendiri, dan max_tokens sebagai batas keras untuk membatasi penggunaan.
Atur max_tokens yang besar pada effort max atau xhigh: Jika Anda menjalankan Claude Opus 4.7 pada effort max atau xhigh, atur budget token output maksimum yang besar sehingga model memiliki ruang untuk berpikir dan bertindak di seluruh subagent dan pemanggilan alatnya. Mulai dari 64k token dan sesuaikan dari sana.
Downsample gambar jika resolusi tinggi tidak diperlukan: Claude Opus 4.7 mendukung gambar hingga 2576px / 3,75MP. Gambar resolusi tinggi menggunakan lebih banyak token. Jika fidelitas gambar tambahan tidak diperlukan, lakukan downsample gambar sebelum mengirim ke Claude untuk menghindari peningkatan penggunaan token. Lihat Gambar dan visi.
claude-opus-4-6 ke claude-opus-4-7 (atau perbarui alias).temperature, top_p, dan top_k dari payload permintaan.thinking: {type: "enabled", budget_tokens: N} dengan thinking: {type: "adaptive"} ditambah parameter effort.max_tokens untuk memperhitungkan tokenisasi yang diperbarui.xhigh atau max, naikkan max_tokens ke setidaknya 64k sebagai titik awal.Jika Anda bermigrasi dari Claude Opus 4.5, Opus 4.1 (deprecated), atau model yang lebih awal langsung ke Claude Opus 4.7, terapkan semua perubahan Opus 4.7 ditambah perubahan kumulatif di bagian ini yang berlaku antara Opus 4.5 dan Opus 4.7. Jika Anda bermigrasi dari Opus 4.6, Anda hanya memerlukan bagian Opus 4.7.
# Migrasi Opus
model = "claude-opus-4-5" # Before
model = "claude-opus-4-7" # AfterPenghapusan prefill dibahas dalam perubahan yang merusak Opus 4.7 di atas.
Quoting parameter alat: Claude Opus 4.6 dan model yang lebih baru mungkin menghasilkan escaping string JSON yang sedikit berbeda dalam argumen pemanggilan alat (misalnya, penanganan escape Unicode atau escaping forward slash yang berbeda). Jika Anda mem-parse input pemanggilan alat sebagai string mentah alih-alih menggunakan parser JSON, verifikasi logika parsing Anda. Parser JSON standar (seperti json.loads() atau JSON.parse()) menangani perbedaan ini secara otomatis.
Perubahan ini meningkatkan pengalaman Anda pada Opus 4.7. Item yang ditandai (wajib pada Opus 4.7) adalah rekomendasi opsional ketika Opus 4.6 diluncurkan tetapi sekarang wajib; sisanya tetap direkomendasikan.
Migrasi ke adaptive thinking (wajib pada Opus 4.7): thinking: {type: "enabled", budget_tokens: N} mengembalikan error 400 pada Claude Opus 4.7. Beralih ke thinking: {type: "adaptive"} dan gunakan parameter effort untuk mengontrol kedalaman thinking. Lihat Adaptive thinking.
response = client.beta.messages.create(
model="claude-opus-4-5",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 32000},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)Perhatikan bahwa migrasi juga berpindah dari client.beta.messages.create ke client.messages.create. Adaptive thinking dan effort adalah fitur GA dan tidak memerlukan namespace SDK beta atau header beta apa pun.
Hapus header beta effort: Parameter effort sekarang GA. Hapus betas=["effort-2025-11-24"] dari permintaan Anda.
Hapus header beta fine-grained tool streaming: Fine-grained tool streaming sekarang GA. Hapus betas=["fine-grained-tool-streaming-2025-05-14"] dari permintaan Anda.
Hapus header beta interleaved thinking: Adaptive thinking secara otomatis mengaktifkan interleaved thinking pada Claude Opus 4.7, Opus 4.6, dan Sonnet 4.6. Hapus betas=["interleaved-thinking-2025-05-14"] dari permintaan Anda. Header ini masih berfungsi pada Sonnet 4.6 dengan extended thinking manual, tetapi mode manual sudah deprecated.
Migrasi ke output_config.format: Jika menggunakan structured outputs, perbarui output_format={...} menjadi output_config={"format": {...}}. Parameter lama tetap berfungsi tetapi sudah deprecated dan akan dihapus dalam rilis model mendatang.
Jika Anda bermigrasi dari Opus 4.1 (deprecated) atau model yang lebih awal langsung ke Claude Opus 4.7, terapkan perubahan Claude Opus 4.7 di bagian atas panduan ini dan perubahan kumulatif di atas ditambah perubahan tambahan di bagian ini.
# Dari Opus 4.1
model = "claude-opus-4-1-20250805" # Before
model = "claude-opus-4-7" # After
# Dari Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Before
model = "claude-opus-4-7" # AfterHapus parameter sampling
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Mulai dari Claude Opus 4.7, mengatur temperature, top_p, atau top_k ke nilai non-default apa pun akan mengembalikan error 400. Jalur migrasi teraman adalah menghilangkan parameter ini sepenuhnya dari permintaan, dan menggunakan prompting untuk memandu perilaku model. Jika Anda menggunakan temperature = 0 untuk determinisme, perhatikan bahwa itu tidak pernah menjamin output yang identik.
# Sebelum - Ini akan menghasilkan error pada model Claude 4+
response = client.messages.create(
model="claude-3-7-sonnet-20250219",
temperature=0.7,
top_p=0.9, # Non-default sampling params return 400 on Opus 4.7
# ...
)
# Sesudah
response = client.messages.create(
model="claude-opus-4-7",
# ...
)Perbarui versi alat
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Perbarui ke versi alat terbaru. Hapus semua kode yang menggunakan perintah undo_edit.
# Sebelum
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
# Sesudah
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]text_editor_20250728 dan str_replace_based_edit_tool. Lihat dokumentasi alat Text editor untuk detailnya.code_execution_20250825. Lihat dokumentasi alat Code execution untuk instruksi migrasi.Tangani stop reason refusal
Perbarui aplikasi Anda untuk menangani stop reason refusal:
response = client.messages.create(...)
if response.stop_reason == "refusal":
# Tangani penolakan dengan tepat
passTangani stop reason model_context_window_exceeded
Model Claude 4.5+ mengembalikan stop reason model_context_window_exceeded ketika generasi berhenti karena mencapai batas jendela konteks, bukan batas max_tokens yang diminta. Perbarui aplikasi Anda untuk menangani stop reason baru ini:
response = client.messages.create(...)
if response.stop_reason == "model_context_window_exceeded":
# Tangani batas jendela konteks dengan tepat
passVerifikasi penanganan parameter alat (newline di akhir)
Model Claude 4.5+ mempertahankan newline di akhir dalam parameter string pemanggilan alat yang sebelumnya dihapus. Jika alat Anda bergantung pada pencocokan string yang tepat terhadap parameter pemanggilan alat, verifikasi bahwa logika Anda menangani newline di akhir dengan benar.
Perbarui prompt Anda untuk perubahan perilaku
Model Claude 4+ memiliki gaya komunikasi yang lebih ringkas dan langsung serta memerlukan arahan eksplisit. Tinjau praktik terbaik prompting untuk panduan optimasi.
token-efficient-tools-2025-02-19 dan output-128k-2025-02-19. Semua model Claude 4+ memiliki penggunaan alat yang efisien token secara bawaan dan header ini tidak memiliki efek.claude-opus-4-7output_config.format sebagai gantinyathinking: {type: "enabled", budget_tokens: N} dengan thinking: {type: "adaptive"} ditambah parameter effort (mengembalikan 400 pada Opus 4.7)effort-2025-11-24 (effort sekarang GA)fine-grained-tool-streaming-2025-05-14interleaved-thinking-2025-05-14 (adaptive thinking mengaktifkan interleaved thinking secara otomatis)output_format ke output_config.format (jika berlaku)temperature, top_p, dan top_k (nilai non-default mengembalikan 400 pada Opus 4.7)text_editor_20250728, code_execution_20250825)refusalmodel_context_window_exceededtoken-efficient-tools-2025-02-19, output-128k-2025-02-19)Claude Sonnet 5 menawarkan kombinasi terbaik antara kecepatan dan kecerdasan dalam keluarga model Claude. Model ini dibangun di atas Claude Sonnet 4.6.
Claude Sonnet 5 adalah upgrade drop-in untuk Claude Sonnet 4.6 dengan harga yang sama $3 / $15 per MTok (harga perkenalan $2 / $10 per MTok hingga 31 Agustus 2026; lihat Harga). Ada dua perubahan API yang merusak untuk kode yang sudah berjalan pada Claude Sonnet 4.6: extended thinking manual (thinking: {type: "enabled", budget_tokens: N}) dan parameter sampling (temperature, top_p, top_k) yang diatur ke nilai non-default tidak lagi diterima dan mengembalikan error 400. Gunakan adaptive thinking dengan parameter effort sebagai gantinya. Claude Sonnet 5 mendukung set fitur yang sama dengan Claude Sonnet 4.6, termasuk jendela konteks 1M token, adaptive thinking, caching prompt, batch processing, Files API, dukungan PDF, visi, dan set lengkap alat sisi server dan sisi klien. Priority Tier tidak tersedia pada Claude Sonnet 5. Claude Sonnet 5 juga menggunakan tokenizer baru.
Jika kode Anda berada pada Claude Sonnet 4.5 atau lebih awal, terapkan juga langkah migrasi Claude Sonnet 4.6 sebelum meningkatkan ke Claude Sonnet 5. Langkah-langkah tersebut mencakup perubahan yang merusak (prefilling pesan asisten ditolak, perbedaan escaping JSON parameter alat) yang tidak dicakup oleh upgrade Sonnet 5 saja.
# Migrasi Sonnet
model = "claude-sonnet-4-6" # Before
model = "claude-sonnet-5" # AfterItem 4 dan 5 dalam daftar berikut adalah perubahan yang merusak. max_tokens tetap menjadi batas keras pada total output (thinking ditambah teks respons), jadi tinjau kembali untuk beban kerja yang berjalan tanpa thinking pada Claude Sonnet 4.6.
Tokenizer baru: Claude Sonnet 5 menggunakan tokenizer baru. Teks input yang sama menghasilkan sekitar 30% lebih banyak token daripada pada Claude Sonnet 4.6. Permintaan, respons, dan event streaming mempertahankan bentuk yang sama, dan tidak ada perubahan kode yang diperlukan, tetapi apa pun yang Anda ukur atau anggarkan dalam token bergeser: field usage dan hasil token counting untuk teks yang sama lebih tinggi, jendela konteks 1M token menampung lebih sedikit teks, dan batas max_tokens yang disetel untuk Claude Sonnet 4.6 mungkin memotong output yang setara. Harga per-token tidak berubah, sehingga biaya permintaan yang setara dapat berbeda. Jalankan ulang token counting terhadap Claude Sonnet 5 alih-alih menggunakan kembali hitungan yang diukur terhadap model sebelumnya.
128k token output maksimum (tidak berubah): Claude Sonnet 5 mendukung hingga 128k token output, sama dengan Claude Sonnet 4.6. Nilai max_tokens yang ada tetap valid. Perhitungkan tokenizer baru saat menentukan ukurannya.
Prefilling pesan asisten (tidak berubah): Prefilling pesan asisten mengembalikan error 400 pada Claude Sonnet 5, sama seperti pada Claude Sonnet 4.6. Jika Anda menghapus prefill saat bermigrasi ke Claude Sonnet 4.6, tidak ada perubahan lebih lanjut yang diperlukan. Gunakan structured outputs, instruksi prompt sistem, atau output_config.format sebagai gantinya.
Adaptive thinking aktif secara default: Pada Claude Sonnet 4.6, permintaan tanpa field thinking berjalan tanpa thinking; pada Claude Sonnet 5, permintaan yang sama berjalan dengan adaptive thinking. Untuk mematikan thinking, kirim thinking: {type: "disabled"}. Extended thinking manual (thinking: {type: "enabled", budget_tokens: N}) tidak didukung dan mengembalikan error 400. Gunakan parameter effort (default high) untuk mengontrol kedalaman thinking.
Parameter sampling dihapus: Parameter sampling (temperature, top_p, top_k) yang diatur ke nilai non-default tidak diterima dan mengembalikan error 400.
Pengamanan keamanan siber: Claude Sonnet 5 adalah model tingkat Sonnet pertama dengan pengamanan keamanan siber real-time. Permintaan yang melibatkan topik keamanan siber yang terlarang atau berisiko tinggi mungkin ditolak. Penolakan dikembalikan sebagai respons HTTP 200 yang berhasil dengan stop_reason: "refusal", bukan error. Lihat Safeguards, warnings, and appeals untuk latar belakang.
claude-sonnet-4-6 ke claude-sonnet-5.max_tokens yang diatur mendekati panjang output yang Anda harapkan, dan naikkan hingga maksimum 128k (tidak berubah dari Claude Sonnet 4.6) jika berguna.thinking: {type: "enabled", budget_tokens: N} (mengembalikan error 400). Adaptive thinking aktif secara default; kirim {type: "disabled"} untuk mematikannya, atau gunakan parameter effort untuk mengontrol kedalaman.temperature, top_p, dan top_k yang diatur ke nilai non-default (mengembalikan error 400 pada Claude Sonnet 5).stop_reason: "refusal" jika beban kerja Anda mungkin menyentuh topik keamanan siber.max_tokens untuk beban kerja yang sebelumnya berjalan tanpa thinking.Claude Sonnet 4.6 menggabungkan kecerdasan yang kuat dengan performa cepat, menampilkan kemampuan pencarian agentik yang ditingkatkan dan code execution gratis ketika digunakan dengan web search atau web fetch. Model ini ideal untuk coding sehari-hari, analisis, dan tugas konten.
Untuk gambaran lengkap kemampuan, lihat gambaran umum model.
Harga Sonnet 4.6 adalah $3 per juta token input, $15 per juta token output. Lihat harga Claude untuk detailnya.
Perbarui nama model Anda:
# Dari Sonnet 4.5
model = "claude-sonnet-4-5" # Before
model = "claude-sonnet-4-6" # AfterPrefilling pesan asisten tidak lagi didukung
Ini adalah perubahan yang merusak saat bermigrasi dari Sonnet 4.5 atau lebih awal.
Prefilling pesan asisten mengembalikan error 400 pada Sonnet 4.6. Gunakan structured outputs, instruksi prompt sistem, atau output_config.format sebagai gantinya.
Kasus penggunaan prefill umum dan migrasinya:
Mengontrol format output (memaksa output JSON/YAML): Gunakan structured outputs atau alat dengan field enum untuk tugas klasifikasi.
Menghilangkan pembukaan (menghapus frasa "Here is..."): Tambahkan instruksi langsung dalam prompt sistem: "Respond directly without preamble. Do not start with phrases like 'Here is...', 'Based on...', etc."
Menghindari penolakan yang buruk: Claude sekarang jauh lebih baik dalam penolakan yang sesuai. Prompting yang jelas dalam pesan pengguna tanpa prefill seharusnya sudah cukup.
Kelanjutan (melanjutkan respons yang terputus): Pindahkan kelanjutan ke pesan pengguna: "Your previous response was interrupted and ended with [previous_response]. Continue from where you left off."
Hidrasi konteks / konsistensi peran (menyegarkan konteks dalam percakapan panjang): Masukkan apa yang sebelumnya merupakan pengingat asisten yang di-prefill ke dalam giliran pengguna sebagai gantinya.
Escaping JSON parameter alat mungkin berbeda
Ini adalah perubahan yang merusak saat bermigrasi dari Sonnet 4.5 atau lebih awal.
Escaping string JSON dalam parameter alat mungkin berbeda dari model sebelumnya. Parser JSON standar menangani ini secara otomatis, tetapi parsing berbasis string kustom mungkin memerlukan pembaruan.
Perbarui parameter sampling
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Gunakan hanya temperature ATAU top_p, bukan keduanya.
Perbarui versi alat
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Perbarui ke versi alat terbaru (text_editor_20250728, code_execution_20250825). Hapus semua kode yang menggunakan perintah undo_edit.
Tangani stop reason refusal
Perbarui aplikasi Anda untuk menangani stop reason refusal.
Perbarui prompt Anda untuk perubahan perilaku
Model Claude 4 memiliki gaya komunikasi yang lebih ringkas dan langsung. Tinjau praktik terbaik prompting untuk panduan optimasi.
fine-grained-tool-streaming-2025-05-14: Fine-grained tool streaming sekarang GA pada Sonnet 4.6 dan tidak lagi memerlukan header beta.output_format ke output_config.format: Parameter output_format sudah deprecated. Gunakan output_config.format sebagai gantinya.Pertimbangkan untuk bermigrasi dari Sonnet 4.5 ke Sonnet 4.6, yang memberikan kecerdasan lebih tinggi dengan harga yang sama.
Sonnet 4.6 secara default menggunakan tingkat effort high, berbeda dengan Sonnet 4.5 yang tidak memiliki parameter effort. Pertimbangkan untuk menyesuaikan parameter effort saat Anda bermigrasi dari Sonnet 4.5 ke Sonnet 4.6. Jika tidak diatur secara eksplisit, Anda mungkin mengalami latensi yang lebih tinggi dengan tingkat effort default.
Jika Anda tidak menggunakan "extended thinking" (pemikiran diperpanjang) pada Sonnet 4.5, Anda dapat melanjutkan tanpa fitur tersebut pada Sonnet 4.6. Anda sebaiknya secara eksplisit mengatur effort ke tingkat yang sesuai untuk kasus penggunaan Anda. Pada effort low dengan thinking dinonaktifkan, Anda dapat mengharapkan performa yang serupa atau lebih baik dibandingkan Sonnet 4.5 tanpa pemikiran diperpanjang.
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
output_config={"effort": "low"},
messages=[{"role": "user", "content": "Your prompt here"}],
)Jika Anda menggunakan pemikiran diperpanjang dengan budget_tokens pada Sonnet 4.5, fitur ini masih berfungsi pada Sonnet 4.6 tetapi sudah tidak digunakan lagi (deprecated). Migrasikan ke adaptive thinking dengan parameter effort.
Adaptive thinking (pemikiran adaptif) adalah pengganti yang direkomendasikan untuk budget_tokens pada Sonnet 4.6. Fitur ini sangat cocok untuk pola beban kerja berikut:
high. Jika latensi atau penggunaan token menjadi perhatian, turunkan ke medium.Saat menggunakan adaptive thinking, evaluasi effort medium dan high pada tugas Anda. Tingkat yang tepat bergantung pada trade-off beban kerja Anda antara kualitas, latensi, dan penggunaan token.
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"},
messages=[{"role": "user", "content": "Your prompt here"}],
)Jika Anda melihat perilaku yang tidak konsisten atau penurunan kualitas dengan adaptive thinking, coba turunkan pengaturan effort atau gunakan max_tokens sebagai batas keras terlebih dahulu. Pemikiran diperpanjang dengan budget_tokens masih berfungsi pada Sonnet 4.6 tetapi sudah tidak digunakan lagi (deprecated) dan tidak lagi direkomendasikan.
Jika Anda perlu mempertahankan budget_tokens untuk sementara selama migrasi, budget sekitar 16k token memberikan ruang yang cukup untuk masalah yang lebih sulit tanpa risiko penggunaan token yang tidak terkendali. Konfigurasi ini sudah tidak digunakan lagi (deprecated) dan akan dihapus pada rilis model mendatang.
Untuk agentic coding, desain frontend, alur kerja yang banyak menggunakan alat, dan alur kerja enterprise yang kompleks, mulailah dengan effort medium. Jika Anda merasa latensi terlalu tinggi, pertimbangkan untuk menurunkan effort ke low. Jika Anda membutuhkan kecerdasan yang lebih tinggi, pertimbangkan untuk meningkatkan effort ke high atau bermigrasi ke Opus 4.7.
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=16384,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "medium"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)Untuk chat, pembuatan konten, pencarian, klasifikasi, dan tugas non-coding lainnya, mulailah dengan effort low dengan pemikiran diperpanjang. Jika Anda membutuhkan kedalaman lebih, tingkatkan effort ke medium.
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "low"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)claude-sonnet-4-6output_config.format sebagai gantinyatext_editor_20250728, code_execution_20250825); versi lama tidak didukung (jika bermigrasi dari 3.x)undo_edit (jika berlaku)temperature ATAU top_p, bukan keduanya (jika bermigrasi dari 3.x)refusal yang baru di aplikasi Andafine-grained-tool-streaming-2025-05-14 (sekarang sudah GA)output_format ke output_config.formatthinking: {type: "enabled", budget_tokens: N} ke thinking: {type: "adaptive"} dengan parameter effort (budget_tokens sudah tidak digunakan lagi dan akan dihapus pada rilis mendatang)Claude Sonnet 4.5 menggabungkan kecerdasan yang kuat dengan performa yang cepat, menjadikannya ideal untuk tugas coding, analisis, dan konten sehari-hari.
Untuk gambaran lengkap tentang kemampuan, lihat ikhtisar model.
Harga Sonnet 4.5 adalah $3 per juta token input, $15 per juta token output. Lihat harga Claude untuk detailnya.
Perbarui nama model Anda:
# Dari Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Before
model = "claude-sonnet-4-5-20250929" # AfterPerubahan yang merusak ini berlaku saat bermigrasi dari model Claude 3.x Sonnet.
Perbarui parameter sampling
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Gunakan hanya temperature ATAU top_p, bukan keduanya.
Perbarui versi alat
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Perbarui ke versi alat terbaru (text_editor_20250728, code_execution_20250825). Hapus kode apa pun yang menggunakan perintah undo_edit.
Tangani stop reason refusal
Perbarui aplikasi Anda untuk menangani stop reason refusal.
Perbarui prompt Anda untuk perubahan perilaku
Model Claude 4 memiliki gaya komunikasi yang lebih ringkas dan langsung. Tinjau praktik terbaik prompting untuk panduan optimasi.
claude-sonnet-4-5-20250929text_editor_20250728, code_execution_20250825); versi lama tidak didukung (jika bermigrasi dari 3.x)undo_edit (jika berlaku)temperature ATAU top_p, bukan keduanya (jika bermigrasi dari 3.x)refusal yang baru di aplikasi AndaClaude Haiku 4.5 adalah model Haiku tercepat dan paling cerdas dengan performa mendekati frontier, memberikan kualitas model premium untuk aplikasi interaktif dan pemrosesan volume tinggi.
Untuk gambaran lengkap tentang kemampuan, lihat ikhtisar model.
Harga Haiku 4.5 adalah $1 per juta token input, $5 per juta token output. Lihat harga Claude untuk detailnya.
Perbarui nama model Anda:
# Dari Haiku 3.5
model = "claude-3-5-haiku-20241022" # Before
model = "claude-haiku-4-5-20251001" # AfterTinjau batas laju baru: Haiku 4.5 memiliki batas laju yang terpisah dari Haiku 3.5. Lihat dokumentasi batas laju untuk detailnya.
Untuk peningkatan performa yang signifikan pada tugas coding dan penalaran, pertimbangkan untuk mengaktifkan pemikiran diperpanjang dengan thinking: {type: "enabled", budget_tokens: N}.
Pemikiran diperpanjang memengaruhi efisiensi caching prompt.
Pemikiran diperpanjang sudah tidak digunakan lagi (deprecated) pada model Claude 4.6 dan dihapus pada Claude Opus 4.7. Jika menggunakan model yang lebih baru, gunakan adaptive thinking sebagai gantinya.
Jelajahi kemampuan baru: Lihat ikhtisar model untuk detail tentang kesadaran konteks, peningkatan kapasitas output (64k token), kecerdasan yang lebih tinggi, dan kecepatan yang lebih baik.
Perubahan yang merusak ini berlaku saat bermigrasi dari model Claude 3.x Haiku.
Perbarui parameter sampling
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Gunakan hanya temperature ATAU top_p, bukan keduanya.
Perbarui versi alat
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Perbarui ke versi alat terbaru (text_editor_20250728, code_execution_20250825). Hapus kode apa pun yang menggunakan perintah undo_edit.
Tangani stop reason refusal
Perbarui aplikasi Anda untuk menangani stop reason refusal.
Perbarui prompt Anda untuk perubahan perilaku
Model Claude 4 memiliki gaya komunikasi yang lebih ringkas dan langsung. Tinjau praktik terbaik prompting untuk panduan optimasi.
claude-haiku-4-5-20251001text_editor_20250728, code_execution_20250825); versi lama tidak didukungundo_edit (jika berlaku)temperature ATAU top_p, bukan keduanyarefusal yang baru di aplikasi AndaWas this page helpful?