Model & hargaModel

Panduan migrasi

Panduan untuk bermigrasi ke model Claude terbaru dari versi Claude sebelumnya

Panduan ini membahas migrasi kode Messages API. Jika Anda menggunakan Claude Managed Agents, tidak ada perubahan yang diperlukan selain memperbarui nama model.

Otomatiskan migrasi Anda dengan skill Claude API. Di Claude Code, jalankan /claude-api migrate untuk memanggil skill Claude API bawaan. Skill ini berfungsi untuk model target mana pun di halaman ini:

/claude-api migrate this project to claude-opus-4-8

Skill ini menerapkan penggantian ID model dan, sesuai kebutuhan, perubahan parameter yang bersifat breaking, penggantian prefill, dan kalibrasi effort untuk model target Anda di seluruh basis kode, lalu menghasilkan daftar periksa item yang perlu diverifikasi secara manual. Skill ini meminta Anda untuk mengonfirmasi cakupan migrasi (seluruh direktori kerja, subdirektori, atau daftar file tertentu) sebelum mengedit file apa pun. Skill ini juga mendeteksi klien Amazon Bedrock, Google Cloud, Claude Platform on AWS, dan Microsoft Foundry serta menyesuaikan format ID model dan perubahan fitur untuk setiap platform.

Bermigrasi dari Claude Mythos Preview ke Claude Mythos 5

Claude Mythos 5 adalah penerus dengan akses terbatas dari Claude Mythos Preview, pratinjau riset yang hanya tersedia melalui undangan. Untuk model yang tersedia secara umum dengan kemampuan yang sama, lihat Claude Fable 5.

Migrasi sebagian besar bersifat drop-in. Claude Mythos 5 menggunakan Messages API yang sama dan pola penggunaan alat yang sama seperti Claude Mythos Preview, dan jumlah token kurang lebih tidak berubah karena kedua model menggunakan tokenizer yang sama. Perubahan utama yang perlu diperiksa adalah fitur-fitur yang tidak lagi tersedia (tercantum di bagian berikutnya) dan output thinking.

Untuk jadwal penghentian Claude Mythos Preview, lihat Penghentian model.

Perbarui nama model Anda

model = "claude-mythos-preview"  # Before
model = "claude-mythos-5"  # After

Fitur yang tidak tersedia di Claude Mythos 5

Pemikiran diperpanjang dan anggaran token thinking: Pemikiran diperpanjang manual (thinking: {type: "enabled", budget_tokens: N}) tidak didukung pada claude-mythos-5 dan mengembalikan error 400. Adaptive thinking selalu aktif: model menentukan kapan dan seberapa banyak berpikir pada setiap permintaan, dan tidak ada konfigurasi thinking yang diperlukan. thinking: {type: "disabled"} mengembalikan error. budget_tokens tidak memiliki pengganti langsung: thinking bersifat adaptif, dan parameter effort adalah kontrol tingkat output yang terpisah, bukan anggaran thinking.

Sebelum (Claude Mythos Preview):
```
client.messages.create(
    model="claude-mythos-preview",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 10000},
    messages=[{"role": "user", "content": "..."}],
)
```
Sesudah (Claude Mythos 5):
```
client.messages.create(
    model="claude-mythos-5",
    max_tokens=16000,
    messages=[{"role": "user", "content": "..."}],
)
```
Prefill asisten: Mengisi awal (prefill) pesan asisten tidak didukung pada claude-mythos-5 dan mengembalikan error 400, sama seperti pada Claude Mythos Preview. Gunakan instruksi prompt sistem sebagai gantinya.
Output thinking: Pada claude-mythos-5, rantai pemikiran mentah tidak pernah dikembalikan, tetapi blok thinking tetap membawa teks ringkasan yang dapat dibaca ketika thinking.display diatur ke summarized. Kirim kembali blok thinking tanpa perubahan saat melanjutkan percakapan pada model yang sama. Lihat Output thinking pada Claude Fable 5 dan Claude Mythos 5.

Penghitungan token dan penagihan

claude-mythos-5 menggunakan tokenizer yang sama dengan claude-mythos-preview (tokenizer yang diperkenalkan dengan Claude Opus 4.7). Jumlah token kurang lebih tidak berubah saat bermigrasi dari claude-mythos-preview. Dibandingkan dengan model sebelum Claude Opus 4.7, konten yang sama dapat ditokenisasi menjadi sekitar 30% lebih banyak token, bervariasi berdasarkan konten dan bentuk beban kerja.

/v1/messages/count_tokens mengembalikan nilai yang kurang lebih tidak berubah untuk claude-mythos-5 dibandingkan dengan claude-mythos-preview. Tetapkan ulang baseline biaya dan latensi pada beban kerja Anda sendiri.

Daftar periksa migrasi

Perbarui nama model dari claude-mythos-preview ke claude-mythos-5.
Hapus konfigurasi pemikiran diperpanjang manual (thinking: {type: "enabled", budget_tokens: N}). Adaptive thinking selalu aktif, dan tidak ada field thinking yang diperlukan.
Hapus konfigurasi thinking: {type: "disabled"} apa pun. Menonaktifkan thinking mengembalikan error pada claude-mythos-5.
Hapus budget_tokens. Parameter ini tidak memiliki pengganti langsung: thinking bersifat adaptif, dan parameter effort adalah kontrol tingkat output yang terpisah, bukan anggaran thinking.
Verifikasi bahwa kode apa pun yang mem-parse field thinking memperlakukannya sebagai teks tampilan saja dan mengirim kembali blok thinking tanpa perubahan saat melanjutkan pada model yang sama. thinking.display secara default adalah "omitted" pada claude-mythos-5, sama seperti pada Claude Mythos Preview; atur display: "summarized" untuk menerima ringkasan yang dapat dibaca. Lihat Output thinking pada Claude Fable 5 dan Claude Mythos 5.
Jika Anda memutar ulang riwayat percakapan pada model lain, hapus blok thinking dan redacted_thinking dari giliran asisten sebelumnya terlebih dahulu. Blok thinking dari claude-mythos-5 terikat pada model yang menghasilkannya, dan model selain Claude Fable 5 dan Claude Mythos 5 mengabaikannya secara diam-diam. Menghapusnya menjaga permintaan lintas model tetap minimal dan seragam.
Tetapkan ulang baseline jumlah token dan biaya pada beban kerja Anda sendiri. Jumlah token kurang lebih tidak berubah saat bermigrasi dari claude-mythos-preview.

Bermigrasi dari Claude Opus 4.8 ke Claude Fable 5

Claude Fable 5 adalah model Anthropic paling mumpuni yang dirilis secara luas, tersedia secara umum di Claude API, Claude Platform on AWS, Amazon Bedrock, Google Cloud, dan Microsoft Foundry.

Migrasi sebagian besar bersifat drop-in. Claude Fable 5 menggunakan Messages API yang sama dan pola penggunaan alat yang sama seperti Claude Opus 4.8. Model ini mendukung jendela konteks 1 juta token yang sama secara default dan 128k token output maksimum yang sama. Jumlah token kurang lebih tidak berubah karena kedua model menggunakan tokenizer yang sama.

Perubahan utama yang perlu diperiksa adalah adaptive thinking yang selalu aktif, output thinking, penolakan oleh safety classifier, dan harga. Sebelum Anda bermigrasi membahas harga dan retensi data; Apa yang berubah membahas sisanya.

Sebelum Anda bermigrasi

Claude Fable 5 dihargai $10 per juta token input dan $50 per juta token output, dibandingkan dengan $5 dan $25 untuk Claude Opus 4.8. Lihat Harga Claude untuk detailnya.

Claude Fable 5 memerlukan retensi data 30 hari dan tidak tersedia di bawah pengaturan "zero data retention" (retensi data nol), atau ZDR; model ini ditetapkan sebagai Covered Model. Pada Claude API, permintaan dari organisasi yang konfigurasi retensi datanya tidak memenuhi persyaratan ini mengembalikan 400 invalid_request_error. Organisasi dengan pengaturan ZDR harus menghubungi tim akun Anthropic mereka untuk membahas konfigurasi retensi data; Claude Opus 4.8 tetap tersedia di bawah ZDR. Sebagai alternatif, Anda dapat mengonfigurasi retensi data per workspace. Persyaratan retensi data 30 hari berlaku di setiap platform tempat Claude Fable 5 ditawarkan; lihat Persyaratan retensi data khusus model untuk detail per platform.

Jika kode Anda berada di Claude Opus 4.7 atau lebih lama, terapkan terlebih dahulu Bermigrasi dari Claude Opus 4.7 ke Claude Opus 4.8 dan, untuk model yang lebih lama dari Claude Opus 4.7, langkah-langkah migrasi Claude Opus 4.7. Bagian-bagian tersebut membahas perubahan yang bersifat breaking (parameter sampling ditolak, pemikiran diperpanjang manual ditolak, prefill dihapus, tokenizer baru) yang tidak diulang di bagian ini.

Perbarui nama model Anda

model = "claude-opus-4-8"  # Before
model = "claude-fable-5"  # After

Apa yang berubah

Item-item di bagian ini menjelaskan perbedaan API dan perilaku yang perlu diperiksa setelah Anda mengganti ID model.

Adaptive thinking selalu aktif: Adaptive thinking adalah satu-satunya mode thinking pada claude-fable-5. Model menentukan kapan dan seberapa banyak berpikir pada setiap permintaan, dan tidak ada konfigurasi thinking yang diperlukan. thinking: {type: "disabled"} mengembalikan error. Gunakan parameter effort untuk mengontrol kedalaman thinking.

Perubahan perilaku yang perlu diperiksa: pada Claude Opus 4.8, permintaan tanpa field thinking berjalan tanpa thinking; pada claude-fable-5, permintaan yang sama tersebut berjalan dengan adaptive thinking. max_tokens tetap menjadi batas keras pada total output, thinking ditambah teks respons, jadi tinjau kembali untuk beban kerja yang berjalan tanpa thinking pada Claude Opus 4.8. Lihat Kontrol biaya.

Sebelum (Claude Opus 4.8):
```
client.messages.create(
    model="claude-opus-4-8",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "high"},
    messages=[{"role": "user", "content": "..."}],
)
```
Sesudah (Claude Fable 5):
```
client.messages.create(
    model="claude-fable-5",
    max_tokens=16000,
    output_config={"effort": "high"},
    messages=[{"role": "user", "content": "..."}],
)
```
Pemikiran diperpanjang dan anggaran thinking (tidak berubah): Pemikiran diperpanjang manual (thinking: {type: "enabled", budget_tokens: N}) tidak didukung pada claude-fable-5 dan mengembalikan error 400, sama seperti pada Claude Opus 4.8. budget_tokens tidak memiliki pengganti langsung: thinking bersifat adaptif, dan parameter effort adalah kontrol tingkat output yang terpisah, bukan anggaran thinking.
Prefill asisten (tidak berubah): Mengisi awal (prefill) pesan asisten tidak didukung pada claude-fable-5 dan mengembalikan error 400, sama seperti pada Claude Opus 4.8. Gunakan instruksi prompt sistem sebagai gantinya.
Output thinking: Pada claude-fable-5, rantai pemikiran mentah tidak pernah dikembalikan, tetapi blok thinking tetap membawa teks ringkasan yang dapat dibaca ketika thinking.display diatur ke summarized. Kirim kembali blok thinking tanpa perubahan saat melanjutkan percakapan pada model yang sama. Lihat Output thinking pada Claude Fable 5 dan Claude Mythos 5.
Safety classifier dan stop reason refusal: claude-fable-5 menjalankan safety classifier pada permintaan dan selama pembuatan respons. Ketika classifier menolak permintaan, Messages API mengembalikan stop_reason: "refusal" sebagai respons HTTP 200 yang berhasil, bukan error. Field stop_details.category melaporkan classifier mana yang terpicu, dengan kategori seperti "cyber", "bio", dan "reasoning_extraction", atau null ketika penolakan tidak dipetakan ke kategori bernama. Lihat tabel kategori penolakan untuk daftar lengkapnya.

Anda tidak ditagih untuk token input dari permintaan yang ditolak sebelum output apa pun dihasilkan. Ketika classifier terpicu di tengah stream, input dan output yang sudah di-stream ditagih; buang output parsial tersebut.

Untuk menjalankan ulang permintaan yang ditolak pada model lain secara otomatis, berikan parameter opt-in fallbacks, yang masih dalam tahap beta di Claude API dan Claude Platform on AWS. Parameter ini tidak tersedia di Message Batches API atau di Amazon Bedrock, Google Cloud, dan Microsoft Foundry; pada ketiga platform tersebut, jalankan retry di sisi klien atau gunakan middleware refusal-fallback SDK. Lihat Menangani stop reason.
Mulai dengan effort high: Default parameter effort tetap high. Pada Claude Opus 4.8, rekomendasi untuk pekerjaan coding dan otonomi tinggi adalah mengatur xhigh secara eksplisit. Pada claude-fable-5, gunakan high sebagai default untuk sebagian besar tugas dan simpan xhigh untuk beban kerja yang paling sensitif terhadap kapabilitas. Pengaturan effort yang lebih rendah pada claude-fable-5 tetap berkinerja baik dan sering kali melampaui kinerja xhigh pada model sebelumnya. Kurangi effort jika tugas selesai tetapi memakan waktu lebih lama dari yang diperlukan. Lihat Prompting Claude Fable 5.
Minimum caching prompt lebih rendah: Panjang prompt minimum yang dapat di-cache pada claude-fable-5 adalah 512 token, lebih rendah dari 1.024 token pada Claude Opus 4.8. Prompt yang terlalu pendek untuk di-cache pada Claude Opus 4.8 sekarang dapat membuat entri cache, tanpa perubahan kode yang diperlukan. Pada Amazon Bedrock, minimum untuk claude-fable-5 adalah 1.024 token. Lihat Caching prompt untuk minimum per model.

Daftar periksa migrasi

Jika organisasi Anda memiliki pengaturan "zero data retention" (ZDR), konfirmasikan kelayakan sebelum bermigrasi. claude-fable-5 memerlukan retensi data 30 hari dan, pada Claude API, mengembalikan 400 invalid_request_error jika tidak terpenuhi. Lihat Persyaratan retensi data khusus model.
Perbarui nama model dari claude-opus-4-8 ke claude-fable-5.
Hapus konfigurasi thinking: {type: "disabled"} apa pun. Menonaktifkan thinking mengembalikan error pada claude-fable-5, dan permintaan tanpa field thinking berjalan dengan adaptive thinking.
Jika Anda menghapus pemikiran diperpanjang manual dan prefill asisten selama migrasi sebelumnya, tidak ada tindakan yang diperlukan: keduanya tetap tidak didukung pada claude-fable-5.
Verifikasi bahwa kode apa pun yang mem-parse field thinking memperlakukannya sebagai teks tampilan saja dan mengirim kembali blok thinking tanpa perubahan saat melanjutkan pada model yang sama. thinking.display secara default adalah "omitted" pada claude-fable-5, sama seperti pada Claude Opus 4.8; atur display: "summarized" untuk menerima ringkasan yang dapat dibaca. Lihat Output thinking pada Claude Fable 5 dan Claude Mythos 5.
Jika Anda memutar ulang riwayat percakapan pada model lain, hapus blok thinking dan redacted_thinking dari giliran asisten sebelumnya terlebih dahulu. Blok thinking dari claude-fable-5 terikat pada model yang menghasilkannya, dan model selain Claude Fable 5 dan Claude Mythos 5 mengabaikannya secara diam-diam. Menghapusnya menjaga permintaan lintas model tetap minimal dan seragam. Pengecualiannya adalah menukarkan kredit fallback, yang memerlukan body permintaan yang di-echo sesuai aturan persis fitur tersebut.
Tangani stop_reason: "refusal" dan baca field stop_details.category. Untuk menjalankan ulang permintaan yang ditolak pada model lain secara otomatis, pertimbangkan parameter opt-in fallbacks (beta). Lihat Menangani stop reason.
Evaluasi ulang pengaturan effort Anda. Mulai dengan high untuk sebagian besar tugas, termasuk beban kerja yang berjalan pada xhigh di Claude Opus 4.8.
Tetapkan ulang baseline biaya dan latensi pada beban kerja Anda sendiri. Jumlah token kurang lebih tidak berubah saat bermigrasi dari claude-opus-4-8; harga per token berbeda.

Bermigrasi dari Claude Opus 4.7 ke Claude Opus 4.8

Claude Opus 4.8 dibangun untuk coding agentic yang kompleks dan pekerjaan enterprise. Model ini dibangun di atas Claude Opus 4.7.

Claude Opus 4.8 seharusnya memiliki kinerja out-of-the-box yang kuat pada prompt dan eval Claude Opus 4.7 yang sudah ada. Tidak ada perubahan API yang bersifat breaking untuk kode yang sudah berjalan di Claude Opus 4.7. Model ini mendukung set fitur yang sama seperti Claude Opus 4.7, termasuk jendela konteks 1 juta token, 128k token output maksimum, adaptive thinking, caching prompt, pemrosesan batch, Files API, dukungan PDF, vision, dan set lengkap alat sisi server dan sisi klien. Model ini juga menambahkan pesan sistem di tengah percakapan dan mendokumentasikan secara publik detail stop penolakan.

Jika kode Anda berada di Claude Opus 4.6 atau lebih lama, terapkan juga langkah-langkah migrasi Claude Opus 4.7 di bawah sebelum meningkatkan ke Claude Opus 4.8. Langkah-langkah tersebut mencakup perubahan yang bersifat breaking (parameter sampling ditolak, pemikiran diperpanjang manual ditolak, tokenizer baru) yang tidak dicakup oleh peningkatan ke 4.8 saja.

Perbarui nama model Anda

# Migrasi Opus
model = "claude-opus-4-7"  # Before
model = "claude-opus-4-8"  # After

Apa yang berubah

Ini bukan perubahan yang bersifat breaking. Kode yang berjalan di Claude Opus 4.7 terus berfungsi tanpa perubahan di Claude Opus 4.8. Item-item di bawah ini menjelaskan perbedaan perilaku yang perlu diperiksa setelah Anda mengganti ID model.

Parameter sampling (tidak berubah): Mengatur temperature, top_p, atau top_k ke nilai non-default mengembalikan error 400 pada Claude Opus 4.8, sama seperti pada Claude Opus 4.7. Tipe permintaan SDK masih mendefinisikan field-field ini untuk kompatibilitas dengan model sebelumnya, sehingga kode yang mengaturnya lolos type-check, tetapi API menolak permintaan di sisi server. Jika Anda menghapus parameter ini saat bermigrasi ke Opus 4.7, tidak ada perubahan lebih lanjut yang diperlukan.
Default effort adalah high: Default parameter effort pada Claude Opus 4.8 adalah high di semua permukaan, termasuk Claude Code dan Messages API. Jika Anda sudah mengatur effort secara eksplisit, pengaturan Anda tidak berubah. Untuk pekerjaan coding dan otonomi tinggi, atur xhigh secara eksplisit. Evaluasi ulang pengaturan effort Anda terhadap anggaran latensi dan biaya Anda.
Jendela konteks 1 juta adalah default: Claude Opus 4.8 menyajikan jendela konteks 1 juta token penuh secara default tanpa header beta dan tanpa premium konteks panjang. Jika klien Anda mengirimkan header beta jendela konteks untuk kompatibilitas dengan model lama, Anda dapat menghapusnya pada Claude Opus 4.8.
Pesan sistem di tengah percakapan: Claude Opus 4.8 menerima pesan role: "system" segera setelah giliran pengguna dalam array messages (tunduk pada aturan penempatan). Gunakan field system tingkat atas untuk instruksi yang berlaku sejak awal. Model sebelumnya, termasuk Claude Opus 4.7, menolak role: "system" dalam messages dengan error 400. Jika Anda memelihara jalur kode yang membangun ulang seluruh riwayat pesan untuk memperbarui instruksi, Anda dapat menyederhanakannya dan mempertahankan hit cache prompt pada giliran sebelumnya.
Detail stop penolakan: Objek stop_details pada respons penolakan (tersedia sejak Claude Opus 4.7) sekarang didokumentasikan secara publik. Ketika model menolak permintaan, objek ini mengidentifikasi kategori penolakan, selain stop reason refusal yang sudah ada. Tidak ada header beta yang diperlukan, dan tidak ada opt-out. Lihat Menangani stop reason.
Minimum caching prompt lebih rendah: Panjang prompt minimum yang dapat di-cache pada Claude Opus 4.8 adalah 1.024 token, lebih rendah dari pada Claude Opus 4.7. Prompt yang terlalu pendek untuk di-cache pada Claude Opus 4.7 sekarang dapat membuat entri cache, tanpa perubahan kode yang diperlukan. Lihat Caching prompt untuk minimum per model.
Tingkat effort dikalibrasi ulang: Alokasi token di balik setiap tingkat effort berubah pada Claude Opus 4.8 dibandingkan dengan Claude Opus 4.7: medium memungkinkan thinking yang sedikit lebih banyak, high sedikit lebih sedikit, dan xhigh jauh lebih banyak. Jika Anda menyetel tingkat effort terhadap biaya atau latensi Claude Opus 4.7, tetapkan ulang baseline pada tingkat yang sama sebelum menyesuaikannya. Lihat Effort.

Daftar periksa migrasi

Perbarui nama model dari claude-opus-4-7 ke claude-opus-4-8 (atau perbarui alias).
Jika Anda menghapus parameter sampling selama migrasi Opus 4.7, tidak ada tindakan yang diperlukan. Jika Anda menambahkannya kembali dengan jalur retry 400, hapus jalur retry tersebut.
Evaluasi ulang pengaturan effort Anda. Default adalah high di semua permukaan; untuk pekerjaan coding dan otonomi tinggi, atur xhigh secara eksplisit.
Hapus header beta jendela konteks apa pun. Jendela konteks 1 juta adalah default di Claude API, Amazon Bedrock, Google Cloud, dan Microsoft Foundry.
Jika Anda membangun ulang riwayat percakapan untuk memperbarui instruksi, pertimbangkan untuk beralih ke pesan sistem di tengah percakapan untuk mempertahankan hit cache prompt.
Verifikasi bahwa penanganan stop-reason Anda membaca stop_details pada penolakan (tersedia sejak Claude Opus 4.7; sekarang didokumentasikan secara publik).
Tetapkan ulang baseline biaya dan latensi pada tingkat effort yang Anda pilih.

Bermigrasi ke Claude Opus 4.7

Claude Opus 4.7 sangat otonom dan berkinerja sangat baik pada pekerjaan agentic jangka panjang, pekerjaan pengetahuan, tugas vision, dan tugas memori.

Claude Opus 4.7 seharusnya memiliki kinerja out-of-the-box yang kuat pada prompt dan eval Claude Opus 4.6 yang sudah ada dengan harga $5 / $25 per MTok yang sama, tetapi ada beberapa perubahan perilaku dan API yang perlu diketahui saat Anda bermigrasi. Model ini mendukung set fitur yang sama seperti Claude Opus 4.6, termasuk:

Jendela konteks 1 juta token dengan harga API standar tanpa premium konteks panjang
128k token output maksimum
Adaptive thinking
Caching prompt
Pemrosesan batch
Files API
Dukungan PDF
Vision
Set lengkap alat sisi server dan sisi klien (bash, eksekusi kode, penggunaan komputer, editor teks, pencarian web, web fetch, konektor MCP, memori)

Perbarui nama model Anda

# Migrasi Opus
model = "claude-opus-4-6"  # Before
model = "claude-opus-4-7"  # After

Perubahan yang bersifat breaking

Pemikiran diperpanjang dihapus: thinking: {type: "enabled", budget_tokens: N} tidak lagi didukung pada Claude Opus 4.7 atau model yang lebih baru dan mengembalikan error 400. Beralihlah ke adaptive thinking (thinking: {type: "adaptive"}) dan gunakan parameter effort untuk mengontrol kedalaman thinking. Adaptive thinking nonaktif secara default pada Claude Opus 4.7: permintaan tanpa field thinking berjalan tanpa thinking, sesuai dengan perilaku Opus 4.6. Atur thinking: {type: "adaptive"} secara eksplisit untuk mengaktifkannya.

Sebelum (Claude Opus 4.6):
```
client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 10000},
    messages=[{"role": "user", "content": "..."}],
)
```
Sesudah (Claude Opus 4.7):
```
client.messages.create(
    model="claude-opus-4-7",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "high"},  # or "max", "xhigh", "medium", "low"
    messages=[{"role": "user", "content": "..."}],
)
```
Adaptive thinking dapat diarahkan melalui prompting. Untuk panduan tentang penyetelan ketika model berpikir terlalu banyak atau terlalu sedikit, lihat Mengkalibrasi effort dan kedalaman thinking.
Parameter sampling dihapus: Mengatur temperature, top_p, atau top_k ke nilai non-default apa pun pada Claude Opus 4.7 mengembalikan error 400. Jalur migrasi paling aman adalah menghilangkan parameter ini sepenuhnya dari payload permintaan. Prompting adalah cara yang direkomendasikan untuk memandu perilaku model pada Claude Opus 4.7. Jika Anda menggunakan temperature = 0 untuk determinisme, perhatikan bahwa hal itu tidak pernah menjamin output yang identik pada model sebelumnya.
Konten thinking dihilangkan secara default: Blok thinking masih muncul dalam stream respons pada Claude Opus 4.7, tetapi field thinking-nya kosong kecuali Anda secara eksplisit memilih untuk menampilkannya. Ini adalah perubahan diam-diam dari Claude Opus 4.6, di mana default-nya adalah mengembalikan teks thinking yang diringkas. Untuk mengembalikan konten thinking yang diringkas pada Claude Opus 4.7, atur thinking.display ke "summarized":
```
thinking = {
    "type": "adaptive",
    "display": "summarized",
}
```
Default-nya adalah "omitted" pada Claude Opus 4.7. Jika produk Anda melakukan streaming penalaran ke pengguna, default baru ini muncul sebagai jeda panjang sebelum output dimulai; atur display: "summarized" untuk mengembalikan progres yang terlihat selama thinking. Lihat Pemikiran diperpanjang untuk detailnya.
Penghitungan token yang diperbarui: Claude Opus 4.7 menggunakan tokenizer baru, yang berkontribusi pada peningkatan kinerjanya pada berbagai tugas. Tokenizer baru dapat menggunakan sekitar 1x hingga 1,35x lebih banyak token saat memproses teks dibandingkan dengan model sebelumnya (hingga ~35% lebih banyak, bervariasi berdasarkan konten).

/v1/messages/count_tokens akan mengembalikan jumlah token yang berbeda untuk Claude Opus 4.7 dibandingkan dengan Claude Opus 4.6. Efisiensi token dapat bervariasi berdasarkan bentuk beban kerja.

Intervensi prompting, task_budget, dan effort dapat membantu mengontrol biaya dan memastikan penggunaan token yang sesuai. Kontrol-kontrol ini mungkin mengorbankan kecerdasan model. Perbarui parameter max_tokens Anda untuk memberikan ruang tambahan, termasuk pemicu pemadatan. Claude Opus 4.7 menyediakan jendela konteks 1 juta dengan harga API standar tanpa premium konteks panjang.
Penghapusan prefill (dibawa dari Opus 4.6): Mengisi awal (prefill) pesan asisten mengembalikan error 400 pada Claude Opus 4.7. Gunakan output terstruktur, instruksi prompt sistem, atau output_config.format sebagai gantinya.

Memilih tingkat effort

Parameter effort memungkinkan Anda menyetel kecerdasan Claude vs. pengeluaran token, menukar kapabilitas dengan kecepatan yang lebih cepat dan biaya yang lebih rendah. Mulai dengan tingkat effort xhigh yang baru untuk kasus penggunaan coding dan agentic, dan gunakan minimal effort high untuk sebagian besar kasus penggunaan yang sensitif terhadap kecerdasan. Bereksperimenlah dengan tingkat effort lain untuk lebih menyetel penggunaan token dan kecerdasan:

max: Effort maksimum dapat memberikan peningkatan kinerja dalam beberapa kasus penggunaan, tetapi mungkin menunjukkan hasil yang semakin berkurang dari peningkatan penggunaan token. Pengaturan ini juga terkadang rentan terhadap overthinking. Uji effort maksimum untuk tugas yang menuntut kecerdasan.
xhigh (baru): Effort ekstra tinggi adalah pengaturan terbaik untuk sebagian besar kasus penggunaan coding dan agentic.
high: Pengaturan ini menyeimbangkan penggunaan token dan kecerdasan. Untuk sebagian besar kasus penggunaan yang sensitif terhadap kecerdasan, gunakan minimal effort high.
medium: Baik untuk kasus penggunaan yang sensitif terhadap biaya yang perlu mengurangi penggunaan token sambil mengorbankan kecerdasan.
low: Simpan untuk tugas pendek dengan cakupan terbatas dan beban kerja yang sensitif terhadap latensi yang tidak sensitif terhadap kecerdasan.

Effort lebih penting untuk model ini dibandingkan Opus sebelumnya mana pun. Bereksperimenlah dengannya secara aktif saat Anda melakukan upgrade.

Perubahan perilaku

Claude Opus 4.7 memiliki beberapa perbedaan perilaku dari Claude Opus 4.6 yang bukan merupakan perubahan yang merusak API tetapi mungkin memerlukan pembaruan prompt atau penghapusan scaffolding.

Panjang respons bervariasi berdasarkan kasus penggunaan: Claude Opus 4.7 mengkalibrasi panjang respons berdasarkan seberapa kompleks model menilai tugas tersebut, alih-alih menggunakan tingkat verbositas tetap secara default. Ini biasanya berarti jawaban yang lebih pendek untuk pencarian sederhana dan jawaban yang jauh lebih panjang untuk analisis terbuka.

Jika produk Anda bergantung pada gaya atau verbositas output tertentu, Anda mungkin perlu menyesuaikan prompt Anda. Misalnya, untuk mengurangi verbositas, tambahkan: "Provide concise, focused responses. Skip non-essential context, and keep examples minimal." Jika Anda melihat jenis penjelasan berlebihan tertentu, tambahkan instruksi yang ditargetkan dalam prompt Anda untuk mencegahnya.

Contoh positif yang menunjukkan bagaimana Claude dapat berkomunikasi dengan tingkat keringkasan yang sesuai cenderung lebih efektif daripada contoh negatif atau instruksi yang memberi tahu model apa yang tidak boleh dilakukan.
Mengikuti instruksi secara lebih harfiah: Claude Opus 4.7 menafsirkan prompt secara lebih harfiah dan eksplisit daripada Claude Opus 4.6, terutama pada tingkat effort yang lebih rendah. Model tidak akan secara diam-diam menggeneralisasi instruksi dari satu item ke item lain, dan tidak akan menyimpulkan permintaan yang tidak Anda buat. Sisi positif dari literalisme ini adalah presisi dan lebih sedikit bolak-balik. Model umumnya berkinerja lebih baik untuk kasus penggunaan API dengan prompt yang disetel dengan cermat, ekstraksi terstruktur, dan pipeline di mana Anda menginginkan perilaku yang dapat diprediksi. Peninjauan prompt dan harness mungkin sangat membantu untuk migrasi ke Claude Opus 4.7.
Nada yang lebih langsung: Seperti halnya model baru lainnya, gaya prosa pada penulisan panjang mungkin bergeser. Claude Opus 4.7 lebih langsung dan berpendapat, dengan lebih sedikit frasa yang berorientasi validasi dan lebih sedikit emoji dibandingkan gaya Claude Opus 4.6 yang lebih hangat. Jika produk Anda bergantung pada suara tertentu, evaluasi ulang prompt gaya terhadap baseline baru.
Pembaruan progres bawaan dalam jejak agentik: Claude Opus 4.7 memberikan pembaruan yang lebih teratur dan berkualitas lebih tinggi kepada pengguna sepanjang jejak agentik yang panjang. Jika Anda telah menambahkan scaffolding untuk memaksa pesan status sementara ("After every 3 tool calls, summarize progress"), coba hapus. Jika Anda menemukan bahwa panjang atau isi pembaruan yang ditampilkan kepada pengguna dari Claude Opus 4.7 tidak terkalibrasi dengan baik untuk kasus penggunaan Anda, jelaskan secara eksplisit seperti apa pembaruan ini seharusnya dalam prompt dan berikan contoh.
Lebih sedikit subagent yang dibuat secara default: Claude Opus 4.7 cenderung membuat lebih sedikit subagent secara default. Namun, perilaku ini dapat diarahkan melalui prompting; berikan Claude Opus 4.7 panduan eksplisit tentang kapan subagent diinginkan.
Kalibrasi effort yang lebih ketat: Berubah secara signifikan dari Claude Opus 4.6, Claude Opus 4.7 mematuhi tingkat effort secara ketat, terutama pada tingkat rendah. Pada low dan medium, model membatasi cakupan pekerjaannya pada apa yang diminta alih-alih melampaui ekspektasi.

Ini baik untuk latensi dan biaya, tetapi pada tugas yang cukup kompleks yang berjalan pada effort low ada risiko pemikiran yang kurang mendalam. Jika Anda mengamati penalaran yang dangkal pada masalah kompleks, naikkan effort ke high atau xhigh alih-alih mengatasinya melalui prompting.

Jika Anda perlu mempertahankan effort pada low untuk latensi, tambahkan panduan yang ditargetkan: "This task involves multi-step reasoning. Think carefully through the problem before responding." Lihat Tingkat effort yang direkomendasikan untuk Claude Opus 4.7.
Lebih sedikit pemanggilan alat secara default: Claude Opus 4.7 memiliki kecenderungan untuk menggunakan alat lebih jarang daripada Claude Opus 4.6 dan lebih banyak menggunakan penalaran. Ini menghasilkan hasil yang lebih baik dalam sebagian besar kasus.

Untuk meningkatkan penggunaan alat, naikkan pengaturan effort. Pengaturan effort high atau xhigh menunjukkan penggunaan alat yang jauh lebih banyak dalam pencarian agentik dan coding. Anda juga dapat menyesuaikan prompt Anda untuk secara eksplisit menginstruksikan model tentang kapan dan bagaimana menggunakan alatnya dengan benar.
Pengamanan keamanan siber real-time: Baru ditambahkan di Claude Opus 4.7, permintaan yang melibatkan topik terlarang atau berisiko tinggi dapat menyebabkan penolakan. Untuk pekerjaan keamanan yang sah seperti penetration testing, penelitian kerentanan, atau red-teaming, ajukan permohonan ke Cyber Verification Program untuk meminta pengurangan pembatasan. Lihat Safeguards, warnings, and appeals untuk latar belakang.
Dukungan gambar resolusi tinggi: Claude Opus 4.7 adalah model Claude pertama dengan dukungan gambar resolusi tinggi. Resolusi gambar maksimum adalah 2576 piksel pada sisi panjang, naik dari 1568 piksel pada model sebelumnya. Ini membuka peningkatan pada beban kerja yang berat pada visi dan sangat berharga untuk computer use, pemahaman screenshot, dan analisis dokumen.

Dukungan resolusi tinggi bersifat otomatis dan tidak memerlukan header beta atau opt-in di sisi klien. Dua hal yang perlu direncanakan:
- Gambar resolusi penuh dapat menggunakan hingga sekitar 3x lebih banyak token gambar daripada pada model sebelumnya (hingga 4.784 token per gambar, dibandingkan dengan batas sebelumnya sekitar 1.600 token per gambar). Anggarkan ulang max_tokens dan ekspektasi biaya untuk beban kerja yang berat pada gambar, atau lakukan downsample sebelum mengirim jika Anda tidak memerlukan fidelitas tambahan.
- Koordinat pointing dan bounding-box yang dikembalikan oleh model adalah 1:1 dengan piksel gambar aktual pada Claude Opus 4.7, sehingga tidak diperlukan konversi faktor skala.
Lihat Dukungan gambar resolusi tinggi pada Claude Opus 4.7 untuk detailnya.

Perubahan yang direkomendasikan

Ini tidak wajib tetapi akan meningkatkan pengalaman Anda:

Evaluasi ulang max_tokens: Karena teks yang sama menghasilkan jumlah token yang lebih tinggi pada Claude Opus 4.7, perbarui parameter max_tokens Anda untuk memberikan ruang tambahan, termasuk pemicu compaction. Intervensi prompting, task_budget, dan effort dapat membantu mengontrol biaya dan memastikan penggunaan token yang sesuai.
Audit ekspektasi jumlah token: Setiap jalur kode yang memperkirakan token di sisi klien atau mengasumsikan rasio token-ke-karakter tetap harus diuji ulang terhadap Claude Opus 4.7. Gunakan endpoint Token counting untuk memverifikasi.
Adopsi task budgets (beta): Claude Opus 4.7 memperkenalkan task budgets. Budget ini memungkinkan Anda memberi tahu Claude berapa banyak token yang dimilikinya untuk satu loop agentik penuh, termasuk thinking, pemanggilan alat, hasil alat, dan output akhir. Model melihat hitungan mundur yang berjalan dan menggunakannya untuk memprioritaskan pekerjaan dan menyelesaikan tugas dengan baik saat budget dikonsumsi. Untuk menggunakannya, atur header beta task-budgets-2026-03-13 dan tambahkan yang berikut ke output config Anda:
```
output_config = {
    "effort": "high",
    "task_budget": {"type": "tokens", "total": 128000},
}
```
Anda mungkin perlu bereksperimen dengan task budget yang berbeda untuk kasus penggunaan Anda. Jika model diberi task budget yang terlalu ketat, model mungkin menyelesaikan tugas dengan kurang menyeluruh, dengan merujuk budget-nya sebagai kendala.

Untuk tugas agentik terbuka di mana kualitas lebih penting daripada kecepatan, jangan atur task budget. Cadangkan task budget untuk beban kerja di mana Anda memerlukan model untuk membatasi cakupan pekerjaannya pada alokasi token. Nilai minimum untuk task budget adalah 20k token.

Task budget bukan batas keras; ini adalah saran yang disadari oleh model. Ini berbeda dari max_tokens:
- task_budget: batas advisori di seluruh loop agentik penuh. Model melihatnya dan menggunakannya untuk mengatur kecepatannya sendiri.
- max_tokens: batas keras per-permintaan pada token yang dihasilkan. Ini tidak diteruskan ke model, sehingga model tidak menyadarinya.
Gunakan task_budget ketika Anda ingin model memoderasi dirinya sendiri, dan max_tokens sebagai batas keras untuk membatasi penggunaan.
Atur max_tokens yang besar pada effort max atau xhigh: Jika Anda menjalankan Claude Opus 4.7 pada effort max atau xhigh, atur budget token output maksimum yang besar sehingga model memiliki ruang untuk berpikir dan bertindak di seluruh subagent dan pemanggilan alatnya. Mulai dari 64k token dan sesuaikan dari sana.
Downsample gambar jika resolusi tinggi tidak diperlukan: Claude Opus 4.7 mendukung gambar hingga 2576px / 3,75MP. Gambar resolusi tinggi menggunakan lebih banyak token. Jika fidelitas gambar tambahan tidak diperlukan, lakukan downsample gambar sebelum mengirim ke Claude untuk menghindari peningkatan penggunaan token. Lihat Gambar dan visi.

Daftar periksa migrasi

Perbarui nama model dari claude-opus-4-6 ke claude-opus-4-7 (atau perbarui alias).
Hapus temperature, top_p, dan top_k dari payload permintaan.
Ganti thinking: {type: "enabled", budget_tokens: N} dengan thinking: {type: "adaptive"} ditambah parameter effort.
Hapus semua prefill pesan asisten.
Jika UI Anda menampilkan konten thinking, secara eksplisit opt in ke ringkasan thinking.
Lakukan benchmark ulang biaya dan latensi end-to-end di bawah tokenisasi yang diperbarui.
Sesuaikan ulang max_tokens untuk memperhitungkan tokenisasi yang diperbarui.
Uji ulang semua estimasi jumlah token di sisi klien.
Jika aplikasi Anda mengirim gambar, anggarkan ulang untuk dukungan gambar resolusi tinggi (hingga sekitar 3x lebih banyak token gambar per gambar resolusi penuh). Lakukan downsample sebelum mengirim jika Anda tidak memerlukan fidelitas tambahan.
Jika Anda menggunakan koordinat pointing atau bounding-box dari model, hapus semua konversi faktor skala; koordinat adalah 1:1 dengan piksel gambar aktual pada Claude Opus 4.7.
Tinjau prompt untuk perubahan perilaku di atas (panjang respons, literalisme, nada, pembaruan progres, subagent, kalibrasi effort, pemicuan alat, pengamanan siber, penanganan gambar resolusi tinggi).
Tetapkan ulang baseline panjang respons dengan prompt kontrol panjang yang ada dihapus, lalu sesuaikan secara eksplisit.
Jika menggunakan effort xhigh atau max, naikkan max_tokens ke setidaknya 64k sebagai titik awal.
Pertimbangkan untuk mengadopsi task budgets (beta) untuk alur kerja agentik.
Jika produk Anda melakukan pekerjaan keamanan yang sah, ajukan permohonan ke Cyber Verification Program untuk akses ke pembatasan yang lebih rendah pada konten siber.

Migrasi ke Claude Opus 4.7 dari Opus 4.5 atau lebih awal

Jika Anda bermigrasi dari Claude Opus 4.5, Opus 4.1 (deprecated), atau model yang lebih awal langsung ke Claude Opus 4.7, terapkan semua perubahan Opus 4.7 ditambah perubahan kumulatif di bagian ini yang berlaku antara Opus 4.5 dan Opus 4.7. Jika Anda bermigrasi dari Opus 4.6, Anda hanya memerlukan bagian Opus 4.7.

Perbarui nama model Anda

# Migrasi Opus
model = "claude-opus-4-5"  # Before
model = "claude-opus-4-7"  # After

Perubahan yang merusak

Penghapusan prefill dibahas dalam perubahan yang merusak Opus 4.7 di atas.
Quoting parameter alat: Claude Opus 4.6 dan model yang lebih baru mungkin menghasilkan escaping string JSON yang sedikit berbeda dalam argumen pemanggilan alat (misalnya, penanganan escape Unicode atau escaping forward slash yang berbeda). Jika Anda mem-parse input pemanggilan alat sebagai string mentah alih-alih menggunakan parser JSON, verifikasi logika parsing Anda. Parser JSON standar (seperti json.loads() atau JSON.parse()) menangani perbedaan ini secara otomatis.

Perubahan yang direkomendasikan

Perubahan ini meningkatkan pengalaman Anda pada Opus 4.7. Item yang ditandai (wajib pada Opus 4.7) adalah rekomendasi opsional ketika Opus 4.6 diluncurkan tetapi sekarang wajib; sisanya tetap direkomendasikan.

Migrasi ke adaptive thinking (wajib pada Opus 4.7): thinking: {type: "enabled", budget_tokens: N} mengembalikan error 400 pada Claude Opus 4.7. Beralih ke thinking: {type: "adaptive"} dan gunakan parameter effort untuk mengontrol kedalaman thinking. Lihat Adaptive thinking.
```
response = client.beta.messages.create(
    model="claude-opus-4-5",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 32000},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)
```
Perhatikan bahwa migrasi juga berpindah dari client.beta.messages.create ke client.messages.create. Adaptive thinking dan effort adalah fitur GA dan tidak memerlukan namespace SDK beta atau header beta apa pun.
Hapus header beta effort: Parameter effort sekarang GA. Hapus betas=["effort-2025-11-24"] dari permintaan Anda.
Hapus header beta fine-grained tool streaming: Fine-grained tool streaming sekarang GA. Hapus betas=["fine-grained-tool-streaming-2025-05-14"] dari permintaan Anda.
Hapus header beta interleaved thinking: Adaptive thinking secara otomatis mengaktifkan interleaved thinking pada Claude Opus 4.7, Opus 4.6, dan Sonnet 4.6. Hapus betas=["interleaved-thinking-2025-05-14"] dari permintaan Anda. Header ini masih berfungsi pada Sonnet 4.6 dengan extended thinking manual, tetapi mode manual sudah deprecated.
Migrasi ke output_config.format: Jika menggunakan structured outputs, perbarui output_format={...} menjadi output_config={"format": {...}}. Parameter lama tetap berfungsi tetapi sudah deprecated dan akan dihapus dalam rilis model mendatang.

Migrasi dari Claude 4.1 atau lebih awal

Jika Anda bermigrasi dari Opus 4.1 (deprecated) atau model yang lebih awal langsung ke Claude Opus 4.7, terapkan perubahan Claude Opus 4.7 di bagian atas panduan ini dan perubahan kumulatif di atas ditambah perubahan tambahan di bagian ini.

# Dari Opus 4.1
model = "claude-opus-4-1-20250805"  # Before
model = "claude-opus-4-7"  # After

# Dari Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Before
model = "claude-opus-4-7"  # After

Perubahan tambahan yang merusak

Hapus parameter sampling

Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.

Mulai dari Claude Opus 4.7, mengatur temperature, top_p, atau top_k ke nilai non-default apa pun akan mengembalikan error 400. Jalur migrasi teraman adalah menghilangkan parameter ini sepenuhnya dari permintaan, dan menggunakan prompting untuk memandu perilaku model. Jika Anda menggunakan temperature = 0 untuk determinisme, perhatikan bahwa itu tidak pernah menjamin output yang identik.
```
# Sebelum - Ini akan menghasilkan error pada model Claude 4+
response = client.messages.create(
    model="claude-3-7-sonnet-20250219",
    temperature=0.7,
    top_p=0.9,  # Non-default sampling params return 400 on Opus 4.7
    # ...
)

# Sesudah
response = client.messages.create(
    model="claude-opus-4-7",
    # ...
)
```
Perbarui versi alat

Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.

Perbarui ke versi alat terbaru. Hapus semua kode yang menggunakan perintah undo_edit.
```
# Sebelum
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]

# Sesudah
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]
```
- Text editor: Gunakan text_editor_20250728 dan str_replace_based_edit_tool. Lihat dokumentasi alat Text editor untuk detailnya.
- Code execution: Tingkatkan ke code_execution_20250825. Lihat dokumentasi alat Code execution untuk instruksi migrasi.

Tangani stop reason refusal

Perbarui aplikasi Anda untuk menangani stop reason refusal:

response = client.messages.create(...)

if response.stop_reason == "refusal":
    # Tangani penolakan dengan tepat
    pass

Tangani stop reason model_context_window_exceeded

Model Claude 4.5+ mengembalikan stop reason model_context_window_exceeded ketika generasi berhenti karena mencapai batas jendela konteks, bukan batas max_tokens yang diminta. Perbarui aplikasi Anda untuk menangani stop reason baru ini:
```
response = client.messages.create(...)

if response.stop_reason == "model_context_window_exceeded":
    # Tangani batas jendela konteks dengan tepat
    pass
```
Verifikasi penanganan parameter alat (newline di akhir)

Model Claude 4.5+ mempertahankan newline di akhir dalam parameter string pemanggilan alat yang sebelumnya dihapus. Jika alat Anda bergantung pada pencocokan string yang tepat terhadap parameter pemanggilan alat, verifikasi bahwa logika Anda menangani newline di akhir dengan benar.
Perbarui prompt Anda untuk perubahan perilaku

Model Claude 4+ memiliki gaya komunikasi yang lebih ringkas dan langsung serta memerlukan arahan eksplisit. Tinjau praktik terbaik prompting untuk panduan optimasi.

Perubahan tambahan yang direkomendasikan

Hapus header beta lama: Hapus token-efficient-tools-2025-02-19 dan output-128k-2025-02-19. Semua model Claude 4+ memiliki penggunaan alat yang efisien token secara bawaan dan header ini tidak memiliki efek.

Daftar periksa migrasi (dari Opus 4.5 atau lebih awal)

Perbarui ID model ke claude-opus-4-7
Terapkan semua perubahan yang merusak Opus 4.7 (extended thinking dihapus, parameter sampling dihapus, tampilan thinking dihilangkan secara default, tokenisasi diperbarui)
MERUSAK: Hapus prefill pesan asisten (mengembalikan error 400); gunakan structured outputs atau output_config.format sebagai gantinya
MERUSAK pada Opus 4.7: Ganti thinking: {type: "enabled", budget_tokens: N} dengan thinking: {type: "adaptive"} ditambah parameter effort (mengembalikan 400 pada Opus 4.7)
Verifikasi parsing JSON pemanggilan alat menggunakan parser JSON standar
Hapus header beta effort-2025-11-24 (effort sekarang GA)
Hapus header beta fine-grained-tool-streaming-2025-05-14
Hapus header beta interleaved-thinking-2025-05-14 (adaptive thinking mengaktifkan interleaved thinking secara otomatis)
Migrasikan output_format ke output_config.format (jika berlaku)
Jika bermigrasi dari Claude 4.1 atau lebih awal: hapus temperature, top_p, dan top_k (nilai non-default mengembalikan 400 pada Opus 4.7)
Jika bermigrasi dari Claude 4.1 atau lebih awal: perbarui versi alat (text_editor_20250728, code_execution_20250825)
Jika bermigrasi dari Claude 4.1 atau lebih awal: tangani stop reason refusal
Jika bermigrasi dari Claude 4.1 atau lebih awal: tangani stop reason model_context_window_exceeded
Jika bermigrasi dari Claude 4.1 atau lebih awal: verifikasi penanganan parameter string alat untuk newline di akhir
Jika bermigrasi dari Claude 4.1 atau lebih awal: hapus header beta lama (token-efficient-tools-2025-02-19, output-128k-2025-02-19)
Tinjau dan perbarui prompt mengikuti praktik terbaik prompting
Uji di lingkungan pengembangan sebelum deployment produksi

Migrasi dari Claude Sonnet 4.6 ke Claude Sonnet 5

Claude Sonnet 5 menawarkan kombinasi terbaik antara kecepatan dan kecerdasan dalam keluarga model Claude. Model ini dibangun di atas Claude Sonnet 4.6.

Claude Sonnet 5 adalah upgrade drop-in untuk Claude Sonnet 4.6 dengan harga yang sama $3 / $15 per MTok (harga perkenalan $2 / $10 per MTok hingga 31 Agustus 2026; lihat Harga). Ada dua perubahan API yang merusak untuk kode yang sudah berjalan pada Claude Sonnet 4.6: extended thinking manual (thinking: {type: "enabled", budget_tokens: N}) dan parameter sampling (temperature, top_p, top_k) yang diatur ke nilai non-default tidak lagi diterima dan mengembalikan error 400. Gunakan adaptive thinking dengan parameter effort sebagai gantinya. Claude Sonnet 5 mendukung set fitur yang sama dengan Claude Sonnet 4.6, termasuk jendela konteks 1M token, adaptive thinking, caching prompt, batch processing, Files API, dukungan PDF, visi, dan set lengkap alat sisi server dan sisi klien. Priority Tier tidak tersedia pada Claude Sonnet 5. Claude Sonnet 5 juga menggunakan tokenizer baru.

Jika kode Anda berada pada Claude Sonnet 4.5 atau lebih awal, terapkan juga langkah migrasi Claude Sonnet 4.6 sebelum meningkatkan ke Claude Sonnet 5. Langkah-langkah tersebut mencakup perubahan yang merusak (prefilling pesan asisten ditolak, perbedaan escaping JSON parameter alat) yang tidak dicakup oleh upgrade Sonnet 5 saja.

Perbarui nama model Anda

# Migrasi Sonnet
model = "claude-sonnet-4-6"  # Before
model = "claude-sonnet-5"  # After

Apa yang berubah

Item 4 dan 5 dalam daftar berikut adalah perubahan yang merusak. max_tokens tetap menjadi batas keras pada total output (thinking ditambah teks respons), jadi tinjau kembali untuk beban kerja yang berjalan tanpa thinking pada Claude Sonnet 4.6.

Tokenizer baru: Claude Sonnet 5 menggunakan tokenizer baru. Teks input yang sama menghasilkan sekitar 30% lebih banyak token daripada pada Claude Sonnet 4.6. Permintaan, respons, dan event streaming mempertahankan bentuk yang sama, dan tidak ada perubahan kode yang diperlukan, tetapi apa pun yang Anda ukur atau anggarkan dalam token bergeser: field usage dan hasil token counting untuk teks yang sama lebih tinggi, jendela konteks 1M token menampung lebih sedikit teks, dan batas max_tokens yang disetel untuk Claude Sonnet 4.6 mungkin memotong output yang setara. Harga per-token tidak berubah, sehingga biaya permintaan yang setara dapat berbeda. Jalankan ulang token counting terhadap Claude Sonnet 5 alih-alih menggunakan kembali hitungan yang diukur terhadap model sebelumnya.
128k token output maksimum (tidak berubah): Claude Sonnet 5 mendukung hingga 128k token output, sama dengan Claude Sonnet 4.6. Nilai max_tokens yang ada tetap valid. Perhitungkan tokenizer baru saat menentukan ukurannya.
Prefilling pesan asisten (tidak berubah): Prefilling pesan asisten mengembalikan error 400 pada Claude Sonnet 5, sama seperti pada Claude Sonnet 4.6. Jika Anda menghapus prefill saat bermigrasi ke Claude Sonnet 4.6, tidak ada perubahan lebih lanjut yang diperlukan. Gunakan structured outputs, instruksi prompt sistem, atau output_config.format sebagai gantinya.
Adaptive thinking aktif secara default: Pada Claude Sonnet 4.6, permintaan tanpa field thinking berjalan tanpa thinking; pada Claude Sonnet 5, permintaan yang sama berjalan dengan adaptive thinking. Untuk mematikan thinking, kirim thinking: {type: "disabled"}. Extended thinking manual (thinking: {type: "enabled", budget_tokens: N}) tidak didukung dan mengembalikan error 400. Gunakan parameter effort (default high) untuk mengontrol kedalaman thinking.
Parameter sampling dihapus: Parameter sampling (temperature, top_p, top_k) yang diatur ke nilai non-default tidak diterima dan mengembalikan error 400.
Pengamanan keamanan siber: Claude Sonnet 5 adalah model tingkat Sonnet pertama dengan pengamanan keamanan siber real-time. Permintaan yang melibatkan topik keamanan siber yang terlarang atau berisiko tinggi mungkin ditolak. Penolakan dikembalikan sebagai respons HTTP 200 yang berhasil dengan stop_reason: "refusal", bukan error. Lihat Safeguards, warnings, and appeals untuk latar belakang.

Daftar periksa migrasi

Perbarui nama model dari claude-sonnet-4-6 ke claude-sonnet-5.
Jalankan ulang token counting terhadap Claude Sonnet 5. Tokenizer baru menghasilkan sekitar 30% lebih banyak token untuk teks yang sama, yang dapat mengubah biaya per-permintaan meskipun harga per-token tidak berubah.
Tinjau kembali batas max_tokens yang diatur mendekati panjang output yang Anda harapkan, dan naikkan hingga maksimum 128k (tidak berubah dari Claude Sonnet 4.6) jika berguna.
Hapus konfigurasi thinking: {type: "enabled", budget_tokens: N} (mengembalikan error 400). Adaptive thinking aktif secara default; kirim {type: "disabled"} untuk mematikannya, atau gunakan parameter effort untuk mengontrol kedalaman.
Hapus parameter temperature, top_p, dan top_k yang diatur ke nilai non-default (mengembalikan error 400 pada Claude Sonnet 5).
Tambahkan penanganan untuk stop_reason: "refusal" jika beban kerja Anda mungkin menyentuh topik keamanan siber.
Tetapkan ulang baseline biaya pada beban kerja tipikal Anda sebelum deployment produksi.
Tinjau max_tokens untuk beban kerja yang sebelumnya berjalan tanpa thinking.

Migrasi ke Claude Sonnet 4.6

Claude Sonnet 4.6 menggabungkan kecerdasan yang kuat dengan performa cepat, menampilkan kemampuan pencarian agentik yang ditingkatkan dan code execution gratis ketika digunakan dengan web search atau web fetch. Model ini ideal untuk coding sehari-hari, analisis, dan tugas konten.

Untuk gambaran lengkap kemampuan, lihat gambaran umum model.

Harga Sonnet 4.6 adalah $3 per juta token input, $15 per juta token output. Lihat harga Claude untuk detailnya.

Perbarui nama model Anda:

# Dari Sonnet 4.5
model = "claude-sonnet-4-5"  # Before
model = "claude-sonnet-4-6"  # After

Perubahan yang merusak

Saat bermigrasi dari Sonnet 4.5

Prefilling pesan asisten tidak lagi didukung

Ini adalah perubahan yang merusak saat bermigrasi dari Sonnet 4.5 atau lebih awal.

Prefilling pesan asisten mengembalikan error 400 pada Sonnet 4.6. Gunakan structured outputs, instruksi prompt sistem, atau output_config.format sebagai gantinya.

Kasus penggunaan prefill umum dan migrasinya:
- Mengontrol format output (memaksa output JSON/YAML): Gunakan structured outputs atau alat dengan field enum untuk tugas klasifikasi.
- Menghilangkan pembukaan (menghapus frasa "Here is..."): Tambahkan instruksi langsung dalam prompt sistem: "Respond directly without preamble. Do not start with phrases like 'Here is...', 'Based on...', etc."
- Menghindari penolakan yang buruk: Claude sekarang jauh lebih baik dalam penolakan yang sesuai. Prompting yang jelas dalam pesan pengguna tanpa prefill seharusnya sudah cukup.
- Kelanjutan (melanjutkan respons yang terputus): Pindahkan kelanjutan ke pesan pengguna: "Your previous response was interrupted and ended with [previous_response]. Continue from where you left off."
- Hidrasi konteks / konsistensi peran (menyegarkan konteks dalam percakapan panjang): Masukkan apa yang sebelumnya merupakan pengingat asisten yang di-prefill ke dalam giliran pengguna sebagai gantinya.
Escaping JSON parameter alat mungkin berbeda

Ini adalah perubahan yang merusak saat bermigrasi dari Sonnet 4.5 atau lebih awal.

Escaping string JSON dalam parameter alat mungkin berbeda dari model sebelumnya. Parser JSON standar menangani ini secara otomatis, tetapi parsing berbasis string kustom mungkin memerlukan pembaruan.

Saat bermigrasi dari Claude 3.x

Perbarui parameter sampling

Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.

Gunakan hanya temperature ATAU top_p, bukan keduanya.
Perbarui versi alat

Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.

Perbarui ke versi alat terbaru (text_editor_20250728, code_execution_20250825). Hapus semua kode yang menggunakan perintah undo_edit.
Tangani stop reason refusal

Perbarui aplikasi Anda untuk menangani stop reason refusal.
Perbarui prompt Anda untuk perubahan perilaku

Model Claude 4 memiliki gaya komunikasi yang lebih ringkas dan langsung. Tinjau praktik terbaik prompting untuk panduan optimasi.

Perubahan yang direkomendasikan

Hapus header beta fine-grained-tool-streaming-2025-05-14: Fine-grained tool streaming sekarang GA pada Sonnet 4.6 dan tidak lagi memerlukan header beta.
Migrasikan output_format ke output_config.format: Parameter output_format sudah deprecated. Gunakan output_config.format sebagai gantinya.

Migrasi dari Sonnet 4.5

Pertimbangkan untuk bermigrasi dari Sonnet 4.5 ke Sonnet 4.6, yang memberikan kecerdasan lebih tinggi dengan harga yang sama.

Sonnet 4.6 secara default menggunakan tingkat effort high, berbeda dengan Sonnet 4.5 yang tidak memiliki parameter effort. Pertimbangkan untuk menyesuaikan parameter effort saat Anda bermigrasi dari Sonnet 4.5 ke Sonnet 4.6. Jika tidak diatur secara eksplisit, Anda mungkin mengalami latensi yang lebih tinggi dengan tingkat effort default.

Jika Anda tidak menggunakan pemikiran diperpanjang

Jika Anda tidak menggunakan "extended thinking" (pemikiran diperpanjang) pada Sonnet 4.5, Anda dapat melanjutkan tanpa fitur tersebut pada Sonnet 4.6. Anda sebaiknya secara eksplisit mengatur effort ke tingkat yang sesuai untuk kasus penggunaan Anda. Pada effort low dengan thinking dinonaktifkan, Anda dapat mengharapkan performa yang serupa atau lebih baik dibandingkan Sonnet 4.5 tanpa pemikiran diperpanjang.

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Jika Anda menggunakan pemikiran diperpanjang

Jika Anda menggunakan pemikiran diperpanjang dengan budget_tokens pada Sonnet 4.5, fitur ini masih berfungsi pada Sonnet 4.6 tetapi sudah tidak digunakan lagi (deprecated). Migrasikan ke adaptive thinking dengan parameter effort.

Migrasi ke adaptive thinking

Adaptive thinking (pemikiran adaptif) adalah pengganti yang direkomendasikan untuk budget_tokens pada Sonnet 4.6. Fitur ini sangat cocok untuk pola beban kerja berikut:

Agen multi-langkah otonom: agen coding yang mengubah persyaratan menjadi perangkat lunak yang berfungsi, pipeline analisis data, dan pencarian bug di mana model berjalan secara independen melalui banyak langkah. Adaptive thinking memungkinkan model mengkalibrasi penalarannya per langkah, tetap berada di jalur yang benar selama trajektori yang lebih panjang. Untuk beban kerja ini, mulailah dengan effort high. Jika latensi atau penggunaan token menjadi perhatian, turunkan ke medium.
Agen computer use: Sonnet 4.6 mencapai akurasi terbaik di kelasnya pada evaluasi computer use menggunakan mode adaptif.
Beban kerja bimodal: campuran tugas mudah dan sulit di mana mode adaptif melewati proses thinking pada kueri sederhana dan bernalar secara mendalam pada kueri yang kompleks.

Saat menggunakan adaptive thinking, evaluasi effort medium dan high pada tugas Anda. Tingkat yang tepat bergantung pada trade-off beban kerja Anda antara kualitas, latensi, dan penggunaan token.

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Jika Anda melihat perilaku yang tidak konsisten atau penurunan kualitas dengan adaptive thinking, coba turunkan pengaturan effort atau gunakan max_tokens sebagai batas keras terlebih dahulu. Pemikiran diperpanjang dengan budget_tokens masih berfungsi pada Sonnet 4.6 tetapi sudah tidak digunakan lagi (deprecated) dan tidak lagi direkomendasikan.

Mempertahankan budget_tokens selama migrasi

Jika Anda perlu mempertahankan budget_tokens untuk sementara selama migrasi, budget sekitar 16k token memberikan ruang yang cukup untuk masalah yang lebih sulit tanpa risiko penggunaan token yang tidak terkendali. Konfigurasi ini sudah tidak digunakan lagi (deprecated) dan akan dihapus pada rilis model mendatang.

Kasus penggunaan coding dan agentic

Untuk agentic coding, desain frontend, alur kerja yang banyak menggunakan alat, dan alur kerja enterprise yang kompleks, mulailah dengan effort medium. Jika Anda merasa latensi terlalu tinggi, pertimbangkan untuk menurunkan effort ke low. Jika Anda membutuhkan kecerdasan yang lebih tinggi, pertimbangkan untuk meningkatkan effort ke high atau bermigrasi ke Opus 4.7.

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16384,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "medium"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Kasus penggunaan chat dan non-coding

Untuk chat, pembuatan konten, pencarian, klasifikasi, dan tugas non-coding lainnya, mulailah dengan effort low dengan pemikiran diperpanjang. Jika Anda membutuhkan kedalaman lebih, tingkatkan effort ke medium.

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "low"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Daftar periksa migrasi Sonnet 4.6

Perbarui ID model ke claude-sonnet-4-6
BREAKING: Hapus prefilling pesan assistant; gunakan structured outputs atau output_config.format sebagai gantinya
BREAKING: Verifikasi bahwa parsing JSON parameter alat menangani perbedaan escaping
BREAKING: Perbarui versi alat ke yang terbaru (text_editor_20250728, code_execution_20250825); versi lama tidak didukung (jika bermigrasi dari 3.x)
BREAKING: Hapus kode apa pun yang menggunakan perintah undo_edit (jika berlaku)
BREAKING: Perbarui parameter sampling untuk hanya menggunakan temperature ATAU top_p, bukan keduanya (jika bermigrasi dari 3.x)
Tangani stop reason refusal yang baru di aplikasi Anda
Hapus beta header fine-grained-tool-streaming-2025-05-14 (sekarang sudah GA)
Migrasikan output_format ke output_config.format
Tinjau dan perbarui prompt mengikuti praktik terbaik prompting
Direkomendasikan: Migrasikan dari thinking: {type: "enabled", budget_tokens: N} ke thinking: {type: "adaptive"} dengan parameter effort (budget_tokens sudah tidak digunakan lagi dan akan dihapus pada rilis mendatang)
Uji di lingkungan pengembangan sebelum deployment ke produksi

Migrasi ke Claude Sonnet 4.5

Claude Sonnet 4.5 menggabungkan kecerdasan yang kuat dengan performa yang cepat, menjadikannya ideal untuk tugas coding, analisis, dan konten sehari-hari.

Untuk gambaran lengkap tentang kemampuan, lihat ikhtisar model.

Harga Sonnet 4.5 adalah $3 per juta token input, $15 per juta token output. Lihat harga Claude untuk detailnya.

Perbarui nama model Anda:

# Dari Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Before
model = "claude-sonnet-4-5-20250929"  # After

Perubahan yang merusak (breaking changes)

Perubahan yang merusak ini berlaku saat bermigrasi dari model Claude 3.x Sonnet.

Perbarui parameter sampling

Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.

Gunakan hanya temperature ATAU top_p, bukan keduanya.
Perbarui versi alat

Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.

Perbarui ke versi alat terbaru (text_editor_20250728, code_execution_20250825). Hapus kode apa pun yang menggunakan perintah undo_edit.
Tangani stop reason refusal

Perbarui aplikasi Anda untuk menangani stop reason refusal.
Perbarui prompt Anda untuk perubahan perilaku

Model Claude 4 memiliki gaya komunikasi yang lebih ringkas dan langsung. Tinjau praktik terbaik prompting untuk panduan optimasi.

Daftar periksa migrasi Sonnet 4.5

Perbarui ID model ke claude-sonnet-4-5-20250929
BREAKING: Perbarui versi alat ke yang terbaru (text_editor_20250728, code_execution_20250825); versi lama tidak didukung (jika bermigrasi dari 3.x)
BREAKING: Hapus kode apa pun yang menggunakan perintah undo_edit (jika berlaku)
BREAKING: Perbarui parameter sampling untuk hanya menggunakan temperature ATAU top_p, bukan keduanya (jika bermigrasi dari 3.x)
Tangani stop reason refusal yang baru di aplikasi Anda
Tinjau dan perbarui prompt mengikuti praktik terbaik prompting
Pertimbangkan untuk mengaktifkan pemikiran diperpanjang untuk tugas penalaran yang kompleks
Uji di lingkungan pengembangan sebelum deployment ke produksi

Migrasi ke Claude Haiku 4.5

Claude Haiku 4.5 adalah model Haiku tercepat dan paling cerdas dengan performa mendekati frontier, memberikan kualitas model premium untuk aplikasi interaktif dan pemrosesan volume tinggi.

Untuk gambaran lengkap tentang kemampuan, lihat ikhtisar model.

Harga Haiku 4.5 adalah $1 per juta token input, $5 per juta token output. Lihat harga Claude untuk detailnya.

Perbarui nama model Anda:

# Dari Haiku 3.5
model = "claude-3-5-haiku-20241022"  # Before
model = "claude-haiku-4-5-20251001"  # After

Tinjau batas laju baru: Haiku 4.5 memiliki batas laju yang terpisah dari Haiku 3.5. Lihat dokumentasi batas laju untuk detailnya.

Untuk peningkatan performa yang signifikan pada tugas coding dan penalaran, pertimbangkan untuk mengaktifkan pemikiran diperpanjang dengan thinking: {type: "enabled", budget_tokens: N}.

Pemikiran diperpanjang memengaruhi efisiensi caching prompt.

Pemikiran diperpanjang sudah tidak digunakan lagi (deprecated) pada model Claude 4.6 dan dihapus pada Claude Opus 4.7. Jika menggunakan model yang lebih baru, gunakan adaptive thinking sebagai gantinya.

Jelajahi kemampuan baru: Lihat ikhtisar model untuk detail tentang kesadaran konteks, peningkatan kapasitas output (64k token), kecerdasan yang lebih tinggi, dan kecepatan yang lebih baik.

Perubahan yang merusak (breaking changes)

Perubahan yang merusak ini berlaku saat bermigrasi dari model Claude 3.x Haiku.

Perbarui parameter sampling

Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.

Gunakan hanya temperature ATAU top_p, bukan keduanya.
Perbarui versi alat

Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.

Perbarui ke versi alat terbaru (text_editor_20250728, code_execution_20250825). Hapus kode apa pun yang menggunakan perintah undo_edit.
Tangani stop reason refusal

Perbarui aplikasi Anda untuk menangani stop reason refusal.
Perbarui prompt Anda untuk perubahan perilaku

Model Claude 4 memiliki gaya komunikasi yang lebih ringkas dan langsung. Tinjau praktik terbaik prompting untuk panduan optimasi.

Daftar periksa migrasi Haiku 4.5

Perbarui ID model ke claude-haiku-4-5-20251001
BREAKING: Perbarui versi alat ke yang terbaru (text_editor_20250728, code_execution_20250825); versi lama tidak didukung
BREAKING: Hapus kode apa pun yang menggunakan perintah undo_edit (jika berlaku)
BREAKING: Perbarui parameter sampling untuk hanya menggunakan temperature ATAU top_p, bukan keduanya
Tangani stop reason refusal yang baru di aplikasi Anda
Tinjau dan sesuaikan untuk batas laju baru (terpisah dari Haiku 3.5)
Tinjau dan perbarui prompt mengikuti praktik terbaik prompting
Pertimbangkan untuk mengaktifkan pemikiran diperpanjang untuk tugas penalaran yang kompleks
Uji di lingkungan pengembangan sebelum deployment ke produksi

Dapatkan bantuan

Periksa dokumentasi API untuk spesifikasi terperinci
Tinjau kemampuan model untuk perbandingan performa
Tinjau catatan rilis API untuk pembaruan API
Hubungi dukungan jika Anda mengalami masalah selama migrasi

Was this page helpful?

Model & hargaModel

Panduan migrasi

Panduan untuk bermigrasi ke model Claude terbaru dari versi Claude sebelumnya

Panduan ini membahas migrasi kode Messages API. Jika Anda menggunakan Claude Managed Agents, tidak ada perubahan yang diperlukan selain memperbarui nama model.

/claude-api migrate this project to claude-opus-4-8

Bermigrasi dari Claude Mythos Preview ke Claude Mythos 5

Untuk jadwal penghentian Claude Mythos Preview, lihat Penghentian model.

Perbarui nama model Anda

model = "claude-mythos-preview"  # Before
model = "claude-mythos-5"  # After

Fitur yang tidak tersedia di Claude Mythos 5

Pemikiran diperpanjang dan anggaran token thinking: Pemikiran diperpanjang manual (thinking: {type: "enabled", budget_tokens: N}) tidak didukung pada claude-mythos-5 dan mengembalikan error 400. Adaptive thinking selalu aktif: model menentukan kapan dan seberapa banyak berpikir pada setiap permintaan, dan tidak ada konfigurasi thinking yang diperlukan. thinking: {type: "disabled"} mengembalikan error. budget_tokens tidak memiliki pengganti langsung: thinking bersifat adaptif, dan parameter effort adalah kontrol tingkat output yang terpisah, bukan anggaran thinking.

Sebelum (Claude Mythos Preview):
```
client.messages.create(
    model="claude-mythos-preview",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 10000},
    messages=[{"role": "user", "content": "..."}],
)
```
Sesudah (Claude Mythos 5):
```
client.messages.create(
    model="claude-mythos-5",
    max_tokens=16000,
    messages=[{"role": "user", "content": "..."}],
)
```
Prefill asisten: Mengisi awal (prefill) pesan asisten tidak didukung pada claude-mythos-5 dan mengembalikan error 400, sama seperti pada Claude Mythos Preview. Gunakan instruksi prompt sistem sebagai gantinya.
Output thinking: Pada claude-mythos-5, rantai pemikiran mentah tidak pernah dikembalikan, tetapi blok thinking tetap membawa teks ringkasan yang dapat dibaca ketika thinking.display diatur ke summarized. Kirim kembali blok thinking tanpa perubahan saat melanjutkan percakapan pada model yang sama. Lihat Output thinking pada Claude Fable 5 dan Claude Mythos 5.

Penghitungan token dan penagihan

Daftar periksa migrasi

Perbarui nama model dari claude-mythos-preview ke claude-mythos-5.
Hapus konfigurasi pemikiran diperpanjang manual (thinking: {type: "enabled", budget_tokens: N}). Adaptive thinking selalu aktif, dan tidak ada field thinking yang diperlukan.
Hapus konfigurasi thinking: {type: "disabled"} apa pun. Menonaktifkan thinking mengembalikan error pada claude-mythos-5.
Hapus budget_tokens. Parameter ini tidak memiliki pengganti langsung: thinking bersifat adaptif, dan parameter effort adalah kontrol tingkat output yang terpisah, bukan anggaran thinking.
Verifikasi bahwa kode apa pun yang mem-parse field thinking memperlakukannya sebagai teks tampilan saja dan mengirim kembali blok thinking tanpa perubahan saat melanjutkan pada model yang sama. thinking.display secara default adalah "omitted" pada claude-mythos-5, sama seperti pada Claude Mythos Preview; atur display: "summarized" untuk menerima ringkasan yang dapat dibaca. Lihat Output thinking pada Claude Fable 5 dan Claude Mythos 5.
Jika Anda memutar ulang riwayat percakapan pada model lain, hapus blok thinking dan redacted_thinking dari giliran asisten sebelumnya terlebih dahulu. Blok thinking dari claude-mythos-5 terikat pada model yang menghasilkannya, dan model selain Claude Fable 5 dan Claude Mythos 5 mengabaikannya secara diam-diam. Menghapusnya menjaga permintaan lintas model tetap minimal dan seragam.
Tetapkan ulang baseline jumlah token dan biaya pada beban kerja Anda sendiri. Jumlah token kurang lebih tidak berubah saat bermigrasi dari claude-mythos-preview.

Bermigrasi dari Claude Opus 4.8 ke Claude Fable 5

Claude Fable 5 adalah model Anthropic paling mumpuni yang dirilis secara luas, tersedia secara umum di Claude API, Claude Platform on AWS, Amazon Bedrock, Google Cloud, dan Microsoft Foundry.

Sebelum Anda bermigrasi

Claude Fable 5 dihargai $10 per juta token input dan $50 per juta token output, dibandingkan dengan $5 dan $25 untuk Claude Opus 4.8. Lihat Harga Claude untuk detailnya.

Perbarui nama model Anda

model = "claude-opus-4-8"  # Before
model = "claude-fable-5"  # After

Apa yang berubah

Item-item di bagian ini menjelaskan perbedaan API dan perilaku yang perlu diperiksa setelah Anda mengganti ID model.

Adaptive thinking selalu aktif: Adaptive thinking adalah satu-satunya mode thinking pada claude-fable-5. Model menentukan kapan dan seberapa banyak berpikir pada setiap permintaan, dan tidak ada konfigurasi thinking yang diperlukan. thinking: {type: "disabled"} mengembalikan error. Gunakan parameter effort untuk mengontrol kedalaman thinking.

Perubahan perilaku yang perlu diperiksa: pada Claude Opus 4.8, permintaan tanpa field thinking berjalan tanpa thinking; pada claude-fable-5, permintaan yang sama tersebut berjalan dengan adaptive thinking. max_tokens tetap menjadi batas keras pada total output, thinking ditambah teks respons, jadi tinjau kembali untuk beban kerja yang berjalan tanpa thinking pada Claude Opus 4.8. Lihat Kontrol biaya.

Sebelum (Claude Opus 4.8):
```
client.messages.create(
    model="claude-opus-4-8",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "high"},
    messages=[{"role": "user", "content": "..."}],
)
```
Sesudah (Claude Fable 5):
```
client.messages.create(
    model="claude-fable-5",
    max_tokens=16000,
    output_config={"effort": "high"},
    messages=[{"role": "user", "content": "..."}],
)
```
Pemikiran diperpanjang dan anggaran thinking (tidak berubah): Pemikiran diperpanjang manual (thinking: {type: "enabled", budget_tokens: N}) tidak didukung pada claude-fable-5 dan mengembalikan error 400, sama seperti pada Claude Opus 4.8. budget_tokens tidak memiliki pengganti langsung: thinking bersifat adaptif, dan parameter effort adalah kontrol tingkat output yang terpisah, bukan anggaran thinking.
Prefill asisten (tidak berubah): Mengisi awal (prefill) pesan asisten tidak didukung pada claude-fable-5 dan mengembalikan error 400, sama seperti pada Claude Opus 4.8. Gunakan instruksi prompt sistem sebagai gantinya.
Output thinking: Pada claude-fable-5, rantai pemikiran mentah tidak pernah dikembalikan, tetapi blok thinking tetap membawa teks ringkasan yang dapat dibaca ketika thinking.display diatur ke summarized. Kirim kembali blok thinking tanpa perubahan saat melanjutkan percakapan pada model yang sama. Lihat Output thinking pada Claude Fable 5 dan Claude Mythos 5.
Safety classifier dan stop reason refusal: claude-fable-5 menjalankan safety classifier pada permintaan dan selama pembuatan respons. Ketika classifier menolak permintaan, Messages API mengembalikan stop_reason: "refusal" sebagai respons HTTP 200 yang berhasil, bukan error. Field stop_details.category melaporkan classifier mana yang terpicu, dengan kategori seperti "cyber", "bio", dan "reasoning_extraction", atau null ketika penolakan tidak dipetakan ke kategori bernama. Lihat tabel kategori penolakan untuk daftar lengkapnya.

Anda tidak ditagih untuk token input dari permintaan yang ditolak sebelum output apa pun dihasilkan. Ketika classifier terpicu di tengah stream, input dan output yang sudah di-stream ditagih; buang output parsial tersebut.

Untuk menjalankan ulang permintaan yang ditolak pada model lain secara otomatis, berikan parameter opt-in fallbacks, yang masih dalam tahap beta di Claude API dan Claude Platform on AWS. Parameter ini tidak tersedia di Message Batches API atau di Amazon Bedrock, Google Cloud, dan Microsoft Foundry; pada ketiga platform tersebut, jalankan retry di sisi klien atau gunakan middleware refusal-fallback SDK. Lihat Menangani stop reason.
Mulai dengan effort high: Default parameter effort tetap high. Pada Claude Opus 4.8, rekomendasi untuk pekerjaan coding dan otonomi tinggi adalah mengatur xhigh secara eksplisit. Pada claude-fable-5, gunakan high sebagai default untuk sebagian besar tugas dan simpan xhigh untuk beban kerja yang paling sensitif terhadap kapabilitas. Pengaturan effort yang lebih rendah pada claude-fable-5 tetap berkinerja baik dan sering kali melampaui kinerja xhigh pada model sebelumnya. Kurangi effort jika tugas selesai tetapi memakan waktu lebih lama dari yang diperlukan. Lihat Prompting Claude Fable 5.
Minimum caching prompt lebih rendah: Panjang prompt minimum yang dapat di-cache pada claude-fable-5 adalah 512 token, lebih rendah dari 1.024 token pada Claude Opus 4.8. Prompt yang terlalu pendek untuk di-cache pada Claude Opus 4.8 sekarang dapat membuat entri cache, tanpa perubahan kode yang diperlukan. Pada Amazon Bedrock, minimum untuk claude-fable-5 adalah 1.024 token. Lihat Caching prompt untuk minimum per model.

Daftar periksa migrasi

Jika organisasi Anda memiliki pengaturan "zero data retention" (ZDR), konfirmasikan kelayakan sebelum bermigrasi. claude-fable-5 memerlukan retensi data 30 hari dan, pada Claude API, mengembalikan 400 invalid_request_error jika tidak terpenuhi. Lihat Persyaratan retensi data khusus model.
Perbarui nama model dari claude-opus-4-8 ke claude-fable-5.
Hapus konfigurasi thinking: {type: "disabled"} apa pun. Menonaktifkan thinking mengembalikan error pada claude-fable-5, dan permintaan tanpa field thinking berjalan dengan adaptive thinking.
Jika Anda menghapus pemikiran diperpanjang manual dan prefill asisten selama migrasi sebelumnya, tidak ada tindakan yang diperlukan: keduanya tetap tidak didukung pada claude-fable-5.
Verifikasi bahwa kode apa pun yang mem-parse field thinking memperlakukannya sebagai teks tampilan saja dan mengirim kembali blok thinking tanpa perubahan saat melanjutkan pada model yang sama. thinking.display secara default adalah "omitted" pada claude-fable-5, sama seperti pada Claude Opus 4.8; atur display: "summarized" untuk menerima ringkasan yang dapat dibaca. Lihat Output thinking pada Claude Fable 5 dan Claude Mythos 5.
Jika Anda memutar ulang riwayat percakapan pada model lain, hapus blok thinking dan redacted_thinking dari giliran asisten sebelumnya terlebih dahulu. Blok thinking dari claude-fable-5 terikat pada model yang menghasilkannya, dan model selain Claude Fable 5 dan Claude Mythos 5 mengabaikannya secara diam-diam. Menghapusnya menjaga permintaan lintas model tetap minimal dan seragam. Pengecualiannya adalah menukarkan kredit fallback, yang memerlukan body permintaan yang di-echo sesuai aturan persis fitur tersebut.
Tangani stop_reason: "refusal" dan baca field stop_details.category. Untuk menjalankan ulang permintaan yang ditolak pada model lain secara otomatis, pertimbangkan parameter opt-in fallbacks (beta). Lihat Menangani stop reason.
Evaluasi ulang pengaturan effort Anda. Mulai dengan high untuk sebagian besar tugas, termasuk beban kerja yang berjalan pada xhigh di Claude Opus 4.8.
Tetapkan ulang baseline biaya dan latensi pada beban kerja Anda sendiri. Jumlah token kurang lebih tidak berubah saat bermigrasi dari claude-opus-4-8; harga per token berbeda.

Bermigrasi dari Claude Opus 4.7 ke Claude Opus 4.8

Claude Opus 4.8 dibangun untuk coding agentic yang kompleks dan pekerjaan enterprise. Model ini dibangun di atas Claude Opus 4.7.

Perbarui nama model Anda

# Migrasi Opus
model = "claude-opus-4-7"  # Before
model = "claude-opus-4-8"  # After

Apa yang berubah

Parameter sampling (tidak berubah): Mengatur temperature, top_p, atau top_k ke nilai non-default mengembalikan error 400 pada Claude Opus 4.8, sama seperti pada Claude Opus 4.7. Tipe permintaan SDK masih mendefinisikan field-field ini untuk kompatibilitas dengan model sebelumnya, sehingga kode yang mengaturnya lolos type-check, tetapi API menolak permintaan di sisi server. Jika Anda menghapus parameter ini saat bermigrasi ke Opus 4.7, tidak ada perubahan lebih lanjut yang diperlukan.
Default effort adalah high: Default parameter effort pada Claude Opus 4.8 adalah high di semua permukaan, termasuk Claude Code dan Messages API. Jika Anda sudah mengatur effort secara eksplisit, pengaturan Anda tidak berubah. Untuk pekerjaan coding dan otonomi tinggi, atur xhigh secara eksplisit. Evaluasi ulang pengaturan effort Anda terhadap anggaran latensi dan biaya Anda.
Jendela konteks 1 juta adalah default: Claude Opus 4.8 menyajikan jendela konteks 1 juta token penuh secara default tanpa header beta dan tanpa premium konteks panjang. Jika klien Anda mengirimkan header beta jendela konteks untuk kompatibilitas dengan model lama, Anda dapat menghapusnya pada Claude Opus 4.8.
Pesan sistem di tengah percakapan: Claude Opus 4.8 menerima pesan role: "system" segera setelah giliran pengguna dalam array messages (tunduk pada aturan penempatan). Gunakan field system tingkat atas untuk instruksi yang berlaku sejak awal. Model sebelumnya, termasuk Claude Opus 4.7, menolak role: "system" dalam messages dengan error 400. Jika Anda memelihara jalur kode yang membangun ulang seluruh riwayat pesan untuk memperbarui instruksi, Anda dapat menyederhanakannya dan mempertahankan hit cache prompt pada giliran sebelumnya.
Detail stop penolakan: Objek stop_details pada respons penolakan (tersedia sejak Claude Opus 4.7) sekarang didokumentasikan secara publik. Ketika model menolak permintaan, objek ini mengidentifikasi kategori penolakan, selain stop reason refusal yang sudah ada. Tidak ada header beta yang diperlukan, dan tidak ada opt-out. Lihat Menangani stop reason.
Minimum caching prompt lebih rendah: Panjang prompt minimum yang dapat di-cache pada Claude Opus 4.8 adalah 1.024 token, lebih rendah dari pada Claude Opus 4.7. Prompt yang terlalu pendek untuk di-cache pada Claude Opus 4.7 sekarang dapat membuat entri cache, tanpa perubahan kode yang diperlukan. Lihat Caching prompt untuk minimum per model.
Tingkat effort dikalibrasi ulang: Alokasi token di balik setiap tingkat effort berubah pada Claude Opus 4.8 dibandingkan dengan Claude Opus 4.7: medium memungkinkan thinking yang sedikit lebih banyak, high sedikit lebih sedikit, dan xhigh jauh lebih banyak. Jika Anda menyetel tingkat effort terhadap biaya atau latensi Claude Opus 4.7, tetapkan ulang baseline pada tingkat yang sama sebelum menyesuaikannya. Lihat Effort.

Daftar periksa migrasi

Perbarui nama model dari claude-opus-4-7 ke claude-opus-4-8 (atau perbarui alias).
Jika Anda menghapus parameter sampling selama migrasi Opus 4.7, tidak ada tindakan yang diperlukan. Jika Anda menambahkannya kembali dengan jalur retry 400, hapus jalur retry tersebut.
Evaluasi ulang pengaturan effort Anda. Default adalah high di semua permukaan; untuk pekerjaan coding dan otonomi tinggi, atur xhigh secara eksplisit.
Hapus header beta jendela konteks apa pun. Jendela konteks 1 juta adalah default di Claude API, Amazon Bedrock, Google Cloud, dan Microsoft Foundry.
Jika Anda membangun ulang riwayat percakapan untuk memperbarui instruksi, pertimbangkan untuk beralih ke pesan sistem di tengah percakapan untuk mempertahankan hit cache prompt.
Verifikasi bahwa penanganan stop-reason Anda membaca stop_details pada penolakan (tersedia sejak Claude Opus 4.7; sekarang didokumentasikan secara publik).
Tetapkan ulang baseline biaya dan latensi pada tingkat effort yang Anda pilih.

Bermigrasi ke Claude Opus 4.7

Claude Opus 4.7 sangat otonom dan berkinerja sangat baik pada pekerjaan agentic jangka panjang, pekerjaan pengetahuan, tugas vision, dan tugas memori.

Jendela konteks 1 juta token dengan harga API standar tanpa premium konteks panjang
128k token output maksimum
Adaptive thinking
Caching prompt
Pemrosesan batch
Files API
Dukungan PDF
Vision
Set lengkap alat sisi server dan sisi klien (bash, eksekusi kode, penggunaan komputer, editor teks, pencarian web, web fetch, konektor MCP, memori)

Perbarui nama model Anda

# Migrasi Opus
model = "claude-opus-4-6"  # Before
model = "claude-opus-4-7"  # After

Perubahan yang bersifat breaking

Pemikiran diperpanjang dihapus: thinking: {type: "enabled", budget_tokens: N} tidak lagi didukung pada Claude Opus 4.7 atau model yang lebih baru dan mengembalikan error 400. Beralihlah ke adaptive thinking (thinking: {type: "adaptive"}) dan gunakan parameter effort untuk mengontrol kedalaman thinking. Adaptive thinking nonaktif secara default pada Claude Opus 4.7: permintaan tanpa field thinking berjalan tanpa thinking, sesuai dengan perilaku Opus 4.6. Atur thinking: {type: "adaptive"} secara eksplisit untuk mengaktifkannya.

Sebelum (Claude Opus 4.6):
```
client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 10000},
    messages=[{"role": "user", "content": "..."}],
)
```
Sesudah (Claude Opus 4.7):
```
client.messages.create(
    model="claude-opus-4-7",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "high"},  # or "max", "xhigh", "medium", "low"
    messages=[{"role": "user", "content": "..."}],
)
```
Adaptive thinking dapat diarahkan melalui prompting. Untuk panduan tentang penyetelan ketika model berpikir terlalu banyak atau terlalu sedikit, lihat Mengkalibrasi effort dan kedalaman thinking.
Parameter sampling dihapus: Mengatur temperature, top_p, atau top_k ke nilai non-default apa pun pada Claude Opus 4.7 mengembalikan error 400. Jalur migrasi paling aman adalah menghilangkan parameter ini sepenuhnya dari payload permintaan. Prompting adalah cara yang direkomendasikan untuk memandu perilaku model pada Claude Opus 4.7. Jika Anda menggunakan temperature = 0 untuk determinisme, perhatikan bahwa hal itu tidak pernah menjamin output yang identik pada model sebelumnya.
Konten thinking dihilangkan secara default: Blok thinking masih muncul dalam stream respons pada Claude Opus 4.7, tetapi field thinking-nya kosong kecuali Anda secara eksplisit memilih untuk menampilkannya. Ini adalah perubahan diam-diam dari Claude Opus 4.6, di mana default-nya adalah mengembalikan teks thinking yang diringkas. Untuk mengembalikan konten thinking yang diringkas pada Claude Opus 4.7, atur thinking.display ke "summarized":
```
thinking = {
    "type": "adaptive",
    "display": "summarized",
}
```
Default-nya adalah "omitted" pada Claude Opus 4.7. Jika produk Anda melakukan streaming penalaran ke pengguna, default baru ini muncul sebagai jeda panjang sebelum output dimulai; atur display: "summarized" untuk mengembalikan progres yang terlihat selama thinking. Lihat Pemikiran diperpanjang untuk detailnya.
Penghitungan token yang diperbarui: Claude Opus 4.7 menggunakan tokenizer baru, yang berkontribusi pada peningkatan kinerjanya pada berbagai tugas. Tokenizer baru dapat menggunakan sekitar 1x hingga 1,35x lebih banyak token saat memproses teks dibandingkan dengan model sebelumnya (hingga ~35% lebih banyak, bervariasi berdasarkan konten).

/v1/messages/count_tokens akan mengembalikan jumlah token yang berbeda untuk Claude Opus 4.7 dibandingkan dengan Claude Opus 4.6. Efisiensi token dapat bervariasi berdasarkan bentuk beban kerja.

Intervensi prompting, task_budget, dan effort dapat membantu mengontrol biaya dan memastikan penggunaan token yang sesuai. Kontrol-kontrol ini mungkin mengorbankan kecerdasan model. Perbarui parameter max_tokens Anda untuk memberikan ruang tambahan, termasuk pemicu pemadatan. Claude Opus 4.7 menyediakan jendela konteks 1 juta dengan harga API standar tanpa premium konteks panjang.
Penghapusan prefill (dibawa dari Opus 4.6): Mengisi awal (prefill) pesan asisten mengembalikan error 400 pada Claude Opus 4.7. Gunakan output terstruktur, instruksi prompt sistem, atau output_config.format sebagai gantinya.

Memilih tingkat effort

max: Effort maksimum dapat memberikan peningkatan kinerja dalam beberapa kasus penggunaan, tetapi mungkin menunjukkan hasil yang semakin berkurang dari peningkatan penggunaan token. Pengaturan ini juga terkadang rentan terhadap overthinking. Uji effort maksimum untuk tugas yang menuntut kecerdasan.
xhigh (baru): Effort ekstra tinggi adalah pengaturan terbaik untuk sebagian besar kasus penggunaan coding dan agentic.
high: Pengaturan ini menyeimbangkan penggunaan token dan kecerdasan. Untuk sebagian besar kasus penggunaan yang sensitif terhadap kecerdasan, gunakan minimal effort high.
medium: Baik untuk kasus penggunaan yang sensitif terhadap biaya yang perlu mengurangi penggunaan token sambil mengorbankan kecerdasan.
low: Simpan untuk tugas pendek dengan cakupan terbatas dan beban kerja yang sensitif terhadap latensi yang tidak sensitif terhadap kecerdasan.

Effort lebih penting untuk model ini dibandingkan Opus sebelumnya mana pun. Bereksperimenlah dengannya secara aktif saat Anda melakukan upgrade.

Perubahan perilaku

Claude Opus 4.7 memiliki beberapa perbedaan perilaku dari Claude Opus 4.6 yang bukan merupakan perubahan yang merusak API tetapi mungkin memerlukan pembaruan prompt atau penghapusan scaffolding.

Panjang respons bervariasi berdasarkan kasus penggunaan: Claude Opus 4.7 mengkalibrasi panjang respons berdasarkan seberapa kompleks model menilai tugas tersebut, alih-alih menggunakan tingkat verbositas tetap secara default. Ini biasanya berarti jawaban yang lebih pendek untuk pencarian sederhana dan jawaban yang jauh lebih panjang untuk analisis terbuka.

Jika produk Anda bergantung pada gaya atau verbositas output tertentu, Anda mungkin perlu menyesuaikan prompt Anda. Misalnya, untuk mengurangi verbositas, tambahkan: "Provide concise, focused responses. Skip non-essential context, and keep examples minimal." Jika Anda melihat jenis penjelasan berlebihan tertentu, tambahkan instruksi yang ditargetkan dalam prompt Anda untuk mencegahnya.

Contoh positif yang menunjukkan bagaimana Claude dapat berkomunikasi dengan tingkat keringkasan yang sesuai cenderung lebih efektif daripada contoh negatif atau instruksi yang memberi tahu model apa yang tidak boleh dilakukan.
Mengikuti instruksi secara lebih harfiah: Claude Opus 4.7 menafsirkan prompt secara lebih harfiah dan eksplisit daripada Claude Opus 4.6, terutama pada tingkat effort yang lebih rendah. Model tidak akan secara diam-diam menggeneralisasi instruksi dari satu item ke item lain, dan tidak akan menyimpulkan permintaan yang tidak Anda buat. Sisi positif dari literalisme ini adalah presisi dan lebih sedikit bolak-balik. Model umumnya berkinerja lebih baik untuk kasus penggunaan API dengan prompt yang disetel dengan cermat, ekstraksi terstruktur, dan pipeline di mana Anda menginginkan perilaku yang dapat diprediksi. Peninjauan prompt dan harness mungkin sangat membantu untuk migrasi ke Claude Opus 4.7.
Nada yang lebih langsung: Seperti halnya model baru lainnya, gaya prosa pada penulisan panjang mungkin bergeser. Claude Opus 4.7 lebih langsung dan berpendapat, dengan lebih sedikit frasa yang berorientasi validasi dan lebih sedikit emoji dibandingkan gaya Claude Opus 4.6 yang lebih hangat. Jika produk Anda bergantung pada suara tertentu, evaluasi ulang prompt gaya terhadap baseline baru.
Pembaruan progres bawaan dalam jejak agentik: Claude Opus 4.7 memberikan pembaruan yang lebih teratur dan berkualitas lebih tinggi kepada pengguna sepanjang jejak agentik yang panjang. Jika Anda telah menambahkan scaffolding untuk memaksa pesan status sementara ("After every 3 tool calls, summarize progress"), coba hapus. Jika Anda menemukan bahwa panjang atau isi pembaruan yang ditampilkan kepada pengguna dari Claude Opus 4.7 tidak terkalibrasi dengan baik untuk kasus penggunaan Anda, jelaskan secara eksplisit seperti apa pembaruan ini seharusnya dalam prompt dan berikan contoh.
Lebih sedikit subagent yang dibuat secara default: Claude Opus 4.7 cenderung membuat lebih sedikit subagent secara default. Namun, perilaku ini dapat diarahkan melalui prompting; berikan Claude Opus 4.7 panduan eksplisit tentang kapan subagent diinginkan.
Kalibrasi effort yang lebih ketat: Berubah secara signifikan dari Claude Opus 4.6, Claude Opus 4.7 mematuhi tingkat effort secara ketat, terutama pada tingkat rendah. Pada low dan medium, model membatasi cakupan pekerjaannya pada apa yang diminta alih-alih melampaui ekspektasi.

Ini baik untuk latensi dan biaya, tetapi pada tugas yang cukup kompleks yang berjalan pada effort low ada risiko pemikiran yang kurang mendalam. Jika Anda mengamati penalaran yang dangkal pada masalah kompleks, naikkan effort ke high atau xhigh alih-alih mengatasinya melalui prompting.

Jika Anda perlu mempertahankan effort pada low untuk latensi, tambahkan panduan yang ditargetkan: "This task involves multi-step reasoning. Think carefully through the problem before responding." Lihat Tingkat effort yang direkomendasikan untuk Claude Opus 4.7.
Lebih sedikit pemanggilan alat secara default: Claude Opus 4.7 memiliki kecenderungan untuk menggunakan alat lebih jarang daripada Claude Opus 4.6 dan lebih banyak menggunakan penalaran. Ini menghasilkan hasil yang lebih baik dalam sebagian besar kasus.

Untuk meningkatkan penggunaan alat, naikkan pengaturan effort. Pengaturan effort high atau xhigh menunjukkan penggunaan alat yang jauh lebih banyak dalam pencarian agentik dan coding. Anda juga dapat menyesuaikan prompt Anda untuk secara eksplisit menginstruksikan model tentang kapan dan bagaimana menggunakan alatnya dengan benar.
Pengamanan keamanan siber real-time: Baru ditambahkan di Claude Opus 4.7, permintaan yang melibatkan topik terlarang atau berisiko tinggi dapat menyebabkan penolakan. Untuk pekerjaan keamanan yang sah seperti penetration testing, penelitian kerentanan, atau red-teaming, ajukan permohonan ke Cyber Verification Program untuk meminta pengurangan pembatasan. Lihat Safeguards, warnings, and appeals untuk latar belakang.
Dukungan gambar resolusi tinggi: Claude Opus 4.7 adalah model Claude pertama dengan dukungan gambar resolusi tinggi. Resolusi gambar maksimum adalah 2576 piksel pada sisi panjang, naik dari 1568 piksel pada model sebelumnya. Ini membuka peningkatan pada beban kerja yang berat pada visi dan sangat berharga untuk computer use, pemahaman screenshot, dan analisis dokumen.

Dukungan resolusi tinggi bersifat otomatis dan tidak memerlukan header beta atau opt-in di sisi klien. Dua hal yang perlu direncanakan:
- Gambar resolusi penuh dapat menggunakan hingga sekitar 3x lebih banyak token gambar daripada pada model sebelumnya (hingga 4.784 token per gambar, dibandingkan dengan batas sebelumnya sekitar 1.600 token per gambar). Anggarkan ulang max_tokens dan ekspektasi biaya untuk beban kerja yang berat pada gambar, atau lakukan downsample sebelum mengirim jika Anda tidak memerlukan fidelitas tambahan.
- Koordinat pointing dan bounding-box yang dikembalikan oleh model adalah 1:1 dengan piksel gambar aktual pada Claude Opus 4.7, sehingga tidak diperlukan konversi faktor skala.
Lihat Dukungan gambar resolusi tinggi pada Claude Opus 4.7 untuk detailnya.

Perubahan yang direkomendasikan

Ini tidak wajib tetapi akan meningkatkan pengalaman Anda:

Evaluasi ulang max_tokens: Karena teks yang sama menghasilkan jumlah token yang lebih tinggi pada Claude Opus 4.7, perbarui parameter max_tokens Anda untuk memberikan ruang tambahan, termasuk pemicu compaction. Intervensi prompting, task_budget, dan effort dapat membantu mengontrol biaya dan memastikan penggunaan token yang sesuai.
Audit ekspektasi jumlah token: Setiap jalur kode yang memperkirakan token di sisi klien atau mengasumsikan rasio token-ke-karakter tetap harus diuji ulang terhadap Claude Opus 4.7. Gunakan endpoint Token counting untuk memverifikasi.
Adopsi task budgets (beta): Claude Opus 4.7 memperkenalkan task budgets. Budget ini memungkinkan Anda memberi tahu Claude berapa banyak token yang dimilikinya untuk satu loop agentik penuh, termasuk thinking, pemanggilan alat, hasil alat, dan output akhir. Model melihat hitungan mundur yang berjalan dan menggunakannya untuk memprioritaskan pekerjaan dan menyelesaikan tugas dengan baik saat budget dikonsumsi. Untuk menggunakannya, atur header beta task-budgets-2026-03-13 dan tambahkan yang berikut ke output config Anda:
```
output_config = {
    "effort": "high",
    "task_budget": {"type": "tokens", "total": 128000},
}
```
Anda mungkin perlu bereksperimen dengan task budget yang berbeda untuk kasus penggunaan Anda. Jika model diberi task budget yang terlalu ketat, model mungkin menyelesaikan tugas dengan kurang menyeluruh, dengan merujuk budget-nya sebagai kendala.

Untuk tugas agentik terbuka di mana kualitas lebih penting daripada kecepatan, jangan atur task budget. Cadangkan task budget untuk beban kerja di mana Anda memerlukan model untuk membatasi cakupan pekerjaannya pada alokasi token. Nilai minimum untuk task budget adalah 20k token.

Task budget bukan batas keras; ini adalah saran yang disadari oleh model. Ini berbeda dari max_tokens:
- task_budget: batas advisori di seluruh loop agentik penuh. Model melihatnya dan menggunakannya untuk mengatur kecepatannya sendiri.
- max_tokens: batas keras per-permintaan pada token yang dihasilkan. Ini tidak diteruskan ke model, sehingga model tidak menyadarinya.
Gunakan task_budget ketika Anda ingin model memoderasi dirinya sendiri, dan max_tokens sebagai batas keras untuk membatasi penggunaan.
Atur max_tokens yang besar pada effort max atau xhigh: Jika Anda menjalankan Claude Opus 4.7 pada effort max atau xhigh, atur budget token output maksimum yang besar sehingga model memiliki ruang untuk berpikir dan bertindak di seluruh subagent dan pemanggilan alatnya. Mulai dari 64k token dan sesuaikan dari sana.
Downsample gambar jika resolusi tinggi tidak diperlukan: Claude Opus 4.7 mendukung gambar hingga 2576px / 3,75MP. Gambar resolusi tinggi menggunakan lebih banyak token. Jika fidelitas gambar tambahan tidak diperlukan, lakukan downsample gambar sebelum mengirim ke Claude untuk menghindari peningkatan penggunaan token. Lihat Gambar dan visi.

Daftar periksa migrasi

Perbarui nama model dari claude-opus-4-6 ke claude-opus-4-7 (atau perbarui alias).
Hapus temperature, top_p, dan top_k dari payload permintaan.
Ganti thinking: {type: "enabled", budget_tokens: N} dengan thinking: {type: "adaptive"} ditambah parameter effort.
Hapus semua prefill pesan asisten.
Jika UI Anda menampilkan konten thinking, secara eksplisit opt in ke ringkasan thinking.
Lakukan benchmark ulang biaya dan latensi end-to-end di bawah tokenisasi yang diperbarui.
Sesuaikan ulang max_tokens untuk memperhitungkan tokenisasi yang diperbarui.
Uji ulang semua estimasi jumlah token di sisi klien.
Jika aplikasi Anda mengirim gambar, anggarkan ulang untuk dukungan gambar resolusi tinggi (hingga sekitar 3x lebih banyak token gambar per gambar resolusi penuh). Lakukan downsample sebelum mengirim jika Anda tidak memerlukan fidelitas tambahan.
Jika Anda menggunakan koordinat pointing atau bounding-box dari model, hapus semua konversi faktor skala; koordinat adalah 1:1 dengan piksel gambar aktual pada Claude Opus 4.7.
Tinjau prompt untuk perubahan perilaku di atas (panjang respons, literalisme, nada, pembaruan progres, subagent, kalibrasi effort, pemicuan alat, pengamanan siber, penanganan gambar resolusi tinggi).
Tetapkan ulang baseline panjang respons dengan prompt kontrol panjang yang ada dihapus, lalu sesuaikan secara eksplisit.
Jika menggunakan effort xhigh atau max, naikkan max_tokens ke setidaknya 64k sebagai titik awal.
Pertimbangkan untuk mengadopsi task budgets (beta) untuk alur kerja agentik.
Jika produk Anda melakukan pekerjaan keamanan yang sah, ajukan permohonan ke Cyber Verification Program untuk akses ke pembatasan yang lebih rendah pada konten siber.

Migrasi ke Claude Opus 4.7 dari Opus 4.5 atau lebih awal

Perbarui nama model Anda

# Migrasi Opus
model = "claude-opus-4-5"  # Before
model = "claude-opus-4-7"  # After

Perubahan yang merusak

Penghapusan prefill dibahas dalam perubahan yang merusak Opus 4.7 di atas.
Quoting parameter alat: Claude Opus 4.6 dan model yang lebih baru mungkin menghasilkan escaping string JSON yang sedikit berbeda dalam argumen pemanggilan alat (misalnya, penanganan escape Unicode atau escaping forward slash yang berbeda). Jika Anda mem-parse input pemanggilan alat sebagai string mentah alih-alih menggunakan parser JSON, verifikasi logika parsing Anda. Parser JSON standar (seperti json.loads() atau JSON.parse()) menangani perbedaan ini secara otomatis.

Perubahan yang direkomendasikan

Migrasi ke adaptive thinking (wajib pada Opus 4.7): thinking: {type: "enabled", budget_tokens: N} mengembalikan error 400 pada Claude Opus 4.7. Beralih ke thinking: {type: "adaptive"} dan gunakan parameter effort untuk mengontrol kedalaman thinking. Lihat Adaptive thinking.
```
response = client.beta.messages.create(
    model="claude-opus-4-5",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 32000},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)
```
Perhatikan bahwa migrasi juga berpindah dari client.beta.messages.create ke client.messages.create. Adaptive thinking dan effort adalah fitur GA dan tidak memerlukan namespace SDK beta atau header beta apa pun.
Hapus header beta effort: Parameter effort sekarang GA. Hapus betas=["effort-2025-11-24"] dari permintaan Anda.
Hapus header beta fine-grained tool streaming: Fine-grained tool streaming sekarang GA. Hapus betas=["fine-grained-tool-streaming-2025-05-14"] dari permintaan Anda.
Hapus header beta interleaved thinking: Adaptive thinking secara otomatis mengaktifkan interleaved thinking pada Claude Opus 4.7, Opus 4.6, dan Sonnet 4.6. Hapus betas=["interleaved-thinking-2025-05-14"] dari permintaan Anda. Header ini masih berfungsi pada Sonnet 4.6 dengan extended thinking manual, tetapi mode manual sudah deprecated.
Migrasi ke output_config.format: Jika menggunakan structured outputs, perbarui output_format={...} menjadi output_config={"format": {...}}. Parameter lama tetap berfungsi tetapi sudah deprecated dan akan dihapus dalam rilis model mendatang.

Migrasi dari Claude 4.1 atau lebih awal

# Dari Opus 4.1
model = "claude-opus-4-1-20250805"  # Before
model = "claude-opus-4-7"  # After

# Dari Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Before
model = "claude-opus-4-7"  # After

Perubahan tambahan yang merusak

Hapus parameter sampling

Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.

Mulai dari Claude Opus 4.7, mengatur temperature, top_p, atau top_k ke nilai non-default apa pun akan mengembalikan error 400. Jalur migrasi teraman adalah menghilangkan parameter ini sepenuhnya dari permintaan, dan menggunakan prompting untuk memandu perilaku model. Jika Anda menggunakan temperature = 0 untuk determinisme, perhatikan bahwa itu tidak pernah menjamin output yang identik.
```
# Sebelum - Ini akan menghasilkan error pada model Claude 4+
response = client.messages.create(
    model="claude-3-7-sonnet-20250219",
    temperature=0.7,
    top_p=0.9,  # Non-default sampling params return 400 on Opus 4.7
    # ...
)

# Sesudah
response = client.messages.create(
    model="claude-opus-4-7",
    # ...
)
```
Perbarui versi alat

Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.

Perbarui ke versi alat terbaru. Hapus semua kode yang menggunakan perintah undo_edit.
```
# Sebelum
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]

# Sesudah
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]
```
- Text editor: Gunakan text_editor_20250728 dan str_replace_based_edit_tool. Lihat dokumentasi alat Text editor untuk detailnya.
- Code execution: Tingkatkan ke code_execution_20250825. Lihat dokumentasi alat Code execution untuk instruksi migrasi.

Tangani stop reason refusal

Perbarui aplikasi Anda untuk menangani stop reason refusal:

response = client.messages.create(...)

if response.stop_reason == "refusal":
    # Tangani penolakan dengan tepat
    pass

Tangani stop reason model_context_window_exceeded

Model Claude 4.5+ mengembalikan stop reason model_context_window_exceeded ketika generasi berhenti karena mencapai batas jendela konteks, bukan batas max_tokens yang diminta. Perbarui aplikasi Anda untuk menangani stop reason baru ini:
```
response = client.messages.create(...)

if response.stop_reason == "model_context_window_exceeded":
    # Tangani batas jendela konteks dengan tepat
    pass
```
Verifikasi penanganan parameter alat (newline di akhir)

Model Claude 4.5+ mempertahankan newline di akhir dalam parameter string pemanggilan alat yang sebelumnya dihapus. Jika alat Anda bergantung pada pencocokan string yang tepat terhadap parameter pemanggilan alat, verifikasi bahwa logika Anda menangani newline di akhir dengan benar.
Perbarui prompt Anda untuk perubahan perilaku

Model Claude 4+ memiliki gaya komunikasi yang lebih ringkas dan langsung serta memerlukan arahan eksplisit. Tinjau praktik terbaik prompting untuk panduan optimasi.

Perubahan tambahan yang direkomendasikan

Hapus header beta lama: Hapus token-efficient-tools-2025-02-19 dan output-128k-2025-02-19. Semua model Claude 4+ memiliki penggunaan alat yang efisien token secara bawaan dan header ini tidak memiliki efek.

Daftar periksa migrasi (dari Opus 4.5 atau lebih awal)

Perbarui ID model ke claude-opus-4-7
Terapkan semua perubahan yang merusak Opus 4.7 (extended thinking dihapus, parameter sampling dihapus, tampilan thinking dihilangkan secara default, tokenisasi diperbarui)
MERUSAK: Hapus prefill pesan asisten (mengembalikan error 400); gunakan structured outputs atau output_config.format sebagai gantinya
MERUSAK pada Opus 4.7: Ganti thinking: {type: "enabled", budget_tokens: N} dengan thinking: {type: "adaptive"} ditambah parameter effort (mengembalikan 400 pada Opus 4.7)
Verifikasi parsing JSON pemanggilan alat menggunakan parser JSON standar
Hapus header beta effort-2025-11-24 (effort sekarang GA)
Hapus header beta fine-grained-tool-streaming-2025-05-14
Hapus header beta interleaved-thinking-2025-05-14 (adaptive thinking mengaktifkan interleaved thinking secara otomatis)
Migrasikan output_format ke output_config.format (jika berlaku)
Jika bermigrasi dari Claude 4.1 atau lebih awal: hapus temperature, top_p, dan top_k (nilai non-default mengembalikan 400 pada Opus 4.7)
Jika bermigrasi dari Claude 4.1 atau lebih awal: perbarui versi alat (text_editor_20250728, code_execution_20250825)
Jika bermigrasi dari Claude 4.1 atau lebih awal: tangani stop reason refusal
Jika bermigrasi dari Claude 4.1 atau lebih awal: tangani stop reason model_context_window_exceeded
Jika bermigrasi dari Claude 4.1 atau lebih awal: verifikasi penanganan parameter string alat untuk newline di akhir
Jika bermigrasi dari Claude 4.1 atau lebih awal: hapus header beta lama (token-efficient-tools-2025-02-19, output-128k-2025-02-19)
Tinjau dan perbarui prompt mengikuti praktik terbaik prompting
Uji di lingkungan pengembangan sebelum deployment produksi

Migrasi dari Claude Sonnet 4.6 ke Claude Sonnet 5

Claude Sonnet 5 menawarkan kombinasi terbaik antara kecepatan dan kecerdasan dalam keluarga model Claude. Model ini dibangun di atas Claude Sonnet 4.6.

Perbarui nama model Anda

# Migrasi Sonnet
model = "claude-sonnet-4-6"  # Before
model = "claude-sonnet-5"  # After

Apa yang berubah

Tokenizer baru: Claude Sonnet 5 menggunakan tokenizer baru. Teks input yang sama menghasilkan sekitar 30% lebih banyak token daripada pada Claude Sonnet 4.6. Permintaan, respons, dan event streaming mempertahankan bentuk yang sama, dan tidak ada perubahan kode yang diperlukan, tetapi apa pun yang Anda ukur atau anggarkan dalam token bergeser: field usage dan hasil token counting untuk teks yang sama lebih tinggi, jendela konteks 1M token menampung lebih sedikit teks, dan batas max_tokens yang disetel untuk Claude Sonnet 4.6 mungkin memotong output yang setara. Harga per-token tidak berubah, sehingga biaya permintaan yang setara dapat berbeda. Jalankan ulang token counting terhadap Claude Sonnet 5 alih-alih menggunakan kembali hitungan yang diukur terhadap model sebelumnya.
128k token output maksimum (tidak berubah): Claude Sonnet 5 mendukung hingga 128k token output, sama dengan Claude Sonnet 4.6. Nilai max_tokens yang ada tetap valid. Perhitungkan tokenizer baru saat menentukan ukurannya.
Prefilling pesan asisten (tidak berubah): Prefilling pesan asisten mengembalikan error 400 pada Claude Sonnet 5, sama seperti pada Claude Sonnet 4.6. Jika Anda menghapus prefill saat bermigrasi ke Claude Sonnet 4.6, tidak ada perubahan lebih lanjut yang diperlukan. Gunakan structured outputs, instruksi prompt sistem, atau output_config.format sebagai gantinya.
Adaptive thinking aktif secara default: Pada Claude Sonnet 4.6, permintaan tanpa field thinking berjalan tanpa thinking; pada Claude Sonnet 5, permintaan yang sama berjalan dengan adaptive thinking. Untuk mematikan thinking, kirim thinking: {type: "disabled"}. Extended thinking manual (thinking: {type: "enabled", budget_tokens: N}) tidak didukung dan mengembalikan error 400. Gunakan parameter effort (default high) untuk mengontrol kedalaman thinking.
Parameter sampling dihapus: Parameter sampling (temperature, top_p, top_k) yang diatur ke nilai non-default tidak diterima dan mengembalikan error 400.
Pengamanan keamanan siber: Claude Sonnet 5 adalah model tingkat Sonnet pertama dengan pengamanan keamanan siber real-time. Permintaan yang melibatkan topik keamanan siber yang terlarang atau berisiko tinggi mungkin ditolak. Penolakan dikembalikan sebagai respons HTTP 200 yang berhasil dengan stop_reason: "refusal", bukan error. Lihat Safeguards, warnings, and appeals untuk latar belakang.

Daftar periksa migrasi

Perbarui nama model dari claude-sonnet-4-6 ke claude-sonnet-5.
Jalankan ulang token counting terhadap Claude Sonnet 5. Tokenizer baru menghasilkan sekitar 30% lebih banyak token untuk teks yang sama, yang dapat mengubah biaya per-permintaan meskipun harga per-token tidak berubah.
Tinjau kembali batas max_tokens yang diatur mendekati panjang output yang Anda harapkan, dan naikkan hingga maksimum 128k (tidak berubah dari Claude Sonnet 4.6) jika berguna.
Hapus konfigurasi thinking: {type: "enabled", budget_tokens: N} (mengembalikan error 400). Adaptive thinking aktif secara default; kirim {type: "disabled"} untuk mematikannya, atau gunakan parameter effort untuk mengontrol kedalaman.
Hapus parameter temperature, top_p, dan top_k yang diatur ke nilai non-default (mengembalikan error 400 pada Claude Sonnet 5).
Tambahkan penanganan untuk stop_reason: "refusal" jika beban kerja Anda mungkin menyentuh topik keamanan siber.
Tetapkan ulang baseline biaya pada beban kerja tipikal Anda sebelum deployment produksi.
Tinjau max_tokens untuk beban kerja yang sebelumnya berjalan tanpa thinking.

Migrasi ke Claude Sonnet 4.6

Untuk gambaran lengkap kemampuan, lihat gambaran umum model.

Harga Sonnet 4.6 adalah $3 per juta token input, $15 per juta token output. Lihat harga Claude untuk detailnya.

Perbarui nama model Anda:

# Dari Sonnet 4.5
model = "claude-sonnet-4-5"  # Before
model = "claude-sonnet-4-6"  # After

Perubahan yang merusak

Saat bermigrasi dari Sonnet 4.5

Prefilling pesan asisten tidak lagi didukung

Ini adalah perubahan yang merusak saat bermigrasi dari Sonnet 4.5 atau lebih awal.

Prefilling pesan asisten mengembalikan error 400 pada Sonnet 4.6. Gunakan structured outputs, instruksi prompt sistem, atau output_config.format sebagai gantinya.

Kasus penggunaan prefill umum dan migrasinya:
- Mengontrol format output (memaksa output JSON/YAML): Gunakan structured outputs atau alat dengan field enum untuk tugas klasifikasi.
- Menghilangkan pembukaan (menghapus frasa "Here is..."): Tambahkan instruksi langsung dalam prompt sistem: "Respond directly without preamble. Do not start with phrases like 'Here is...', 'Based on...', etc."
- Menghindari penolakan yang buruk: Claude sekarang jauh lebih baik dalam penolakan yang sesuai. Prompting yang jelas dalam pesan pengguna tanpa prefill seharusnya sudah cukup.
- Kelanjutan (melanjutkan respons yang terputus): Pindahkan kelanjutan ke pesan pengguna: "Your previous response was interrupted and ended with [previous_response]. Continue from where you left off."
- Hidrasi konteks / konsistensi peran (menyegarkan konteks dalam percakapan panjang): Masukkan apa yang sebelumnya merupakan pengingat asisten yang di-prefill ke dalam giliran pengguna sebagai gantinya.
Escaping JSON parameter alat mungkin berbeda

Ini adalah perubahan yang merusak saat bermigrasi dari Sonnet 4.5 atau lebih awal.

Escaping string JSON dalam parameter alat mungkin berbeda dari model sebelumnya. Parser JSON standar menangani ini secara otomatis, tetapi parsing berbasis string kustom mungkin memerlukan pembaruan.

Saat bermigrasi dari Claude 3.x

Perbarui parameter sampling

Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.

Gunakan hanya temperature ATAU top_p, bukan keduanya.
Perbarui versi alat

Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.

Perbarui ke versi alat terbaru (text_editor_20250728, code_execution_20250825). Hapus semua kode yang menggunakan perintah undo_edit.
Tangani stop reason refusal

Perbarui aplikasi Anda untuk menangani stop reason refusal.
Perbarui prompt Anda untuk perubahan perilaku

Model Claude 4 memiliki gaya komunikasi yang lebih ringkas dan langsung. Tinjau praktik terbaik prompting untuk panduan optimasi.

Perubahan yang direkomendasikan

Hapus header beta fine-grained-tool-streaming-2025-05-14: Fine-grained tool streaming sekarang GA pada Sonnet 4.6 dan tidak lagi memerlukan header beta.
Migrasikan output_format ke output_config.format: Parameter output_format sudah deprecated. Gunakan output_config.format sebagai gantinya.

Migrasi dari Sonnet 4.5

Pertimbangkan untuk bermigrasi dari Sonnet 4.5 ke Sonnet 4.6, yang memberikan kecerdasan lebih tinggi dengan harga yang sama.

Jika Anda tidak menggunakan pemikiran diperpanjang

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Jika Anda menggunakan pemikiran diperpanjang

Migrasi ke adaptive thinking

Adaptive thinking (pemikiran adaptif) adalah pengganti yang direkomendasikan untuk budget_tokens pada Sonnet 4.6. Fitur ini sangat cocok untuk pola beban kerja berikut:

Agen multi-langkah otonom: agen coding yang mengubah persyaratan menjadi perangkat lunak yang berfungsi, pipeline analisis data, dan pencarian bug di mana model berjalan secara independen melalui banyak langkah. Adaptive thinking memungkinkan model mengkalibrasi penalarannya per langkah, tetap berada di jalur yang benar selama trajektori yang lebih panjang. Untuk beban kerja ini, mulailah dengan effort high. Jika latensi atau penggunaan token menjadi perhatian, turunkan ke medium.
Agen computer use: Sonnet 4.6 mencapai akurasi terbaik di kelasnya pada evaluasi computer use menggunakan mode adaptif.
Beban kerja bimodal: campuran tugas mudah dan sulit di mana mode adaptif melewati proses thinking pada kueri sederhana dan bernalar secara mendalam pada kueri yang kompleks.

Saat menggunakan adaptive thinking, evaluasi effort medium dan high pada tugas Anda. Tingkat yang tepat bergantung pada trade-off beban kerja Anda antara kualitas, latensi, dan penggunaan token.

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Mempertahankan budget_tokens selama migrasi

Kasus penggunaan coding dan agentic

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16384,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "medium"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Kasus penggunaan chat dan non-coding

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "low"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Daftar periksa migrasi Sonnet 4.6

Perbarui ID model ke claude-sonnet-4-6
BREAKING: Hapus prefilling pesan assistant; gunakan structured outputs atau output_config.format sebagai gantinya
BREAKING: Verifikasi bahwa parsing JSON parameter alat menangani perbedaan escaping
BREAKING: Perbarui versi alat ke yang terbaru (text_editor_20250728, code_execution_20250825); versi lama tidak didukung (jika bermigrasi dari 3.x)
BREAKING: Hapus kode apa pun yang menggunakan perintah undo_edit (jika berlaku)
BREAKING: Perbarui parameter sampling untuk hanya menggunakan temperature ATAU top_p, bukan keduanya (jika bermigrasi dari 3.x)
Tangani stop reason refusal yang baru di aplikasi Anda
Hapus beta header fine-grained-tool-streaming-2025-05-14 (sekarang sudah GA)
Migrasikan output_format ke output_config.format
Tinjau dan perbarui prompt mengikuti praktik terbaik prompting
Direkomendasikan: Migrasikan dari thinking: {type: "enabled", budget_tokens: N} ke thinking: {type: "adaptive"} dengan parameter effort (budget_tokens sudah tidak digunakan lagi dan akan dihapus pada rilis mendatang)
Uji di lingkungan pengembangan sebelum deployment ke produksi

Migrasi ke Claude Sonnet 4.5

Claude Sonnet 4.5 menggabungkan kecerdasan yang kuat dengan performa yang cepat, menjadikannya ideal untuk tugas coding, analisis, dan konten sehari-hari.

Untuk gambaran lengkap tentang kemampuan, lihat ikhtisar model.

Harga Sonnet 4.5 adalah $3 per juta token input, $15 per juta token output. Lihat harga Claude untuk detailnya.

Perbarui nama model Anda:

# Dari Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Before
model = "claude-sonnet-4-5-20250929"  # After

Perubahan yang merusak (breaking changes)

Perubahan yang merusak ini berlaku saat bermigrasi dari model Claude 3.x Sonnet.

Perbarui parameter sampling

Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.

Gunakan hanya temperature ATAU top_p, bukan keduanya.
Perbarui versi alat

Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.

Perbarui ke versi alat terbaru (text_editor_20250728, code_execution_20250825). Hapus kode apa pun yang menggunakan perintah undo_edit.
Tangani stop reason refusal

Perbarui aplikasi Anda untuk menangani stop reason refusal.
Perbarui prompt Anda untuk perubahan perilaku

Model Claude 4 memiliki gaya komunikasi yang lebih ringkas dan langsung. Tinjau praktik terbaik prompting untuk panduan optimasi.

Daftar periksa migrasi Sonnet 4.5

Perbarui ID model ke claude-sonnet-4-5-20250929
BREAKING: Perbarui versi alat ke yang terbaru (text_editor_20250728, code_execution_20250825); versi lama tidak didukung (jika bermigrasi dari 3.x)
BREAKING: Hapus kode apa pun yang menggunakan perintah undo_edit (jika berlaku)
BREAKING: Perbarui parameter sampling untuk hanya menggunakan temperature ATAU top_p, bukan keduanya (jika bermigrasi dari 3.x)
Tangani stop reason refusal yang baru di aplikasi Anda
Tinjau dan perbarui prompt mengikuti praktik terbaik prompting
Pertimbangkan untuk mengaktifkan pemikiran diperpanjang untuk tugas penalaran yang kompleks
Uji di lingkungan pengembangan sebelum deployment ke produksi

Migrasi ke Claude Haiku 4.5

Claude Haiku 4.5 adalah model Haiku tercepat dan paling cerdas dengan performa mendekati frontier, memberikan kualitas model premium untuk aplikasi interaktif dan pemrosesan volume tinggi.

Untuk gambaran lengkap tentang kemampuan, lihat ikhtisar model.

Harga Haiku 4.5 adalah $1 per juta token input, $5 per juta token output. Lihat harga Claude untuk detailnya.

Perbarui nama model Anda:

# Dari Haiku 3.5
model = "claude-3-5-haiku-20241022"  # Before
model = "claude-haiku-4-5-20251001"  # After

Tinjau batas laju baru: Haiku 4.5 memiliki batas laju yang terpisah dari Haiku 3.5. Lihat dokumentasi batas laju untuk detailnya.

Untuk peningkatan performa yang signifikan pada tugas coding dan penalaran, pertimbangkan untuk mengaktifkan pemikiran diperpanjang dengan thinking: {type: "enabled", budget_tokens: N}.

Pemikiran diperpanjang memengaruhi efisiensi caching prompt.

Jelajahi kemampuan baru: Lihat ikhtisar model untuk detail tentang kesadaran konteks, peningkatan kapasitas output (64k token), kecerdasan yang lebih tinggi, dan kecepatan yang lebih baik.

Perubahan yang merusak (breaking changes)

Perubahan yang merusak ini berlaku saat bermigrasi dari model Claude 3.x Haiku.

Perbarui parameter sampling

Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.

Gunakan hanya temperature ATAU top_p, bukan keduanya.
Perbarui versi alat

Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.

Perbarui ke versi alat terbaru (text_editor_20250728, code_execution_20250825). Hapus kode apa pun yang menggunakan perintah undo_edit.
Tangani stop reason refusal

Perbarui aplikasi Anda untuk menangani stop reason refusal.
Perbarui prompt Anda untuk perubahan perilaku

Model Claude 4 memiliki gaya komunikasi yang lebih ringkas dan langsung. Tinjau praktik terbaik prompting untuk panduan optimasi.

Daftar periksa migrasi Haiku 4.5

Perbarui ID model ke claude-haiku-4-5-20251001
BREAKING: Perbarui versi alat ke yang terbaru (text_editor_20250728, code_execution_20250825); versi lama tidak didukung
BREAKING: Hapus kode apa pun yang menggunakan perintah undo_edit (jika berlaku)
BREAKING: Perbarui parameter sampling untuk hanya menggunakan temperature ATAU top_p, bukan keduanya
Tangani stop reason refusal yang baru di aplikasi Anda
Tinjau dan sesuaikan untuk batas laju baru (terpisah dari Haiku 3.5)
Tinjau dan perbarui prompt mengikuti praktik terbaik prompting
Pertimbangkan untuk mengaktifkan pemikiran diperpanjang untuk tugas penalaran yang kompleks
Uji di lingkungan pengembangan sebelum deployment ke produksi

Dapatkan bantuan

Periksa dokumentasi API untuk spesifikasi terperinci
Tinjau kemampuan model untuk perbandingan performa
Tinjau catatan rilis API untuk pembaruan API
Hubungi dukungan jika Anda mengalami masalah selama migrasi

Was this page helpful?

Bermigrasi dari Claude Mythos Preview ke Claude Mythos 5

Perbarui nama model Anda

Fitur yang tidak tersedia di Claude Mythos 5

Penghitungan token dan penagihan

Daftar periksa migrasi

Bermigrasi dari Claude Opus 4.8 ke Claude Fable 5

Sebelum Anda bermigrasi

Perbarui nama model Anda

Apa yang berubah

Daftar periksa migrasi

Bermigrasi dari Claude Opus 4.7 ke Claude Opus 4.8

Perbarui nama model Anda

Apa yang berubah

Daftar periksa migrasi

Bermigrasi ke Claude Opus 4.7

Perbarui nama model Anda

Perubahan yang bersifat breaking

Memilih tingkat effort

Perubahan perilaku

Perubahan yang direkomendasikan

Daftar periksa migrasi

Migrasi ke Claude Opus 4.7 dari Opus 4.5 atau lebih awal

Perbarui nama model Anda

Perubahan yang merusak

Perubahan yang direkomendasikan

Migrasi dari Claude 4.1 atau lebih awal

Perubahan tambahan yang merusak

Perubahan tambahan yang direkomendasikan

Daftar periksa migrasi (dari Opus 4.5 atau lebih awal)

Migrasi dari Claude Sonnet 4.6 ke Claude Sonnet 5

Perbarui nama model Anda

Apa yang berubah

Daftar periksa migrasi

Migrasi ke Claude Sonnet 4.6

Perubahan yang merusak

Saat bermigrasi dari Sonnet 4.5

Saat bermigrasi dari Claude 3.x

Perubahan yang direkomendasikan

Migrasi dari Sonnet 4.5

Jika Anda tidak menggunakan pemikiran diperpanjang

Jika Anda menggunakan pemikiran diperpanjang

Migrasi ke adaptive thinking

Mempertahankan budget_tokens selama migrasi

Kasus penggunaan coding dan agentic

Kasus penggunaan chat dan non-coding

Daftar periksa migrasi Sonnet 4.6

Migrasi ke Claude Sonnet 4.5

Perubahan yang merusak (breaking changes)

Daftar periksa migrasi Sonnet 4.5

Migrasi ke Claude Haiku 4.5

Perubahan yang merusak (breaking changes)

Daftar periksa migrasi Haiku 4.5

Dapatkan bantuan

Bermigrasi dari Claude Mythos Preview ke Claude Mythos 5

Perbarui nama model Anda

Fitur yang tidak tersedia di Claude Mythos 5

Penghitungan token dan penagihan

Daftar periksa migrasi

Bermigrasi dari Claude Opus 4.8 ke Claude Fable 5

Sebelum Anda bermigrasi

Perbarui nama model Anda

Apa yang berubah

Daftar periksa migrasi

Bermigrasi dari Claude Opus 4.7 ke Claude Opus 4.8

Perbarui nama model Anda

Apa yang berubah

Daftar periksa migrasi

Bermigrasi ke Claude Opus 4.7

Perbarui nama model Anda

Perubahan yang bersifat breaking

Memilih tingkat effort

Perubahan perilaku

Perubahan yang direkomendasikan

Daftar periksa migrasi

Migrasi ke Claude Opus 4.7 dari Opus 4.5 atau lebih awal

Perbarui nama model Anda

Perubahan yang merusak

Perubahan yang direkomendasikan

Migrasi dari Claude 4.1 atau lebih awal

Perubahan tambahan yang merusak

Bermigrasi dari Claude Mythos Preview ke Claude Mythos 5

Perbarui nama model Anda

Fitur yang tidak tersedia di Claude Mythos 5

Penghitungan token dan penagihan

Daftar periksa migrasi

Bermigrasi dari Claude Opus 4.8 ke Claude Fable 5

Sebelum Anda bermigrasi

Perbarui nama model Anda

Apa yang berubah

Daftar periksa migrasi

Bermigrasi dari Claude Opus 4.7 ke Claude Opus 4.8

Perbarui nama model Anda

Apa yang berubah

Daftar periksa migrasi

Bermigrasi ke Claude Opus 4.7

Perbarui nama model Anda

Perubahan yang bersifat breaking

Memilih tingkat effort

Perubahan perilaku

Perubahan yang direkomendasikan

Daftar periksa migrasi

Migrasi ke Claude Opus 4.7 dari Opus 4.5 atau lebih awal

Perbarui nama model Anda

Perubahan yang merusak

Perubahan yang direkomendasikan

Migrasi dari Claude 4.1 atau lebih awal

Perubahan tambahan yang merusak

Perubahan tambahan yang direkomendasikan

Daftar periksa migrasi (dari Opus 4.5 atau lebih awal)

Migrasi dari Claude Sonnet 4.6 ke Claude Sonnet 5

Perbarui nama model Anda

Apa yang berubah

Daftar periksa migrasi

Migrasi ke Claude Sonnet 4.6

Perubahan yang merusak

Saat bermigrasi dari Sonnet 4.5

Saat bermigrasi dari Claude 3.x

Perubahan yang direkomendasikan

Migrasi dari Sonnet 4.5

Jika Anda tidak menggunakan pemikiran diperpanjang

Jika Anda menggunakan pemikiran diperpanjang

Daftar periksa migrasi Sonnet 4.6

Migrasi ke Claude Sonnet 4.5

Perubahan yang merusak (breaking changes)

Daftar periksa migrasi Sonnet 4.5

Migrasi ke Claude Haiku 4.5

Perubahan yang merusak (breaking changes)

Daftar periksa migrasi Haiku 4.5

Dapatkan bantuan

Bermigrasi dari Claude Mythos Preview ke Claude Mythos 5

Perbarui nama model Anda

Fitur yang tidak tersedia di Claude Mythos 5

Penghitungan token dan penagihan

Daftar periksa migrasi

Bermigrasi dari Claude Opus 4.8 ke Claude Fable 5

Sebelum Anda bermigrasi

Perbarui nama model Anda

Apa yang berubah

Daftar periksa migrasi

Bermigrasi dari Claude Opus 4.7 ke Claude Opus 4.8

Perbarui nama model Anda

Apa yang berubah

Daftar periksa migrasi

Bermigrasi ke Claude Opus 4.7

Perbarui nama model Anda

Perubahan yang bersifat breaking

Memilih tingkat effort

Perubahan perilaku

Perubahan yang direkomendasikan

Daftar periksa migrasi

Migrasi ke Claude Opus 4.7 dari Opus 4.5 atau lebih awal

Perbarui nama model Anda

Perubahan yang merusak

Perubahan yang direkomendasikan

Migrasi dari Claude 4.1 atau lebih awal

Perubahan tambahan yang merusak

Perubahan tambahan yang direkomendasikan

Daftar periksa migrasi (dari Opus 4.5 atau lebih awal)

Migrasi dari Claude Sonnet 4.6 ke Claude Sonnet 5

Perbarui nama model Anda