Claude Opus 4.6 adalah pengganti yang hampir drop-in untuk Claude 4.5, dengan beberapa perubahan yang merusak untuk diperhatikan. Untuk daftar lengkap fitur baru, lihat Yang baru di Claude 4.6.
# Migrasi Opus
model = "claude-opus-4-5" # Sebelum
model = "claude-opus-4-6" # SesudahPenghapusan prefill: Prefilling pesan asisten mengembalikan kesalahan 400 pada model Claude 4.6. Gunakan output terstruktur, instruksi prompt sistem, atau output_config.format sebagai gantinya.
Penawaran parameter alat: Model Claude 4.6 mungkin menghasilkan penghindaran string JSON yang sedikit berbeda dalam argumen panggilan alat (misalnya, penanganan penghindaran Unicode atau penghindaran garis miring yang berbeda). Jika Anda mengurai input panggilan alat sebagai string mentah daripada menggunakan parser JSON, verifikasi logika penguraian Anda. Parser JSON standar (seperti json.loads() atau JSON.parse()) menangani perbedaan ini secara otomatis.
Ini tidak diperlukan tetapi akan meningkatkan pengalaman Anda:
Bermigrasi ke pemikiran adaptif: thinking: {type: "enabled", budget_tokens: N} tidak direkomendasikan pada model Claude 4.6 dan akan dihapus dalam rilis model di masa depan. Beralih ke thinking: {type: "adaptive"} dan gunakan parameter effort untuk mengontrol kedalaman pemikiran. Lihat Pemikiran adaptif.
response = client.beta.messages.create(
model="claude-opus-4-5",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 32000},
betas=["interleaved-thinking-2025-05-14"],
messages=[...],
)Perhatikan bahwa migrasi juga bergerak dari client.beta.messages.create ke client.messages.create. Pemikiran adaptif dan effort adalah fitur GA dan tidak memerlukan namespace SDK beta atau header beta apa pun.
Hapus header beta effort: Parameter effort sekarang GA. Hapus betas=["effort-2025-11-24"] dari permintaan Anda.
Hapus header beta streaming alat yang halus: Streaming alat yang halus sekarang GA. Hapus betas=["fine-grained-tool-streaming-2025-05-14"] dari permintaan Anda.
Hapus header beta pemikiran yang tersisip (Opus 4.6 saja): Pemikiran adaptif secara otomatis mengaktifkan pemikiran yang tersisip pada Opus 4.6. Hapus betas=["interleaved-thinking-2025-05-14"] dari permintaan Opus 4.6 Anda. Catatan: Sonnet 4.6 terus mendukung header beta ini dengan pemikiran yang diperpanjang secara manual.
Bermigrasi ke output_config.format: Jika menggunakan output terstruktur, perbarui output_format={...} ke output_config={"format": {...}}. Parameter lama tetap berfungsi tetapi tidak direkomendasikan dan akan dihapus dalam rilis model di masa depan.
Jika Anda bermigrasi dari Opus 4.1, Sonnet 4, atau model sebelumnya langsung ke Claude 4.6, terapkan perubahan yang merusak Claude 4.6 di atas ditambah perubahan tambahan di bagian ini.
# Dari Opus 4.1
model = "claude-opus-4-1-20250805" # Sebelum
model = "claude-opus-4-6" # Sesudah
# Dari Sonnet 4
model = "claude-sonnet-4-20250514" # Sebelum
model = "claude-opus-4-6" # Sesudah
# Dari Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Sebelum
model = "claude-opus-4-6" # SesudahPerbarui parameter sampling
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Gunakan hanya temperature ATAU top_p, bukan keduanya:
# Sebelum - Ini akan error di model Claude 4+
response = client.messages.create(
model="claude-3-7-sonnet-20250219",
temperature=0.7,
top_p=0.9, # Tidak dapat menggunakan keduanya
# ...
)
# Sesudah
response = client.messages.create(
model="claude-opus-4-6",
temperature=0.7, # Gunakan temperature ATAU top_p, bukan keduanya
# ...
)Perbarui versi alat
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Perbarui ke versi alat terbaru. Hapus kode apa pun yang menggunakan perintah undo_edit.
# Sebelum
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
# Sesudah
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]text_editor_20250728 dan str_replace_based_edit_tool. Lihat Dokumentasi alat editor teks untuk detail.code_execution_20250825. Lihat Dokumentasi alat eksekusi kode untuk instruksi migrasi.Tangani alasan penghentian refusal
Perbarui aplikasi Anda untuk menangani alasan penghentian refusal:
response = client.messages.create(...)
if response.stop_reason == "refusal":
# Tangani penolakan dengan tepat
passTangani alasan penghentian model_context_window_exceeded
Model Claude 4.5+ mengembalikan alasan penghentian model_context_window_exceeded ketika generasi berhenti karena mencapai batas jendela konteks, bukan batas max_tokens yang diminta. Perbarui aplikasi Anda untuk menangani alasan penghentian baru ini:
response = client.messages.create(...)
if response.stop_reason == "model_context_window_exceeded":
# Tangani batas jendela konteks dengan tepat
passVerifikasi penanganan parameter alat (trailing newlines)
Model Claude 4.5+ mempertahankan trailing newlines dalam parameter string panggilan alat yang sebelumnya dihapus. Jika alat Anda mengandalkan pencocokan string yang tepat terhadap parameter panggilan alat, verifikasi logika Anda menangani trailing newlines dengan benar.
Perbarui prompt Anda untuk perubahan perilaku
Model Claude 4+ memiliki gaya komunikasi yang lebih ringkas dan langsung serta memerlukan arahan eksplisit. Tinjau praktik terbaik prompting untuk panduan optimasi.
token-efficient-tools-2025-02-19 dan output-128k-2025-02-19. Semua model Claude 4+ memiliki penggunaan alat yang efisien token bawaan dan header ini tidak berpengaruh.claude-opus-4-6output_config.format sebagai gantinyathinking: {type: "enabled", budget_tokens: N} ke thinking: {type: "adaptive"} dengan parameter effort (budget_tokens tidak direkomendasikan dan akan dihapus dalam rilis model di masa depan)effort-2025-11-24 (effort sekarang GA)fine-grained-tool-streaming-2025-05-14interleaved-thinking-2025-05-14 (Opus 4.6 saja; Sonnet 4.6 masih mendukungnya)output_format ke output_config.format (jika berlaku)temperature ATAU top_ptext_editor_20250728, code_execution_20250825)refusalmodel_context_window_exceededtoken-efficient-tools-2025-02-19, output-128k-2025-02-19)Claude Sonnet 4.6 menggabungkan intelijen yang kuat dengan kinerja cepat, menampilkan kemampuan pencarian agentic yang ditingkatkan dan eksekusi kode gratis saat digunakan dengan pencarian web atau pengambilan web. Ini ideal untuk tugas coding, analisis, dan konten sehari-hari.
Untuk gambaran lengkap kemampuan, lihat ikhtisar model.
Harga Sonnet 4.6 adalah $3 per juta token input, $15 per juta token output. Lihat harga Claude untuk detail.
Perbarui nama model Anda:
# Dari Sonnet 4.5
model = "claude-sonnet-4-5" # Sebelum
model = "claude-sonnet-4-6" # Sesudah
# Dari Sonnet 4
model = "claude-sonnet-4-20250514" # Sebelum
model = "claude-sonnet-4-6" # SesudahPrefilling pesan asisten tidak lagi didukung
Ini adalah perubahan yang merusak saat bermigrasi dari Sonnet 4.5 atau lebih awal.
Prefilling pesan asisten mengembalikan kesalahan 400 pada Sonnet 4.6. Gunakan output terstruktur, instruksi prompt sistem, atau output_config.format sebagai gantinya.
Kasus penggunaan prefill umum dan migrasi:
Mengontrol format output (memaksa output JSON/YAML): Gunakan output terstruktur atau alat dengan bidang enum untuk tugas klasifikasi.
Menghilangkan preamble (menghapus frasa "Here is..."): Tambahkan instruksi langsung dalam prompt sistem: "Respond directly without preamble. Do not start with phrases like 'Here is...', 'Based on...', etc."
Menghindari penolakan buruk: Claude jauh lebih baik dalam penolakan yang tepat sekarang. Prompting yang jelas dalam pesan pengguna tanpa prefill harus cukup.
Kelanjutan (melanjutkan respons yang terputus): Pindahkan kelanjutan ke pesan pengguna: "Your previous response was interrupted and ended with [previous_response]. Continue from where you left off."
Hidrasi konteks / konsistensi peran (menyegarkan konteks dalam percakapan panjang): Injeksi apa yang sebelumnya adalah pengingat prefilled-assistant ke giliran pengguna sebagai gantinya.
Penghindaran JSON parameter alat mungkin berbeda
Ini adalah perubahan yang merusak saat bermigrasi dari Sonnet 4.5 atau lebih awal.
Penghindaran string JSON dalam parameter alat mungkin berbeda dari model sebelumnya. Parser JSON standar menangani ini secara otomatis, tetapi parsing berbasis string khusus mungkin memerlukan pembaruan.
Perbarui parameter sampling
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Gunakan hanya temperature ATAU top_p, bukan keduanya.
Perbarui versi alat
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Perbarui ke versi alat terbaru (text_editor_20250728, code_execution_20250825). Hapus kode apa pun yang menggunakan perintah undo_edit.
Tangani alasan penghentian refusal
Perbarui aplikasi Anda untuk menangani alasan penghentian refusal.
Perbarui prompt Anda untuk perubahan perilaku
Model Claude 4 memiliki gaya komunikasi yang lebih ringkas dan langsung. Tinjau praktik terbaik prompting untuk panduan optimasi.
fine-grained-tool-streaming-2025-05-14 — Streaming alat yang halus sekarang GA pada Sonnet 4.6 dan tidak lagi memerlukan header beta.output_format ke output_config.format — Parameter output_format tidak direkomendasikan. Gunakan output_config.format sebagai gantinya.Kami sangat mendorong migrasi dari Sonnet 4.5 ke Sonnet 4.6, yang memberikan lebih banyak intelijen dengan harga yang sama.
Sonnet 4.6 default ke tingkat effort high, berbeda dengan Sonnet 4.5 yang tidak memiliki parameter effort. Kami merekomendasikan menyesuaikan parameter effort saat Anda bermigrasi dari Sonnet 4.5 ke Sonnet 4.6. Jika tidak secara eksplisit diatur, Anda mungkin mengalami latensi yang lebih tinggi dengan tingkat effort default.
Jika Anda tidak menggunakan pemikiran yang diperpanjang pada Sonnet 4.5, Anda dapat melanjutkan tanpanya pada Sonnet 4.6. Anda harus secara eksplisit menetapkan effort ke tingkat yang sesuai untuk kasus penggunaan Anda. Pada effort low dengan pemikiran dinonaktifkan, Anda dapat mengharapkan kinerja yang sama atau lebih baik relatif terhadap Sonnet 4.5 tanpa pemikiran yang diperpanjang.
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
output_config={"effort": "low"},
messages=[{"role": "user", "content": "Your prompt here"}],
)Jika Anda menggunakan pemikiran yang diperpanjang pada Sonnet 4.5, itu terus didukung pada Sonnet 4.6 tanpa perubahan yang diperlukan pada konfigurasi pemikiran Anda. Kami merekomendasikan menjaga anggaran pemikiran sekitar 16k token. Dalam praktik, sebagian besar tugas tidak menggunakan sebanyak itu, tetapi itu memberikan ruang kepala untuk masalah yang lebih sulit tanpa risiko penggunaan token yang liar.
Untuk coding agentic, desain frontend, alur kerja yang berat alat, dan alur kerja enterprise yang kompleks, kami merekomendasikan memulai dengan effort medium. Jika Anda menemukan latensi terlalu tinggi, pertimbangkan mengurangi effort ke low. Jika Anda memerlukan intelijen yang lebih tinggi, pertimbangkan meningkatkan effort ke high atau bermigrasi ke Opus 4.6.
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=16384,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "medium"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)Untuk chat, pembuatan konten, pencarian, klasifikasi, dan tugas non-coding lainnya, kami merekomendasikan memulai dengan effort low dengan pemikiran yang diperpanjang. Jika Anda memerlukan lebih banyak kedalaman, tingkatkan effort ke medium.
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "low"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)Jalur migrasi di atas menggunakan pemikiran yang diperpanjang dengan budget_tokens untuk penggunaan token yang dapat diprediksi. Jika beban kerja Anda sesuai dengan salah satu pola berikut, pertimbangkan mencoba pemikiran adaptif sebagai gantinya:
high. Jika latensi atau penggunaan token menjadi masalah, skala turun ke medium.Saat menggunakan pemikiran adaptif, evaluasi effort medium dan high pada tugas Anda. Tingkat yang tepat tergantung pada tradeoff beban kerja Anda antara kualitas, latensi, dan penggunaan token.
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"},
messages=[{"role": "user", "content": "Your prompt here"}],
)Jika Anda melihat perilaku yang tidak konsisten atau regresi kualitas dengan pemikiran adaptif, beralih ke pemikiran yang diperpanjang dengan budget_tokens. Ini memberikan hasil yang lebih dapat diprediksi dengan batas pada biaya pemikiran.
claude-sonnet-4-6output_config.format sebagai gantinyatext_editor_20250728, code_execution_20250825); versi warisan tidak didukung (jika bermigrasi dari 3.x)undo_edit (jika berlaku)temperature ATAU top_p, bukan keduanya (jika bermigrasi dari 3.x)refusal baru dalam aplikasi Andafine-grained-tool-streaming-2025-05-14 (sekarang GA)output_format ke output_config.formatClaude Sonnet 4.5 menggabungkan intelijen yang kuat dengan kinerja cepat, menjadikannya ideal untuk tugas coding, analisis, dan konten sehari-hari.
Untuk gambaran lengkap kemampuan, lihat ikhtisar model.
Harga Sonnet 4.5 adalah $3 per juta token input, $15 per juta token output. Lihat harga Claude untuk detail.
Perbarui nama model Anda:
# Dari Sonnet 4
model = "claude-sonnet-4-20250514" # Sebelum
model = "claude-sonnet-4-5-20250929" # Sesudah
# Dari Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Sebelum
model = "claude-sonnet-4-5-20250929" # SesudahPerubahan yang merusak ini berlaku saat bermigrasi dari model Claude 3.x Sonnet.
Perbarui parameter sampling
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Gunakan hanya temperature ATAU top_p, bukan keduanya.
Perbarui versi alat
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Perbarui ke versi alat terbaru (text_editor_20250728, code_execution_20250825). Hapus kode apa pun yang menggunakan perintah undo_edit.
Tangani alasan penghentian refusal
Perbarui aplikasi Anda untuk menangani alasan penghentian refusal.
Perbarui prompt Anda untuk perubahan perilaku
Model Claude 4 memiliki gaya komunikasi yang lebih ringkas dan langsung. Tinjau praktik terbaik prompting untuk panduan optimasi.
claude-sonnet-4-5-20250929text_editor_20250728, code_execution_20250825); versi warisan tidak didukung (jika bermigrasi dari 3.x)undo_edit (jika berlaku)temperature ATAU top_p, bukan keduanya (jika bermigrasi dari 3.x)refusal baru dalam aplikasi AndaClaude Haiku 4.5 adalah model Haiku tercepat dan paling cerdas dengan kinerja mendekati frontier, memberikan kualitas model premium untuk aplikasi interaktif dan pemrosesan volume tinggi.
Untuk gambaran lengkap kemampuan, lihat ikhtisar model.
Harga Haiku 4.5 adalah $1 per juta token input, $5 per juta token output. Lihat harga Claude untuk detail.
Perbarui nama model Anda:
# Dari Haiku 3.5
model = "claude-3-5-haiku-20241022" # Sebelum
model = "claude-haiku-4-5-20251001" # SesudahTinjau batas laju baru: Haiku 4.5 memiliki batas laju terpisah dari Haiku 3.5. Lihat dokumentasi batas laju untuk detail.
Untuk peningkatan kinerja yang signifikan pada tugas coding dan penalaran, pertimbangkan mengaktifkan pemikiran yang diperpanjang dengan thinking: {type: "enabled", budget_tokens: N}.
Pemikiran yang diperpanjang berdampak pada efisiensi prompt caching.
Pemikiran yang diperpanjang tidak direkomendasikan di model Claude 4.6 atau lebih baru. Jika menggunakan model yang lebih baru, gunakan pemikiran adaptif sebagai gantinya.
Jelajahi kemampuan baru: Lihat ikhtisar model untuk detail tentang kesadaran konteks, kapasitas output yang ditingkatkan (64K token), intelijen yang lebih tinggi, dan kecepatan yang ditingkatkan.
Perubahan yang merusak ini berlaku saat bermigrasi dari model Claude 3.x Haiku.
Perbarui parameter sampling
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Gunakan hanya temperature ATAU top_p, bukan keduanya.
Perbarui versi alat
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Perbarui ke versi alat terbaru (text_editor_20250728, code_execution_20250825). Hapus kode apa pun yang menggunakan perintah undo_edit.
Tangani alasan penghentian refusal
Perbarui aplikasi Anda untuk menangani alasan penghentian refusal.
Perbarui prompt Anda untuk perubahan perilaku
Model Claude 4 memiliki gaya komunikasi yang lebih ringkas dan langsung. Tinjau praktik terbaik prompting untuk panduan optimasi.
claude-haiku-4-5-20251001text_editor_20250728, code_execution_20250825); versi warisan tidak didukungundo_edit (jika berlaku)temperature ATAU top_p, bukan keduanyarefusal baru dalam aplikasi AndaWas this page helpful?