Panduan ini mencakup migrasi kode Messages API. Jika Anda menggunakan Claude Managed Agents, tidak ada perubahan selain memperbarui nama model yang diperlukan.
Claude Opus 4.7 adalah model yang tersedia secara umum paling mampu hingga saat ini. Model ini sangat otonom dan berkinerja luar biasa pada pekerjaan agentic jangka panjang, pekerjaan pengetahuan, tugas visi, dan tugas memori. Claude Opus 4.7 harus memiliki kinerja out-of-the-box yang kuat pada prompt dan eval Claude Opus 4.6 yang ada dengan harga $5 / $25 per MTok yang sama, tetapi ada beberapa perubahan perilaku dan API yang perlu diketahui saat Anda bermigrasi. Model ini mendukung set fitur yang sama dengan Claude Opus 4.6, termasuk jendela konteks 1M token dengan harga API standar tanpa premium konteks panjang, 128k token output maksimal, adaptive thinking, prompt caching, batch processing, Files API, dukungan PDF, visi, dan set lengkap alat sisi server dan sisi klien (bash, eksekusi kode, penggunaan komputer, editor teks, pencarian web, pengambilan web, konektor MCP, memori).
Otomatiskan migrasi ini dengan Claude API skill. Di Claude Code, jalankan /claude-api migrate untuk memanggil Claude API skill yang disertakan:
/claude-api migrate this project to claude-opus-4-7Skill menerapkan penukaran ID model, perubahan parameter yang merusak, penggantian prefill, dan kalibrasi upaya yang dijelaskan di bawah di seluruh basis kode Anda, kemudian menghasilkan daftar periksa item untuk diverifikasi secara manual. Skill meminta Anda untuk mengonfirmasi cakupan migrasi (seluruh direktori kerja, subdirektori, atau daftar file tertentu) sebelum mengedit file apa pun.
# Migrasi Opus
model = "claude-opus-4-6" # Sebelum
model = "claude-opus-4-7" # SesudahExtended thinking dihapus: thinking: {type: "enabled", budget_tokens: N} tidak lagi didukung pada Claude Opus 4.7 atau model yang lebih baru dan mengembalikan kesalahan 400. Beralih ke adaptive thinking (thinking: {type: "adaptive"}) dan gunakan parameter effort untuk mengontrol kedalaman pemikiran. Adaptive thinking dimatikan secara default pada Claude Opus 4.7: permintaan tanpa bidang thinking berjalan tanpa pemikiran, cocok dengan perilaku Opus 4.6. Atur thinking: {type: "adaptive"} secara eksplisit untuk mengaktifkannya.
Sebelum (Claude Opus 4.6):
client.messages.create(
model="claude-opus-4-6",
max_tokens=64000,
thinking={"type": "enabled", "budget_tokens": 32000},
messages=[{"role": "user", "content": "..."}],
)Parameter effort memungkinkan Anda untuk menyesuaikan kecerdasan Claude vs. pengeluaran token, menukar kemampuan untuk kecepatan lebih cepat dan biaya lebih rendah. Mulai dengan tingkat upaya xhigh baru untuk kasus penggunaan coding dan agentic, dan gunakan minimum upaya high untuk sebagian besar kasus penggunaan yang sensitif terhadap kecerdasan. Bereksperimen dengan tingkat upaya lain untuk lebih menyesuaikan penggunaan token dan kecerdasan:
max: Upaya maksimal dapat memberikan peningkatan kinerja dalam beberapa kasus penggunaan, tetapi mungkin menunjukkan hasil yang berkurang dari peningkatan penggunaan token. Pengaturan ini juga kadang-kadang dapat rentan terhadap overthinking. Kami merekomendasikan pengujian upaya maksimal untuk tugas yang menuntut kecerdasan.xhigh (baru): Upaya ekstra tinggi adalah pengaturan terbaik untuk sebagian besar kasus penggunaan coding dan agentic.high: Pengaturan ini menyeimbangkan penggunaan token dan kecerdasan. Untuk sebagian besar kasus penggunaan yang sensitif terhadap kecerdasan, kami merekomendasikan minimum upaya high.medium: Baik untuk kasus penggunaan yang sensitif terhadap biaya yang perlu mengurangi penggunaan token sambil menukar kecerdasan.low: Cadangkan untuk tugas pendek dan terbatas serta beban kerja yang sensitif terhadap latensi yang tidak sensitif terhadap kecerdasan.Kami mengharapkan upaya menjadi lebih penting untuk model ini daripada untuk Opus sebelumnya, dan merekomendasikan bereksperimen dengannya secara aktif saat Anda meningkatkan.
Claude Opus 4.7 memiliki beberapa perbedaan perilaku dari Claude Opus 4.6 yang bukan perubahan API yang merusak tetapi mungkin memerlukan pembaruan prompt atau penghapusan scaffolding.
Panjang respons bervariasi menurut kasus penggunaan: Claude Opus 4.7 mengkalibrasi panjang respons ke seberapa kompleks yang dianggapnya tugas tersebut, daripada default ke verbositas tetap. Ini biasanya berarti jawaban lebih pendek pada pencarian sederhana dan jawaban jauh lebih panjang pada analisis terbuka. Jika produk Anda bergantung pada gaya atau verbositas output tertentu, Anda mungkin perlu menyesuaikan prompt Anda. Sebagai contoh, untuk mengurangi verbositas, Anda mungkin menambahkan: "Berikan respons yang ringkas dan terfokus. Lewati konteks yang tidak penting, dan jaga contoh tetap minimal." Jika Anda melihat contoh spesifik tentang jenis verbositas (yaitu penjelasan berlebihan), Anda dapat menambahkan instruksi tambahan dalam prompt Anda untuk mencegahnya. Contoh positif yang menunjukkan bagaimana Claude dapat berkomunikasi dengan tingkat keringkasan yang sesuai cenderung lebih efektif daripada contoh negatif atau instruksi yang memberi tahu model apa yang tidak boleh dilakukan.
Penurutan instruksi yang lebih literal: Claude Opus 4.7 menafsirkan prompt lebih literal dan eksplisit daripada Claude Opus 4.6, terutama pada tingkat upaya yang lebih rendah. Model ini tidak akan diam-diam menggeneralisasi instruksi dari satu item ke item lain, dan tidak akan menyimpulkan permintaan yang tidak Anda buat. Sisi positif dari literalisme ini adalah presisi dan lebih sedikit thrash. Model ini umumnya berkinerja lebih baik untuk kasus penggunaan API dengan prompt yang dikalibrasi dengan hati-hati, ekstraksi terstruktur, dan pipeline di mana Anda menginginkan perilaku yang dapat diprediksi. Tinjauan prompt dan harness mungkin sangat membantu untuk migrasi ke Claude Opus 4.7.
Nada yang lebih langsung: Seperti halnya model baru apa pun, gaya prosa pada penulisan bentuk panjang mungkin bergeser. Claude Opus 4.7 lebih langsung dan berpendapat, dengan frasa yang lebih sedikit yang berpusat pada validasi dan emoji lebih sedikit daripada gaya yang lebih hangat dari Claude Opus 4.6. Jika produk Anda mengandalkan suara tertentu, evaluasi kembali prompt gaya terhadap baseline baru.
Ini bukan persyaratan tetapi akan meningkatkan pengalaman Anda:
Evaluasi kembali max_tokens: Karena teks yang sama menghasilkan jumlah token yang lebih tinggi pada Claude Opus 4.7, kami menyarankan memperbarui parameter max_tokens Anda untuk memberikan ruang tambahan, termasuk pemicu pemadatan. Intervensi prompting, task_budget, dan effort dapat membantu mengontrol biaya dan memastikan penggunaan token yang sesuai.
Audit ekspektasi penghitungan token: Jalur kode apa pun yang memperkirakan token sisi klien atau mengasumsikan rasio token-ke-karakter tetap harus diuji ulang terhadap Claude Opus 4.7. Gunakan endpoint Token counting untuk memverifikasi.
Adopsi task budgets (beta): Claude Opus 4.7 memperkenalkan task budgets. Anggaran ini memungkinkan Anda untuk menginformasikan Claude berapa banyak token yang dimilikinya untuk loop agentic penuh, termasuk pemikiran, panggilan alat, hasil alat, dan output akhir. Model melihat hitungan mundur yang berjalan dan menggunakannya untuk memprioritaskan pekerjaan dan menyelesaikan tugas dengan anggun saat anggaran dikonsumsi. Untuk menggunakan, atur header beta task-budgets-2026-03-13 dan tambahkan yang berikut ke konfigurasi output Anda:
claude-opus-4-6 ke claude-opus-4-7 (atau perbarui alias).temperature, top_p, dan top_k dari muatan permintaan.thinking: {type: "enabled", budget_tokens: N} dengan thinking: {type: "adaptive"} ditambah parameter effort.Jika Anda bermigrasi dari Claude Opus 4.5, Opus 4.1, atau model yang lebih awal langsung ke Claude Opus 4.7, terapkan semua perubahan Opus 4.7 di atas ditambah perubahan kumulatif di bagian ini yang berlaku antara Opus 4.5 dan Opus 4.7. Jika Anda bermigrasi dari Opus 4.6, Anda hanya memerlukan bagian Opus 4.7 di atas.
# Migrasi Opus
model = "claude-opus-4-5" # Sebelum
model = "claude-opus-4-7" # SesudahPenghapusan prefill tercakup dalam perubahan yang merusak Opus 4.7 di atas.
Penawaran parameter alat: Model Claude Opus 4.6 dan yang lebih baru mungkin menghasilkan penghindaran string JSON yang sedikit berbeda dalam argumen panggilan alat (misalnya, penanganan penghindaran Unicode atau penghindaran garis miring yang berbeda). Jika Anda mengurai input panggilan alat sebagai string mentah daripada menggunakan parser JSON, verifikasi logika parsing Anda. Parser JSON standar (seperti json.loads() atau JSON.parse()) menangani perbedaan ini secara otomatis.
Perubahan ini meningkatkan pengalaman Anda pada Opus 4.7. Item yang ditandai (diperlukan pada Opus 4.7) adalah rekomendasi opsional saat Opus 4.6 diluncurkan tetapi sekarang wajib; sisanya tetap direkomendasikan.
Migrasi ke adaptive thinking (diperlukan pada Opus 4.7): thinking: {type: "enabled", budget_tokens: N} mengembalikan kesalahan 400 pada Claude Opus 4.7. Beralih ke thinking: {type: "adaptive"} dan gunakan parameter effort untuk mengontrol kedalaman pemikiran. Lihat Adaptive thinking.
Jika Anda bermigrasi dari Opus 4.1, Sonnet 4 (sudah usang), atau model yang lebih awal langsung ke Claude Opus 4.7, terapkan perubahan Claude Opus 4.7 di bagian atas panduan ini dan perubahan kumulatif di atas ditambah perubahan tambahan di bagian ini.
# Dari Opus 4.1
model = "claude-opus-4-1-20250805" # Sebelum
model = "claude-opus-4-7" # Sesudah
# Dari Sonnet 4
model = "claude-sonnet-4-20250514" # Sebelum
model = "claude-opus-4-7" # Sesudah
# Dari Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Sebelum
model = "claude-opus-4-7" # SesudahHapus parameter sampling
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Mulai dengan Claude Opus 4.7, mengatur temperature, top_p, atau top_k ke nilai non-default apa pun akan mengembalikan kesalahan 400. Jalur migrasi paling aman adalah menghilangkan parameter ini sepenuhnya dari permintaan, dan menggunakan prompting untuk memandu perilaku model. Jika Anda menggunakan temperature = 0 untuk determinisme, perhatikan bahwa itu tidak pernah menjamin output yang identik.
# Sebelum - Ini akan error di model Claude 4+
response = client.messages.create(
model="claude-3-7-sonnet-20250219",
temperature=0.7,
top_p=0.9, # Parameter sampling non-default mengembalikan 400 pada Opus 4.7
# ...
)
# Sesudah
response = client.messages.create(
model="claude-opus-4-7",
# ...
)token-efficient-tools-2025-02-19 dan output-128k-2025-02-19. Semua model Claude 4+ memiliki penggunaan alat yang efisien token bawaan dan header ini tidak berpengaruh.claude-opus-4-7output_config.format sebagai gantinyathinking: {type: "enabled", budget_tokens: N} dengan thinking: {type: "adaptive"} ditambah parameter effort (mengembalikan 400 pada Opus 4.7)effort-2025-11-24 (effort sekarang GA)Claude Sonnet 4.6 menggabungkan kecerdasan yang kuat dengan kinerja cepat, menampilkan kemampuan pencarian agentic yang ditingkatkan dan eksekusi kode gratis saat digunakan dengan pencarian web atau pengambilan web. Model ini ideal untuk tugas coding, analisis, dan konten sehari-hari.
Untuk gambaran lengkap tentang kemampuan, lihat gambaran umum model.
Harga Sonnet 4.6 adalah $3 per juta token input, $15 per juta token output. Lihat harga Claude untuk detail.
Perbarui nama model Anda:
# Dari Sonnet 4.5
model = "claude-sonnet-4-5" # Sebelum
model = "claude-sonnet-4-6" # Sesudah
# Dari Sonnet 4
model = "claude-sonnet-4-20250514" # Sebelum
model = "claude-sonnet-4-6" # SesudahPrefilling pesan asisten tidak lagi didukung
Ini adalah perubahan yang merusak saat bermigrasi dari Sonnet 4.5 atau lebih awal.
Prefilling pesan asisten mengembalikan kesalahan 400 pada Sonnet 4.6. Gunakan structured outputs, instruksi system prompt, atau output_config.format sebagai gantinya.
Kasus penggunaan prefill umum dan migrasi:
Mengontrol format output (memaksa output JSON/YAML): Gunakan structured outputs atau tools dengan enum fields untuk tugas klasifikasi.
Menghilangkan preamble (menghapus frasa "Here is..."): Tambahkan instruksi langsung dalam system prompt: "Respond directly without preamble. Do not start with phrases like 'Here is...', 'Based on...', etc."
Menghindari penolakan yang buruk: Claude sekarang jauh lebih baik dalam penolakan yang tepat. Prompting yang jelas dalam pesan pengguna tanpa prefill harus cukup.
Perbarui parameter sampling
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Gunakan hanya temperature ATAU top_p, bukan keduanya.
Perbarui versi tool
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Perbarui ke versi tool terbaru (text_editor_20250728, code_execution_20250825). Hapus kode apa pun yang menggunakan perintah undo_edit.
Tangani alasan stop refusal
Perbarui aplikasi Anda untuk menangani alasan stop refusal.
fine-grained-tool-streaming-2025-05-14: Fine-grained tool streaming sekarang GA pada Sonnet 4.6 dan tidak lagi memerlukan header beta.output_format ke output_config.format: Parameter output_format sudah usang. Gunakan output_config.format sebagai gantinya.Pertimbangkan untuk bermigrasi dari Sonnet 4.5 ke Sonnet 4.6, yang memberikan lebih banyak kecerdasan dengan harga yang sama.
Sonnet 4.6 default ke effort level high, berbeda dengan Sonnet 4.5 yang tidak memiliki parameter effort. Pertimbangkan untuk menyesuaikan parameter effort saat Anda bermigrasi dari Sonnet 4.5 ke Sonnet 4.6. Jika tidak secara eksplisit diatur, Anda mungkin mengalami latency yang lebih tinggi dengan effort level default.
Jika Anda tidak menggunakan extended thinking pada Sonnet 4.5, Anda dapat melanjutkan tanpanya pada Sonnet 4.6. Anda harus secara eksplisit mengatur effort ke level yang sesuai untuk kasus penggunaan Anda. Pada effort low dengan thinking dinonaktifkan, Anda dapat mengharapkan performa yang sama atau lebih baik relatif terhadap Sonnet 4.5 tanpa extended thinking.
Jika Anda menggunakan extended thinking dengan budget_tokens pada Sonnet 4.5, masih berfungsi pada Sonnet 4.6 tetapi sudah usang. Migrasikan ke adaptive thinking dengan parameter effort.
Adaptive thinking adalah pengganti yang direkomendasikan untuk budget_tokens pada Sonnet 4.6. Ini sangat cocok untuk pola beban kerja berikut:
high. Jika latency atau penggunaan token menjadi perhatian, turunkan ke medium.Saat menggunakan adaptive thinking, evaluasi effort medium dan high pada tugas Anda. Level yang tepat tergantung pada trade-off beban kerja Anda antara kualitas, latency, dan penggunaan token.
Jika Anda melihat perilaku yang tidak konsisten atau regresi kualitas dengan adaptive thinking, coba turunkan pengaturan effort atau gunakan max_tokens sebagai batas keras terlebih dahulu. Extended thinking dengan budget_tokens masih berfungsi pada Sonnet 4.6 tetapi sudah usang dan tidak lagi direkomendasikan.
Jika Anda perlu menjaga budget_tokens sementara saat bermigrasi, budget sekitar 16k token memberikan ruang untuk masalah yang lebih sulit tanpa risiko penggunaan token yang liar. Konfigurasi ini sudah usang dan akan dihapus dalam rilis model di masa depan.
Untuk coding agentic, desain frontend, workflow tool-heavy, dan workflow enterprise yang kompleks, mulai dengan effort medium. Jika Anda menemukan latency terlalu tinggi, pertimbangkan mengurangi effort ke low. Jika Anda memerlukan kecerdasan yang lebih tinggi, pertimbangkan meningkatkan effort ke high atau bermigrasi ke Opus 4.7.
Untuk chat, pembuatan konten, pencarian, klasifikasi, dan tugas non-coding lainnya, mulai dengan effort low dengan extended thinking. Jika Anda memerlukan kedalaman lebih, tingkatkan effort ke medium.
claude-sonnet-4-6output_config.format sebagai gantinyatext_editor_20250728, code_execution_20250825); versi legacy tidak didukung (jika bermigrasi dari 3.x)undo_edit (jika berlaku)temperature ATAU top_p, bukan keduanya (jika bermigrasi dari 3.x)Claude Sonnet 4.5 menggabungkan kecerdasan yang kuat dengan performa cepat, menjadikannya ideal untuk tugas coding, analisis, dan konten sehari-hari.
Untuk gambaran lengkap kemampuan, lihat models overview.
Harga Sonnet 4.5 adalah $3 per juta token input, $15 per juta token output. Lihat Claude pricing untuk detail.
Perbarui nama model Anda:
# Dari Sonnet 4
model = "claude-sonnet-4-20250514" # Sebelum
model = "claude-sonnet-4-5-20250929" # Sesudah
# Dari Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Sebelum
model = "claude-sonnet-4-5-20250929" # SesudahPerubahan yang merusak ini berlaku saat bermigrasi dari model Claude 3.x Sonnet.
Perbarui parameter sampling
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Gunakan hanya temperature ATAU top_p, bukan keduanya.
Perbarui versi tool
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Perbarui ke versi tool terbaru (text_editor_20250728, code_execution_20250825). Hapus kode apa pun yang menggunakan perintah undo_edit.
Tangani alasan stop refusal
Perbarui aplikasi Anda untuk menangani alasan stop refusal.
claude-sonnet-4-5-20250929text_editor_20250728, code_execution_20250825); versi legacy tidak didukung (jika bermigrasi dari 3.x)undo_edit (jika berlaku)temperature ATAU top_p, bukan keduanya (jika bermigrasi dari 3.x)refusal baru dalam aplikasi AndaClaude Haiku 4.5 adalah model Haiku tercepat dan paling cerdas dengan performa mendekati frontier, memberikan kualitas model premium untuk aplikasi interaktif dan pemrosesan volume tinggi.
Untuk gambaran lengkap kemampuan, lihat models overview.
Harga Haiku 4.5 adalah $1 per juta token input, $5 per juta token output. Lihat Claude pricing untuk detail.
Perbarui nama model Anda:
# Dari Haiku 3.5
model = "claude-3-5-haiku-20241022" # Sebelum
model = "claude-haiku-4-5-20251001" # Sesudah
# Dari Haiku 3
model = "claude-3-haiku-20240307" # Sebelum
model = "claude-haiku-4-5-20251001" # SesudahTinjau batas laju baru: Haiku 4.5 memiliki batas laju terpisah dari Haiku 3.5 dan Haiku 3. Lihat dokumentasi Rate limits untuk detail.
Untuk peningkatan performa signifikan pada tugas coding dan penalaran, pertimbangkan mengaktifkan extended thinking dengan thinking: {type: "enabled", budget_tokens: N}.
Extended thinking berdampak pada efisiensi prompt caching.
Extended thinking sudah usang dalam model Claude 4.6 atau lebih baru. Jika menggunakan model lebih baru, gunakan adaptive thinking sebagai gantinya.
Jelajahi kemampuan baru: Lihat models overview untuk detail tentang context awareness, peningkatan kapasitas output (64k token), kecerdasan lebih tinggi, dan kecepatan yang ditingkatkan.
Perubahan yang merusak ini berlaku saat bermigrasi dari model Claude 3.x Haiku.
Perbarui parameter sampling
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Gunakan hanya temperature ATAU top_p, bukan keduanya.
Perbarui versi tool
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Perbarui ke versi tool terbaru (text_editor_20250728, code_execution_20250825). Hapus kode apa pun yang menggunakan perintah undo_edit.
Tangani alasan stop refusal
Perbarui aplikasi Anda untuk menangani alasan stop refusal.
claude-haiku-4-5-20251001text_editor_20250728, code_execution_20250825); versi legacy tidak didukungundo_edit (jika berlaku)temperature ATAU top_p, bukan keduanyarefusal baru dalam aplikasi AndaWas this page helpful?
Sesudah (Claude Opus 4.7):
client.messages.create(
model="claude-opus-4-7",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "high"}, # atau "max", "xhigh", "medium", "low"
messages=[{"role": "user", "content": "..."}],
)Adaptive thinking dapat diarahkan melalui prompting. Untuk panduan tentang penyesuaian ketika model berpikir terlalu banyak atau terlalu sedikit, lihat Kalibrasi upaya dan kedalaman pemikiran.
Parameter sampling dihapus: Mengatur temperature, top_p, atau top_k ke nilai non-default apa pun pada Claude Opus 4.7 mengembalikan kesalahan 400. Jalur migrasi paling aman adalah menghilangkan parameter ini sepenuhnya dari muatan permintaan. Prompting adalah cara yang direkomendasikan untuk memandu perilaku model pada Claude Opus 4.7. Jika Anda menggunakan temperature = 0 untuk determinisme, perhatikan bahwa itu tidak pernah menjamin output yang identik pada model sebelumnya.
Konten pemikiran dihilangkan secara default: Blok pemikiran masih muncul dalam aliran respons pada Claude Opus 4.7, tetapi bidang thinking mereka kosong kecuali Anda secara eksplisit memilih untuk masuk. Ini adalah perubahan senyap dari Claude Opus 4.6, di mana default adalah mengembalikan teks pemikiran yang dirangkum. Untuk mengembalikan konten pemikiran yang dirangkum pada Claude Opus 4.7, atur thinking.display ke "summarized":
thinking = {
"type": "adaptive",
"display": "summarized",
}Default adalah "omitted" pada Claude Opus 4.7. Jika produk Anda melakukan streaming penalaran kepada pengguna, default baru muncul sebagai jeda panjang sebelum output dimulai; atur display: "summarized" untuk mengembalikan kemajuan yang terlihat selama pemikiran. Lihat Extended thinking untuk detail.
Penghitungan token yang diperbarui: Claude Opus 4.7 menggunakan tokenizer baru, berkontribusi pada peningkatan kinerjanya pada berbagai tugas. Tokenizer baru ini mungkin menggunakan kira-kira 1x hingga 1,35x lebih banyak token saat memproses teks dibandingkan dengan model sebelumnya (hingga ~35% lebih banyak, bervariasi menurut konten), dan /v1/messages/count_tokens akan mengembalikan jumlah token yang berbeda untuk Claude Opus 4.7 daripada untuk Claude Opus 4.6. Efisiensi token Claude Opus 4.7 dapat bervariasi menurut bentuk beban kerja. Intervensi prompting, task_budget, dan effort dapat membantu mengontrol biaya dan memastikan penggunaan token yang sesuai. Ingat bahwa kontrol ini dapat menukar kecerdasan model. Kami menyarankan memperbarui parameter max_tokens Anda untuk memberikan ruang tambahan, termasuk pemicu pemadatan. Claude Opus 4.7 menyediakan jendela konteks 1M dengan harga API standar tanpa premium konteks panjang.
Penghapusan prefill (dibawa dari Opus 4.6): Prefilling pesan asisten mengembalikan kesalahan 400 pada Claude Opus 4.7. Gunakan structured outputs, instruksi prompt sistem, atau output_config.format sebagai gantinya.
Pembaruan kemajuan bawaan dalam jejak agentic: Claude Opus 4.7 menyediakan pembaruan yang lebih teratur dan berkualitas lebih tinggi kepada pengguna di seluruh jejak agentic yang panjang. Jika Anda telah menambahkan scaffolding untuk memaksa pesan status interim ("Setelah setiap 3 panggilan alat, rangkum kemajuan"), coba hapus. Jika Anda menemukan bahwa panjang atau konten pembaruan yang menghadap pengguna dari Claude Opus 4.7 tidak dikalibrasi dengan baik untuk kasus penggunaan Anda, secara eksplisit jelaskan seperti apa pembaruan ini dalam prompt dan berikan contoh.
Lebih sedikit subagen yang dihasilkan secara default: Claude Opus 4.7 cenderung menghasilkan lebih sedikit subagen secara default. Namun, perilaku ini dapat diarahkan melalui prompting; berikan Claude Opus 4.7 panduan eksplisit tentang kapan subagen diinginkan.
Kalibrasi upaya yang lebih ketat: Bermakna berubah dari Claude Opus 4.6, Claude Opus 4.7 menghormati tingkat upaya secara ketat, terutama di ujung bawah. Pada low dan medium, model membatasi pekerjaan ke apa yang diminta daripada melampaui dan di atas. Ini baik untuk latensi dan biaya, tetapi pada tugas yang cukup kompleks yang berjalan pada upaya low ada beberapa risiko under-thinking. Jika Anda mengamati penalaran dangkal pada masalah kompleks, naikkan upaya ke high atau xhigh daripada prompting di sekitarnya. Jika Anda perlu menjaga upaya pada low untuk latensi, tambahkan panduan yang ditargetkan: "Tugas ini melibatkan penalaran multi-langkah. Pikirkan dengan hati-hati melalui masalah sebelum merespons." Lihat Tingkat upaya yang direkomendasikan untuk Claude Opus 4.7.
Lebih sedikit panggilan alat secara default: Claude Opus 4.7 memiliki kecenderungan untuk menggunakan alat lebih jarang daripada Claude Opus 4.6 dan menggunakan penalaran lebih banyak. Ini menghasilkan hasil yang lebih baik dalam sebagian besar kasus. Namun, meningkatkan pengaturan upaya adalah tuas yang berguna untuk meningkatkan tingkat penggunaan alat, terutama dalam pekerjaan pengetahuan. Pengaturan upaya high atau xhigh menunjukkan penggunaan alat yang jauh lebih banyak dalam pencarian agentic dan coding. Untuk skenario di mana Anda menginginkan lebih banyak penggunaan alat, Anda juga dapat menyesuaikan prompt Anda untuk secara eksplisit menginstruksikan model tentang kapan dan bagaimana menggunakan alat dengan benar.
Perlindungan keamanan siber real-time: Baru ditambahkan di Claude Opus 4.7, permintaan yang melibatkan topik yang dilarang atau berisiko tinggi dapat menyebabkan penolakan. Untuk pekerjaan keamanan yang sah seperti penetration testing, penelitian kerentanan, atau red-teaming, ajukan permohonan ke Program Verifikasi Siber untuk meminta pembatasan yang lebih rendah. Lihat Perlindungan, peringatan, dan banding untuk latar belakang.
Dukungan gambar resolusi tinggi: Claude Opus 4.7 adalah model Claude pertama dengan dukungan gambar resolusi tinggi, dengan resolusi gambar maksimal 2576 piksel di tepi panjang (naik dari 1568 piksel pada model sebelumnya). Ini membuka keuntungan pada beban kerja yang berat visi dan sangat berharga untuk penggunaan komputer, pemahaman tangkapan layar, dan analisis dokumen. Dukungan resolusi tinggi bersifat otomatis dan tidak memerlukan header beta atau opt-in sisi klien. Gambar resolusi penuh dapat menggunakan hingga sekitar 3x lebih banyak token gambar daripada pada model sebelumnya (hingga 4.784 token per gambar, dibandingkan dengan batas sebelumnya sekitar 1.600 token per gambar), jadi anggaran ulang max_tokens dan ekspektasi biaya untuk beban kerja yang berat gambar, atau downsample sebelum mengirim jika Anda tidak memerlukan kesetiaan tambahan. Koordinat penunjukan dan kotak pembatas yang dikembalikan oleh model adalah 1
output_config = {
"effort": "high",
"task_budget": {"type": "tokens", "total": 128000},
}Anda mungkin perlu bereksperimen dengan anggaran tugas yang berbeda untuk kasus penggunaan Anda. Jika model diberi anggaran tugas yang terlalu ketat untuk tugas tertentu, model mungkin menyelesaikan tugas dengan kurang menyeluruh, mereferensikan anggaran sebagai kendala. Untuk tugas agentic terbuka di mana kualitas lebih penting daripada kecepatan, jangan atur anggaran tugas; cadangkan anggaran tugas untuk beban kerja di mana Anda perlu model untuk membatasi pekerjaan ke tunjangan token. Nilai minimum untuk anggaran tugas adalah 20k token.
Ini bukan batas keras; ini adalah saran yang disadari model. Ini berbeda dari max_tokens, yang merupakan batas keras per permintaan pada token yang dihasilkan (max_tokens tidak diteruskan ke model, dan model tidak menyadarinya), sementara task_budget adalah batas penasihat di seluruh loop agentic penuh. Gunakan task_budget ketika Anda ingin model untuk self-moderate, dan max_tokens sebagai batas per permintaan keras untuk membatasi penggunaan.
Atur max_tokens besar pada upaya max atau xhigh: Jika Anda menjalankan Claude Opus 4.7 pada upaya max atau xhigh, atur anggaran token output maksimal yang besar sehingga model memiliki ruang untuk berpikir dan bertindak di seluruh subagen dan panggilan alat. Kami merekomendasikan memulai dengan 64k token dan menyesuaikan dari sana.
Downsample gambar jika resolusi tinggi tidak perlu: Claude Opus 4.7 mendukung gambar hingga 2576px / 3.75MP. Gambar resolusi tinggi menggunakan lebih banyak token. Jika kesetiaan gambar tambahan tidak perlu, downsample gambar sebelum mengirim ke Claude untuk menghindari peningkatan penggunaan token. Lihat Gambar dan visi.
max_tokensxhigh atau max, naikkan max_tokens ke setidaknya 64k sebagai titik awal.response = client.beta.messages.create(
model="claude-opus-4-5",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 32000},
betas=["interleaved-thinking-2025-05-14"],
messages=[...],
)Perhatikan bahwa migrasi juga bergerak dari client.beta.messages.create ke client.messages.create. Adaptive thinking dan effort adalah fitur GA dan tidak memerlukan namespace SDK beta atau header beta apa pun.
Hapus header beta effort: Parameter effort sekarang GA. Hapus betas=["effort-2025-11-24"] dari permintaan Anda.
Hapus header beta streaming alat yang halus: Streaming alat yang halus sekarang GA. Hapus betas=["fine-grained-tool-streaming-2025-05-14"] dari permintaan Anda.
Hapus header beta pemikiran yang saling terkait: Adaptive thinking secara otomatis mengaktifkan pemikiran yang saling terkait pada Claude Opus 4.7, Opus 4.6, dan Sonnet 4.6. Hapus betas=["interleaved-thinking-2025-05-14"] dari permintaan Anda. Header masih berfungsi pada Sonnet 4.6 dengan pemikiran extended manual, tetapi mode manual sudah usang.
Migrasi ke output_config.format: Jika menggunakan structured outputs, perbarui output_format={...} ke output_config={"format": {...}}. Parameter lama tetap berfungsi tetapi sudah usang dan akan dihapus dalam rilis model di masa depan.
Perbarui versi alat
Ini adalah perubahan yang merusak saat bermigrasi dari model Claude 3.x.
Perbarui ke versi alat terbaru. Hapus kode apa pun yang menggunakan perintah undo_edit.
# Sebelum
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
# Sesudah
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]text_editor_20250728 dan str_replace_based_edit_tool. Lihat dokumentasi alat editor teks untuk detail.code_execution_20250825. Lihat dokumentasi alat eksekusi kode untuk instruksi migrasi.Tangani alasan penghentian refusal
Perbarui aplikasi Anda untuk menangani alasan penghentian refusal:
response = client.messages.create(...)
if response.stop_reason == "refusal":
# Tangani penolakan dengan tepat
passTangani alasan penghentian model_context_window_exceeded
Model Claude 4.5+ mengembalikan alasan penghentian model_context_window_exceeded ketika generasi berhenti karena mencapai batas jendela konteks, daripada batas max_tokens yang diminta. Perbarui aplikasi Anda untuk menangani alasan penghentian baru ini:
response = client.messages.create(...)
if response.stop_reason == "model_context_window_exceeded":
# Tangani batas jendela konteks dengan tepat
passVerifikasi penanganan parameter alat (trailing newlines)
Model Claude 4.5+ mempertahankan trailing newlines dalam parameter string panggilan alat yang sebelumnya dihapus. Jika alat Anda mengandalkan pencocokan string yang tepat terhadap parameter panggilan alat, verifikasi logika Anda menangani trailing newlines dengan benar.
Perbarui prompt Anda untuk perubahan perilaku
Model Claude 4+ memiliki gaya komunikasi yang lebih ringkas dan langsung dan memerlukan arahan eksplisit. Tinjau praktik terbaik prompting untuk panduan optimisasi.
fine-grained-tool-streaming-2025-05-14interleaved-thinking-2025-05-14 (adaptive thinking mengaktifkan pemikiran yang saling terkait secara otomatis)output_format ke output_config.format (jika berlaku)temperature, top_p, dan top_k (nilai non-default mengembalikan 400 pada Opus 4.7)text_editor_20250728, code_execution_20250825)refusalmodel_context_window_exceededtoken-efficient-tools-2025-02-19, output-128k-2025-02-19)Continuations (melanjutkan respons yang terputus): Pindahkan continuation ke pesan pengguna: "Your previous response was interrupted and ended with [previous_response]. Continue from where you left off."
Context hydration / role consistency (menyegarkan konteks dalam percakapan panjang): Injeksikan apa yang sebelumnya adalah pengingat prefilled-assistant ke dalam user turn sebagai gantinya.
Escaping JSON parameter tool mungkin berbeda
Ini adalah perubahan yang merusak saat bermigrasi dari Sonnet 4.5 atau lebih awal.
Escaping string JSON dalam parameter tool mungkin berbeda dari model sebelumnya. Parser JSON standar menangani ini secara otomatis, tetapi parsing berbasis string kustom mungkin memerlukan pembaruan.
Perbarui prompt Anda untuk perubahan perilaku
Model Claude 4 memiliki gaya komunikasi yang lebih ringkas dan langsung. Tinjau prompting best practices untuk panduan optimasi.
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
output_config={"effort": "low"},
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"},
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=16384,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "medium"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "low"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)refusal baru dalam aplikasi Andafine-grained-tool-streaming-2025-05-14 (sekarang GA)output_format ke output_config.formatthinking: {type: "enabled", budget_tokens: N} ke thinking: {type: "adaptive"} dengan parameter effort (budget_tokens sudah usang dan akan dihapus dalam rilis di masa depan)Perbarui prompt Anda untuk perubahan perilaku
Model Claude 4 memiliki gaya komunikasi yang lebih ringkas dan langsung. Tinjau prompting best practices untuk panduan optimasi.
Perbarui prompt Anda untuk perubahan perilaku
Model Claude 4 memiliki gaya komunikasi yang lebih ringkas dan langsung. Tinjau prompting best practices untuk panduan optimasi.