Was this page helpful?
Claude Opus 4.7 adalah model yang tersedia secara umum paling mampu hingga saat ini. Model ini sangat otonom dan berkinerja luar biasa pada pekerjaan agentic jangka panjang, pekerjaan pengetahuan, tugas visi, dan tugas memori. Halaman ini merangkum semua yang baru saat peluncuran.
| Model | ID model API | Deskripsi |
|---|---|---|
| Claude Opus 4.7 | claude-opus-4-7 | Model yang tersedia secara umum paling mampu kami untuk penalaran kompleks dan pengkodean agentic |
Claude Opus 4.7 mendukung jendela konteks token 1M, token output maksimal 128k, adaptive thinking, dan set alat serta fitur platform yang sama dengan Claude Opus 4.6.
Untuk harga lengkap dan spesifikasi, lihat ikhtisar model.
Claude Opus 4.7 adalah model Claude pertama kami dengan dukungan gambar resolusi tinggi. Resolusi gambar maksimal telah meningkat menjadi 2576px / 3.75MP (meningkat dari batas sebelumnya 1568px / 1.15MP). Perubahan ini harus membuka keuntungan kinerja pada beban kerja yang berat visi, dan sangat penting untuk penggunaan komputer dan alur kerja pemahaman tangkapan layar/artefak/dokumen.
Selain itu, operasi seperti pemetaan koordinat ke gambar sekarang lebih sederhana — koordinat model adalah 1
dengan piksel aktual, jadi tidak ada matematika faktor skala yang diperlukan.Gambar resolusi tinggi menggunakan lebih banyak token. Jika kejelasan gambar tambahan tidak perlu, kurangi sampel gambar sebelum mengirim ke Claude untuk menghindari peningkatan penggunaan token.
Selain resolusi, Claude Opus 4.7 juga meningkat pada:
Lihat Gambar dan visi untuk detail.
xhigh baruParameter upaya memungkinkan Anda menyesuaikan kecerdasan Claude vs. pengeluaran token, menukar kemampuan untuk kecepatan lebih cepat dan biaya lebih rendah. Mulai dengan tingkat upaya xhigh baru untuk kasus penggunaan pengkodean dan agentic, dan gunakan upaya minimum high untuk sebagian besar kasus penggunaan yang sensitif terhadap kecerdasan. Lihat Tingkat upaya yang direkomendasikan untuk Claude Opus 4.7 untuk panduan per tingkat. (Hanya Messages API; Claude Managed Agents menangani upaya secara otomatis.)
Claude Opus 4.7 memperkenalkan anggaran tugas. Anggaran tugas memberikan Claude perkiraan kasar tentang berapa banyak token yang ditargetkan untuk loop agentic penuh, termasuk pemikiran, panggilan alat, hasil alat, dan output akhir. Model melihat hitungan mundur yang berjalan dan menggunakannya untuk memprioritaskan pekerjaan dan menyelesaikan tugas dengan anggun saat anggaran dikonsumsi. Untuk menggunakan, atur header beta task-budgets-2026-03-13 dan tambahkan yang berikut ke konfigurasi output Anda:
response = client.beta.messages.create(
model="claude-opus-4-7",
max_tokens=128000,
output_config={
"effort": "high",
"task_budget": {"type": "tokens", "total": 128000},
},
messages=[
{"role": "user", "content": "Review the codebase and propose a refactor plan."}
],
betas=["task-budgets-2026-03-13"],
)Anda mungkin perlu bereksperimen dengan anggaran tugas yang berbeda untuk kasus penggunaan Anda. Jika model diberi anggaran tugas yang terlalu ketat untuk tugas tertentu, model mungkin menyelesaikan tugas dengan kurang menyeluruh atau menolak untuk melakukan tugas sama sekali.
Untuk tugas agentic terbuka di mana kualitas lebih penting daripada kecepatan, jangan atur anggaran tugas; cadangkan anggaran tugas untuk beban kerja di mana Anda memerlukan model untuk membatasi pekerjaan ke tunjangan token. Nilai minimum untuk anggaran tugas adalah 20k token.
Ini bukan batas keras; ini adalah saran yang disadari model. Ini berbeda dari max_tokens, yang merupakan batas keras per permintaan pada token yang dihasilkan (max_tokens tidak diteruskan ke model, dan model tidak menyadarinya), sementara task_budget adalah batas penasihat di seluruh loop agentic penuh. Gunakan task_budget ketika Anda ingin model untuk memoderasi diri sendiri, dan max_tokens sebagai batas per permintaan keras untuk membatasi penggunaan.
Perubahan yang merusak ini hanya berlaku untuk Messages API. Jika Anda menggunakan Claude Managed Agents, tidak ada perubahan API yang merusak untuk Claude Opus 4.7.
Anggaran pemikiran yang diperpanjang dihapus di Claude Opus 4.7. Menetapkan thinking: {"type": "enabled", "budget_tokens": N} akan mengembalikan kesalahan 400. Adaptive thinking adalah satu-satunya mode pemikiran-on, dan dalam evaluasi internal kami secara andal mengungguli pemikiran yang diperpanjang.
# Sebelumnya (Opus 4.6)
thinking = {"type": "enabled", "budget_tokens": 32000}
# Sesudahnya (Opus 4.7)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}Adaptive thinking dimatikan secara default di Claude Opus 4.7. Permintaan tanpa bidang thinking berjalan tanpa pemikiran. Atur thinking: {type: "adaptive"} secara eksplisit untuk mengaktifkannya.
Mulai dengan Claude Opus 4.7, menetapkan temperature, top_p, atau top_k ke nilai non-default apa pun akan mengembalikan kesalahan 400. Jalur migrasi teraman adalah menghilangkan parameter ini sepenuhnya dari permintaan, dan menggunakan prompting untuk memandu perilaku model. Jika Anda menggunakan temperature = 0 untuk determinisme, perhatikan bahwa itu tidak pernah menjamin output yang identik.
Mulai dengan Claude Opus 4.7, konten pemikiran dihilangkan dari respons secara default. Blok pemikiran masih muncul dalam aliran respons, tetapi bidang thinking mereka akan kosong kecuali pemanggil secara eksplisit memilih masuk. Ini adalah perubahan senyap — tidak ada kesalahan yang dimunculkan — dan latensi respons akan sedikit ditingkatkan. Jika output penalaran diperlukan, Anda dapat mengatur display ke "summarized" dan memilih kembali masuk dengan perubahan satu baris:
thinking = {
"type": "adaptive",
"display": "summarized", # atau "omitted" (default)
}Jika produk Anda mengalirkan penalaran kepada pengguna, default baru akan muncul sebagai jeda panjang sebelum output dimulai. Atur "display": "summarized" untuk mengembalikan kemajuan yang terlihat selama pemikiran.
Claude Opus 4.7 menggunakan tokenizer baru, berkontribusi pada kinerja yang ditingkatkan pada berbagai tugas. Tokenizer baru ini mungkin menggunakan kira-kira 1x hingga 1.35x lebih banyak token saat memproses teks dibandingkan dengan model sebelumnya (hingga ~35% lebih, bervariasi menurut konten), dan /v1/messages/count_tokens akan mengembalikan jumlah token yang berbeda untuk Claude Opus 4.7 daripada untuk Claude Opus 4.6. Efisiensi token Claude Opus 4.7 dapat bervariasi menurut bentuk beban kerja. Intervensi prompting, task_budget, dan effort dapat membantu mengontrol biaya dan memastikan penggunaan token yang sesuai. Ingat bahwa kontrol ini mungkin menukar kecerdasan model.
Kami menyarankan memperbarui parameter max_tokens Anda untuk memberikan ruang tambahan, termasuk pemicu pemadatan. Claude Opus 4.7 menyediakan jendela konteks 1M pada harga API standar tanpa premium konteks panjang.
Claude Opus 4.7 menunjukkan keuntungan yang berarti pada tugas pekerja pengetahuan, khususnya di mana model perlu memverifikasi output-nya sendiri secara visual:
Jika prompt yang ada memiliki mitigasi di area ini (misalnya "periksa kembali tata letak slide sebelum mengembalikan"), coba hapus perancah itu dan baseline ulang.
Claude Opus 4.7 lebih baik dalam menulis dan menggunakan memori berbasis sistem file. Jika agen mempertahankan scratchpad, file catatan, atau penyimpanan memori terstruktur di seluruh putaran, agen itu harus meningkat dalam membuat catatan untuk dirinya sendiri dan memanfaatkan catatannya dalam tugas-tugas masa depan. Untuk memberikan Claude scratchpad yang dikelola tanpa membangun milik Anda sendiri, gunakan alat memori sisi klien.
Lihat Dukungan gambar resolusi tinggi di atas.
Ini bukan perubahan API yang merusak tetapi mungkin memerlukan pembaruan prompt. Lihat Migrasi ke Claude Opus 4.7 untuk panduan lengkap.
Untuk instruksi migrasi langkah demi langkah dan daftar periksa migrasi lengkap, lihat Migrasi ke Claude Opus 4.7. Jika Anda menggunakan Claude Code atau Agent SDK, Claude API skill dapat menerapkan langkah-langkah migrasi ini ke basis kode Anda secara otomatis.
Panduan upaya per tingkat untuk Claude Opus 4.7.