Halaman ini menyediakan informasi harga terperinci untuk model dan fitur Anthropic. Semua harga dalam USD.
Untuk informasi harga terkini, silakan kunjungi claude.com/pricing.
Tabel berikut menunjukkan harga untuk semua model Claude di berbagai tingkat penggunaan:
| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.6 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.5 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok |
Was this page helpful?
| $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.6 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = Juta token. Kolom "Base Input Tokens" menunjukkan harga input standar, "Cache Writes" dan "Cache Hits" khusus untuk prompt caching, dan "Output Tokens" menunjukkan harga output. Lihat harga prompt caching di bawah untuk penjelasan kolom cache dan pengali harga.
Model Claude tersedia di AWS Bedrock, Google Vertex AI, dan Microsoft Foundry. Untuk harga resmi, kunjungi:
Harga endpoint regional dan multi-region untuk model Claude 4.5 dan seterusnya
Mulai dengan Claude Sonnet 4.5 dan Haiku 4.5:
Endpoint regional dan multi-region mencakup premi 10% di atas endpoint global. Claude API (1P) bersifat global secara default; untuk opsi residensi data 1P dan harga, lihat Harga residensi data di bawah.
Cakupan: Struktur harga ini berlaku untuk Claude Sonnet 4.5, Haiku 4.5, dan semua model di masa mendatang. Model sebelumnya (Claude Sonnet 4, Opus 4, dan rilis sebelumnya) mempertahankan harga yang ada.
Untuk detail implementasi dan contoh kode:
Prompt caching mengurangi biaya dan latensi dengan menggunakan kembali bagian prompt yang telah diproses sebelumnya di seluruh panggilan API. Alih-alih memproses ulang system prompt besar, dokumen, atau riwayat percakapan yang sama pada setiap permintaan, API membaca dari cache dengan sebagian kecil dari harga input standar.
Ada dua cara untuk mengaktifkan prompt caching:
cache_control di tingkat atas permintaan Anda. Sistem secara otomatis mengelola breakpoint cache seiring percakapan berkembang. Ini adalah titik awal yang direkomendasikan untuk sebagian besar kasus penggunaan.cache_control langsung pada blok konten individual untuk kontrol terperinci atas apa yang di-cache.Prompt caching menggunakan pengali harga berikut relatif terhadap tarif token input dasar:
| Operasi cache | Pengali | Durasi |
|---|---|---|
| Penulisan cache 5 menit | 1,25x harga input dasar | Cache berlaku selama 5 menit |
| Penulisan cache 1 jam | 2x harga input dasar | Cache berlaku selama 1 jam |
| Pembacaan cache (hit) | 0,1x harga input dasar | Durasi sama dengan penulisan sebelumnya |
Token penulisan cache dikenakan biaya saat konten pertama kali disimpan. Token pembacaan cache dikenakan biaya saat permintaan berikutnya mengambil konten yang di-cache. Cache hit dikenakan biaya 10% dari harga input standar, yang berarti caching terbayar setelah hanya satu pembacaan cache untuk durasi 5 menit (penulisan 1,25x), atau setelah dua pembacaan cache untuk durasi 1 jam (penulisan 2x).
Pengali ini bertumpuk dengan pengubah harga lainnya, termasuk diskon Batch API dan residensi data.
Untuk detail implementasi, model yang didukung, dan contoh kode, lihat dokumentasi prompt caching.
Untuk Claude Opus 4.6 dan model yang lebih baru, menentukan inferensi khusus AS melalui parameter inference_geo dikenakan pengali 1,1x pada semua kategori harga token, termasuk token input, token output, penulisan cache, dan pembacaan cache. Perutean global (default) menggunakan harga standar.
Ini hanya berlaku untuk Claude API (1P). Platform pihak ketiga memiliki harga regional mereka sendiri. Lihat AWS Bedrock dan Google Vertex AI untuk detailnya. Model sebelumnya mempertahankan harga yang ada terlepas dari pengaturan inference_geo.
Untuk informasi lebih lanjut, lihat dokumentasi residensi data.
Fast mode (beta: pratinjau penelitian) untuk Claude Opus 4.6 memberikan output yang jauh lebih cepat dengan harga premium (6x tarif standar). Harga fast mode berlaku di seluruh jendela konteks penuh, termasuk permintaan di atas 200k token input. Saat ini didukung pada Opus 4.6:
| Input | Output |
|---|---|
| $30 / MTok | $150 / MTok |
Harga fast mode bertumpuk dengan pengubah harga lainnya:
Fast mode tidak tersedia dengan Batch API.
Untuk informasi lebih lanjut, lihat dokumentasi fast mode.
Batch API memungkinkan pemrosesan asinkron dari volume permintaan yang besar dengan diskon 50% pada token input dan output.
| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.6 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.5 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.6 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 | $0.50 / MTok | $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
Untuk informasi lebih lanjut tentang pemrosesan batch, lihat dokumentasi pemrosesan batch.
Claude Mythos Preview, Opus 4.6 dan Sonnet 4.6 mencakup jendela konteks 1M token penuh dengan harga standar. (Permintaan 900k token ditagih dengan tarif per token yang sama seperti permintaan 9k token.) Diskon prompt caching dan pemrosesan batch berlaku dengan tarif standar di seluruh jendela konteks penuh.
Tool use requests are priced based on:
tools parameter)Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.
The additional tokens from tool use come from:
tools parameter in API requests (tool names, descriptions, and schemas)tool_use content blocks in API requests and responsestool_result content blocks in API requestsWhen you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.6 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.1 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.6 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |
These token counts are added to your normal input and output tokens to calculate the total cost of a request.
Untuk harga per model saat ini, lihat bagian harga model.
Untuk informasi lebih lanjut tentang implementasi penggunaan alat dan praktik terbaik, lihat dokumentasi penggunaan alat.
The bash tool adds 245 input tokens to your API calls.
Additional tokens are consumed by:
Lihat harga penggunaan alat untuk detail harga lengkap.
Code execution is free when used with web search or web fetch. When web_search_20260209 or web_fetch_20260209 is included in your API request, there are no additional charges for code execution tool calls beyond the standard input and output token costs.
When used without these tools, code execution is billed by execution time, tracked separately from token usage:
Code execution usage is tracked in the response:
"usage": {
"input_tokens": 105,
"output_tokens": 239,
"server_tool_use": {
"code_execution_requests": 1
}
}The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.
In addition to the base tokens, the following additional input tokens are needed for the text editor tool:
| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7 (deprecated)) | 700 tokens |
Lihat harga penggunaan alat untuk detail harga lengkap.
Web search usage is charged in addition to token usage:
"usage": {
"input_tokens": 105,
"output_tokens": 6039,
"cache_read_input_tokens": 7123,
"cache_creation_input_tokens": 7345,
"server_tool_use": {
"web_search_requests": 1
}
}Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.
Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.
Web fetch usage has no additional charges beyond standard token costs:
"usage": {
"input_tokens": 25039,
"output_tokens": 931,
"cache_read_input_tokens": 0,
"cache_creation_input_tokens": 0,
"server_tool_use": {
"web_fetch_requests": 1
}
}The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.
To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
Computer use follows the standard tool use pricing. When using the computer use tool:
System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt
Computer use tool token usage:
| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
Additional token consumption:
If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Claude Managed Agents ditagih berdasarkan dua dimensi: token dan durasi sesi.
Semua token yang dikonsumsi oleh sesi Claude Managed Agents ditagih dengan tarif yang ditunjukkan dalam Harga model di atas. Pengali Prompt caching berlaku secara identik. Pencarian web yang dipicu di dalam sesi dikenakan biaya standar $10 per 1.000 pencarian.
Pengubah Messages API berikut tidak berlaku untuk sesi Claude Managed Agents:
| Pengubah | Mengapa tidak berlaku |
|---|---|
| Diskon Batch API | Sesi bersifat stateful dan interaktif. Tidak ada mode batch. |
| Premi fast mode | Kecepatan inferensi dikelola oleh runtime. |
| Pengali residensi data | inference_geo adalah field permintaan Messages API. |
| Premi konteks panjang | Jendela konteks dikelola oleh runtime. |
| Harga platform pihak ketiga | Claude Managed Agents hanya tersedia melalui Claude API secara langsung. |
| SKU | Tarif | Pengukuran |
|---|---|---|
| Durasi sesi | $0,08 per jam sesi | Durasi status running |
Durasi diukur hingga milidetik dan hanya terakumulasi saat status sesi adalah running. Waktu yang dihabiskan dalam status idle (menunggu pesan berikutnya atau konfirmasi alat), rescheduling, atau terminated tidak dihitung sebagai durasi.
Durasi sesi menggantikan model penagihan jam kontainer Code Execution saat menggunakan Claude Managed Agents. Anda tidak ditagih secara terpisah untuk jam kontainer di atas durasi sesi.
Sesi coding satu jam menggunakan Claude Opus 4.6 yang mengonsumsi 50.000 token input dan 15.000 token output:
| Item | Perhitungan | Biaya |
|---|---|---|
| Token input | 50.000 × $5 / 1.000.000 | $0,25 |
| Token output | 15.000 × $25 / 1.000.000 | $0,375 |
| Durasi sesi | 1,0 jam × $0,08 | $0,08 |
| Total | $0,705 |
Jika prompt caching aktif dan 40.000 dari token input adalah cache read:
| Item | Perhitungan | Biaya |
|---|---|---|
| Token input tidak di-cache | 10.000 × $5 / 1.000.000 | $0,05 |
| Token cache read | 40.000 × $5 × 0,1 / 1.000.000 | $0,02 |
| Token output | 15.000 × $25 / 1.000.000 | $0,375 |
| Durasi sesi | 1,0 jam × $0,08 | $0,08 |
| Total | $0,525 |
Contoh perhitungan untuk memproses 10.000 tiket dukungan:
Untuk panduan terperinci tentang perhitungan ini, lihat panduan agen dukungan pelanggan.
Saat membangun agen dengan Claude:
Untuk aplikasi agen bervolume tinggi, hubungi tim penjualan enterprise untuk pengaturan harga khusus.
Batas laju bervariasi berdasarkan tingkat penggunaan dan memengaruhi berapa banyak permintaan yang dapat Anda buat:
Untuk informasi batas laju terperinci, lihat dokumentasi batas laju.
Untuk batas laju yang lebih tinggi atau pengaturan harga khusus, hubungi tim penjualan.
Diskon volume mungkin tersedia untuk pengguna bervolume tinggi. Ini dinegosiasikan berdasarkan kasus per kasus.
Untuk pelanggan enterprise dengan kebutuhan khusus:
Hubungi tim penjualan di [email protected] atau melalui Claude Console untuk mendiskusikan opsi harga enterprise.
Bagaimana penggunaan token dihitung?
Token adalah potongan teks yang diproses oleh model. Sebagai perkiraan kasar, 1 token kira-kira 4 karakter atau 0,75 kata dalam bahasa Inggris. Jumlah pasti bervariasi berdasarkan bahasa dan jenis konten.
Apakah ada tingkat gratis atau uji coba?
Pengguna baru menerima sejumlah kecil kredit gratis untuk menguji API. Hubungi penjualan untuk informasi tentang uji coba yang diperpanjang untuk evaluasi enterprise.
Bagaimana diskon bertumpuk?
Diskon Batch API dan prompt caching dapat digabungkan. Misalnya, menggunakan kedua fitur bersama-sama memberikan penghematan biaya yang signifikan dibandingkan panggilan API standar. Lihat harga prompt caching untuk cara pengali berinteraksi.
Metode pembayaran apa yang diterima?
Kartu kredit utama diterima untuk akun standar. Pelanggan enterprise dapat mengatur faktur dan metode pembayaran lainnya.
Untuk pertanyaan tambahan tentang harga, hubungi [email protected].