Halaman ini menyediakan informasi harga terperinci untuk model dan fitur Anthropic. Semua harga dalam USD.
Untuk informasi harga terkini, silakan kunjungi claude.com/pricing.
Tabel berikut menunjukkan harga untuk semua model Claude di berbagai tingkat penggunaan:
| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.7 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.6 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.5 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.6 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI) | $0.80 / MTok | $1 / MTok | $1.60 / MTok | $0.08 / MTok | $4 / MTok |
MTok = Juta token. Kolom "Base Input Tokens" menunjukkan harga input standar, "Cache Writes" dan "Cache Hits" khusus untuk prompt caching, dan "Output Tokens" menunjukkan harga output. Lihat harga prompt caching di bawah untuk penjelasan kolom cache dan pengganda harga.
Opus 4.7 menggunakan tokenizer baru dibandingkan dengan model sebelumnya, berkontribusi pada peningkatan kinerjanya di berbagai tugas. Tokenizer baru ini mungkin menggunakan hingga 35% lebih banyak token untuk teks tetap yang sama.
Model Claude tersedia di AWS Bedrock, Google Vertex AI, dan Microsoft Foundry. Untuk harga resmi, kunjungi:
Harga endpoint regional dan multi-region untuk model Claude 4.5 dan seterusnya
Dimulai dengan Claude Sonnet 4.5 dan Haiku 4.5:
Endpoint regional dan multi-region mencakup premium 10% di atas endpoint global. Claude API (1P) bersifat global secara default; untuk opsi residensi data 1P dan harga, lihat Harga residensi data di bawah.
Cakupan: Struktur harga ini berlaku untuk Claude Sonnet 4.5, Haiku 4.5, dan semua model masa depan. Model sebelumnya (Claude Sonnet 4 (deprecated), Opus 4 (deprecated), dan rilis sebelumnya) mempertahankan harga yang ada.
Untuk detail implementasi dan contoh kode:
Prompt caching mengurangi biaya dan latensi dengan menggunakan kembali bagian prompt yang telah diproses sebelumnya di seluruh panggilan API. Alih-alih memproses ulang prompt sistem besar yang sama, dokumen, atau riwayat percakapan pada setiap permintaan, API membaca dari cache dengan harga input sebagian kecil dari harga standar.
Ada dua cara untuk mengaktifkan prompt caching:
cache_control di tingkat atas permintaan Anda. Sistem secara otomatis mengelola breakpoint cache saat percakapan berkembang. Ini adalah titik awal yang direkomendasikan untuk sebagian besar kasus penggunaan.cache_control langsung pada blok konten individual untuk kontrol terperinci atas apa yang di-cache.Prompt caching menggunakan pengganda harga berikut relatif terhadap tingkat token input dasar:
| Operasi cache | Pengganda | Durasi |
|---|---|---|
| Cache write 5 menit | 1.25x harga input dasar | Cache valid selama 5 menit |
| Cache write 1 jam | 2x harga input dasar | Cache valid selama 1 jam |
| Cache read (hit) | 0.1x harga input dasar | Durasi yang sama dengan write sebelumnya |
Token cache write dikenakan biaya ketika konten pertama kali disimpan. Token cache read dikenakan biaya ketika permintaan berikutnya mengambil konten yang di-cache. Cache hit berharga 10% dari harga input standar, yang berarti caching terbayar setelah hanya satu cache read untuk durasi 5 menit (1.25x write), atau setelah dua cache read untuk durasi 1 jam (2x write).
Pengganda ini ditumpuk dengan modifier harga lainnya, termasuk diskon Batch API dan residensi data.
Untuk detail implementasi, model yang didukung, dan contoh kode, lihat dokumentasi prompt caching.
Untuk Claude Opus 4.7, Claude Opus 4.6, dan model yang lebih baru, menentukan inferensi hanya AS melalui parameter inference_geo menimbulkan pengganda 1.1x pada semua kategori harga token, termasuk token input, token output, cache write, dan cache read. Perutean global (default) menggunakan harga standar.
Ini hanya berlaku untuk Claude API (1P). Platform pihak ketiga memiliki harga regional mereka sendiri. Lihat AWS Bedrock dan Google Vertex AI untuk detail. Model sebelumnya mempertahankan harga yang ada terlepas dari pengaturan inference_geo.
Untuk informasi lebih lanjut, lihat dokumentasi residensi data.
Fast mode (beta: research preview) untuk Claude Opus 4.6 menyediakan output yang jauh lebih cepat dengan harga premium (6x tingkat standar). Harga fast mode berlaku di seluruh jendela konteks, termasuk permintaan di atas 200k token input. Saat ini didukung di Opus 4.6:
| Input | Output |
|---|---|
| $30 / MTok | $150 / MTok |
Harga fast mode ditumpuk dengan modifier harga lainnya:
Fast mode tidak tersedia dengan Batch API.
Untuk informasi lebih lanjut, lihat dokumentasi fast mode.
Batch API memungkinkan pemrosesan asinkron dari volume besar permintaan dengan diskon 50% pada token input dan output.
| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.7 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.6 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.5 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 (deprecated) | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.6 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 | $0.50 / MTok | $2.50 / MTok |
| Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI) | $0.40 / MTok | $2 / MTok |
Untuk informasi lebih lanjut tentang batch processing, lihat dokumentasi batch processing.
Claude Mythos Preview, Opus 4.7, Opus 4.6, dan Sonnet 4.6 mencakup jendela konteks token 1M penuh dengan harga standar. (Permintaan token 900k ditagih dengan tingkat per-token yang sama seperti permintaan token 9k.) Diskon prompt caching dan batch processing berlaku dengan tingkat standar di seluruh jendela konteks penuh.
Tool use requests are priced based on:
tools parameter)Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.
The additional tokens from tool use come from:
tools parameter in API requests (tool names, descriptions, and schemas)tool_use content blocks in API requests and responsestool_result content blocks in API requestsWhen you use tools, the API also automatically includes a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.7 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.6 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.1 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.6 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI) | auto, noneany, tool | 264 tokens 340 tokens |
These token counts are added to your normal input and output tokens to calculate the total cost of a request.
Untuk harga per-model saat ini, lihat bagian harga model.
Untuk informasi lebih lanjut tentang implementasi tool use dan praktik terbaik, lihat dokumentasi tool use.
The bash tool adds 245 input tokens to your API calls.
Additional tokens are consumed by:
Lihat harga tool use untuk detail harga lengkap.
Code execution is free when used with web search or web fetch. When web_search_20260209 or web_fetch_20260209 is included in your API request, there are no additional charges for code execution tool calls beyond the standard input and output token costs.
When used without these tools, code execution is billed by execution time, tracked separately from token usage:
Code execution usage is tracked in the response:
{
"usage": {
"input_tokens": 105,
"output_tokens": 239,
"server_tool_use": {
"code_execution_requests": 1
}
}
}The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.
In addition to the base tokens, the following additional input tokens are needed for the text editor tool:
| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
Lihat harga tool use untuk detail harga lengkap.
Web search usage is charged in addition to token usage:
{
"usage": {
"input_tokens": 105,
"output_tokens": 6039,
"cache_read_input_tokens": 7123,
"cache_creation_input_tokens": 7345,
"server_tool_use": {
"web_search_requests": 1
}
}
}Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.
Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.
Web fetch usage has no additional charges beyond standard token costs:
{
"usage": {
"input_tokens": 25039,
"output_tokens": 931,
"cache_read_input_tokens": 0,
"cache_creation_input_tokens": 0,
"server_tool_use": {
"web_fetch_requests": 1
}
}
}The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.
To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
Computer use follows the standard tool use pricing. When using the computer use tool:
System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt
Computer use tool token usage:
| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
Additional token consumption:
If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Claude Managed Agents ditagih dalam dua dimensi: token dan runtime sesi.
Semua token yang dikonsumsi oleh sesi Claude Managed Agents ditagih dengan tingkat yang ditunjukkan di Harga model di atas. Pengganda prompt caching berlaku secara identik. Web search yang dipicu di dalam sesi menimbulkan $10 standar per 1.000 pencarian.
Modifier Messages API berikut tidak berlaku untuk sesi Claude Managed Agents:
| Modifier | Mengapa tidak berlaku |
|---|---|
| Diskon Batch API | Sesi bersifat stateful dan interaktif. Tidak ada mode batch. |
| Premium fast mode | Kecepatan inferensi dikelola oleh runtime. |
| Pengganda residensi data | inference_geo adalah bidang permintaan Messages API. |
| Premium konteks panjang | Jendela konteks dikelola oleh runtime. |
| Harga platform pihak ketiga | Claude Managed Agents hanya tersedia melalui Claude API secara langsung. |
| SKU | Tingkat | Metering |
|---|---|---|
| Session runtime | $0.08 per session-hour | durasi status running |
Runtime diukur hingga milidetik dan terakumulasi hanya saat status sesi adalah running. Waktu yang dihabiskan idle (menunggu pesan Anda berikutnya atau konfirmasi tool), rescheduling, atau terminated tidak dihitung menuju runtime.
Session runtime menggantikan model penagihan container-hour Code Execution saat menggunakan Claude Managed Agents. Anda tidak ditagih secara terpisah untuk jam container di atas session runtime.
Sesi coding satu jam menggunakan Claude Opus 4.7 yang mengkonsumsi 50.000 token input dan 15.000 token output:
| Item baris | Perhitungan | Biaya |
|---|---|---|
| Token input | 50.000 × $5 / 1.000.000 | $0.25 |
| Token output | 15.000 × $25 / 1.000.000 | $0.375 |
| Session runtime | 1.0 jam × $0.08 | $0.08 |
| Total | $0.705 |
Jika prompt caching aktif dan 40.000 dari token input adalah cache read:
| Item baris | Perhitungan | Biaya |
|---|---|---|
| Token input tidak di-cache | 10.000 × $5 / 1.000.000 | $0.05 |
| Token cache read | 40.000 × $5 × 0.1 / 1.000.000 | $0.02 |
| Token output | 15.000 × $25 / 1.000.000 | $0.375 |
| Session runtime | 1.0 jam × $0.08 | $0.08 |
| Total | $0.525 |
Contoh perhitungan untuk memproses 10.000 tiket dukungan:
Untuk panduan rinci tentang perhitungan ini, lihat panduan agen dukungan pelanggan.
Saat membangun agen dengan Claude:
Untuk aplikasi agen volume tinggi, hubungi tim penjualan enterprise untuk pengaturan harga khusus.
Rate limits bervariasi menurut tingkat penggunaan dan mempengaruhi berapa banyak permintaan yang dapat Anda buat:
Untuk informasi rate limit terperinci, lihat dokumentasi rate limits.
Untuk rate limits lebih tinggi atau pengaturan harga khusus, hubungi tim penjualan.
Diskon volume mungkin tersedia untuk pengguna volume tinggi. Ini dinegosiasikan berdasarkan kasus per kasus.
Untuk pelanggan enterprise dengan kebutuhan spesifik:
Hubungi tim penjualan di [email protected] atau melalui Claude Console untuk membahas opsi harga enterprise.
Bagaimana penggunaan token dihitung?
Token adalah potongan teks yang diproses model. Sebagai perkiraan kasar, 1 token kira-kira 4 karakter atau 0,75 kata dalam bahasa Inggris. Jumlah pastinya bervariasi menurut bahasa dan jenis konten.
Apakah ada tier gratis atau uji coba?
Pengguna baru menerima sejumlah kecil kredit gratis untuk menguji API. Hubungi penjualan untuk informasi tentang uji coba yang diperpanjang untuk evaluasi enterprise.
Bagaimana diskon ditumpuk?
Diskon Batch API dan prompt caching dapat digabungkan. Misalnya, menggunakan kedua fitur bersama-sama memberikan penghematan biaya yang signifikan dibandingkan dengan panggilan API standar. Lihat harga prompt caching untuk cara pengganda berinteraksi.
Metode pembayaran apa yang diterima?
Kartu kredit utama diterima untuk akun standar. Pelanggan enterprise dapat mengatur invoicing dan metode pembayaran lainnya.
Untuk pertanyaan tambahan tentang harga, hubungi [email protected].
Was this page helpful?