Halaman ini menyediakan informasi harga terperinci untuk model dan fitur Anthropic. Semua harga dalam USD.
Untuk informasi harga terkini, silakan kunjungi claude.com/pricing.
Tabel berikut menunjukkan harga untuk semua model Claude di berbagai tingkat penggunaan:
| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.5 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = Juta token. Kolom "Base Input Tokens" menunjukkan harga input standar, "Cache Writes" dan "Cache Hits" khusus untuk prompt caching, dan "Output Tokens" menunjukkan harga output. Prompt caching menawarkan durasi cache 5 menit (default) dan 1 jam untuk mengoptimalkan biaya untuk berbagai kasus penggunaan.
Tabel di atas mencerminkan pengganda harga berikut untuk prompt caching:
Model Claude tersedia di AWS Bedrock, Google Vertex AI, dan Microsoft Foundry. Untuk harga resmi, kunjungi:
Harga endpoint regional untuk model Claude 4.5 dan seterusnya
Mulai dari Claude Sonnet 4.5 dan Haiku 4.5, AWS Bedrock dan Google Vertex AI menawarkan dua jenis endpoint:
Endpoint regional mencakup premium 10% dibandingkan endpoint global. Claude API (1P) bersifat global secara default dan tidak terpengaruh oleh perubahan ini. Claude API bersifat global-only (setara dengan penawaran endpoint global dan harga dari penyedia lain).
Cakupan: Struktur harga ini berlaku untuk Claude Sonnet 4.5, Haiku 4.5, dan semua model di masa depan. Model sebelumnya (Claude Sonnet 4, Opus 4, dan rilis sebelumnya) mempertahankan harga yang ada.
Untuk detail implementasi dan contoh kode:
Batch API memungkinkan pemrosesan asinkron dari volume besar permintaan dengan diskon 50% untuk token input dan output.
| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.5 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 | $0.50 / MTok | $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 () |
Untuk informasi lebih lanjut tentang pemrosesan batch, lihat dokumentasi pemrosesan batch kami.
Saat menggunakan Claude Sonnet 4 atau Sonnet 4.5 dengan jendela konteks token 1M diaktifkan, permintaan yang melebihi 200K token input secara otomatis dikenakan biaya pada tingkat konteks panjang premium:
Jendela konteks token 1M saat ini dalam beta untuk organisasi di tingkat penggunaan 4 dan organisasi dengan batas laju kustom. Jendela konteks token 1M hanya tersedia untuk Claude Sonnet 4 dan Sonnet 4.5.
| ≤ 200K token input | > 200K token input |
|---|---|
| Input: $3 / MTok | Input: $6 / MTok |
| Output: $15 / MTok | Output: $22.50 / MTok |
Harga konteks panjang ditumpuk dengan pengubah harga lainnya:
Bahkan dengan flag beta diaktifkan, permintaan dengan kurang dari 200K token input dikenakan biaya pada tingkat standar. Jika permintaan Anda melebihi 200K token input, semua token dikenakan harga premium.
Ambang batas 200K didasarkan semata-mata pada token input (termasuk cache reads/writes). Jumlah token output tidak mempengaruhi pemilihan tingkat harga, meskipun token output dikenakan biaya pada tingkat lebih tinggi ketika ambang batas input terlampaui.
Untuk memeriksa apakah permintaan API Anda dikenakan biaya pada tingkat jendela konteks 1M, periksa objek usage dalam respons API:
{
"usage": {
"input_tokens": 250000,
"cache_creation_input_tokens": 0,
"cache_read_input_tokens": 0,
"output_tokens": 500
}
}Hitung total token input dengan menjumlahkan:
input_tokenscache_creation_input_tokens (jika menggunakan prompt caching)cache_read_input_tokens (jika menggunakan prompt caching)Jika total melebihi 200.000 token, seluruh permintaan ditagih pada tingkat konteks 1M.
Untuk informasi lebih lanjut tentang objek usage, lihat dokumentasi respons API.
Tool use requests are priced based on:
tools parameter)Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.
The additional tokens from tool use come from:
tools parameter in API requests (tool names, descriptions, and schemas)tool_use content blocks in API requests and responsestool_result content blocks in API requestsWhen you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.1 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool |
These token counts are added to your normal input and output tokens to calculate the total cost of a request.
Untuk harga per-model saat ini, lihat bagian harga model kami di atas.
Untuk informasi lebih lanjut tentang implementasi penggunaan alat dan praktik terbaik, lihat dokumentasi penggunaan alat kami.
The bash tool adds 245 input tokens to your API calls.
Additional tokens are consumed by:
Lihat harga penggunaan alat untuk detail harga lengkap.
Code execution tool usage is tracked separately from token usage. Execution time has a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container.
Each organization receives 1,550 free hours of usage with the code execution tool per month. Additional usage beyond the first 1,550 hours is billed at $0.05 per hour, per container.
The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.
In addition to the base tokens, the following additional input tokens are needed for the text editor tool:
| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7 (deprecated)) | 700 tokens |
Lihat harga penggunaan alat untuk detail harga lengkap.
Web search usage is charged in addition to token usage:
"usage": {
"input_tokens": 105,
"output_tokens": 6039,
"cache_read_input_tokens": 7123,
"cache_creation_input_tokens": 7345,
"server_tool_use": {
"web_search_requests": 1
}
}Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.
Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.
Web fetch usage has no additional charges beyond standard token costs:
"usage": {
"input_tokens": 25039,
"output_tokens": 931,
"cache_read_input_tokens": 0,
"cache_creation_input_tokens": 0,
"server_tool_use": {
"web_fetch_requests": 1
}
}The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.
To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
Computer use follows the standard tool use pricing. When using the computer use tool:
System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt
Computer use tool token usage:
| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
Additional token consumption:
If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Memahami harga untuk aplikasi agen sangat penting saat membangun dengan Claude. Contoh dunia nyata ini dapat membantu Anda memperkirakan biaya untuk pola agen yang berbeda.
Saat membangun agen dukungan pelanggan, berikut adalah cara biaya dapat terbagi:
Contoh perhitungan untuk memproses 10.000 tiket dukungan:
Untuk panduan terperinci tentang perhitungan ini, lihat panduan agen dukungan pelanggan kami.
Untuk arsitektur agen yang lebih kompleks dengan beberapa langkah:
Pemrosesan permintaan awal
Pengambilan memori dan konteks
Perencanaan dan eksekusi tindakan
Untuk panduan komprehensif tentang pola harga agen, lihat panduan kasus penggunaan agen kami.
Saat membangun agen dengan Claude:
Untuk aplikasi agen volume tinggi, pertimbangkan untuk menghubungi tim penjualan enterprise kami untuk pengaturan harga kustom.
Batas laju bervariasi menurut tingkat penggunaan dan mempengaruhi berapa banyak permintaan yang dapat Anda buat:
Untuk informasi batas laju terperinci, lihat dokumentasi batas laju kami.
Untuk batas laju lebih tinggi atau pengaturan harga kustom, hubungi tim penjualan kami.
Diskon volume mungkin tersedia untuk pengguna volume tinggi. Ini dinegosiasikan berdasarkan kasus per kasus.
Untuk pelanggan enterprise dengan kebutuhan khusus:
Hubungi tim penjualan kami di [email protected] atau melalui Claude Console untuk membahas opsi harga enterprise.
Bagaimana penggunaan token dihitung?
Token adalah potongan teks yang diproses model. Sebagai perkiraan kasar, 1 token kira-kira 4 karakter atau 0,75 kata dalam bahasa Inggris. Jumlah pastinya bervariasi menurut bahasa dan jenis konten.
Apakah ada tier gratis atau uji coba?
Pengguna baru menerima sejumlah kecil kredit gratis untuk menguji API. Hubungi penjualan untuk informasi tentang uji coba yang diperpanjang untuk evaluasi enterprise.
Bagaimana diskon ditumpuk?
Diskon Batch API dan prompt caching dapat digabungkan. Misalnya, menggunakan kedua fitur bersama-sama memberikan penghematan biaya yang signifikan dibandingkan dengan panggilan API standar.
Metode pembayaran apa yang diterima?
Kami menerima kartu kredit utama untuk akun standar. Pelanggan enterprise dapat mengatur faktur dan metode pembayaran lainnya.
Untuk pertanyaan tambahan tentang harga, hubungi [email protected].
| $7.50 / MTok |
| $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
| 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |