Loading...
  • Bangun
  • Admin
  • Model & harga
  • Client SDK
  • Referensi API
Search...
⌘K
Model
Ikhtisar modelMemilih modelYang baru di Claude Opus 4.7Panduan migrasiPenghentian modelKartu modelPrompt sistem
Harga
Harga
Log in
Harga
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Model & harga/Harga

Harga

Pelajari struktur harga Anthropic untuk model dan fitur

Halaman ini menyediakan informasi harga terperinci untuk model dan fitur Anthropic. Semua harga dalam USD.

Untuk informasi harga terkini, silakan kunjungi claude.com/pricing.

Harga model

Tabel berikut menunjukkan harga untuk semua model Claude di berbagai tingkat penggunaan:

ModelBase Input Tokens5m Cache Writes1h Cache WritesCache Hits & RefreshesOutput Tokens
Claude Opus 4.7$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.6$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.5$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.1$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Opus 4 (deprecated)$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Sonnet 4.6$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 4.5$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 4 (deprecated)$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Haiku 4.5$1 / MTok$1.25 / MTok$2 / MTok$0.10 / MTok$5 / MTok
Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI)$0.80 / MTok$1 / MTok$1.60 / MTok$0.08 / MTok$4 / MTok

MTok = Juta token. Kolom "Base Input Tokens" menunjukkan harga input standar, "Cache Writes" dan "Cache Hits" khusus untuk prompt caching, dan "Output Tokens" menunjukkan harga output. Lihat harga prompt caching di bawah untuk penjelasan kolom cache dan pengganda harga.

Opus 4.7 menggunakan tokenizer baru dibandingkan dengan model sebelumnya, berkontribusi pada peningkatan kinerjanya di berbagai tugas. Tokenizer baru ini mungkin menggunakan hingga 35% lebih banyak token untuk teks tetap yang sama.

Harga platform pihak ketiga

Model Claude tersedia di AWS Bedrock, Google Vertex AI, dan Microsoft Foundry. Untuk harga resmi, kunjungi:

  • Harga AWS Bedrock
  • Harga Google Vertex AI
  • Harga Microsoft Foundry

Harga endpoint regional dan multi-region untuk model Claude 4.5 dan seterusnya

Dimulai dengan Claude Sonnet 4.5 dan Haiku 4.5:

  • AWS Bedrock menawarkan dua jenis endpoint: endpoint global (perutean dinamis untuk ketersediaan maksimal) dan endpoint regional (perutean data terjamin melalui wilayah geografis tertentu).
  • Google Vertex AI menawarkan tiga jenis endpoint: endpoint global, endpoint multi-region (perutean dinamis dalam area geografis), dan endpoint regional.

Endpoint regional dan multi-region mencakup premium 10% di atas endpoint global. Claude API (1P) bersifat global secara default; untuk opsi residensi data 1P dan harga, lihat Harga residensi data di bawah.

Cakupan: Struktur harga ini berlaku untuk Claude Sonnet 4.5, Haiku 4.5, dan semua model masa depan. Model sebelumnya (Claude Sonnet 4 (deprecated), Opus 4 (deprecated), dan rilis sebelumnya) mempertahankan harga yang ada.

Untuk detail implementasi dan contoh kode:

  • AWS Bedrock endpoint global vs regional
  • Google Vertex AI endpoint global, multi-region, dan regional

Harga khusus fitur

Prompt caching

Prompt caching mengurangi biaya dan latensi dengan menggunakan kembali bagian prompt yang telah diproses sebelumnya di seluruh panggilan API. Alih-alih memproses ulang prompt sistem besar yang sama, dokumen, atau riwayat percakapan pada setiap permintaan, API membaca dari cache dengan harga input sebagian kecil dari harga standar.

Ada dua cara untuk mengaktifkan prompt caching:

  • Caching otomatis: Tambahkan satu bidang cache_control di tingkat atas permintaan Anda. Sistem secara otomatis mengelola breakpoint cache saat percakapan berkembang. Ini adalah titik awal yang direkomendasikan untuk sebagian besar kasus penggunaan.
  • Breakpoint cache eksplisit: Tempatkan cache_control langsung pada blok konten individual untuk kontrol terperinci atas apa yang di-cache.

Prompt caching menggunakan pengganda harga berikut relatif terhadap tingkat token input dasar:

Operasi cachePenggandaDurasi
Cache write 5 menit1.25x harga input dasarCache valid selama 5 menit
Cache write 1 jam2x harga input dasarCache valid selama 1 jam
Cache read (hit)0.1x harga input dasarDurasi yang sama dengan write sebelumnya

Token cache write dikenakan biaya ketika konten pertama kali disimpan. Token cache read dikenakan biaya ketika permintaan berikutnya mengambil konten yang di-cache. Cache hit berharga 10% dari harga input standar, yang berarti caching terbayar setelah hanya satu cache read untuk durasi 5 menit (1.25x write), atau setelah dua cache read untuk durasi 1 jam (2x write).

Pengganda ini ditumpuk dengan modifier harga lainnya, termasuk diskon Batch API dan residensi data.

Untuk detail implementasi, model yang didukung, dan contoh kode, lihat dokumentasi prompt caching.

Harga residensi data

Untuk Claude Opus 4.7, Claude Opus 4.6, dan model yang lebih baru, menentukan inferensi hanya AS melalui parameter inference_geo menimbulkan pengganda 1.1x pada semua kategori harga token, termasuk token input, token output, cache write, dan cache read. Perutean global (default) menggunakan harga standar.

Ini hanya berlaku untuk Claude API (1P). Platform pihak ketiga memiliki harga regional mereka sendiri. Lihat AWS Bedrock dan Google Vertex AI untuk detail. Model sebelumnya mempertahankan harga yang ada terlepas dari pengaturan inference_geo.

Untuk informasi lebih lanjut, lihat dokumentasi residensi data.

Harga fast mode

Fast mode (beta: research preview) untuk Claude Opus 4.6 menyediakan output yang jauh lebih cepat dengan harga premium (6x tingkat standar). Harga fast mode berlaku di seluruh jendela konteks, termasuk permintaan di atas 200k token input. Saat ini didukung di Opus 4.6:

InputOutput
$30 / MTok$150 / MTok

Harga fast mode ditumpuk dengan modifier harga lainnya:

  • Pengganda prompt caching berlaku di atas harga fast mode
  • Pengganda residensi data berlaku di atas harga fast mode

Fast mode tidak tersedia dengan Batch API.

Untuk informasi lebih lanjut, lihat dokumentasi fast mode.

Batch processing

Batch API memungkinkan pemrosesan asinkron dari volume besar permintaan dengan diskon 50% pada token input dan output.

ModelBatch inputBatch output
Claude Opus 4.7$2.50 / MTok$12.50 / MTok
Claude Opus 4.6$2.50 / MTok$12.50 / MTok
Claude Opus 4.5$2.50 / MTok$12.50 / MTok
Claude Opus 4.1$7.50 / MTok$37.50 / MTok
Claude Opus 4 (deprecated)$7.50 / MTok$37.50 / MTok
Claude Sonnet 4.6$1.50 / MTok$7.50 / MTok
Claude Sonnet 4.5$1.50 / MTok$7.50 / MTok
Claude Sonnet 4 (deprecated)$1.50 / MTok$7.50 / MTok
Claude Haiku 4.5$0.50 / MTok$2.50 / MTok
Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI)$0.40 / MTok$2 / MTok

Untuk informasi lebih lanjut tentang batch processing, lihat dokumentasi batch processing.

Harga konteks panjang

Claude Mythos Preview, Opus 4.7, Opus 4.6, dan Sonnet 4.6 mencakup jendela konteks token 1M penuh dengan harga standar. (Permintaan token 900k ditagih dengan tingkat per-token yang sama seperti permintaan token 9k.) Diskon prompt caching dan batch processing berlaku dengan tingkat standar di seluruh jendela konteks penuh.

Harga tool use

Tool use requests are priced based on:

  1. The total number of input tokens sent to the model (including in the tools parameter)
  2. The number of output tokens generated
  3. For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

The additional tokens from tool use come from:

  • The tools parameter in API requests (tool names, descriptions, and schemas)
  • tool_use content blocks in API requests and responses
  • tool_result content blocks in API requests

When you use tools, the API also automatically includes a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

ModelTool choiceTool use system prompt token count
Claude Opus 4.7auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.6auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.1auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4 (deprecated)auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4.6auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4 (deprecated)auto, none
any, tool
346 tokens
313 tokens
Claude Haiku 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI)auto, none
any, tool
264 tokens
340 tokens

These token counts are added to your normal input and output tokens to calculate the total cost of a request.

Untuk harga per-model saat ini, lihat bagian harga model.

Untuk informasi lebih lanjut tentang implementasi tool use dan praktik terbaik, lihat dokumentasi tool use.

Harga tool spesifik

Bash tool

The bash tool adds 245 input tokens to your API calls.

Additional tokens are consumed by:

  • Command outputs (stdout/stderr)
  • Error messages
  • Large file contents

Lihat harga tool use untuk detail harga lengkap.

Code execution tool

Code execution is free when used with web search or web fetch. When web_search_20260209 or web_fetch_20260209 is included in your API request, there are no additional charges for code execution tool calls beyond the standard input and output token costs.

When used without these tools, code execution is billed by execution time, tracked separately from token usage:

  • Execution time has a minimum of 5 minutes
  • Each organization receives 1,550 free hours of usage per month
  • Additional usage beyond 1,550 hours is billed at $0.05 per hour, per container
  • If files are included in the request, execution time is billed even if the tool is not invoked, due to files being preloaded onto the container

Code execution usage is tracked in the response:

{
  "usage": {
    "input_tokens": 105,
    "output_tokens": 239,
    "server_tool_use": {
      "code_execution_requests": 1
    }
  }
}

Text editor tool

The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.

In addition to the base tokens, the following additional input tokens are needed for the text editor tool:

ToolAdditional input tokens
text_editor_20250429 (Claude 4.x)700 tokens

Lihat harga tool use untuk detail harga lengkap.

Web search tool

Web search usage is charged in addition to token usage:

{
  "usage": {
    "input_tokens": 105,
    "output_tokens": 6039,
    "cache_read_input_tokens": 7123,
    "cache_creation_input_tokens": 7345,
    "server_tool_use": {
      "web_search_requests": 1
    }
  }
}

Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.

Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

Web fetch tool

Web fetch usage has no additional charges beyond standard token costs:

{
  "usage": {
    "input_tokens": 25039,
    "output_tokens": 931,
    "cache_read_input_tokens": 0,
    "cache_creation_input_tokens": 0,
    "server_tool_use": {
      "web_fetch_requests": 1
    }
  }
}

The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.

To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.

Example token usage for typical content:

  • Average web page (10 kB): ~2,500 tokens
  • Large documentation page (100 kB): ~25,000 tokens
  • Research paper PDF (500 kB): ~125,000 tokens

Computer use tool

Computer use follows the standard tool use pricing. When using the computer use tool:

System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt

Computer use tool token usage:

ModelInput tokens per tool definition
Claude 4.x models735 tokens

Additional token consumption:

  • Screenshot images (see Vision pricing)
  • Tool execution results returned to Claude

If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

Harga Claude Managed Agents

Claude Managed Agents ditagih dalam dua dimensi: token dan runtime sesi.

Token

Semua token yang dikonsumsi oleh sesi Claude Managed Agents ditagih dengan tingkat yang ditunjukkan di Harga model di atas. Pengganda prompt caching berlaku secara identik. Web search yang dipicu di dalam sesi menimbulkan $10 standar per 1.000 pencarian.

Modifier Messages API berikut tidak berlaku untuk sesi Claude Managed Agents:

ModifierMengapa tidak berlaku
Diskon Batch APISesi bersifat stateful dan interaktif. Tidak ada mode batch.
Premium fast modeKecepatan inferensi dikelola oleh runtime.
Pengganda residensi datainference_geo adalah bidang permintaan Messages API.
Premium konteks panjangJendela konteks dikelola oleh runtime.
Harga platform pihak ketigaClaude Managed Agents hanya tersedia melalui Claude API secara langsung.

Runtime sesi

SKUTingkatMetering
Session runtime$0.08 per session-hourdurasi status running

Runtime diukur hingga milidetik dan terakumulasi hanya saat status sesi adalah running. Waktu yang dihabiskan idle (menunggu pesan Anda berikutnya atau konfirmasi tool), rescheduling, atau terminated tidak dihitung menuju runtime.

Session runtime menggantikan model penagihan container-hour Code Execution saat menggunakan Claude Managed Agents. Anda tidak ditagih secara terpisah untuk jam container di atas session runtime.

Contoh yang dikerjakan

Sesi coding satu jam menggunakan Claude Opus 4.7 yang mengkonsumsi 50.000 token input dan 15.000 token output:

Item barisPerhitunganBiaya
Token input50.000 × $5 / 1.000.000$0.25
Token output15.000 × $25 / 1.000.000$0.375
Session runtime1.0 jam × $0.08$0.08
Total$0.705

Jika prompt caching aktif dan 40.000 dari token input adalah cache read:

Item barisPerhitunganBiaya
Token input tidak di-cache10.000 × $5 / 1.000.000$0.05
Token cache read40.000 × $5 × 0.1 / 1.000.000$0.02
Token output15.000 × $25 / 1.000.000$0.375
Session runtime1.0 jam × $0.08$0.08
Total$0.525

Contoh perhitungan untuk memproses 10.000 tiket dukungan:

  • Rata-rata ~3.700 token per percakapan
  • Menggunakan Claude Haiku 4.5 pada $1/MTok input, $5/MTok output
  • Total biaya: ~$37.00 per 10.000 tiket

Untuk panduan rinci tentang perhitungan ini, lihat panduan agen dukungan pelanggan.

Pertimbangan harga tambahan

Strategi optimasi biaya

Saat membangun agen dengan Claude:

  1. Gunakan model yang sesuai: Pilih Haiku untuk tugas sederhana, Sonnet untuk penalaran kompleks
  2. Implementasikan prompt caching: Kurangi biaya untuk konteks berulang
  3. Operasi batch: Gunakan Batch API untuk tugas yang tidak sensitif waktu
  4. Pantau pola penggunaan: Lacak konsumsi token untuk mengidentifikasi peluang optimasi

Untuk aplikasi agen volume tinggi, hubungi tim penjualan enterprise untuk pengaturan harga khusus.

Rate limits

Rate limits bervariasi menurut tingkat penggunaan dan mempengaruhi berapa banyak permintaan yang dapat Anda buat:

  • Tier 1: Penggunaan tingkat entry dengan batas dasar
  • Tier 2: Batas yang meningkat untuk aplikasi yang berkembang
  • Tier 3: Batas lebih tinggi untuk aplikasi yang sudah mapan
  • Tier 4: Batas standar maksimum
  • Enterprise: Batas khusus tersedia

Untuk informasi rate limit terperinci, lihat dokumentasi rate limits.

Untuk rate limits lebih tinggi atau pengaturan harga khusus, hubungi tim penjualan.

Diskon volume

Diskon volume mungkin tersedia untuk pengguna volume tinggi. Ini dinegosiasikan berdasarkan kasus per kasus.

  • Tier standar menggunakan harga yang ditunjukkan di atas
  • Pelanggan enterprise dapat menghubungi penjualan untuk harga khusus
  • Diskon akademik dan penelitian mungkin tersedia

Harga enterprise

Untuk pelanggan enterprise dengan kebutuhan spesifik:

  • Rate limits khusus
  • Diskon volume
  • Dukungan khusus
  • Syarat khusus

Hubungi tim penjualan di [email protected] atau melalui Claude Console untuk membahas opsi harga enterprise.

Penagihan dan pembayaran

  • Penagihan berdasarkan penggunaan bulanan aktual
  • Semua pembayaran dalam USD
  • Opsi kartu kredit dan invoicing tersedia
  • Pelacakan penggunaan tersedia di Claude Console

Pertanyaan yang sering diajukan

Bagaimana penggunaan token dihitung?

Token adalah potongan teks yang diproses model. Sebagai perkiraan kasar, 1 token kira-kira 4 karakter atau 0,75 kata dalam bahasa Inggris. Jumlah pastinya bervariasi menurut bahasa dan jenis konten.

Apakah ada tier gratis atau uji coba?

Pengguna baru menerima sejumlah kecil kredit gratis untuk menguji API. Hubungi penjualan untuk informasi tentang uji coba yang diperpanjang untuk evaluasi enterprise.

Bagaimana diskon ditumpuk?

Diskon Batch API dan prompt caching dapat digabungkan. Misalnya, menggunakan kedua fitur bersama-sama memberikan penghematan biaya yang signifikan dibandingkan dengan panggilan API standar. Lihat harga prompt caching untuk cara pengganda berinteraksi.

Metode pembayaran apa yang diterima?

Kartu kredit utama diterima untuk akun standar. Pelanggan enterprise dapat mengatur invoicing dan metode pembayaran lainnya.

Untuk pertanyaan tambahan tentang harga, hubungi [email protected].

Was this page helpful?

  • Harga model
  • Harga platform pihak ketiga
  • Harga khusus fitur
  • Prompt caching
  • Harga residensi data
  • Harga fast mode
  • Batch processing
  • Harga konteks panjang
  • Harga tool use
  • Harga tool spesifik
  • Harga Claude Managed Agents
  • Token
  • Runtime sesi
  • Contoh yang dikerjakan
  • Pertimbangan harga tambahan
  • Strategi optimasi biaya
  • Rate limits
  • Diskon volume
  • Harga enterprise
  • Penagihan dan pembayaran
  • Pertanyaan yang sering diajukan