Loading...
    • Bangun
    • Admin
    • Model & harga
    • Client SDK
    • Referensi API
    Search...
    ⌘K
    Model
    Ikhtisar modelMemilih modelYang baru di Claude 4.6Panduan migrasiPenghentian modelKartu modelPrompt sistem
    Harga
    Harga
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Harga

    Harga

    Pelajari tentang struktur harga Anthropic untuk model dan fitur

    Halaman ini menyediakan informasi harga terperinci untuk model dan fitur Anthropic. Semua harga dalam USD.

    Untuk informasi harga terkini, silakan kunjungi claude.com/pricing.

    Harga model

    Tabel berikut menunjukkan harga untuk semua model Claude di berbagai tingkat penggunaan:

    ModelBase Input Tokens5m Cache Writes1h Cache WritesCache Hits & RefreshesOutput Tokens
    Claude Opus 4.6$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
    Claude Opus 4.5$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
    Claude Opus 4.1$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok

    Was this page helpful?

    • Harga model
    • Harga platform pihak ketiga
    • Harga khusus fitur
    • Prompt caching
    • Harga residensi data
    • Harga fast mode
    • Pemrosesan batch
    • Harga konteks panjang
    • Harga penggunaan alat
    • Harga alat tertentu
    • Harga Claude Managed Agents
    • Token
    • Durasi sesi
    • Contoh perhitungan
    • Pertimbangan harga tambahan
    • Strategi optimasi biaya
    • Batas laju
    • Diskon volume
    • Harga enterprise
    • Penagihan dan pembayaran
    • Pertanyaan yang sering diajukan
    $75 / MTok
    Claude Opus 4$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
    Claude Sonnet 4.6$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
    Claude Sonnet 4.5$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
    Claude Sonnet 4$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
    Claude Sonnet 3.7 (deprecated)$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
    Claude Haiku 4.5$1 / MTok$1.25 / MTok$2 / MTok$0.10 / MTok$5 / MTok
    Claude Haiku 3.5$0.80 / MTok$1 / MTok$1.6 / MTok$0.08 / MTok$4 / MTok
    Claude Opus 3 (deprecated)$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
    Claude Haiku 3$0.25 / MTok$0.30 / MTok$0.50 / MTok$0.03 / MTok$1.25 / MTok

    MTok = Juta token. Kolom "Base Input Tokens" menunjukkan harga input standar, "Cache Writes" dan "Cache Hits" khusus untuk prompt caching, dan "Output Tokens" menunjukkan harga output. Lihat harga prompt caching di bawah untuk penjelasan kolom cache dan pengali harga.

    Harga platform pihak ketiga

    Model Claude tersedia di AWS Bedrock, Google Vertex AI, dan Microsoft Foundry. Untuk harga resmi, kunjungi:

    • Harga AWS Bedrock
    • Harga Google Vertex AI
    • Harga Microsoft Foundry

    Harga endpoint regional dan multi-region untuk model Claude 4.5 dan seterusnya

    Mulai dengan Claude Sonnet 4.5 dan Haiku 4.5:

    • AWS Bedrock menawarkan dua jenis endpoint: endpoint global (perutean dinamis untuk ketersediaan maksimum) dan endpoint regional (perutean data yang dijamin melalui wilayah geografis tertentu).
    • Google Vertex AI menawarkan tiga jenis endpoint: endpoint global, endpoint multi-region (perutean dinamis dalam area geografis), dan endpoint regional.

    Endpoint regional dan multi-region mencakup premi 10% di atas endpoint global. Claude API (1P) bersifat global secara default; untuk opsi residensi data 1P dan harga, lihat Harga residensi data di bawah.

    Cakupan: Struktur harga ini berlaku untuk Claude Sonnet 4.5, Haiku 4.5, dan semua model di masa mendatang. Model sebelumnya (Claude Sonnet 4, Opus 4, dan rilis sebelumnya) mempertahankan harga yang ada.

    Untuk detail implementasi dan contoh kode:

    • Endpoint global vs regional AWS Bedrock
    • Endpoint global, multi-region, dan regional Google Vertex AI

    Harga khusus fitur

    Prompt caching

    Prompt caching mengurangi biaya dan latensi dengan menggunakan kembali bagian prompt yang telah diproses sebelumnya di seluruh panggilan API. Alih-alih memproses ulang system prompt besar, dokumen, atau riwayat percakapan yang sama pada setiap permintaan, API membaca dari cache dengan sebagian kecil dari harga input standar.

    Ada dua cara untuk mengaktifkan prompt caching:

    • Caching otomatis: Tambahkan satu field cache_control di tingkat atas permintaan Anda. Sistem secara otomatis mengelola breakpoint cache seiring percakapan berkembang. Ini adalah titik awal yang direkomendasikan untuk sebagian besar kasus penggunaan.
    • Breakpoint cache eksplisit: Tempatkan cache_control langsung pada blok konten individual untuk kontrol terperinci atas apa yang di-cache.

    Prompt caching menggunakan pengali harga berikut relatif terhadap tarif token input dasar:

    Operasi cachePengaliDurasi
    Penulisan cache 5 menit1,25x harga input dasarCache berlaku selama 5 menit
    Penulisan cache 1 jam2x harga input dasarCache berlaku selama 1 jam
    Pembacaan cache (hit)0,1x harga input dasarDurasi sama dengan penulisan sebelumnya

    Token penulisan cache dikenakan biaya saat konten pertama kali disimpan. Token pembacaan cache dikenakan biaya saat permintaan berikutnya mengambil konten yang di-cache. Cache hit dikenakan biaya 10% dari harga input standar, yang berarti caching terbayar setelah hanya satu pembacaan cache untuk durasi 5 menit (penulisan 1,25x), atau setelah dua pembacaan cache untuk durasi 1 jam (penulisan 2x).

    Pengali ini bertumpuk dengan pengubah harga lainnya, termasuk diskon Batch API dan residensi data.

    Untuk detail implementasi, model yang didukung, dan contoh kode, lihat dokumentasi prompt caching.

    Harga residensi data

    Untuk Claude Opus 4.6 dan model yang lebih baru, menentukan inferensi khusus AS melalui parameter inference_geo dikenakan pengali 1,1x pada semua kategori harga token, termasuk token input, token output, penulisan cache, dan pembacaan cache. Perutean global (default) menggunakan harga standar.

    Ini hanya berlaku untuk Claude API (1P). Platform pihak ketiga memiliki harga regional mereka sendiri. Lihat AWS Bedrock dan Google Vertex AI untuk detailnya. Model sebelumnya mempertahankan harga yang ada terlepas dari pengaturan inference_geo.

    Untuk informasi lebih lanjut, lihat dokumentasi residensi data.

    Harga fast mode

    Fast mode (beta: pratinjau penelitian) untuk Claude Opus 4.6 memberikan output yang jauh lebih cepat dengan harga premium (6x tarif standar). Harga fast mode berlaku di seluruh jendela konteks penuh, termasuk permintaan di atas 200k token input. Saat ini didukung pada Opus 4.6:

    InputOutput
    $30 / MTok$150 / MTok

    Harga fast mode bertumpuk dengan pengubah harga lainnya:

    • Pengali prompt caching berlaku di atas harga fast mode
    • Pengali residensi data berlaku di atas harga fast mode

    Fast mode tidak tersedia dengan Batch API.

    Untuk informasi lebih lanjut, lihat dokumentasi fast mode.

    Pemrosesan batch

    Batch API memungkinkan pemrosesan asinkron dari volume permintaan yang besar dengan diskon 50% pada token input dan output.

    ModelBatch inputBatch output
    Claude Opus 4.6$2.50 / MTok$12.50 / MTok
    Claude Opus 4.5$2.50 / MTok$12.50 / MTok
    Claude Opus 4.1$7.50 / MTok$37.50 / MTok
    Claude Opus 4$7.50 / MTok$37.50 / MTok
    Claude Sonnet 4.6$1.50 / MTok$7.50 / MTok
    Claude Sonnet 4.5$1.50 / MTok$7.50 / MTok
    Claude Sonnet 4$1.50 / MTok$7.50 / MTok
    Claude Sonnet 3.7 (deprecated)$1.50 / MTok$7.50 / MTok
    Claude Haiku 4.5$0.50 / MTok$2.50 / MTok
    Claude Haiku 3.5$0.40 / MTok$2 / MTok
    Claude Opus 3 (deprecated)$7.50 / MTok$37.50 / MTok
    Claude Haiku 3$0.125 / MTok$0.625 / MTok

    Untuk informasi lebih lanjut tentang pemrosesan batch, lihat dokumentasi pemrosesan batch.

    Harga konteks panjang

    Claude Mythos Preview, Opus 4.6 dan Sonnet 4.6 mencakup jendela konteks 1M token penuh dengan harga standar. (Permintaan 900k token ditagih dengan tarif per token yang sama seperti permintaan 9k token.) Diskon prompt caching dan pemrosesan batch berlaku dengan tarif standar di seluruh jendela konteks penuh.

    Harga penggunaan alat

    Tool use requests are priced based on:

    1. The total number of input tokens sent to the model (including in the tools parameter)
    2. The number of output tokens generated
    3. For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

    Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

    The additional tokens from tool use come from:

    • The tools parameter in API requests (tool names, descriptions, and schemas)
    • tool_use content blocks in API requests and responses
    • tool_result content blocks in API requests

    When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

    ModelTool choiceTool use system prompt token count
    Claude Opus 4.6auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Opus 4.5auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Opus 4.1auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Opus 4auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Sonnet 4.6auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Sonnet 4.5auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Sonnet 4auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Sonnet 3.7 (deprecated)auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Haiku 4.5auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Haiku 3.5auto, none
    any, tool
    264 tokens
    340 tokens
    Claude Opus 3 (deprecated)auto, none
    any, tool
    530 tokens
    281 tokens
    Claude Sonnet 3auto, none
    any, tool
    159 tokens
    235 tokens
    Claude Haiku 3auto, none
    any, tool
    264 tokens
    340 tokens

    These token counts are added to your normal input and output tokens to calculate the total cost of a request.

    Untuk harga per model saat ini, lihat bagian harga model.

    Untuk informasi lebih lanjut tentang implementasi penggunaan alat dan praktik terbaik, lihat dokumentasi penggunaan alat.

    Harga alat tertentu

    Alat Bash

    The bash tool adds 245 input tokens to your API calls.

    Additional tokens are consumed by:

    • Command outputs (stdout/stderr)
    • Error messages
    • Large file contents

    Lihat harga penggunaan alat untuk detail harga lengkap.

    Alat eksekusi kode

    Code execution is free when used with web search or web fetch. When web_search_20260209 or web_fetch_20260209 is included in your API request, there are no additional charges for code execution tool calls beyond the standard input and output token costs.

    When used without these tools, code execution is billed by execution time, tracked separately from token usage:

    • Execution time has a minimum of 5 minutes
    • Each organization receives 1,550 free hours of usage per month
    • Additional usage beyond 1,550 hours is billed at $0.05 per hour, per container
    • If files are included in the request, execution time is billed even if the tool is not invoked, due to files being preloaded onto the container

    Code execution usage is tracked in the response:

    "usage": {
      "input_tokens": 105,
      "output_tokens": 239,
      "server_tool_use": {
        "code_execution_requests": 1
      }
    }

    Alat editor teks

    The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.

    In addition to the base tokens, the following additional input tokens are needed for the text editor tool:

    ToolAdditional input tokens
    text_editor_20250429 (Claude 4.x)700 tokens
    text_editor_20250124 (Claude Sonnet 3.7 (deprecated))700 tokens

    Lihat harga penggunaan alat untuk detail harga lengkap.

    Alat pencarian web

    Web search usage is charged in addition to token usage:

    "usage": {
      "input_tokens": 105,
      "output_tokens": 6039,
      "cache_read_input_tokens": 7123,
      "cache_creation_input_tokens": 7345,
      "server_tool_use": {
        "web_search_requests": 1
      }
    }

    Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.

    Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

    Alat pengambilan web

    Web fetch usage has no additional charges beyond standard token costs:

    "usage": {
      "input_tokens": 25039,
      "output_tokens": 931,
      "cache_read_input_tokens": 0,
      "cache_creation_input_tokens": 0,
      "server_tool_use": {
        "web_fetch_requests": 1
      }
    }

    The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.

    To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.

    Example token usage for typical content:

    • Average web page (10 kB): ~2,500 tokens
    • Large documentation page (100 kB): ~25,000 tokens
    • Research paper PDF (500 kB): ~125,000 tokens

    Alat penggunaan komputer

    Computer use follows the standard tool use pricing. When using the computer use tool:

    System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt

    Computer use tool token usage:

    ModelInput tokens per tool definition
    Claude 4.x models735 tokens
    Claude Sonnet 3.7 (deprecated)735 tokens

    Additional token consumption:

    • Screenshot images (see Vision pricing)
    • Tool execution results returned to Claude

    If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

    Harga Claude Managed Agents

    Claude Managed Agents ditagih berdasarkan dua dimensi: token dan durasi sesi.

    Token

    Semua token yang dikonsumsi oleh sesi Claude Managed Agents ditagih dengan tarif yang ditunjukkan dalam Harga model di atas. Pengali Prompt caching berlaku secara identik. Pencarian web yang dipicu di dalam sesi dikenakan biaya standar $10 per 1.000 pencarian.

    Pengubah Messages API berikut tidak berlaku untuk sesi Claude Managed Agents:

    PengubahMengapa tidak berlaku
    Diskon Batch APISesi bersifat stateful dan interaktif. Tidak ada mode batch.
    Premi fast modeKecepatan inferensi dikelola oleh runtime.
    Pengali residensi datainference_geo adalah field permintaan Messages API.
    Premi konteks panjangJendela konteks dikelola oleh runtime.
    Harga platform pihak ketigaClaude Managed Agents hanya tersedia melalui Claude API secara langsung.

    Durasi sesi

    SKUTarifPengukuran
    Durasi sesi$0,08 per jam sesiDurasi status running

    Durasi diukur hingga milidetik dan hanya terakumulasi saat status sesi adalah running. Waktu yang dihabiskan dalam status idle (menunggu pesan berikutnya atau konfirmasi alat), rescheduling, atau terminated tidak dihitung sebagai durasi.

    Durasi sesi menggantikan model penagihan jam kontainer Code Execution saat menggunakan Claude Managed Agents. Anda tidak ditagih secara terpisah untuk jam kontainer di atas durasi sesi.

    Contoh perhitungan

    Sesi coding satu jam menggunakan Claude Opus 4.6 yang mengonsumsi 50.000 token input dan 15.000 token output:

    ItemPerhitunganBiaya
    Token input50.000 × $5 / 1.000.000$0,25
    Token output15.000 × $25 / 1.000.000$0,375
    Durasi sesi1,0 jam × $0,08$0,08
    Total$0,705

    Jika prompt caching aktif dan 40.000 dari token input adalah cache read:

    ItemPerhitunganBiaya
    Token input tidak di-cache10.000 × $5 / 1.000.000$0,05
    Token cache read40.000 × $5 × 0,1 / 1.000.000$0,02
    Token output15.000 × $25 / 1.000.000$0,375
    Durasi sesi1,0 jam × $0,08$0,08
    Total$0,525

    Contoh perhitungan untuk memproses 10.000 tiket dukungan:

    • Rata-rata ~3.700 token per percakapan
    • Menggunakan Claude Opus 4.6 dengan input $5/MTok, output $25/MTok
    • Total biaya: ~$37,00 per 10.000 tiket

    Untuk panduan terperinci tentang perhitungan ini, lihat panduan agen dukungan pelanggan.

    Pertimbangan harga tambahan

    Strategi optimasi biaya

    Saat membangun agen dengan Claude:

    1. Gunakan model yang sesuai: Pilih Haiku untuk tugas sederhana, Sonnet untuk penalaran kompleks
    2. Terapkan prompt caching: Kurangi biaya untuk konteks yang berulang
    3. Operasi batch: Gunakan Batch API untuk tugas yang tidak sensitif terhadap waktu
    4. Pantau pola penggunaan: Lacak konsumsi token untuk mengidentifikasi peluang optimasi

    Untuk aplikasi agen bervolume tinggi, hubungi tim penjualan enterprise untuk pengaturan harga khusus.

    Batas laju

    Batas laju bervariasi berdasarkan tingkat penggunaan dan memengaruhi berapa banyak permintaan yang dapat Anda buat:

    • Tier 1: Penggunaan tingkat awal dengan batas dasar
    • Tier 2: Batas yang ditingkatkan untuk aplikasi yang berkembang
    • Tier 3: Batas lebih tinggi untuk aplikasi yang sudah mapan
    • Tier 4: Batas standar maksimum
    • Enterprise: Batas khusus tersedia

    Untuk informasi batas laju terperinci, lihat dokumentasi batas laju.

    Untuk batas laju yang lebih tinggi atau pengaturan harga khusus, hubungi tim penjualan.

    Diskon volume

    Diskon volume mungkin tersedia untuk pengguna bervolume tinggi. Ini dinegosiasikan berdasarkan kasus per kasus.

    • Tingkat standar menggunakan harga yang ditunjukkan di atas
    • Pelanggan enterprise dapat menghubungi penjualan untuk harga khusus
    • Diskon akademik dan penelitian mungkin tersedia

    Harga enterprise

    Untuk pelanggan enterprise dengan kebutuhan khusus:

    • Batas laju khusus
    • Diskon volume
    • Dukungan khusus
    • Ketentuan khusus

    Hubungi tim penjualan di [email protected] atau melalui Claude Console untuk mendiskusikan opsi harga enterprise.

    Penagihan dan pembayaran

    • Penagihan berdasarkan penggunaan bulanan aktual
    • Semua pembayaran dalam USD
    • Opsi kartu kredit dan faktur tersedia
    • Pelacakan penggunaan tersedia di Claude Console

    Pertanyaan yang sering diajukan

    Bagaimana penggunaan token dihitung?

    Token adalah potongan teks yang diproses oleh model. Sebagai perkiraan kasar, 1 token kira-kira 4 karakter atau 0,75 kata dalam bahasa Inggris. Jumlah pasti bervariasi berdasarkan bahasa dan jenis konten.

    Apakah ada tingkat gratis atau uji coba?

    Pengguna baru menerima sejumlah kecil kredit gratis untuk menguji API. Hubungi penjualan untuk informasi tentang uji coba yang diperpanjang untuk evaluasi enterprise.

    Bagaimana diskon bertumpuk?

    Diskon Batch API dan prompt caching dapat digabungkan. Misalnya, menggunakan kedua fitur bersama-sama memberikan penghematan biaya yang signifikan dibandingkan panggilan API standar. Lihat harga prompt caching untuk cara pengali berinteraksi.

    Metode pembayaran apa yang diterima?

    Kartu kredit utama diterima untuk akun standar. Pelanggan enterprise dapat mengatur faktur dan metode pembayaran lainnya.

    Untuk pertanyaan tambahan tentang harga, hubungi [email protected].