MessagesManajemen konteks

Penghitungan token

Hitung token dalam sebuah pesan sebelum Anda mengirimkannya ke Claude. Gunakan jumlah token untuk mengelola batas laju dan biaya, membuat keputusan perutean model, dan menyesuaikan prompt dengan panjang target.

Penghitungan token memungkinkan Anda menentukan jumlah token dalam sebuah pesan sebelum Anda mengirimkannya ke Claude. Ini membantu Anda membuat keputusan yang tepat tentang prompt dan penggunaan Anda. Dengan penghitungan token, Anda dapat:

Mengelola batas laju dan biaya secara proaktif
Membuat keputusan perutean model yang cerdas
Mengoptimalkan prompt ke panjang tertentu

Fitur ini memenuhi syarat untuk Zero Data Retention (ZDR). Ketika organisasi Anda memiliki pengaturan ZDR, data yang dikirim melalui fitur ini tidak disimpan setelah respons API dikembalikan.

Cara menghitung token pesan

Endpoint penghitungan token menerima daftar input terstruktur yang sama seperti untuk membuat pesan, termasuk dukungan untuk prompt sistem, alat, gambar, dan PDF. Respons berisi jumlah total token input.

Jumlah token harus dianggap sebagai estimasi. Dalam beberapa kasus, jumlah token input aktual yang digunakan saat membuat pesan mungkin berbeda sedikit.

Jumlah token dapat mencakup token yang ditambahkan secara otomatis oleh Anthropic untuk optimasi sistem. Anda tidak ditagih untuk token yang ditambahkan sistem. Penagihan hanya mencerminkan konten Anda.

Model yang didukung

Semua model aktif mendukung penghitungan token, termasuk Claude Sonnet 5.

Claude Opus 4.7 dan model Opus yang lebih baru, Claude Fable 5, Claude Mythos 5, Claude Mythos Preview, dan Claude Sonnet 5 menggunakan tokenizer yang lebih baru. Teks input yang sama menghasilkan sekitar 30% lebih banyak token dibandingkan model sebelumnya. Hitung ulang prompt terhadap model yang akan Anda gunakan, alih-alih menggunakan kembali jumlah yang diukur terhadap model sebelumnya.

Menghitung token dalam pesan dasar

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-8",
    system="You are a scientist",
    messages=[{"role": "user", "content": "Hello, Claude"}],
)

print(response.json())

Output

{ "input_tokens": 14 }

Menghitung token dalam pesan dengan alat

Jumlah token alat server hanya berlaku untuk panggilan sampling pertama.

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-8",
    tools=[
        {
            "name": "get_weather",
            "description": "Get the current weather in a given location",
            "input_schema": {
                "type": "object",
                "properties": {
                    "location": {
                        "type": "string",
                        "description": "The city and state, e.g. San Francisco, CA",
                    }
                },
                "required": ["location"],
            },
        }
    ],
    messages=[{"role": "user", "content": "What's the weather like in San Francisco?"}],
)

print(response.json())

Output

{ "input_tokens": 403 }

Menghitung token dalam pesan dengan gambar

import base64
import httpx

image_url = "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
image_media_type = "image/jpeg"
image_data = base64.standard_b64encode(httpx.get(image_url).content).decode("utf-8")

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-8",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image_media_type,
                        "data": image_data,
                    },
                },
                {"type": "text", "text": "Describe this image"},
            ],
        }
    ],
)
print(response.json())

Output

{ "input_tokens": 1551 }

Menghitung token dalam pesan dengan pemikiran diperpanjang

Lihat bagaimana jendela konteks dihitung dengan pemikiran diperpanjang untuk detail lebih lanjut

Blok pemikiran dari giliran asisten sebelumnya diabaikan dan tidak dihitung terhadap token input Anda
Pemikiran giliran asisten saat ini dihitung terhadap token input Anda

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-sonnet-4-6",
    thinking={"type": "enabled", "budget_tokens": 16000},
    messages=[
        {
            "role": "user",
            "content": "Are there an infinite number of prime numbers such that n mod 4 == 3?",
        },
        {
            "role": "assistant",
            "content": [
                {
                    "type": "thinking",
                    "thinking": "This is a nice number theory question. Let's think about it step by step...",
                    "signature": "EuYBCkQYAiJAgCs1le6/Pol5Z4/JMomVOouGrWdhYNsH3ukzUECbB6iWrSQtsQuRHJID6lWV...",
                },
                {
                    "type": "text",
                    "text": "Yes, there are infinitely many prime numbers p such that p mod 4 = 3...",
                },
            ],
        },
        {"role": "user", "content": "Can you write a formal proof?"},
    ],
)

print(response.json())

Output

{ "input_tokens": 88 }

Menghitung token dalam pesan dengan PDF

Penghitungan token mendukung PDF dengan batasan yang sama seperti Messages API.

import base64
import anthropic

client = anthropic.Anthropic()

with open("/path/to/document.pdf", "rb") as pdf_file:
    pdf_base64 = base64.standard_b64encode(pdf_file.read()).decode("utf-8")

response = client.messages.count_tokens(
    model="claude-opus-4-8",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_base64,
                    },
                },
                {"type": "text", "text": "Please summarize this document."},
            ],
        }
    ],
)

print(response.json())

Output

{ "input_tokens": 2188 }

Jumlah token pada Claude Fable 5 dan Claude Mythos 5

Claude Fable 5 dan Claude Mythos 5 menggunakan tokenizer yang diperkenalkan dengan Claude Opus 4.7, yang menghasilkan sekitar 30% lebih banyak token dibandingkan model sebelum Claude Opus 4.7 untuk teks yang sama. Endpoint penghitungan token mengembalikan jumlah berdasarkan tokenizer dari model yang Anda berikan, jadi untuk mengukur perbedaan pada beban kerja Anda, hitung permintaan yang sama dua kali: sekali dengan model Anda saat ini dan sekali dengan model: "claude-fable-5" (atau "claude-mythos-5"), lalu bandingkan kedua nilai input_tokens.

Penagihan dan migrasi: Penggunaan dan penagihan pada Claude Fable 5 dan Claude Mythos 5 mencerminkan jumlah dari tokenizer ini. Jika Anda bermigrasi dari model sebelum Claude Opus 4.7, konten yang sama mengonsumsi sekitar 30% lebih banyak token. Saat memigrasikan beban kerja ke Claude Fable 5 dan Claude Mythos 5, jangan gunakan kembali jumlah token yang diukur pada model sebelum Claude Opus 4.7 untuk memperkirakan biaya atau kesesuaian jendela konteks. Hitung prompt Anda dengan model: "claude-fable-5" (atau "claude-mythos-5").

Harga dan batas laju

Penghitungan token gratis untuk digunakan tetapi tunduk pada batas laju permintaan per menit berdasarkan tingkat penggunaan Anda. Jika Anda memerlukan batas yang lebih tinggi, gunakan Request rate limit increase pada halaman Limits.

Tingkat penggunaan	Permintaan per menit (RPM)
Start	2.000
Build	4.000
Scale	8.000

Penghitungan token dan pembuatan pesan memiliki batas laju yang terpisah dan independen. Penggunaan salah satunya tidak dihitung terhadap batas yang lain.

FAQ

Langkah selanjutnya

Menghitung token pesan

Baca referensi API lengkap untuk endpoint penghitungan token.

Jendela konteks

Gunakan jumlah token untuk menjaga prompt tetap dalam jendela konteks model.

Batas laju

Periksa jumlah token sebelum Anda mengirim permintaan agar tetap dalam tingkat penggunaan Anda.

Caching prompt

Kurangi biaya dan latensi pada prompt berulang dengan melakukan caching pada prefiks prompt.

Was this page helpful?

MessagesManajemen konteks

Penghitungan token

Mengelola batas laju dan biaya secara proaktif
Membuat keputusan perutean model yang cerdas
Mengoptimalkan prompt ke panjang tertentu

Fitur ini memenuhi syarat untuk Zero Data Retention (ZDR). Ketika organisasi Anda memiliki pengaturan ZDR, data yang dikirim melalui fitur ini tidak disimpan setelah respons API dikembalikan.

Cara menghitung token pesan

Jumlah token harus dianggap sebagai estimasi. Dalam beberapa kasus, jumlah token input aktual yang digunakan saat membuat pesan mungkin berbeda sedikit.

Model yang didukung

Semua model aktif mendukung penghitungan token, termasuk Claude Sonnet 5.

Menghitung token dalam pesan dasar

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-8",
    system="You are a scientist",
    messages=[{"role": "user", "content": "Hello, Claude"}],
)

print(response.json())

Output

{ "input_tokens": 14 }

Menghitung token dalam pesan dengan alat

Jumlah token alat server hanya berlaku untuk panggilan sampling pertama.

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-8",
    tools=[
        {
            "name": "get_weather",
            "description": "Get the current weather in a given location",
            "input_schema": {
                "type": "object",
                "properties": {
                    "location": {
                        "type": "string",
                        "description": "The city and state, e.g. San Francisco, CA",
                    }
                },
                "required": ["location"],
            },
        }
    ],
    messages=[{"role": "user", "content": "What's the weather like in San Francisco?"}],
)

print(response.json())

Output

{ "input_tokens": 403 }

Menghitung token dalam pesan dengan gambar

import base64
import httpx

image_url = "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
image_media_type = "image/jpeg"
image_data = base64.standard_b64encode(httpx.get(image_url).content).decode("utf-8")

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-8",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image_media_type,
                        "data": image_data,
                    },
                },
                {"type": "text", "text": "Describe this image"},
            ],
        }
    ],
)
print(response.json())

Output

{ "input_tokens": 1551 }

Menghitung token dalam pesan dengan pemikiran diperpanjang

Lihat bagaimana jendela konteks dihitung dengan pemikiran diperpanjang untuk detail lebih lanjut

Blok pemikiran dari giliran asisten sebelumnya diabaikan dan tidak dihitung terhadap token input Anda
Pemikiran giliran asisten saat ini dihitung terhadap token input Anda

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-sonnet-4-6",
    thinking={"type": "enabled", "budget_tokens": 16000},
    messages=[
        {
            "role": "user",
            "content": "Are there an infinite number of prime numbers such that n mod 4 == 3?",
        },
        {
            "role": "assistant",
            "content": [
                {
                    "type": "thinking",
                    "thinking": "This is a nice number theory question. Let's think about it step by step...",
                    "signature": "EuYBCkQYAiJAgCs1le6/Pol5Z4/JMomVOouGrWdhYNsH3ukzUECbB6iWrSQtsQuRHJID6lWV...",
                },
                {
                    "type": "text",
                    "text": "Yes, there are infinitely many prime numbers p such that p mod 4 = 3...",
                },
            ],
        },
        {"role": "user", "content": "Can you write a formal proof?"},
    ],
)

print(response.json())

Output

{ "input_tokens": 88 }

Menghitung token dalam pesan dengan PDF

Penghitungan token mendukung PDF dengan batasan yang sama seperti Messages API.

import base64
import anthropic

client = anthropic.Anthropic()

with open("/path/to/document.pdf", "rb") as pdf_file:
    pdf_base64 = base64.standard_b64encode(pdf_file.read()).decode("utf-8")

response = client.messages.count_tokens(
    model="claude-opus-4-8",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_base64,
                    },
                },
                {"type": "text", "text": "Please summarize this document."},
            ],
        }
    ],
)

print(response.json())

Output

{ "input_tokens": 2188 }

Jumlah token pada Claude Fable 5 dan Claude Mythos 5

Harga dan batas laju

Tingkat penggunaan	Permintaan per menit (RPM)
Start	2.000
Build	4.000
Scale	8.000

Penghitungan token dan pembuatan pesan memiliki batas laju yang terpisah dan independen. Penggunaan salah satunya tidak dihitung terhadap batas yang lain.

FAQ

Langkah selanjutnya

Menghitung token pesan

Baca referensi API lengkap untuk endpoint penghitungan token.

Jendela konteks

Gunakan jumlah token untuk menjaga prompt tetap dalam jendela konteks model.

Batas laju

Periksa jumlah token sebelum Anda mengirim permintaan agar tetap dalam tingkat penggunaan Anda.

Caching prompt

Kurangi biaya dan latensi pada prompt berulang dengan melakukan caching pada prefiks prompt.

Was this page helpful?

Cara menghitung token pesan

Model yang didukung

Menghitung token dalam pesan dasar

Menghitung token dalam pesan dengan alat

Menghitung token dalam pesan dengan gambar

Menghitung token dalam pesan dengan pemikiran diperpanjang

Menghitung token dalam pesan dengan PDF

Jumlah token pada Claude Fable 5 dan Claude Mythos 5

Harga dan batas laju

FAQ

Apakah penghitungan token menggunakan caching prompt?

Langkah selanjutnya

Cara menghitung token pesan

Model yang didukung

Menghitung token dalam pesan dasar

Menghitung token dalam pesan dengan alat

Menghitung token dalam pesan dengan gambar

Menghitung token dalam pesan dengan pemikiran diperpanjang

Menghitung token dalam pesan dengan PDF

Jumlah token pada Claude Fable 5 dan Claude Mythos 5

Harga dan batas laju

FAQ

Apakah penghitungan token menggunakan caching prompt?

Langkah selanjutnya

Cara menghitung token pesan

Model yang didukung

Menghitung token dalam pesan dasar

Menghitung token dalam pesan dengan alat

Menghitung token dalam pesan dengan gambar

Menghitung token dalam pesan dengan pemikiran diperpanjang

Menghitung token dalam pesan dengan PDF

Jumlah token pada Claude Fable 5 dan Claude Mythos 5

Harga dan batas laju

FAQ

Langkah selanjutnya

Cara menghitung token pesan

Model yang didukung

Menghitung token dalam pesan dasar

Menghitung token dalam pesan dengan alat

Menghitung token dalam pesan dengan gambar

Menghitung token dalam pesan dengan pemikiran diperpanjang

Menghitung token dalam pesan dengan PDF

Jumlah token pada Claude Fable 5 dan Claude Mythos 5

Harga dan batas laju

FAQ

Langkah selanjutnya