Conteo de tokens

ConstruirGestión de contexto

Conteo de tokens

Determina el número de tokens en un mensaje antes de enviarlo a Claude para tomar decisiones informadas sobre tus indicaciones y uso.

El conteo de tokens te permite determinar el número de tokens en un mensaje antes de enviarlo a Claude, ayudándote a tomar decisiones informadas sobre tus indicaciones y uso. Con el conteo de tokens, puedes

Gestionar proactivamente los límites de velocidad y costos
Tomar decisiones inteligentes de enrutamiento de modelos
Optimizar indicaciones para que tengan una longitud específica

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

Cómo contar tokens de mensajes

El endpoint de conteo de tokens acepta la misma lista estructurada de entradas para crear un mensaje, incluyendo soporte para indicaciones del sistema, herramientas, imágenes y PDFs. La respuesta contiene el número total de tokens de entrada.

El conteo de tokens debe considerarse una estimación. En algunos casos, el número real de tokens de entrada utilizados al crear un mensaje puede diferir en una pequeña cantidad.

Los conteos de tokens pueden incluir tokens agregados automáticamente por Anthropic para optimizaciones del sistema. No se te factura por los tokens agregados por el sistema. La facturación refleja solo tu contenido.

Modelos compatibles

Todos los modelos activos admiten el conteo de tokens.

Contar tokens en mensajes básicos

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-7",
    system="You are a scientist",
    messages=[{"role": "user", "content": "Hello, Claude"}],
)

print(response.json())

Output

{ "input_tokens": 14 }

Contar tokens en mensajes con herramientas

Los conteos de tokens de herramientas del servidor solo se aplican a la primera llamada de muestreo.

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-7",
    tools=[
        {
            "name": "get_weather",
            "description": "Get the current weather in a given location",
            "input_schema": {
                "type": "object",
                "properties": {
                    "location": {
                        "type": "string",
                        "description": "The city and state, e.g. San Francisco, CA",
                    }
                },
                "required": ["location"],
            },
        }
    ],
    messages=[{"role": "user", "content": "What's the weather like in San Francisco?"}],
)

print(response.json())

Output

{ "input_tokens": 403 }

Contar tokens en mensajes con imágenes

import base64
import httpx

image_url = "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
image_media_type = "image/jpeg"
image_data = base64.standard_b64encode(httpx.get(image_url).content).decode("utf-8")

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-7",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image_media_type,
                        "data": image_data,
                    },
                },
                {"type": "text", "text": "Describe this image"},
            ],
        }
    ],
)
print(response.json())

Output

{ "input_tokens": 1551 }

Contar tokens en mensajes con pensamiento extendido

Consulta cómo se calcula la ventana de contexto con pensamiento extendido para más detalles

Los bloques de pensamiento de turnos de asistente anteriores se ignoran y no cuentan hacia tus tokens de entrada
El pensamiento del turno de asistente actual sí cuenta hacia tus tokens de entrada

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-sonnet-4-6",
    thinking={"type": "enabled", "budget_tokens": 16000},
    messages=[
        {
            "role": "user",
            "content": "Are there an infinite number of prime numbers such that n mod 4 == 3?",
        },
        {
            "role": "assistant",
            "content": [
                {
                    "type": "thinking",
                    "thinking": "This is a nice number theory question. Let's think about it step by step...",
                    "signature": "EuYBCkQYAiJAgCs1le6/Pol5Z4/JMomVOouGrWdhYNsH3ukzUECbB6iWrSQtsQuRHJID6lWV...",
                },
                {
                    "type": "text",
                    "text": "Yes, there are infinitely many prime numbers p such that p mod 4 = 3...",
                },
            ],
        },
        {"role": "user", "content": "Can you write a formal proof?"},
    ],
)

print(response.json())

Output

{ "input_tokens": 88 }

Contar tokens en mensajes con PDFs

El conteo de tokens admite PDFs con las mismas limitaciones que la API de Mensajes.

import base64
import anthropic

client = anthropic.Anthropic()

with open("document.pdf", "rb") as pdf_file:
    pdf_base64 = base64.standard_b64encode(pdf_file.read()).decode("utf-8")

response = client.messages.count_tokens(
    model="claude-opus-4-7",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_base64,
                    },
                },
                {"type": "text", "text": "Please summarize this document."},
            ],
        }
    ],
)

print(response.json())

Output

{ "input_tokens": 2188 }

Precios y límites de velocidad

El conteo de tokens es gratuito pero está sujeto a límites de velocidad de solicitudes por minuto basados en tu nivel de uso. Si necesitas límites más altos, contacta a ventas a través de la Claude Console.

Nivel de uso	Solicitudes por minuto (RPM)
1	100
2	2,000
3	4,000
4	8,000

El conteo de tokens y la creación de mensajes tienen límites de velocidad separados e independientes. El uso de uno no cuenta contra los límites del otro.

Preguntas frecuentes

Was this page helpful?

ConstruirGestión de contexto

Conteo de tokens

Determina el número de tokens en un mensaje antes de enviarlo a Claude para tomar decisiones informadas sobre tus indicaciones y uso.

Gestionar proactivamente los límites de velocidad y costos
Tomar decisiones inteligentes de enrutamiento de modelos
Optimizar indicaciones para que tengan una longitud específica

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

Cómo contar tokens de mensajes

El conteo de tokens debe considerarse una estimación. En algunos casos, el número real de tokens de entrada utilizados al crear un mensaje puede diferir en una pequeña cantidad.

Modelos compatibles

Todos los modelos activos admiten el conteo de tokens.

Contar tokens en mensajes básicos

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-7",
    system="You are a scientist",
    messages=[{"role": "user", "content": "Hello, Claude"}],
)

print(response.json())

Output

{ "input_tokens": 14 }

Contar tokens en mensajes con herramientas

Los conteos de tokens de herramientas del servidor solo se aplican a la primera llamada de muestreo.

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-7",
    tools=[
        {
            "name": "get_weather",
            "description": "Get the current weather in a given location",
            "input_schema": {
                "type": "object",
                "properties": {
                    "location": {
                        "type": "string",
                        "description": "The city and state, e.g. San Francisco, CA",
                    }
                },
                "required": ["location"],
            },
        }
    ],
    messages=[{"role": "user", "content": "What's the weather like in San Francisco?"}],
)

print(response.json())

Output

{ "input_tokens": 403 }

Contar tokens en mensajes con imágenes

import base64
import httpx

image_url = "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
image_media_type = "image/jpeg"
image_data = base64.standard_b64encode(httpx.get(image_url).content).decode("utf-8")

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-7",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image_media_type,
                        "data": image_data,
                    },
                },
                {"type": "text", "text": "Describe this image"},
            ],
        }
    ],
)
print(response.json())

Output

{ "input_tokens": 1551 }

Contar tokens en mensajes con pensamiento extendido

Consulta cómo se calcula la ventana de contexto con pensamiento extendido para más detalles

Los bloques de pensamiento de turnos de asistente anteriores se ignoran y no cuentan hacia tus tokens de entrada
El pensamiento del turno de asistente actual sí cuenta hacia tus tokens de entrada

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-sonnet-4-6",
    thinking={"type": "enabled", "budget_tokens": 16000},
    messages=[
        {
            "role": "user",
            "content": "Are there an infinite number of prime numbers such that n mod 4 == 3?",
        },
        {
            "role": "assistant",
            "content": [
                {
                    "type": "thinking",
                    "thinking": "This is a nice number theory question. Let's think about it step by step...",
                    "signature": "EuYBCkQYAiJAgCs1le6/Pol5Z4/JMomVOouGrWdhYNsH3ukzUECbB6iWrSQtsQuRHJID6lWV...",
                },
                {
                    "type": "text",
                    "text": "Yes, there are infinitely many prime numbers p such that p mod 4 = 3...",
                },
            ],
        },
        {"role": "user", "content": "Can you write a formal proof?"},
    ],
)

print(response.json())

Output

{ "input_tokens": 88 }

Contar tokens en mensajes con PDFs

El conteo de tokens admite PDFs con las mismas limitaciones que la API de Mensajes.

import base64
import anthropic

client = anthropic.Anthropic()

with open("document.pdf", "rb") as pdf_file:
    pdf_base64 = base64.standard_b64encode(pdf_file.read()).decode("utf-8")

response = client.messages.count_tokens(
    model="claude-opus-4-7",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_base64,
                    },
                },
                {"type": "text", "text": "Please summarize this document."},
            ],
        }
    ],
)

print(response.json())

Output

{ "input_tokens": 2188 }

Precios y límites de velocidad

Nivel de uso	Solicitudes por minuto (RPM)
1	100
2	2,000
3	4,000
4	8,000

El conteo de tokens y la creación de mensajes tienen límites de velocidad separados e independientes. El uso de uno no cuenta contra los límites del otro.

Preguntas frecuentes

Was this page helpful?

Cómo contar tokens de mensajes

Modelos compatibles

Contar tokens en mensajes básicos

Contar tokens en mensajes con herramientas

Contar tokens en mensajes con imágenes

Contar tokens en mensajes con pensamiento extendido

Contar tokens en mensajes con PDFs

Precios y límites de velocidad

Preguntas frecuentes

¿El conteo de tokens utiliza almacenamiento en caché de indicaciones?

Cómo contar tokens de mensajes

Modelos compatibles

Contar tokens en mensajes básicos

Contar tokens en mensajes con herramientas

Contar tokens en mensajes con imágenes

Contar tokens en mensajes con pensamiento extendido

Contar tokens en mensajes con PDFs

Precios y límites de velocidad

Preguntas frecuentes

¿El conteo de tokens utiliza almacenamiento en caché de indicaciones?