Loading...
  • Construir
  • Administración
  • Modelos y precios
  • SDKs de cliente
  • Referencia de API
Search...
⌘K
Modelos
Descripción general de modelosElegir un modeloNovedades en Claude Opus 4.7Guía de migraciónDeprecaciones de modelosTarjetas de modelosPrompts del sistema
Precios
Precios
Log in
Precios
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Modelos y precios/Precios

Precios

Aprende sobre la estructura de precios de Anthropic para modelos y características

Esta página proporciona información detallada sobre precios para los modelos y características de Anthropic. Todos los precios están en USD.

Para obtener la información de precios más actual, visita claude.com/pricing.

Precios de modelos

La siguiente tabla muestra los precios para todos los modelos Claude en diferentes niveles de uso:

ModelBase Input Tokens5m Cache Writes1h Cache WritesCache Hits & RefreshesOutput Tokens
Claude Opus 4.7$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.6$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.5$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.1$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Opus 4 (deprecated)$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Sonnet 4.6$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 4.5$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 4 (deprecated)$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Haiku 4.5$1 / MTok$1.25 / MTok$2 / MTok$0.10 / MTok$5 / MTok
Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI)$0.80 / MTok$1 / MTok$1.60 / MTok$0.08 / MTok$4 / MTok

MTok = Millones de tokens. La columna "Base Input Tokens" muestra los precios de entrada estándar, "Cache Writes" y "Cache Hits" son específicos del almacenamiento en caché de prompts, y "Output Tokens" muestra los precios de salida. Consulta la sección precios de almacenamiento en caché de prompts a continuación para obtener una explicación de las columnas de caché y los multiplicadores de precios.

Opus 4.7 utiliza un nuevo tokenizador en comparación con modelos anteriores, lo que contribuye a su rendimiento mejorado en una amplia gama de tareas. Este nuevo tokenizador puede usar hasta un 35% más de tokens para el mismo texto fijo.

Precios de plataformas de terceros

Los modelos Claude están disponibles en AWS Bedrock, Google Vertex AI, y Microsoft Foundry. Para obtener precios oficiales, visita:

  • Precios de AWS Bedrock
  • Precios de Google Vertex AI
  • Precios de Microsoft Foundry

Precios de puntos finales regionales y multirregionales para modelos Claude 4.5 y posteriores

A partir de Claude Sonnet 4.5 y Haiku 4.5:

  • AWS Bedrock ofrece dos tipos de puntos finales: puntos finales globales (enrutamiento dinámico para máxima disponibilidad) y puntos finales regionales (enrutamiento de datos garantizado a través de regiones geográficas específicas).
  • Google Vertex AI ofrece tres tipos de puntos finales: puntos finales globales, puntos finales multirregionales (enrutamiento dinámico dentro de un área geográfica) y puntos finales regionales.

Los puntos finales regionales y multirregionales incluyen una prima del 10% sobre los puntos finales globales. La Claude API (1P) es global por defecto; para opciones de residencia de datos 1P y precios, consulta Precios de residencia de datos a continuación.

Alcance: Esta estructura de precios se aplica a Claude Sonnet 4.5, Haiku 4.5 y todos los modelos futuros. Los modelos anteriores (Claude Sonnet 4 (deprecated), Opus 4 (deprecated) y versiones anteriores) mantienen sus precios existentes.

Para detalles de implementación y ejemplos de código:

  • Puntos finales globales vs regionales de AWS Bedrock
  • Puntos finales globales, multirregionales y regionales de Google Vertex AI

Precios específicos de características

Almacenamiento en caché de prompts

El almacenamiento en caché de prompts reduce costos y latencia al reutilizar porciones previamente procesadas de tu prompt en llamadas API. En lugar de reprocesar el mismo prompt del sistema grande, documento o historial de conversación en cada solicitud, la API lee desde el caché a una fracción del precio de entrada estándar.

Hay dos formas de habilitar el almacenamiento en caché de prompts:

  • Almacenamiento en caché automático: Agrega un único campo cache_control en el nivel superior de tu solicitud. El sistema administra automáticamente los puntos de ruptura de caché a medida que crecen las conversaciones. Este es el punto de partida recomendado para la mayoría de los casos de uso.
  • Puntos de ruptura de caché explícitos: Coloca cache_control directamente en bloques de contenido individuales para un control granular sobre exactamente qué se almacena en caché.

El almacenamiento en caché de prompts utiliza los siguientes multiplicadores de precios relativos a las tasas de tokens de entrada base:

Operación de cachéMultiplicadorDuración
Escritura de caché de 5 minutos1.25x precio de entrada baseCaché válido por 5 minutos
Escritura de caché de 1 hora2x precio de entrada baseCaché válido por 1 hora
Lectura de caché (acierto)0.1x precio de entrada baseMisma duración que la escritura anterior

Los tokens de escritura de caché se cobran cuando el contenido se almacena por primera vez. Los tokens de lectura de caché se cobran cuando una solicitud posterior recupera el contenido almacenado en caché. Un acierto de caché cuesta el 10% del precio de entrada estándar, lo que significa que el almacenamiento en caché se amortiza después de solo una lectura de caché para la duración de 5 minutos (1.25x escritura), o después de dos lecturas de caché para la duración de 1 hora (2x escritura).

Estos multiplicadores se apilan con otros modificadores de precios, incluido el descuento de Batch API y la residencia de datos.

Para detalles de implementación, modelos compatibles y ejemplos de código, consulta la documentación de almacenamiento en caché de prompts.

Precios de residencia de datos

Para Claude Opus 4.7, Claude Opus 4.6 y modelos más nuevos, especificar inferencia solo para EE.UU. a través del parámetro inference_geo incurre en un multiplicador de 1.1x en todas las categorías de precios de tokens, incluidos tokens de entrada, tokens de salida, escrituras de caché y lecturas de caché. El enrutamiento global (el predeterminado) utiliza precios estándar.

Esto se aplica solo a la Claude API (1P). Las plataformas de terceros tienen sus propios precios regionales. Consulta AWS Bedrock y Google Vertex AI para obtener detalles. Los modelos anteriores mantienen sus precios existentes independientemente de la configuración de inference_geo.

Para más información, consulta la documentación de residencia de datos.

Precios del modo rápido

Modo rápido (beta: vista previa de investigación) para Claude Opus 4.6 proporciona una salida significativamente más rápida a precios premium (6x tasas estándar). Los precios del modo rápido se aplican en toda la ventana de contexto, incluidas solicitudes con más de 200k tokens de entrada. Actualmente compatible con Opus 4.6:

EntradaSalida
$30 / MTok$150 / MTok

Los precios del modo rápido se apilan con otros modificadores de precios:

  • Los multiplicadores de almacenamiento en caché de prompts se aplican sobre los precios del modo rápido
  • Los multiplicadores de residencia de datos se aplican sobre los precios del modo rápido

El modo rápido no está disponible con la Batch API.

Para más información, consulta la documentación del modo rápido.

Procesamiento por lotes

La Batch API permite el procesamiento asincrónico de grandes volúmenes de solicitudes con un descuento del 50% en tokens de entrada y salida.

ModelBatch inputBatch output
Claude Opus 4.7$2.50 / MTok$12.50 / MTok
Claude Opus 4.6$2.50 / MTok$12.50 / MTok
Claude Opus 4.5$2.50 / MTok$12.50 / MTok
Claude Opus 4.1$7.50 / MTok$37.50 / MTok
Claude Opus 4 (deprecated)$7.50 / MTok$37.50 / MTok
Claude Sonnet 4.6$1.50 / MTok$7.50 / MTok
Claude Sonnet 4.5$1.50 / MTok$7.50 / MTok
Claude Sonnet 4 (deprecated)$1.50 / MTok$7.50 / MTok
Claude Haiku 4.5$0.50 / MTok$2.50 / MTok
Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI)$0.40 / MTok$2 / MTok

Para más información sobre procesamiento por lotes, consulta la documentación de procesamiento por lotes.

Precios de contexto largo

Claude Mythos Preview, Opus 4.7, Opus 4.6 y Sonnet 4.6 incluyen la ventana de contexto completa de 1M tokens a precios estándar. (Una solicitud de 900k tokens se factura a la misma tasa por token que una solicitud de 9k tokens.) Los descuentos de almacenamiento en caché de prompts y procesamiento por lotes se aplican a tasas estándar en toda la ventana de contexto.

Precios de uso de herramientas

Tool use requests are priced based on:

  1. The total number of input tokens sent to the model (including in the tools parameter)
  2. The number of output tokens generated
  3. For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

The additional tokens from tool use come from:

  • The tools parameter in API requests (tool names, descriptions, and schemas)
  • tool_use content blocks in API requests and responses
  • tool_result content blocks in API requests

When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

ModelTool choiceTool use system prompt token count
Claude Opus 4.7auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.6auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.1auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4 (deprecated)auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4.6auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4 (deprecated)auto, none
any, tool
346 tokens
313 tokens
Claude Haiku 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI)auto, none
any, tool
264 tokens
340 tokens

These token counts are added to your normal input and output tokens to calculate the total cost of a request.

Para precios actuales por modelo, consulta la sección precios de modelos.

Para más información sobre implementación de uso de herramientas y mejores prácticas, consulta la documentación de uso de herramientas.

Precios de herramientas específicas

Herramienta Bash

The bash tool adds 245 input tokens to your API calls.

Additional tokens are consumed by:

  • Command outputs (stdout/stderr)
  • Error messages
  • Large file contents

Consulta precios de uso de herramientas para obtener detalles de precios completos.

Herramienta de ejecución de código

Code execution is free when used with web search or web fetch. When web_search_20260209 or web_fetch_20260209 is included in your API request, there are no additional charges for code execution tool calls beyond the standard input and output token costs.

When used without these tools, code execution is billed by execution time, tracked separately from token usage:

  • Execution time has a minimum of 5 minutes
  • Each organization receives 1,550 free hours of usage per month
  • Additional usage beyond 1,550 hours is billed at $0.05 per hour, per container
  • If files are included in the request, execution time is billed even if the tool is not invoked, due to files being preloaded onto the container

Code execution usage is tracked in the response:

"usage": {
  "input_tokens": 105,
  "output_tokens": 239,
  "server_tool_use": {
    "code_execution_requests": 1
  }
}

Herramienta de editor de texto

The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.

In addition to the base tokens, the following additional input tokens are needed for the text editor tool:

ToolAdditional input tokens
text_editor_20250429 (Claude 4.x)700 tokens

Consulta precios de uso de herramientas para obtener detalles de precios completos.

Herramienta de búsqueda web

Web search usage is charged in addition to token usage:

"usage": {
  "input_tokens": 105,
  "output_tokens": 6039,
  "cache_read_input_tokens": 7123,
  "cache_creation_input_tokens": 7345,
  "server_tool_use": {
    "web_search_requests": 1
  }
}

Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.

Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

Herramienta de obtención web

Web fetch usage has no additional charges beyond standard token costs:

"usage": {
  "input_tokens": 25039,
  "output_tokens": 931,
  "cache_read_input_tokens": 0,
  "cache_creation_input_tokens": 0,
  "server_tool_use": {
    "web_fetch_requests": 1
  }
}

The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.

To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.

Example token usage for typical content:

  • Average web page (10 kB): ~2,500 tokens
  • Large documentation page (100 kB): ~25,000 tokens
  • Research paper PDF (500 kB): ~125,000 tokens

Herramienta de uso de computadora

Computer use follows the standard tool use pricing. When using the computer use tool:

System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt

Computer use tool token usage:

ModelInput tokens per tool definition
Claude 4.x models735 tokens

Additional token consumption:

  • Screenshot images (see Vision pricing)
  • Tool execution results returned to Claude

If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

Precios de Claude Managed Agents

Claude Managed Agents se factura en dos dimensiones: tokens y tiempo de ejecución de sesión.

Tokens

Todos los tokens consumidos por una sesión de Claude Managed Agents se facturan a las tasas mostradas en Precios de modelos anteriormente. Los multiplicadores de almacenamiento en caché de prompts se aplican de manera idéntica. La búsqueda web activada dentro de una sesión incurre en los $10 estándar por 1,000 búsquedas.

Los siguientes modificadores de Messages API no se aplican a sesiones de Claude Managed Agents:

ModificadorPor qué no se aplica
Descuento de Batch APILas sesiones son con estado e interactivas. No hay modo de lote.
Prima del modo rápidoLa velocidad de inferencia es administrada por el tiempo de ejecución.
Multiplicador de residencia de datosinference_geo es un campo de solicitud de Messages API.
Prima de contexto largoLa ventana de contexto es administrada por el tiempo de ejecución.
Precios de plataforma de tercerosClaude Managed Agents está disponible solo a través de la Claude API directamente.

Tiempo de ejecución de sesión

SKUTasaMedición
Tiempo de ejecución de sesión$0.08 por hora de sesiónDuración del estado running

El tiempo de ejecución se mide hasta el milisegundo y se acumula solo mientras el estado de la sesión es running. El tiempo pasado idle (esperando tu próximo mensaje o confirmación de herramienta), rescheduling o terminated no cuenta hacia el tiempo de ejecución.

El tiempo de ejecución de sesión reemplaza el modelo de facturación de horas de contenedor de Code Execution cuando se usa Claude Managed Agents. No se te factura por separado por horas de contenedor además del tiempo de ejecución de sesión.

Ejemplo trabajado

Una sesión de codificación de una hora usando Claude Opus 4.7 que consume 50,000 tokens de entrada y 15,000 tokens de salida:

Elemento de líneaCálculoCosto
Tokens de entrada50,000 × $5 / 1,000,000$0.25
Tokens de salida15,000 × $25 / 1,000,000$0.375
Tiempo de ejecución de sesión1.0 hora × $0.08$0.08
Total$0.705

Si el almacenamiento en caché de prompts está activo y 40,000 de los tokens de entrada son lecturas de caché:

Elemento de líneaCálculoCosto
Tokens de entrada sin caché10,000 × $5 / 1,000,000$0.05
Tokens de lectura de caché40,000 × $5 × 0.1 / 1,000,000$0.02
Tokens de salida15,000 × $25 / 1,000,000$0.375
Tiempo de ejecución de sesión1.0 hora × $0.08$0.08
Total$0.525

Cálculo de ejemplo para procesar 10,000 tickets de soporte:

  • Aproximadamente ~3,700 tokens por conversación
  • Usando Claude Haiku 4.5 a $1/MTok entrada, $5/MTok salida
  • Costo total: ~$37.00 por 10,000 tickets

Para un recorrido detallado de este cálculo, consulta la guía de agente de soporte al cliente.

Consideraciones de precios adicionales

Estrategias de optimización de costos

Al construir agentes con Claude:

  1. Usa modelos apropiados: Elige Haiku para tareas simples, Sonnet para razonamiento complejo
  2. Implementa almacenamiento en caché de prompts: Reduce costos para contexto repetido
  3. Operaciones por lotes: Usa la Batch API para tareas no sensibles al tiempo
  4. Monitorea patrones de uso: Rastrea el consumo de tokens para identificar oportunidades de optimización

Para aplicaciones de agentes de alto volumen, contacta al equipo de ventas empresariales para arreglos de precios personalizados.

Límites de velocidad

Los límites de velocidad varían según el nivel de uso y afectan cuántas solicitudes puedes hacer:

  • Nivel 1: Uso de nivel de entrada con límites básicos
  • Nivel 2: Límites aumentados para aplicaciones en crecimiento
  • Nivel 3: Límites más altos para aplicaciones establecidas
  • Nivel 4: Límites estándar máximos
  • Empresa: Límites personalizados disponibles

Para información detallada sobre límites de velocidad, consulta la documentación de límites de velocidad.

Para límites de velocidad más altos o arreglos de precios personalizados, contacta al equipo de ventas.

Descuentos por volumen

Los descuentos por volumen pueden estar disponibles para usuarios de alto volumen. Estos se negocian caso por caso.

  • Los niveles estándar utilizan los precios mostrados anteriormente
  • Los clientes empresariales pueden contactar a ventas para precios personalizados
  • Los descuentos académicos y de investigación pueden estar disponibles

Precios empresariales

Para clientes empresariales con necesidades específicas:

  • Límites de velocidad personalizados
  • Descuentos por volumen
  • Soporte dedicado
  • Términos personalizados

Contacta al equipo de ventas en [email protected] o a través de la Claude Console para discutir opciones de precios empresariales.

Facturación y pago

  • La facturación se basa en el uso mensual real
  • Todos los pagos están en USD
  • Opciones de tarjeta de crédito y facturación disponibles
  • Seguimiento de uso disponible en la Claude Console

Preguntas frecuentes

¿Cómo se calcula el uso de tokens?

Los tokens son piezas de texto que procesan los modelos. Como estimación aproximada, 1 token es aproximadamente 4 caracteres o 0.75 palabras en inglés. El conteo exacto varía según el idioma y el tipo de contenido.

¿Hay niveles gratuitos o pruebas?

Los nuevos usuarios reciben una pequeña cantidad de créditos gratuitos para probar la API. Contacta a ventas para obtener información sobre pruebas extendidas para evaluación empresarial.

¿Cómo se apilan los descuentos?

Los descuentos de Batch API y almacenamiento en caché de prompts se pueden combinar. Por ejemplo, usar ambas características juntas proporciona ahorros de costos significativos en comparación con llamadas API estándar. Consulta precios de almacenamiento en caché de prompts para ver cómo interactúan los multiplicadores.

¿Qué métodos de pago se aceptan?

Se aceptan tarjetas de crédito principales para cuentas estándar. Los clientes empresariales pueden arreglar facturación y otros métodos de pago.

Para preguntas adicionales sobre precios, contacta a [email protected].

Was this page helpful?

  • Precios de modelos
  • Precios de plataformas de terceros
  • Precios específicos de características
  • Almacenamiento en caché de prompts
  • Precios de residencia de datos
  • Precios del modo rápido
  • Procesamiento por lotes
  • Precios de contexto largo
  • Precios de uso de herramientas
  • Precios de herramientas específicas
  • Precios de Claude Managed Agents
  • Tokens
  • Tiempo de ejecución de sesión
  • Ejemplo trabajado
  • Consideraciones de precios adicionales
  • Estrategias de optimización de costos
  • Límites de velocidad
  • Descuentos por volumen
  • Precios empresariales
  • Facturación y pago
  • Preguntas frecuentes