Modelos y preciosModelos

Novedades en Claude Sonnet 5

Descripción general de las nuevas funciones y cambios de comportamiento en Claude Sonnet 5.

Claude Sonnet 5 es la próxima generación de la familia de modelos Sonnet de Anthropic. Es una actualización directa de Claude Sonnet 4.6 con tres cambios de comportamiento: el pensamiento adaptativo está activado de forma predeterminada, el pensamiento extendido manual ahora devuelve un error 400 (quedó obsoleto en Claude Sonnet 4.6), y establecer parámetros de muestreo (temperature, top_p, top_k) en valores no predeterminados devuelve un error 400. Esta página resume todas las novedades del lanzamiento, incluido un nuevo tokenizador.

Nuevo modelo

Modelo	ID del modelo en la API	Descripción
Claude Sonnet 5	`claude-sonnet-5`	La mejor combinación de velocidad e inteligencia

Claude Sonnet 5 admite la ventana de contexto de 1M de tokens de forma predeterminada (1M de tokens es tanto el valor predeterminado como el máximo; no existe una variante de contexto más pequeña), 128k tokens máximos de salida, pensamiento adaptativo y el mismo conjunto de herramientas y funciones de plataforma que Claude Sonnet 4.6, excepto Priority Tier, que no está disponible en Claude Sonnet 5.

Para ver los precios y especificaciones completos, consulta la descripción general de modelos.

Cambios de comportamiento

Pensamiento adaptativo activado de forma predeterminada

En Claude Sonnet 4.6, las solicitudes sin un campo thinking se ejecutan sin pensamiento. En Claude Sonnet 5, las mismas solicitudes se ejecutan con pensamiento adaptativo. Para desactivar el pensamiento, pasa thinking: {type: "disabled"}. Dado que max_tokens es un límite estricto sobre la salida total (pensamiento más texto de respuesta), revísalo para cargas de trabajo que se ejecutaban sin pensamiento en Claude Sonnet 4.6.

No se aceptan parámetros de muestreo

Establecer temperature, top_p o top_k en un valor no predeterminado devuelve un error 400. Elimina estos parámetros al migrar; se acepta el valor predeterminado (u omitir el parámetro). Usa instrucciones en la indicación del sistema para guiar el comportamiento del modelo. Esto es nuevo para los modelos de clase Sonnet; la misma restricción se introdujo previamente en Claude Opus 4.7.

Pensamiento extendido manual eliminado

El pensamiento extendido manual (thinking: {type: "enabled", budget_tokens: N}) quedó obsoleto en Claude Sonnet 4.6; en Claude Sonnet 5 se ha eliminado y devuelve un error 400, igual que en Claude Opus 4.8 y Claude Opus 4.7. Usa el pensamiento adaptativo con el parámetro effort en su lugar.

Python

# No compatible con Claude Sonnet 5 (devuelve 400)
thinking = {"type": "enabled", "budget_tokens": 32000}

# Usa esto en su lugar
thinking = {"type": "adaptive"}

Nuevo tokenizador

Claude Sonnet 5 usa un nuevo tokenizador. El mismo texto de entrada produce aproximadamente un 30% más de tokens que en Claude Sonnet 4.6. Esto no es un cambio en la API: las solicitudes, respuestas y eventos de streaming mantienen la misma estructura, y no se requieren cambios de código.

El cambio afecta todo lo que midas o presupuestes en tokens:

Recuentos de tokens: los campos usage y los resultados del conteo de tokens para el mismo texto son más altos que en Claude Sonnet 4.6. No reutilices recuentos medidos con modelos anteriores; vuelve a contar con Claude Sonnet 5.
Capacidad de la ventana de contexto en términos de texto: la ventana de contexto es de 1M de tokens, pero cada token cubre menos texto en promedio, por lo que la misma ventana contiene menos texto que en Claude Sonnet 4.6.
Presupuestos de max_tokens: un límite de salida ajustado para Claude Sonnet 4.6 puede truncar una salida equivalente en Claude Sonnet 5. Revisa los límites dimensionados cerca de la longitud de salida esperada.
Costo por solicitud: el precio por token no cambia (consulta Precios), pero dado que el mismo texto produce más tokens, el costo de una solicitud equivalente puede diferir del de Claude Sonnet 4.6.

Restricciones de la API heredadas de Claude Sonnet 4.6

Esta restricción no cambia respecto a Claude Sonnet 4.6. Aparte de los tres cambios de comportamiento (consulta la Guía de migración), el código que ya se ejecuta en Claude Sonnet 4.6 no necesita otros cambios.

No se admite el prellenado del mensaje del asistente

Prellenar el mensaje del asistente devuelve un error 400, sin cambios respecto a Claude Sonnet 4.6. Usa salidas estructuradas, instrucciones en la indicación del sistema o output_config.format en su lugar.

Mejoras de capacidad

Claude Sonnet 5 es una mejora de capacidad sobre Claude Sonnet 4.6 al mismo precio. También es una opción para cargas de trabajo que necesitan más capacidad de la que proporciona Claude Sonnet 4.6 sin pasar a un modelo de clase Opus.

Las mayores mejoras respecto a Claude Sonnet 4.6 están en tareas de programación y agénticas. Para ver los resultados de los benchmarks, consulta el Transparency Hub de Anthropic.

Salvaguardas de ciberseguridad

Claude Sonnet 5 es el primer modelo de nivel Sonnet con salvaguardas de ciberseguridad en tiempo real. Las solicitudes que involucren temas de ciberseguridad prohibidos o de alto riesgo pueden ser rechazadas. Los rechazos se devuelven como una respuesta HTTP 200 exitosa con stop_reason: "refusal", no como un error. Consulta Salvaguardas, advertencias y apelaciones para obtener más contexto.

Precios

Claude Sonnet 5 tiene un precio de $3 por millón de tokens de entrada y $15 por millón de tokens de salida, sin cambios respecto a Claude Sonnet 4.6. Dado que el nuevo tokenizador produce aproximadamente un 30% más de tokens para el mismo texto, el costo de una solicitud equivalente puede diferir del de Claude Sonnet 4.6 aunque el precio por token no haya cambiado.

El precio introductorio de $2/$10 por millón de tokens de entrada/salida está vigente hasta el 31 de agosto de 2026, después de lo cual entrará en vigor el precio estándar de $3/$15 por millón de tokens de entrada/salida.

Consulta Precios para ver los precios completos, incluidas las tarifas de procesamiento por lotes y almacenamiento en caché de prompts.

Disponibilidad

En el lanzamiento, Claude Sonnet 5 está disponible en:

API de Claude: disponible para todos los clientes.
AWS: disponible a través de Claude en Amazon Bedrock y Claude Platform en AWS. Claude Sonnet 5 no está disponible en Claude en Amazon Bedrock (legacy) (las API InvokeModel y Converse).
Google Cloud: disponible a través de Claude en Google Cloud.
Microsoft Foundry (vista previa): disponible a través de Claude en Microsoft Foundry.

Claude Sonnet 5 admite retención cero de datos para organizaciones con acuerdos ZDR.

Guía de migración

Claude Sonnet 5 es un reemplazo directo de Claude Sonnet 4.6. Actualiza tu ID de modelo:

model = "claude-sonnet-4-6"  # Before
model = "claude-sonnet-5"  # After

Luego revisa lo siguiente:

Presupuestos y recuentos de tokens: el nuevo tokenizador produce aproximadamente un 30% más de tokens para el mismo texto. Vuelve a contar los prompts con el conteo de tokens y revisa los límites de max_tokens dimensionados cerca de la longitud de salida esperada.
Pensamiento extendido: si todavía estableces budget_tokens, migra al pensamiento adaptativo. El pensamiento extendido manual (thinking: {type: "enabled"}) no es compatible y devuelve un error 400.
Parámetros de muestreo: las solicitudes que establecen parámetros de muestreo (temperature, top_p, top_k) en un valor no predeterminado devuelven un error 400; elimínalos al migrar. Las definiciones de herramientas y las estructuras de respuesta no cambian, y el prellenado del mensaje del asistente ya no era compatible en Claude Sonnet 4.6.

Consulta la sección de Claude Sonnet 5 de la guía de migración para obtener más detalles.

Próximos pasos

Descripción general de modelos

Especificaciones y precios completos de todos los modelos actuales de Claude.

Conteo de tokens

Mide tus prompts con el nuevo tokenizador antes de migrar.

Pensamiento adaptativo

El modo de pensamiento activado recomendado en Claude Sonnet 5.

Ventanas de contexto

Cómo funciona la ventana de contexto de 1M de tokens.

Precios

Precios completos, incluidas las tarifas de procesamiento por lotes y almacenamiento en caché de prompts.

Was this page helpful?

Modelos y preciosModelos

Novedades en Claude Sonnet 5

Descripción general de las nuevas funciones y cambios de comportamiento en Claude Sonnet 5.

Nuevo modelo

Modelo	ID del modelo en la API	Descripción
Claude Sonnet 5	`claude-sonnet-5`	La mejor combinación de velocidad e inteligencia

Para ver los precios y especificaciones completos, consulta la descripción general de modelos.

Cambios de comportamiento

Pensamiento adaptativo activado de forma predeterminada

No se aceptan parámetros de muestreo

Pensamiento extendido manual eliminado

Python

# No compatible con Claude Sonnet 5 (devuelve 400)
thinking = {"type": "enabled", "budget_tokens": 32000}

# Usa esto en su lugar
thinking = {"type": "adaptive"}

Nuevo tokenizador

El cambio afecta todo lo que midas o presupuestes en tokens:

Recuentos de tokens: los campos usage y los resultados del conteo de tokens para el mismo texto son más altos que en Claude Sonnet 4.6. No reutilices recuentos medidos con modelos anteriores; vuelve a contar con Claude Sonnet 5.
Capacidad de la ventana de contexto en términos de texto: la ventana de contexto es de 1M de tokens, pero cada token cubre menos texto en promedio, por lo que la misma ventana contiene menos texto que en Claude Sonnet 4.6.
Presupuestos de max_tokens: un límite de salida ajustado para Claude Sonnet 4.6 puede truncar una salida equivalente en Claude Sonnet 5. Revisa los límites dimensionados cerca de la longitud de salida esperada.
Costo por solicitud: el precio por token no cambia (consulta Precios), pero dado que el mismo texto produce más tokens, el costo de una solicitud equivalente puede diferir del de Claude Sonnet 4.6.

Restricciones de la API heredadas de Claude Sonnet 4.6

No se admite el prellenado del mensaje del asistente

Mejoras de capacidad

Las mayores mejoras respecto a Claude Sonnet 4.6 están en tareas de programación y agénticas. Para ver los resultados de los benchmarks, consulta el Transparency Hub de Anthropic.

Salvaguardas de ciberseguridad

Precios

Consulta Precios para ver los precios completos, incluidas las tarifas de procesamiento por lotes y almacenamiento en caché de prompts.

Disponibilidad

En el lanzamiento, Claude Sonnet 5 está disponible en:

API de Claude: disponible para todos los clientes.
AWS: disponible a través de Claude en Amazon Bedrock y Claude Platform en AWS. Claude Sonnet 5 no está disponible en Claude en Amazon Bedrock (legacy) (las API InvokeModel y Converse).
Google Cloud: disponible a través de Claude en Google Cloud.
Microsoft Foundry (vista previa): disponible a través de Claude en Microsoft Foundry.

Claude Sonnet 5 admite retención cero de datos para organizaciones con acuerdos ZDR.

Guía de migración

Claude Sonnet 5 es un reemplazo directo de Claude Sonnet 4.6. Actualiza tu ID de modelo:

model = "claude-sonnet-4-6"  # Before
model = "claude-sonnet-5"  # After

Luego revisa lo siguiente:

Presupuestos y recuentos de tokens: el nuevo tokenizador produce aproximadamente un 30% más de tokens para el mismo texto. Vuelve a contar los prompts con el conteo de tokens y revisa los límites de max_tokens dimensionados cerca de la longitud de salida esperada.
Pensamiento extendido: si todavía estableces budget_tokens, migra al pensamiento adaptativo. El pensamiento extendido manual (thinking: {type: "enabled"}) no es compatible y devuelve un error 400.
Parámetros de muestreo: las solicitudes que establecen parámetros de muestreo (temperature, top_p, top_k) en un valor no predeterminado devuelven un error 400; elimínalos al migrar. Las definiciones de herramientas y las estructuras de respuesta no cambian, y el prellenado del mensaje del asistente ya no era compatible en Claude Sonnet 4.6.

Consulta la sección de Claude Sonnet 5 de la guía de migración para obtener más detalles.

Próximos pasos

Descripción general de modelos

Especificaciones y precios completos de todos los modelos actuales de Claude.

Conteo de tokens

Mide tus prompts con el nuevo tokenizador antes de migrar.

Pensamiento adaptativo

El modo de pensamiento activado recomendado en Claude Sonnet 5.

Ventanas de contexto

Cómo funciona la ventana de contexto de 1M de tokens.

Precios

Precios completos, incluidas las tarifas de procesamiento por lotes y almacenamiento en caché de prompts.

Was this page helpful?

Nuevo modelo

Cambios de comportamiento

Pensamiento adaptativo activado de forma predeterminada

No se aceptan parámetros de muestreo

Pensamiento extendido manual eliminado

Nuevo tokenizador

Restricciones de la API heredadas de Claude Sonnet 4.6

No se admite el prellenado del mensaje del asistente

Mejoras de capacidad

Salvaguardas de ciberseguridad

Precios

Disponibilidad

Guía de migración

Próximos pasos

Nuevo modelo

Cambios de comportamiento

Pensamiento adaptativo activado de forma predeterminada

No se aceptan parámetros de muestreo

Pensamiento extendido manual eliminado

Nuevo tokenizador

Restricciones de la API heredadas de Claude Sonnet 4.6

No se admite el prellenado del mensaje del asistente

Mejoras de capacidad

Salvaguardas de ciberseguridad

Precios

Disponibilidad

Guía de migración

Próximos pasos

Nuevo modelo

Cambios de comportamiento

Pensamiento adaptativo activado de forma predeterminada

No se aceptan parámetros de muestreo

Pensamiento extendido manual eliminado

Nuevo tokenizador

Restricciones de la API heredadas de Claude Sonnet 4.6

No se admite el prellenado del mensaje del asistente

Mejoras de capacidad

Salvaguardas de ciberseguridad

Precios

Disponibilidad

Guía de migración

Próximos pasos

Nuevo modelo

Cambios de comportamiento

Pensamiento adaptativo activado de forma predeterminada

No se aceptan parámetros de muestreo

Pensamiento extendido manual eliminado

Nuevo tokenizador

Restricciones de la API heredadas de Claude Sonnet 4.6

No se admite el prellenado del mensaje del asistente

Mejoras de capacidad

Salvaguardas de ciberseguridad

Precios

Disponibilidad

Guía de migración

Próximos pasos