Claude Sonnet 5 es la próxima generación de la familia de modelos Sonnet de Anthropic. Es una actualización directa de Claude Sonnet 4.6 con tres cambios de comportamiento: el pensamiento adaptativo está activado de forma predeterminada, el pensamiento extendido manual ahora devuelve un error 400 (quedó obsoleto en Claude Sonnet 4.6), y establecer parámetros de muestreo (temperature, top_p, top_k) en valores no predeterminados devuelve un error 400. Esta página resume todas las novedades del lanzamiento, incluido un nuevo tokenizador.
| Modelo | ID del modelo en la API | Descripción |
|---|---|---|
| Claude Sonnet 5 | claude-sonnet-5 | La mejor combinación de velocidad e inteligencia |
Claude Sonnet 5 admite la ventana de contexto de 1M de tokens de forma predeterminada (1M de tokens es tanto el valor predeterminado como el máximo; no existe una variante de contexto más pequeña), 128k tokens máximos de salida, pensamiento adaptativo y el mismo conjunto de herramientas y funciones de plataforma que Claude Sonnet 4.6, excepto Priority Tier, que no está disponible en Claude Sonnet 5.
Para ver los precios y especificaciones completos, consulta la descripción general de modelos.
En Claude Sonnet 4.6, las solicitudes sin un campo thinking se ejecutan sin pensamiento. En Claude Sonnet 5, las mismas solicitudes se ejecutan con pensamiento adaptativo. Para desactivar el pensamiento, pasa thinking: {type: "disabled"}. Dado que max_tokens es un límite estricto sobre la salida total (pensamiento más texto de respuesta), revísalo para cargas de trabajo que se ejecutaban sin pensamiento en Claude Sonnet 4.6.
Establecer temperature, top_p o top_k en un valor no predeterminado devuelve un error 400. Elimina estos parámetros al migrar; se acepta el valor predeterminado (u omitir el parámetro). Usa instrucciones en la indicación del sistema para guiar el comportamiento del modelo. Esto es nuevo para los modelos de clase Sonnet; la misma restricción se introdujo previamente en Claude Opus 4.7.
El pensamiento extendido manual (thinking: {type: "enabled", budget_tokens: N}) quedó obsoleto en Claude Sonnet 4.6; en Claude Sonnet 5 se ha eliminado y devuelve un error 400, igual que en Claude Opus 4.8 y Claude Opus 4.7. Usa el pensamiento adaptativo con el parámetro effort en su lugar.
# No compatible con Claude Sonnet 5 (devuelve 400)
thinking = {"type": "enabled", "budget_tokens": 32000}
# Usa esto en su lugar
thinking = {"type": "adaptive"}Claude Sonnet 5 usa un nuevo tokenizador. El mismo texto de entrada produce aproximadamente un 30% más de tokens que en Claude Sonnet 4.6. Esto no es un cambio en la API: las solicitudes, respuestas y eventos de streaming mantienen la misma estructura, y no se requieren cambios de código.
El cambio afecta todo lo que midas o presupuestes en tokens:
usage y los resultados del conteo de tokens para el mismo texto son más altos que en Claude Sonnet 4.6. No reutilices recuentos medidos con modelos anteriores; vuelve a contar con Claude Sonnet 5.max_tokens: un límite de salida ajustado para Claude Sonnet 4.6 puede truncar una salida equivalente en Claude Sonnet 5. Revisa los límites dimensionados cerca de la longitud de salida esperada.Esta restricción no cambia respecto a Claude Sonnet 4.6. Aparte de los tres cambios de comportamiento (consulta la Guía de migración), el código que ya se ejecuta en Claude Sonnet 4.6 no necesita otros cambios.
Prellenar el mensaje del asistente devuelve un error 400, sin cambios respecto a Claude Sonnet 4.6. Usa salidas estructuradas, instrucciones en la indicación del sistema o output_config.format en su lugar.
Claude Sonnet 5 es una mejora de capacidad sobre Claude Sonnet 4.6 al mismo precio. También es una opción para cargas de trabajo que necesitan más capacidad de la que proporciona Claude Sonnet 4.6 sin pasar a un modelo de clase Opus.
Las mayores mejoras respecto a Claude Sonnet 4.6 están en tareas de programación y agénticas. Para ver los resultados de los benchmarks, consulta el Transparency Hub de Anthropic.
Claude Sonnet 5 es el primer modelo de nivel Sonnet con salvaguardas de ciberseguridad en tiempo real. Las solicitudes que involucren temas de ciberseguridad prohibidos o de alto riesgo pueden ser rechazadas. Los rechazos se devuelven como una respuesta HTTP 200 exitosa con stop_reason: "refusal", no como un error. Consulta Salvaguardas, advertencias y apelaciones para obtener más contexto.
Claude Sonnet 5 tiene un precio de $3 por millón de tokens de entrada y $15 por millón de tokens de salida, sin cambios respecto a Claude Sonnet 4.6. Dado que el nuevo tokenizador produce aproximadamente un 30% más de tokens para el mismo texto, el costo de una solicitud equivalente puede diferir del de Claude Sonnet 4.6 aunque el precio por token no haya cambiado.
El precio introductorio de $2/$10 por millón de tokens de entrada/salida está vigente hasta el 31 de agosto de 2026, después de lo cual entrará en vigor el precio estándar de $3/$15 por millón de tokens de entrada/salida.
Consulta Precios para ver los precios completos, incluidas las tarifas de procesamiento por lotes y almacenamiento en caché de prompts.
En el lanzamiento, Claude Sonnet 5 está disponible en:
InvokeModel y Converse).Claude Sonnet 5 admite retención cero de datos para organizaciones con acuerdos ZDR.
Claude Sonnet 5 es un reemplazo directo de Claude Sonnet 4.6. Actualiza tu ID de modelo:
model = "claude-sonnet-4-6" # Before
model = "claude-sonnet-5" # AfterLuego revisa lo siguiente:
max_tokens dimensionados cerca de la longitud de salida esperada.budget_tokens, migra al pensamiento adaptativo. El pensamiento extendido manual (thinking: {type: "enabled"}) no es compatible y devuelve un error 400.temperature, top_p, top_k) en un valor no predeterminado devuelven un error 400; elimínalos al migrar. Las definiciones de herramientas y las estructuras de respuesta no cambian, y el prellenado del mensaje del asistente ya no era compatible en Claude Sonnet 4.6.Consulta la sección de Claude Sonnet 5 de la guía de migración para obtener más detalles.
Especificaciones y precios completos de todos los modelos actuales de Claude.
Mide tus prompts con el nuevo tokenizador antes de migrar.
El modo de pensamiento activado recomendado en Claude Sonnet 5.
Cómo funciona la ventana de contexto de 1M de tokens.
Precios completos, incluidas las tarifas de procesamiento por lotes y almacenamiento en caché de prompts.
Was this page helpful?