Modelos y preciosModelos

Novedades en Claude Opus 5

Resumen de las nuevas funciones y cambios de comportamiento en Claude Opus 5.

Claude Opus 5 es una mejora radical con respecto a Claude Opus 4.8, con las mayores ganancias en razonamiento profundo, tareas agénticas y de largo horizonte, y escalado de cómputo en tiempo de prueba. Esta página resume todo lo nuevo en Claude Opus 5, incluyendo el pensamiento activado por defecto, los cambios de herramientas a mitad de conversación y un cambio incompatible sobre cuándo se puede desactivar el pensamiento.

Nuevo modelo

Modelo	ID de modelo de API	Descripción
Claude Opus 5	`claude-opus-5`	Para codificación agéntica compleja y trabajo empresarial

Claude Opus 5 tiene una ventana de contexto de 1M de tokens (1M de tokens es tanto el valor predeterminado como el máximo; no existe una variante de contexto más pequeña), 128k tokens máximos de salida y pensamiento activado por defecto.

Para ver los precios y especificaciones completos, consulta la descripción general de modelos.

Nuevas funciones

Cambios de herramientas a mitad de conversación (beta)

Puedes agregar o eliminar herramientas entre turnos de una conversación mientras preservas la caché de prompts, en lugar de reenviar una lista fija de herramientas durante toda la sesión. Los cambios de herramientas a mitad de conversación están en beta: incluye el encabezado beta mid-conversation-tool-changes-2026-07-01 en tus solicitudes. Consulta Cambios de herramientas a mitad de conversación para conocer su uso.

Modo de fallbacks predeterminado

El parámetro fallbacks admite un nuevo modo "default", que aplica los modelos de respaldo recomendados por Anthropic según la categoría de rechazo en lugar de una lista de modelos que mantienes tú mismo. Todo el parámetro fallbacks está en beta. Usa el encabezado beta server-side-fallback-2026-07-01, que admite tanto el modo "default" como listas explícitas de modelos (el encabezado anterior server-side-fallback-2026-06-01 acepta solo listas explícitas). Consulta Rechazos y fallback.

Mínimo más bajo para la caché de prompts

La longitud mínima de prompt almacenable en caché en Claude Opus 5 es de 512 tokens, por debajo de los 1,024 tokens en Claude Opus 4.8. Los prompts que eran demasiado cortos para almacenarse en caché en Claude Opus 4.8 ahora pueden crear entradas de caché sin cambios en el código. Consulta Almacenamiento en caché de prompts para ver los mínimos por modelo.

Modo rápido

El modo rápido (vista previa de investigación) está disponible para Claude Opus 5 solo en la API de Claude; actualmente no está disponible en Amazon Bedrock, Google Cloud ni Microsoft Foundry. El modo rápido para Claude Opus 5 tiene un precio de $10 por millón de tokens de entrada y $50 por millón de tokens de salida. Consulta Modo rápido para conocer el acceso, los modelos compatibles y los precios.

Cambios de comportamiento

Pensamiento activado por defecto

En Claude Opus 4.8, las solicitudes se ejecutan sin pensamiento a menos que establezcas thinking: {"type": "adaptive"}. En Claude Opus 5, las mismas solicitudes se ejecutan con el pensamiento activado: el modelo decide cuándo y cuánto pensar en cada turno, y el parámetro effort es el control de la profundidad del pensamiento. El valor en el protocolo no cambia; thinking: {"type": "adaptive"} sigue siendo válido y equivalente al valor predeterminado.

Debido a que max_tokens es un límite estricto sobre la salida total (pensamiento más texto de respuesta), revísalo para las cargas de trabajo que se ejecutaban sin pensamiento en Claude Opus 4.8.

La API mantiene la opción de desactivar el pensamiento, sujeta a la restricción de effort que se describe a continuación.

El effort importa más

Claude Opus 5 convierte el effort adicional en mejores resultados de manera más confiable que cualquier modelo Opus anterior, por lo que el nivel de effort que elijas tiene más peso. La escala completa está disponible: low, medium, high, xhigh y max, con max como el nivel superior para el razonamiento más profundo posible. Comienza con el valor predeterminado, high, y ajusta en cualquier dirección según tus evaluaciones: baja un nivel donde la calidad se mantenga para ahorrar tokens y latencia, o sube un nivel para el trabajo más exigente. Cuando ejecutes con effort xhigh o max, establece un max_tokens grande para que el modelo tenga espacio para pensar y actuar a través de subagentes y llamadas a herramientas.

Esta solicitud sube el effort al máximo con max:

client = anthropic.Anthropic()

with client.messages.stream(
    model="claude-opus-5",
    max_tokens=64000,
    output_config={"effort": "max"},
    messages=[
        {
            "role": "user",
            "content": "Explain why the sum of two even numbers is always even.",
        }
    ],
) as stream:
    response = stream.get_final_message()

print(response)

El pensamiento está activado por defecto en Claude Opus 5, por lo que no se necesita el campo thinking.

Desactivar el pensamiento requiere effort `high` o inferior

En Claude Opus 5, thinking: {"type": "disabled"} se acepta solo cuando el nivel de effort es high o inferior. Establecer thinking: {"type": "disabled"} con effort xhigh o max devuelve un error 400. Este es un comportamiento disponible de forma general en Claude Opus 5 en adelante, se aplica en cada solicitud, y es un cambio incompatible con respecto a Claude Opus 4.8, donde desactivar el pensamiento era independiente del nivel de effort. Si hoy desactivas el pensamiento en niveles altos de effort, mantén el pensamiento desactivado y establece el effort en high o inferior, o mantén el nivel de effort y elimina el campo thinking.

Con el pensamiento desactivado, Claude Opus 5 puede ocasionalmente escribir una llamada a herramienta en su salida de texto en lugar de emitir un bloque tool_use, o incluir etiquetas XML internas en su respuesta visible. Cuando sea posible, mantén el pensamiento habilitado y controla el costo de tokens con niveles de effort más bajos; para integraciones que deben mantener el pensamiento desactivado, consulta Ejecutar con el pensamiento desactivado para conocer mitigaciones mediante prompts.

Diferencias de comportamiento del modelo

Más allá de los cambios de API anteriores, Claude Opus 5 se comporta de manera diferente a Claude Opus 4.8 en formas que puedes notar sin cambiar ningún código. Las respuestas predeterminadas dirigidas al usuario y los entregables escritos son más largos. En sesiones agénticas, el modelo narra su progreso al usuario con más frecuencia. En frameworks multiagente, delega a subagentes con mayor facilidad. También verifica su propio trabajo sin que se le indique, así que elimina las instrucciones de verificación heredadas de modelos anteriores ("incluye un paso final de verificación", "usa un subagente para verificar"); causan una verificación excesiva en Claude Opus 5. Para conocer los patrones de prompting que ajustan cada uno de estos comportamientos, consulta Prompting para Claude Opus 5.

Mejoras de capacidades

En comparación con Claude Opus 4.8, Claude Opus 5 es una mejora radical en lugar de una incremental, y ofrece inteligencia de frontera a la mitad del costo de Claude Fable 5. Las mayores ganancias están en:

Razonamiento profundo, sosteniendo análisis de múltiples pasos a lo largo de cadenas largas de problemas.
Codificación agéntica y tareas de largo horizonte, manteniéndose enfocado en la tarea a lo largo de bucles extendidos de uso de herramientas y completando funciones de múltiples archivos, refactorizaciones más grandes y trabajo de funciones de extremo a extremo sin dejar stubs ni marcadores de posición.
Escalado de cómputo en tiempo de prueba, convirtiendo el effort adicional (hasta el nivel max) en mejores resultados.
Eficiencia en niveles de effort más bajos, con effort low y medium produciendo una calidad sólida con una fracción de los tokens y la latencia de configuraciones más altas.
Revisión de código y detección de errores, detectando errores reales a una tasa alta por pasada con pocos falsos positivos, y manteniendo la precisión en niveles de effort más bajos.
Visión, comprendiendo gráficos, documentos y diagramas y replicando elementos visuales de UI y frontend, con mayor fortaleza cuando se le dan herramientas para analizar, recortar y verificar su trabajo de forma iterativa.
Trabajo de contexto largo, con una ventana de contexto de 1M de tokens como valor predeterminado y máximo, y un seguimiento de instrucciones, llamadas a herramientas y razonamiento consistentes a lo largo de toda la ventana.
Tareas de oficina y documentos, generando y editando hojas de cálculo complejas de múltiples hojas con fórmulas no triviales, y produciendo presentaciones de diapositivas bien estructuradas.
Coordinación multiagente, ejecutando equipos de subagentes con patrones efectivos de escritor-verificador y pocos casos de agentes sobrescribiendo el trabajo de otros.

Para conocer los patrones de prompting que aprovechan al máximo estas capacidades, consulta Prompting para Claude Opus 5.

Precios

Claude Opus 5 tiene un precio de $5 por millón de tokens de entrada y $25 por millón de tokens de salida, sin cambios con respecto a Claude Opus 4.8.

Consulta Precios para ver los precios completos, incluyendo el procesamiento por lotes, el almacenamiento en caché de prompts y las tarifas del modo rápido.

Disponibilidad

Claude Opus 5 está disponible en:

API de Claude: disponible para todos los clientes, como claude-opus-5.
AWS: disponible a través de Claude en Amazon Bedrock, como anthropic.claude-opus-5. Claude Opus 5 también es accesible a través de la API InvokeModel en bedrock-runtime, servida por la misma infraestructura; la integración Claude en Amazon Bedrock (legado) no lo incluye en su tabla de IDs de modelo versionados por ARN.
Google Cloud: disponible a través de Claude en Google Cloud, como claude-opus-5.
Microsoft Foundry: disponible a través de Claude en Microsoft Foundry.

Claude Opus 4.8 sigue disponible en todas estas plataformas.

Guía de migración

Para migrar desde Claude Opus 4.8, actualiza tu ID de modelo:

model = "claude-opus-4-8"  # Before
model = "claude-opus-5"  # After

Luego revisa los dos cambios de comportamiento: el pensamiento está activado por defecto, y desactivar el pensamiento con effort xhigh o max devuelve un error 400. Consulta la guía de migración para obtener instrucciones paso a paso.

Próximos pasos

Descripción general de modelos

Especificaciones y precios completos de todos los modelos actuales de Claude.

Prompting para Claude Opus 5

Diferencias de comportamiento y patrones de prompting específicos de Claude Opus 5.

Effort

Controla cuántos tokens usa Claude al responder, desde low hasta max.

Pensamiento

Cómo funciona el pensamiento cuando está activado por defecto, y cuándo se puede desactivar.

Presupuestos de tareas

Dale a Claude un presupuesto de tokens orientativo para regular el ritmo de su trabajo.

Guía de migración

Guía para migrar a los modelos más recientes de Claude desde versiones anteriores de Claude.

Modo rápido

Obtén más tokens de salida por segundo de los modelos Claude Opus con precios premium.

Was this page helpful?

Modelos y preciosModelos

Novedades en Claude Opus 5

Resumen de las nuevas funciones y cambios de comportamiento en Claude Opus 5.

Nuevo modelo

Modelo	ID de modelo de API	Descripción
Claude Opus 5	`claude-opus-5`	Para codificación agéntica compleja y trabajo empresarial

Para ver los precios y especificaciones completos, consulta la descripción general de modelos.

Nuevas funciones

Cambios de herramientas a mitad de conversación (beta)

Modo de fallbacks predeterminado

Mínimo más bajo para la caché de prompts

Modo rápido

Cambios de comportamiento

Pensamiento activado por defecto

La API mantiene la opción de desactivar el pensamiento, sujeta a la restricción de effort que se describe a continuación.

El effort importa más

Esta solicitud sube el effort al máximo con max:

client = anthropic.Anthropic()

with client.messages.stream(
    model="claude-opus-5",
    max_tokens=64000,
    output_config={"effort": "max"},
    messages=[
        {
            "role": "user",
            "content": "Explain why the sum of two even numbers is always even.",
        }
    ],
) as stream:
    response = stream.get_final_message()

print(response)

El pensamiento está activado por defecto en Claude Opus 5, por lo que no se necesita el campo thinking.

Desactivar el pensamiento requiere effort `high` o inferior

Diferencias de comportamiento del modelo

Mejoras de capacidades

Razonamiento profundo, sosteniendo análisis de múltiples pasos a lo largo de cadenas largas de problemas.
Codificación agéntica y tareas de largo horizonte, manteniéndose enfocado en la tarea a lo largo de bucles extendidos de uso de herramientas y completando funciones de múltiples archivos, refactorizaciones más grandes y trabajo de funciones de extremo a extremo sin dejar stubs ni marcadores de posición.
Escalado de cómputo en tiempo de prueba, convirtiendo el effort adicional (hasta el nivel max) en mejores resultados.
Eficiencia en niveles de effort más bajos, con effort low y medium produciendo una calidad sólida con una fracción de los tokens y la latencia de configuraciones más altas.
Revisión de código y detección de errores, detectando errores reales a una tasa alta por pasada con pocos falsos positivos, y manteniendo la precisión en niveles de effort más bajos.
Visión, comprendiendo gráficos, documentos y diagramas y replicando elementos visuales de UI y frontend, con mayor fortaleza cuando se le dan herramientas para analizar, recortar y verificar su trabajo de forma iterativa.
Trabajo de contexto largo, con una ventana de contexto de 1M de tokens como valor predeterminado y máximo, y un seguimiento de instrucciones, llamadas a herramientas y razonamiento consistentes a lo largo de toda la ventana.
Tareas de oficina y documentos, generando y editando hojas de cálculo complejas de múltiples hojas con fórmulas no triviales, y produciendo presentaciones de diapositivas bien estructuradas.
Coordinación multiagente, ejecutando equipos de subagentes con patrones efectivos de escritor-verificador y pocos casos de agentes sobrescribiendo el trabajo de otros.

Para conocer los patrones de prompting que aprovechan al máximo estas capacidades, consulta Prompting para Claude Opus 5.

Precios

Claude Opus 5 tiene un precio de $5 por millón de tokens de entrada y $25 por millón de tokens de salida, sin cambios con respecto a Claude Opus 4.8.

Consulta Precios para ver los precios completos, incluyendo el procesamiento por lotes, el almacenamiento en caché de prompts y las tarifas del modo rápido.

Disponibilidad

Claude Opus 5 está disponible en:

API de Claude: disponible para todos los clientes, como claude-opus-5.
AWS: disponible a través de Claude en Amazon Bedrock, como anthropic.claude-opus-5. Claude Opus 5 también es accesible a través de la API InvokeModel en bedrock-runtime, servida por la misma infraestructura; la integración Claude en Amazon Bedrock (legado) no lo incluye en su tabla de IDs de modelo versionados por ARN.
Google Cloud: disponible a través de Claude en Google Cloud, como claude-opus-5.
Microsoft Foundry: disponible a través de Claude en Microsoft Foundry.

Claude Opus 4.8 sigue disponible en todas estas plataformas.

Guía de migración

Para migrar desde Claude Opus 4.8, actualiza tu ID de modelo:

model = "claude-opus-4-8"  # Before
model = "claude-opus-5"  # After

Próximos pasos

Descripción general de modelos

Especificaciones y precios completos de todos los modelos actuales de Claude.

Prompting para Claude Opus 5

Diferencias de comportamiento y patrones de prompting específicos de Claude Opus 5.

Effort

Controla cuántos tokens usa Claude al responder, desde low hasta max.

Pensamiento

Cómo funciona el pensamiento cuando está activado por defecto, y cuándo se puede desactivar.

Presupuestos de tareas

Dale a Claude un presupuesto de tokens orientativo para regular el ritmo de su trabajo.

Guía de migración

Guía para migrar a los modelos más recientes de Claude desde versiones anteriores de Claude.

Modo rápido

Obtén más tokens de salida por segundo de los modelos Claude Opus con precios premium.

Was this page helpful?

Nuevo modelo

Nuevas funciones

Cambios de herramientas a mitad de conversación (beta)

Modo de fallbacks predeterminado

Mínimo más bajo para la caché de prompts

Modo rápido

Cambios de comportamiento

Pensamiento activado por defecto

El effort importa más

Desactivar el pensamiento requiere effort high o inferior

Diferencias de comportamiento del modelo

Mejoras de capacidades

Precios

Disponibilidad

Guía de migración

Próximos pasos

Nuevo modelo

Nuevas funciones

Cambios de herramientas a mitad de conversación (beta)

Modo de fallbacks predeterminado

Mínimo más bajo para la caché de prompts

Modo rápido

Cambios de comportamiento

Pensamiento activado por defecto

El effort importa más

Desactivar el pensamiento requiere effort high o inferior

Diferencias de comportamiento del modelo

Mejoras de capacidades

Precios

Disponibilidad

Guía de migración

Próximos pasos

Nuevo modelo

Nuevas funciones

Cambios de herramientas a mitad de conversación (beta)

Modo de fallbacks predeterminado

Mínimo más bajo para la caché de prompts

Modo rápido

Cambios de comportamiento

Pensamiento activado por defecto

El effort importa más

Desactivar el pensamiento requiere effort `high` o inferior

Diferencias de comportamiento del modelo

Mejoras de capacidades

Precios

Disponibilidad

Guía de migración

Próximos pasos

Nuevo modelo

Nuevas funciones

Cambios de herramientas a mitad de conversación (beta)

Modo de fallbacks predeterminado

Mínimo más bajo para la caché de prompts

Modo rápido

Cambios de comportamiento

Pensamiento activado por defecto

El effort importa más

Desactivar el pensamiento requiere effort `high` o inferior

Diferencias de comportamiento del modelo

Mejoras de capacidades

Precios

Disponibilidad

Guía de migración

Próximos pasos