Claude Opus 4.8 es el modelo de nivel Opus más capaz de Anthropic. Se basa en Claude Opus 4.7. Esta página resume todas las novedades del lanzamiento, incluido el "fast mode" (modo rápido, vista previa de investigación en la API de Claude) y una longitud mínima de prompt cacheable reducida a 1.024 tokens.
| Modelo | ID de modelo de la API | Descripción |
|---|---|---|
| Claude Opus 4.8 | claude-opus-4-8 | El modelo de nivel Opus más capaz de Anthropic para razonamiento complejo, programación agéntica de largo horizonte y trabajo de alta autonomía |
Claude Opus 4.8 admite la ventana de contexto de 1M de tokens de forma predeterminada en la API de Claude, Amazon Bedrock y Vertex AI (200k en Microsoft Foundry), 128k tokens máximos de salida, adaptive thinking (pensamiento adaptativo) y el mismo conjunto de herramientas y funciones de plataforma que Claude Opus 4.7.
Para ver los precios y especificaciones completos, consulta la descripción general de modelos.
Claude Opus 4.8 acepta mensajes con role: "system" inmediatamente después de un turno de usuario en el array messages (sujeto a reglas de ubicación). Esto te permite añadir instrucciones actualizadas más adelante en una conversación de larga duración sin repetir la indicación del sistema completa, lo que preserva los aciertos de caché de prompts en los turnos anteriores y reduce el costo de entrada en bucles agénticos. No se requiere ningún encabezado beta. Consulta Mensajes de sistema a mitad de conversación para ver los detalles de uso.
El objeto stop_details en las respuestas de rechazo (disponible desde Claude Opus 4.7) ahora está documentado públicamente. Cuando Claude se niega a completar una solicitud, este objeto describe la categoría del rechazo, además del stop reason refusal existente, lo que facilita que tu aplicación distinga entre diferentes clases de solicitudes rechazadas y dirija al usuario al siguiente paso correcto. No se requiere ningún encabezado beta. Consulta Manejo de stop reasons para ver la lista de categorías y orientación sobre su manejo.
El valor predeterminado del parámetro effort (esfuerzo) en Claude Opus 4.8 es high en todas las superficies, incluidas la API de Claude y Claude Code. Si actualmente configuras effort de forma explícita, tu configuración no cambia. Consulta Effort para obtener orientación por nivel.
El fast mode (modo rápido) ahora está disponible para Claude Opus 4.8 como vista previa de investigación en la API de Claude. Configura speed: "fast" para obtener hasta 2,5 veces más tokens de salida por segundo del mismo modelo con precios premium. Consulta Fast mode para ver el acceso, los modelos compatibles y los precios.
La longitud mínima de prompt cacheable en Claude Opus 4.8 es de 1.024 tokens, menor que en Claude Opus 4.7. Los prompts que eran demasiado cortos para cachear en Claude Opus 4.7 ahora pueden crear entradas de caché sin cambios en el código. Consulta Almacenamiento en caché de prompts para ver los mínimos por modelo.
Estas restricciones no han cambiado respecto a Claude Opus 4.7, por lo que el código que ya se ejecuta en Claude Opus 4.7 no necesita cambios. Se aplican únicamente a la Messages API; los Claude Managed Agents no se ven afectados.
Configurar temperature, top_p o top_k con un valor no predeterminado devuelve un error 400 en Claude Opus 4.8, igual que en Claude Opus 4.7. Omite estos parámetros y usa prompting para guiar el comportamiento del modelo.
Al igual que Claude Opus 4.7, Claude Opus 4.8 no admite presupuestos de pensamiento extendido. Configurar thinking: {"type": "enabled", "budget_tokens": N} devuelve un error 400. Usa adaptive thinking y el parámetro effort para controlar la profundidad del pensamiento.
# Antes (Opus 4.6 o anterior)
thinking = {"type": "enabled", "budget_tokens": 32000}
# Después (Opus 4.7 y posterior)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}En comparación con Claude Opus 4.7, Claude Opus 4.8 apunta a mejoras de comportamiento en:
Con adaptive thinking habilitado, Claude Opus 4.8 activa el razonamiento solo cuando juzga que el turno lo necesita. En búsquedas simples y pasos agénticos cortos responde directamente; en problemas complejos de múltiples pasos razona antes de responder. Esto reduce los tokens de pensamiento desperdiciados en cargas de trabajo bimodales en comparación con Claude Opus 4.7 al mismo nivel de effort. Al igual que en Claude Opus 4.7, el pensamiento está desactivado a menos que configures explícitamente thinking: {type: "adaptive"} en tu solicitud.
Estos no son cambios que rompan la API, pero pueden requerir actualizaciones de prompts. Consulta Migración a Claude Opus 4.8 para obtener orientación completa.
Para obtener instrucciones de migración paso a paso y la lista de verificación completa de migración, consulta Migración a Claude Opus 4.8. Si usas Claude Code o el Agent SDK, la skill de la API de Claude puede aplicar estos pasos de migración a tu base de código automáticamente.
Instrucciones de actualización paso a paso desde Claude Opus 4.7.
Orientación de effort por nivel, incluidos los nuevos valores predeterminados.
El único modo de pensamiento activado admitido en Claude Opus 4.8.
Cómo los mensajes de sistema a mitad de conversación preservan los aciertos de caché.
Detalles de parada por rechazo y cómo manejarlos.
Mayor velocidad de salida con precios premium.
Was this page helpful?