Claude Opus 4.8 es el modelo de nivel Opus más capaz de Anthropic. Se basa en Claude Opus 4.7. Esta página resume todas las novedades en el lanzamiento, incluido el modo rápido (vista previa de investigación en la API de Claude) y una longitud mínima de prompt cacheable reducida a 1.024 tokens.
| Modelo | ID del modelo en la API | Descripción |
|---|---|---|
| Claude Opus 4.8 | claude-opus-4-8 | El modelo de nivel Opus más capaz de Anthropic para razonamiento complejo, programación agéntica de largo horizonte y trabajo de alta autonomía |
Claude Opus 4.8 admite la ventana de contexto de 1M de tokens de forma predeterminada en la API de Claude, Amazon Bedrock, Google Cloud y Microsoft Foundry, 128k tokens máximos de salida, pensamiento adaptativo y el mismo conjunto de herramientas y funciones de plataforma que Claude Opus 4.7.
Para ver los precios y especificaciones completos, consulta la descripción general de los modelos.
Claude Opus 4.8 acepta mensajes con role: "system" inmediatamente después de un turno de usuario en el array messages (sujeto a las reglas de ubicación). Esto te permite añadir instrucciones actualizadas más adelante en una conversación de larga duración sin tener que repetir la indicación del sistema completa. Actualizar las instrucciones de esta manera preserva los aciertos de caché de prompts en los turnos anteriores y reduce el costo de entrada en bucles agénticos. No se requiere ningún encabezado beta. Consulta Mensajes de sistema a mitad de conversación para obtener detalles de uso.
El objeto stop_details en las respuestas de rechazo (disponible desde Claude Opus 4.7) ahora está documentado públicamente. Cuando Claude se niega a completar una solicitud, este objeto describe la categoría del rechazo, además del stop reason refusal existente. Tu aplicación puede usarlo para distinguir entre diferentes clases de solicitudes rechazadas y dirigir al usuario al siguiente paso adecuado. No se requiere ningún encabezado beta. Consulta Rechazos y alternativas para ver la lista de categorías y Stop reasons y alternativas para obtener orientación sobre cómo manejarlos.
El valor predeterminado del parámetro effort en Claude Opus 4.8 es high en todas las superficies, incluidas la API de Claude y Claude Code. Si actualmente configuras effort de forma explícita, tu configuración no cambia. Consulta Effort para obtener orientación por nivel.
El modo rápido ahora está disponible para Claude Opus 4.8 como vista previa de investigación en la API de Claude. Configura speed: "fast" con el encabezado beta fast-mode-2026-02-01 para obtener hasta 2,5 veces más tokens de salida por segundo del mismo modelo con precios premium. Consulta Modo rápido para obtener información sobre acceso, modelos compatibles y precios.
La longitud mínima de prompt cacheable en Claude Opus 4.8 es de 1.024 tokens, frente a los 2.048 tokens de Claude Opus 4.7. Los prompts que eran demasiado cortos para almacenarse en caché en Claude Opus 4.7 ahora pueden crear entradas de caché sin cambios en el código. Consulta Almacenamiento en caché de prompts para ver los mínimos por modelo.
Estas restricciones no han cambiado respecto a Claude Opus 4.7, por lo que el código que ya se ejecuta en Claude Opus 4.7 no necesita cambios. Se aplican únicamente a la API de Messages. Los Claude Managed Agents no se ven afectados.
Configurar temperature, top_p o top_k con un valor distinto al predeterminado devuelve un error 400 en Claude Opus 4.8, igual que en Claude Opus 4.7. Omite estos parámetros y usa el prompting para guiar el comportamiento del modelo.
Al igual que Claude Opus 4.7, Claude Opus 4.8 no admite presupuestos de pensamiento extendido. Configurar thinking: {type: "enabled", budget_tokens: N} devuelve un error 400.
El siguiente diff actualiza una solicitud escrita para Claude Opus 4.6 o anterior para que se ejecute en Claude Opus 4.8. Las líneas eliminadas (-) configuran el ID del modelo anterior y el presupuesto de pensamiento manual que Claude Opus 4.8 rechaza. Las líneas añadidas (+) configuran el nuevo ID del modelo, cambian a pensamiento adaptativo y controlan la profundidad del pensamiento con el parámetro effort, pasado en el campo de nivel superior output_config. El modelo determina cuándo y cuánto pensar en cada turno. Si eliminas el campo thinking por completo, las solicitudes se ejecutan sin pensamiento:
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
- model="claude-opus-4-6",
+ model="claude-opus-4-8",
max_tokens=16000,
- thinking={"type": "enabled", "budget_tokens": 10000},
+ thinking={"type": "adaptive"},
+ output_config={"effort": "high"},
messages=[
{
"role": "user",
"content": "Explain why the sum of two even numbers is always even.",
}
],
)En comparación con Claude Opus 4.7, Claude Opus 4.8 apunta a mejoras de comportamiento en:
Con el pensamiento adaptativo habilitado, Claude Opus 4.8 activa el razonamiento solo cuando determina que el turno lo necesita. En búsquedas simples y pasos agénticos cortos responde directamente. En problemas complejos de varios pasos razona antes de responder. Esto reduce los tokens de pensamiento desperdiciados en cargas de trabajo bimodales en comparación con Claude Opus 4.7 al mismo nivel de effort. Al igual que en Claude Opus 4.7, el pensamiento está desactivado a menos que configures explícitamente thinking: {type: "adaptive"} en tu solicitud.
Estos no son cambios que rompan la compatibilidad de la API, pero podrían requerir actualizaciones de prompts. Consulta Migración a Claude Opus 4.8 para obtener orientación completa.
medium permite algo más de pensamiento, high algo menos y xhigh sustancialmente más. Si ajustaste un nivel de effort con Claude Opus 4.7, vuelve a establecer una línea base de costo y latencia en ese nivel antes de ajustarlo.Para obtener instrucciones de migración paso a paso y la lista de verificación completa de migración, consulta Migración a Claude Opus 4.8. Si estás actualizando desde Claude Opus 4.6 o anterior, aplica también los pasos de migración de Claude Opus 4.7. Esos pasos cubren cambios incompatibles que la actualización a Claude Opus 4.8 por sí sola no cubre. Si usas Claude Code o el Agent SDK, la skill de la API de Claude puede aplicar estos pasos de migración a tu base de código automáticamente.
Guía para migrar a los modelos más recientes de Claude desde versiones anteriores de Claude.
Controla cuántos tokens usa Claude al responder con el parámetro effort, equilibrando la exhaustividad de la respuesta y la eficiencia de tokens.
Permite que Claude determine dinámicamente cuándo y cuánto usar el pensamiento extendido con el modo de pensamiento adaptativo.
Cómo los mensajes de sistema a mitad de conversación preservan los aciertos de caché.
Aprende qué significa cada valor de stop_reason y cómo manejar el truncamiento, el uso de herramientas, los turnos pausados y los rechazos en tu aplicación.
Obtén hasta 2,5 veces más tokens de salida por segundo de los modelos Claude Opus.
Was this page helpful?