Claude Platform Docs
  • Mensajes
  • Agentes gestionados
  • Administración

Search...
⌘K
Modelos
Descripción general de modelosID de modelos y versionadoElegir un modeloPresentamos Claude Fable 5 y Claude Mythos 5Novedades de Claude Opus 4.8Novedades de Claude Sonnet 5Actualizar entre versiones de modelosModelos obsoletosFichas de modelosIndicaciones del sistemaPrecios

Log in
Novedades de Claude Opus 4.8
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claude Platform Docs

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Claude on Google Cloud

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Modelos y precios/Modelos

Novedades en Claude Opus 4.8

Descripción general de las nuevas funciones y cambios de comportamiento en Claude Opus 4.8.

Claude Opus 4.8 es el modelo de nivel Opus más capaz de Anthropic. Se basa en Claude Opus 4.7. Esta página resume todas las novedades en el lanzamiento, incluido el modo rápido (vista previa de investigación en la API de Claude) y una longitud mínima de prompt cacheable reducida a 1.024 tokens.

Nuevo modelo

ModeloID del modelo en la APIDescripción
Claude Opus 4.8claude-opus-4-8El modelo de nivel Opus más capaz de Anthropic para razonamiento complejo, programación agéntica de largo horizonte y trabajo de alta autonomía

Claude Opus 4.8 admite la ventana de contexto de 1M de tokens de forma predeterminada en la API de Claude, Amazon Bedrock, Google Cloud y Microsoft Foundry, 128k tokens máximos de salida, pensamiento adaptativo y el mismo conjunto de herramientas y funciones de plataforma que Claude Opus 4.7.

Para ver los precios y especificaciones completos, consulta la descripción general de los modelos.

Nuevas funciones

Mensajes de sistema a mitad de conversación

Claude Opus 4.8 acepta mensajes con role: "system" inmediatamente después de un turno de usuario en el array messages (sujeto a las reglas de ubicación). Esto te permite añadir instrucciones actualizadas más adelante en una conversación de larga duración sin tener que repetir la indicación del sistema completa. Actualizar las instrucciones de esta manera preserva los aciertos de caché de prompts en los turnos anteriores y reduce el costo de entrada en bucles agénticos. No se requiere ningún encabezado beta. Consulta Mensajes de sistema a mitad de conversación para obtener detalles de uso.

Detalles de parada por rechazo

El objeto stop_details en las respuestas de rechazo (disponible desde Claude Opus 4.7) ahora está documentado públicamente. Cuando Claude se niega a completar una solicitud, este objeto describe la categoría del rechazo, además del stop reason refusal existente. Tu aplicación puede usarlo para distinguir entre diferentes clases de solicitudes rechazadas y dirigir al usuario al siguiente paso adecuado. No se requiere ningún encabezado beta. Consulta Rechazos y alternativas para ver la lista de categorías y Stop reasons y alternativas para obtener orientación sobre cómo manejarlos.

Valores predeterminados de effort

El valor predeterminado del parámetro effort en Claude Opus 4.8 es high en todas las superficies, incluidas la API de Claude y Claude Code. Si actualmente configuras effort de forma explícita, tu configuración no cambia. Consulta Effort para obtener orientación por nivel.

Modo rápido

El modo rápido ahora está disponible para Claude Opus 4.8 como vista previa de investigación en la API de Claude. Configura speed: "fast" con el encabezado beta fast-mode-2026-02-01 para obtener hasta 2,5 veces más tokens de salida por segundo del mismo modelo con precios premium. Consulta Modo rápido para obtener información sobre acceso, modelos compatibles y precios.

Mínimo de caché de prompts reducido

La longitud mínima de prompt cacheable en Claude Opus 4.8 es de 1.024 tokens, frente a los 2.048 tokens de Claude Opus 4.7. Los prompts que eran demasiado cortos para almacenarse en caché en Claude Opus 4.7 ahora pueden crear entradas de caché sin cambios en el código. Consulta Almacenamiento en caché de prompts para ver los mínimos por modelo.

Restricciones de la API heredadas de Claude Opus 4.7



Estas restricciones no han cambiado respecto a Claude Opus 4.7, por lo que el código que ya se ejecuta en Claude Opus 4.7 no necesita cambios. Se aplican únicamente a la API de Messages. Los Claude Managed Agents no se ven afectados.

Parámetros de muestreo no admitidos

Configurar temperature, top_p o top_k con un valor distinto al predeterminado devuelve un error 400 en Claude Opus 4.8, igual que en Claude Opus 4.7. Omite estos parámetros y usa el prompting para guiar el comportamiento del modelo.

El pensamiento adaptativo es el único modo de pensamiento

Al igual que Claude Opus 4.7, Claude Opus 4.8 no admite presupuestos de pensamiento extendido. Configurar thinking: {type: "enabled", budget_tokens: N} devuelve un error 400.

El siguiente diff actualiza una solicitud escrita para Claude Opus 4.6 o anterior para que se ejecute en Claude Opus 4.8. Las líneas eliminadas (-) configuran el ID del modelo anterior y el presupuesto de pensamiento manual que Claude Opus 4.8 rechaza. Las líneas añadidas (+) configuran el nuevo ID del modelo, cambian a pensamiento adaptativo y controlan la profundidad del pensamiento con el parámetro effort, pasado en el campo de nivel superior output_config. El modelo determina cuándo y cuánto pensar en cada turno. Si eliminas el campo thinking por completo, las solicitudes se ejecutan sin pensamiento:

 import anthropic

 client = anthropic.Anthropic()

 response = client.messages.create(
-    model="claude-opus-4-6",
+    model="claude-opus-4-8",
     max_tokens=16000,
-    thinking={"type": "enabled", "budget_tokens": 10000},
+    thinking={"type": "adaptive"},
+    output_config={"effort": "high"},
     messages=[
         {
             "role": "user",
             "content": "Explain why the sum of two even numbers is always even.",
         }
     ],
 )

Mejoras de capacidad

Áreas de mejora

En comparación con Claude Opus 4.7, Claude Opus 4.8 apunta a mejoras de comportamiento en:

  • Programación agéntica de largo horizonte, incluido un mejor manejo de contextos largos, menos compactaciones y mejor recuperación tras la compactación.
  • Calibración del esfuerzo de razonamiento, con un comportamiento más confiable en cada nivel de effort en una variedad de dominios.
  • Activación de herramientas, con menos casos en los que se omite una llamada a herramienta que la tarea requería.

Pensamiento adaptativo

Con el pensamiento adaptativo habilitado, Claude Opus 4.8 activa el razonamiento solo cuando determina que el turno lo necesita. En búsquedas simples y pasos agénticos cortos responde directamente. En problemas complejos de varios pasos razona antes de responder. Esto reduce los tokens de pensamiento desperdiciados en cargas de trabajo bimodales en comparación con Claude Opus 4.7 al mismo nivel de effort. Al igual que en Claude Opus 4.7, el pensamiento está desactivado a menos que configures explícitamente thinking: {type: "adaptive"} en tu solicitud.

Cambios de comportamiento

Estos no son cambios que rompan la compatibilidad de la API, pero podrían requerir actualizaciones de prompts. Consulta Migración a Claude Opus 4.8 para obtener orientación completa.

  • Menos tokens de pensamiento desperdiciados al mismo nivel de effort cuando el pensamiento adaptativo está habilitado, porque el modelo determina en cada turno si debe pensar.
  • Mejor activación de herramientas. Es menos probable que el modelo omita una llamada a herramienta que la tarea requería, un problema que algunos usuarios reportaron en Claude Opus 4.7.
  • Mejor manejo de compactación y calidad de contexto largo. Las trazas agénticas largas se mantienen enfocadas en la tarea con menos desviaciones después de la compactación.
  • Niveles de effort recalibrados. La asignación de tokens detrás de cada nivel de effort cambia en comparación con Claude Opus 4.7: medium permite algo más de pensamiento, high algo menos y xhigh sustancialmente más. Si ajustaste un nivel de effort con Claude Opus 4.7, vuelve a establecer una línea base de costo y latencia en ese nivel antes de ajustarlo.

Guía de migración

Para obtener instrucciones de migración paso a paso y la lista de verificación completa de migración, consulta Migración a Claude Opus 4.8. Si estás actualizando desde Claude Opus 4.6 o anterior, aplica también los pasos de migración de Claude Opus 4.7. Esos pasos cubren cambios incompatibles que la actualización a Claude Opus 4.8 por sí sola no cubre. Si usas Claude Code o el Agent SDK, la skill de la API de Claude puede aplicar estos pasos de migración a tu base de código automáticamente.

Próximos pasos


Guía de migración

Guía para migrar a los modelos más recientes de Claude desde versiones anteriores de Claude.

Effort

Controla cuántos tokens usa Claude al responder con el parámetro effort, equilibrando la exhaustividad de la respuesta y la eficiencia de tokens.

Pensamiento adaptativo

Permite que Claude determine dinámicamente cuándo y cuánto usar el pensamiento extendido con el modo de pensamiento adaptativo.

Almacenamiento en caché de prompts

Cómo los mensajes de sistema a mitad de conversación preservan los aciertos de caché.


Stop reasons y alternativas

Aprende qué significa cada valor de stop_reason y cómo manejar el truncamiento, el uso de herramientas, los turnos pausados y los rechazos en tu aplicación.


Modo rápido (vista previa de investigación)

Obtén hasta 2,5 veces más tokens de salida por segundo de los modelos Claude Opus.

Was this page helpful?

  • Nuevo modelo
  • Nuevas funciones
  • Mensajes de sistema a mitad de conversación
  • Detalles de parada por rechazo
  • Valores predeterminados de effort
  • Modo rápido
  • Mínimo de caché de prompts reducido
  • Restricciones de la API heredadas de Claude Opus 4.7
  • Parámetros de muestreo no admitidos
  • El pensamiento adaptativo es el único modo de pensamiento
  • Mejoras de capacidad
  • Áreas de mejora
  • Pensamiento adaptativo
  • Cambios de comportamiento
  • Guía de migración
  • Próximos pasos