• Mensajes
  • Agentes gestionados
  • Administración
Search...
⌘K
Modelos
Descripción general de modelosIDs y versiones de modelosElegir un modeloPresentamos Claude Fable 5 y Claude Mythos 5Novedades de Claude Opus 4.8Actualizar entre versiones de modelosModelos obsoletosFichas de modelosIndicaciones del sistemaPrecios
Log in
Novedades de Claude Opus 4.8
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Modelos y precios/Modelos

Novedades en Claude Opus 4.8

Descripción general de las nuevas funciones y cambios de comportamiento en Claude Opus 4.8.

Claude Opus 4.8 es el modelo de nivel Opus más capaz de Anthropic. Se basa en Claude Opus 4.7. Esta página resume todas las novedades del lanzamiento, incluido el "fast mode" (modo rápido, vista previa de investigación en la API de Claude) y una longitud mínima de prompt cacheable reducida a 1.024 tokens.

Nuevo modelo

ModeloID de modelo de la APIDescripción
Claude Opus 4.8claude-opus-4-8El modelo de nivel Opus más capaz de Anthropic para razonamiento complejo, programación agéntica de largo horizonte y trabajo de alta autonomía

Claude Opus 4.8 admite la ventana de contexto de 1M de tokens de forma predeterminada en la API de Claude, Amazon Bedrock y Vertex AI (200k en Microsoft Foundry), 128k tokens máximos de salida, adaptive thinking (pensamiento adaptativo) y el mismo conjunto de herramientas y funciones de plataforma que Claude Opus 4.7.

Para ver los precios y especificaciones completos, consulta la descripción general de modelos.

Nuevas funciones

Mensajes de sistema a mitad de conversación

Claude Opus 4.8 acepta mensajes con role: "system" inmediatamente después de un turno de usuario en el array messages (sujeto a reglas de ubicación). Esto te permite añadir instrucciones actualizadas más adelante en una conversación de larga duración sin repetir la indicación del sistema completa, lo que preserva los aciertos de caché de prompts en los turnos anteriores y reduce el costo de entrada en bucles agénticos. No se requiere ningún encabezado beta. Consulta Mensajes de sistema a mitad de conversación para ver los detalles de uso.

Detalles de parada por rechazo

El objeto stop_details en las respuestas de rechazo (disponible desde Claude Opus 4.7) ahora está documentado públicamente. Cuando Claude se niega a completar una solicitud, este objeto describe la categoría del rechazo, además del stop reason refusal existente, lo que facilita que tu aplicación distinga entre diferentes clases de solicitudes rechazadas y dirija al usuario al siguiente paso correcto. No se requiere ningún encabezado beta. Consulta Manejo de stop reasons para ver la lista de categorías y orientación sobre su manejo.

Valores predeterminados de effort

El valor predeterminado del parámetro effort (esfuerzo) en Claude Opus 4.8 es high en todas las superficies, incluidas la API de Claude y Claude Code. Si actualmente configuras effort de forma explícita, tu configuración no cambia. Consulta Effort para obtener orientación por nivel.

Fast mode

El fast mode (modo rápido) ahora está disponible para Claude Opus 4.8 como vista previa de investigación en la API de Claude. Configura speed: "fast" para obtener hasta 2,5 veces más tokens de salida por segundo del mismo modelo con precios premium. Consulta Fast mode para ver el acceso, los modelos compatibles y los precios.

Mínimo de caché de prompts reducido

La longitud mínima de prompt cacheable en Claude Opus 4.8 es de 1.024 tokens, menor que en Claude Opus 4.7. Los prompts que eran demasiado cortos para cachear en Claude Opus 4.7 ahora pueden crear entradas de caché sin cambios en el código. Consulta Almacenamiento en caché de prompts para ver los mínimos por modelo.

Restricciones de la API heredadas de Claude Opus 4.7

Estas restricciones no han cambiado respecto a Claude Opus 4.7, por lo que el código que ya se ejecuta en Claude Opus 4.7 no necesita cambios. Se aplican únicamente a la Messages API; los Claude Managed Agents no se ven afectados.

Parámetros de muestreo no admitidos

Configurar temperature, top_p o top_k con un valor no predeterminado devuelve un error 400 en Claude Opus 4.8, igual que en Claude Opus 4.7. Omite estos parámetros y usa prompting para guiar el comportamiento del modelo.

Adaptive thinking es el único modo de pensamiento

Al igual que Claude Opus 4.7, Claude Opus 4.8 no admite presupuestos de pensamiento extendido. Configurar thinking: {"type": "enabled", "budget_tokens": N} devuelve un error 400. Usa adaptive thinking y el parámetro effort para controlar la profundidad del pensamiento.

Python
# Antes (Opus 4.6 o anterior)
thinking = {"type": "enabled", "budget_tokens": 32000}

# Después (Opus 4.7 y posterior)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}

Mejoras de capacidad

Áreas de mejora

En comparación con Claude Opus 4.7, Claude Opus 4.8 apunta a mejoras de comportamiento en:

  • Programación agéntica de largo horizonte, incluido un mejor manejo de contexto largo, menos compactaciones y mejor recuperación tras la compactación.
  • Calibración del esfuerzo de razonamiento, con un comportamiento más confiable en cada nivel de effort en una variedad de dominios.
  • Activación de herramientas, con menos casos de omisión de una llamada a herramienta que la tarea requería.

Adaptive thinking

Con adaptive thinking habilitado, Claude Opus 4.8 activa el razonamiento solo cuando juzga que el turno lo necesita. En búsquedas simples y pasos agénticos cortos responde directamente; en problemas complejos de múltiples pasos razona antes de responder. Esto reduce los tokens de pensamiento desperdiciados en cargas de trabajo bimodales en comparación con Claude Opus 4.7 al mismo nivel de effort. Al igual que en Claude Opus 4.7, el pensamiento está desactivado a menos que configures explícitamente thinking: {type: "adaptive"} en tu solicitud.

Cambios de comportamiento

Estos no son cambios que rompan la API, pero pueden requerir actualizaciones de prompts. Consulta Migración a Claude Opus 4.8 para obtener orientación completa.

  • Menos tokens de pensamiento desperdiciados al mismo nivel de effort cuando adaptive thinking está habilitado, porque el modelo decide en cada turno si debe pensar.
  • Mejor activación de herramientas. Es menos probable que el modelo omita una llamada a herramienta que la tarea requería, un problema que algunos usuarios reportaron en Claude Opus 4.7.
  • Mejor manejo de compactación y calidad de contexto largo. Las trazas agénticas largas se mantienen enfocadas en la tarea con menos desviaciones después de la compactación.

Guía de migración

Para obtener instrucciones de migración paso a paso y la lista de verificación completa de migración, consulta Migración a Claude Opus 4.8. Si usas Claude Code o el Agent SDK, la skill de la API de Claude puede aplicar estos pasos de migración a tu base de código automáticamente.

Próximos pasos

Guía de migración

Instrucciones de actualización paso a paso desde Claude Opus 4.7.

Effort

Orientación de effort por nivel, incluidos los nuevos valores predeterminados.

Adaptive thinking

El único modo de pensamiento activado admitido en Claude Opus 4.8.

Almacenamiento en caché de prompts

Cómo los mensajes de sistema a mitad de conversación preservan los aciertos de caché.

Manejo de stop reasons

Detalles de parada por rechazo y cómo manejarlos.

Fast mode

Mayor velocidad de salida con precios premium.

Was this page helpful?

  • Nuevo modelo
  • Nuevas funciones
  • Mensajes de sistema a mitad de conversación
  • Detalles de parada por rechazo
  • Valores predeterminados de effort
  • Fast mode
  • Mínimo de caché de prompts reducido
  • Restricciones de la API heredadas de Claude Opus 4.7
  • Parámetros de muestreo no admitidos
  • Adaptive thinking es el único modo de pensamiento
  • Mejoras de capacidad
  • Áreas de mejora
  • Adaptive thinking
  • Cambios de comportamiento
  • Guía de migración
  • Próximos pasos