Claude 4.6 representa la próxima generación de modelos Claude, aportando nuevas capacidades significativas y mejoras en la API. Esta página resume todas las nuevas características disponibles en el lanzamiento.
| Modelo | ID del modelo API | Descripción |
|---|---|---|
| Claude Opus 4.6 | claude-opus-4-6 | Nuestro modelo más inteligente para construir agentes y codificación |
Claude Opus 4.6 admite una ventana de contexto de 200K (con ventana de contexto de 1M tokens disponible en beta), 128K de tokens de salida máxima, pensamiento extendido y todas las características existentes de la API Claude.
Para obtener precios y especificaciones completas, consulte la descripción general de modelos.
Pensamiento adaptativo (thinking: {type: "adaptive"}) es el modo de pensamiento recomendado para Opus 4.6. Claude decide dinámicamente cuándo y cuánto pensar. En el nivel de esfuerzo predeterminado (high), Claude casi siempre pensará. En niveles de esfuerzo más bajos, puede omitir el pensamiento para problemas más simples.
thinking: {type: "enabled"} y budget_tokens están deprecados en Opus 4.6. Permanecen funcionales pero se eliminarán en un lanzamiento de modelo futuro. Use pensamiento adaptativo y el parámetro de esfuerzo para controlar la profundidad del pensamiento en su lugar. El pensamiento adaptativo también habilita automáticamente el pensamiento intercalado.
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
messages=[{"role": "user", "content": "Solve this complex problem..."}]
)El parámetro de esfuerzo ahora está disponible en general (no se requiere encabezado beta). Un nuevo nivel de esfuerzo max proporciona la capacidad absoluta más alta en Opus 4.6. Combine esfuerzo con pensamiento adaptativo para obtener compensaciones óptimas de costo-calidad.
Compactación proporciona resumen de contexto automático del lado del servidor, permitiendo conversaciones efectivamente infinitas. Cuando el contexto se acerca al límite de la ventana, la API resume automáticamente las partes anteriores de la conversación.
Transmisión de herramientas de grano fino ahora está disponible en general en todos los modelos y plataformas. No se requiere encabezado beta.
Opus 4.6 admite hasta 128K tokens de salida, duplicando el límite anterior de 64K. Esto permite presupuestos de pensamiento más largos y respuestas más completas. Los SDK requieren transmisión para solicitudes con valores grandes de max_tokens para evitar tiempos de espera HTTP. Si no necesita procesar eventos de forma incremental, use .stream() con .get_final_message() para obtener la respuesta completa — consulte Mensajes de transmisión para obtener detalles.
Controles de residencia de datos le permiten especificar dónde se ejecuta la inferencia del modelo usando el parámetro inference_geo. Puede elegir enrutamiento "global" (predeterminado) o "us" por solicitud. La inferencia solo en EE.UU. tiene un precio de 1.1x en Claude Opus 4.6 y modelos más nuevos.
type: "enabled" y budget_tokensthinking: {type: "enabled", budget_tokens: N} está deprecado en Opus 4.6. Permanece funcional pero se eliminará en un lanzamiento de modelo futuro. Migre a thinking: {type: "adaptive"} con el parámetro de esfuerzo.
interleaved-thinking-2025-05-14El encabezado beta interleaved-thinking-2025-05-14 está deprecado en Opus 4.6. Se ignora de forma segura si se incluye, pero ya no es necesario. Pensamiento adaptativo habilita automáticamente pensamiento intercalado. Elimine betas=["interleaved-thinking-2025-05-14"] de sus solicitudes cuando use Opus 4.6.
output_formatEl parámetro output_format para salidas estructuradas se ha movido a output_config.format. El parámetro anterior permanece funcional pero está deprecado y se eliminará en un lanzamiento de modelo futuro.
# Before
response = client.messages.create(
output_format={"type": "json_schema", "schema": {...}},
...
)
# After
response = client.messages.create(
output_config={"format": {"type": "json_schema", "schema": {...}}},
...
)El relleno previo de mensajes del asistente (rellenos del último turno del asistente) no es compatible en Opus 4.6. Las solicitudes con mensajes del asistente rellenados previamente devuelven un error 400.
Alternativas:
output_config.format para salida JSONOpus 4.6 puede producir un escape de cadena JSON ligeramente diferente en argumentos de llamadas de herramientas (por ejemplo, manejo diferente de escapes Unicode o escape de barra diagonal). Los analizadores JSON estándar manejan estas diferencias automáticamente. Si analiza la input de llamadas de herramientas como una cadena sin procesar en lugar de usar json.loads() o JSON.parse(), verifique que su lógica de análisis siga funcionando.
Para obtener instrucciones de migración paso a paso, consulte Migración a Claude 4.6.
Aprenda cómo usar el modo de pensamiento adaptativo.
Compare todos los modelos Claude.
Explore la compactación de contexto del lado del servidor.
Instrucciones de migración paso a paso.
Was this page helpful?