Modelos y precios

Novedades en Claude 4.6

Descripción general de nuevas características y capacidades en Claude Opus 4.6.

Claude 4.6 representa la próxima generación de modelos Claude, aportando nuevas capacidades significativas y mejoras en la API. Esta página resume todas las nuevas características disponibles en el lanzamiento.

Nuevos modelos

Modelo	ID del modelo API	Descripción
Claude Opus 4.6	`claude-opus-4-6`	Nuestro modelo más inteligente para construir agentes y codificación

Claude Opus 4.6 admite una ventana de contexto de 200K (con ventana de contexto de 1M tokens disponible en beta), 128K de tokens de salida máxima, pensamiento extendido y todas las características existentes de la API Claude.

Para obtener precios y especificaciones completas, consulte la descripción general de modelos.

Nuevas características

Modo de pensamiento adaptativo

Pensamiento adaptativo (thinking: {type: "adaptive"}) es el modo de pensamiento recomendado para Opus 4.6. Claude decide dinámicamente cuándo y cuánto pensar. En el nivel de esfuerzo predeterminado (high), Claude casi siempre pensará. En niveles de esfuerzo más bajos, puede omitir el pensamiento para problemas más simples.

thinking: {type: "enabled"} y budget_tokens están deprecados en Opus 4.6. Permanecen funcionales pero se eliminarán en un lanzamiento de modelo futuro. Use pensamiento adaptativo y el parámetro de esfuerzo para controlar la profundidad del pensamiento en su lugar. El pensamiento adaptativo también habilita automáticamente el pensamiento intercalado.

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[{"role": "user", "content": "Solve this complex problem..."}]
)

Parámetro de esfuerzo GA

El parámetro de esfuerzo ahora está disponible en general (no se requiere encabezado beta). Un nuevo nivel de esfuerzo max proporciona la capacidad absoluta más alta en Opus 4.6. Combine esfuerzo con pensamiento adaptativo para obtener compensaciones óptimas de costo-calidad.

API de compactación (beta)

Compactación proporciona resumen de contexto automático del lado del servidor, permitiendo conversaciones efectivamente infinitas. Cuando el contexto se acerca al límite de la ventana, la API resume automáticamente las partes anteriores de la conversación.

Transmisión de herramientas de grano fino (GA)

Transmisión de herramientas de grano fino ahora está disponible en general en todos los modelos y plataformas. No se requiere encabezado beta.

128K tokens de salida

Opus 4.6 admite hasta 128K tokens de salida, duplicando el límite anterior de 64K. Esto permite presupuestos de pensamiento más largos y respuestas más completas. Los SDK requieren transmisión para solicitudes con valores grandes de max_tokens para evitar tiempos de espera HTTP. Si no necesita procesar eventos de forma incremental, use .stream() con .get_final_message() para obtener la respuesta completa — consulte Mensajes de transmisión para obtener detalles.

Controles de residencia de datos

Controles de residencia de datos le permiten especificar dónde se ejecuta la inferencia del modelo usando el parámetro inference_geo. Puede elegir enrutamiento "global" (predeterminado) o "us" por solicitud. La inferencia solo en EE.UU. tiene un precio de 1.1x en Claude Opus 4.6 y modelos más nuevos.

Deprecaciones

`type: "enabled"` y `budget_tokens`

thinking: {type: "enabled", budget_tokens: N} está deprecado en Opus 4.6. Permanece funcional pero se eliminará en un lanzamiento de modelo futuro. Migre a thinking: {type: "adaptive"} con el parámetro de esfuerzo.

Encabezado beta `interleaved-thinking-2025-05-14`

El encabezado beta interleaved-thinking-2025-05-14 está deprecado en Opus 4.6. Se ignora de forma segura si se incluye, pero ya no es necesario. Pensamiento adaptativo habilita automáticamente pensamiento intercalado. Elimine betas=["interleaved-thinking-2025-05-14"] de sus solicitudes cuando use Opus 4.6.

`output_format`

El parámetro output_format para salidas estructuradas se ha movido a output_config.format. El parámetro anterior permanece funcional pero está deprecado y se eliminará en un lanzamiento de modelo futuro.

# Before
response = client.messages.create(
    output_format={"type": "json_schema", "schema": {...}},
    ...
)

# After
response = client.messages.create(
    output_config={"format": {"type": "json_schema", "schema": {...}}},
    ...
)

Cambios importantes

Eliminación de prefill

El relleno previo de mensajes del asistente (rellenos del último turno del asistente) no es compatible en Opus 4.6. Las solicitudes con mensajes del asistente rellenados previamente devuelven un error 400.

Alternativas:

Salidas estructuradas para controlar el formato de respuesta
Instrucciones de indicación del sistema para guiar el estilo de respuesta
output_config.format para salida JSON

Entrecomillado de parámetros de herramientas

Opus 4.6 puede producir un escape de cadena JSON ligeramente diferente en argumentos de llamadas de herramientas (por ejemplo, manejo diferente de escapes Unicode o escape de barra diagonal). Los analizadores JSON estándar manejan estas diferencias automáticamente. Si analiza la input de llamadas de herramientas como una cadena sin procesar en lugar de usar json.loads() o JSON.parse(), verifique que su lógica de análisis siga funcionando.

Guía de migración

Para obtener instrucciones de migración paso a paso, consulte Migración a Claude 4.6.

Próximos pasos

Pensamiento adaptativo

Aprenda cómo usar el modo de pensamiento adaptativo.

Descripción general de modelos

Compare todos los modelos Claude.

Compactación

Explore la compactación de contexto del lado del servidor.

Guía de migración

Instrucciones de migración paso a paso.

Was this page helpful?

Modelos y precios

Novedades en Claude 4.6

Descripción general de nuevas características y capacidades en Claude Opus 4.6.

Nuevos modelos

Modelo	ID del modelo API	Descripción
Claude Opus 4.6	`claude-opus-4-6`	Nuestro modelo más inteligente para construir agentes y codificación

Para obtener precios y especificaciones completas, consulte la descripción general de modelos.

Nuevas características

Modo de pensamiento adaptativo

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[{"role": "user", "content": "Solve this complex problem..."}]
)

Parámetro de esfuerzo GA

API de compactación (beta)

Transmisión de herramientas de grano fino (GA)

Transmisión de herramientas de grano fino ahora está disponible en general en todos los modelos y plataformas. No se requiere encabezado beta.

128K tokens de salida

Controles de residencia de datos

Deprecaciones

`type: "enabled"` y `budget_tokens`

Encabezado beta `interleaved-thinking-2025-05-14`

`output_format`

# Before
response = client.messages.create(
    output_format={"type": "json_schema", "schema": {...}},
    ...
)

# After
response = client.messages.create(
    output_config={"format": {"type": "json_schema", "schema": {...}}},
    ...
)

Cambios importantes

Eliminación de prefill

Alternativas:

Salidas estructuradas para controlar el formato de respuesta
Instrucciones de indicación del sistema para guiar el estilo de respuesta
output_config.format para salida JSON

Entrecomillado de parámetros de herramientas

Guía de migración

Para obtener instrucciones de migración paso a paso, consulte Migración a Claude 4.6.

Próximos pasos

Pensamiento adaptativo

Aprenda cómo usar el modo de pensamiento adaptativo.

Descripción general de modelos

Compare todos los modelos Claude.

Compactación

Explore la compactación de contexto del lado del servidor.

Guía de migración

Instrucciones de migración paso a paso.

Was this page helpful?

Nuevos modelos

Nuevas características

Modo de pensamiento adaptativo

Parámetro de esfuerzo GA

API de compactación (beta)

Transmisión de herramientas de grano fino (GA)

128K tokens de salida

Controles de residencia de datos

Deprecaciones

type: "enabled" y budget_tokens

Encabezado beta interleaved-thinking-2025-05-14

output_format

Cambios importantes

Eliminación de prefill

Entrecomillado de parámetros de herramientas

Guía de migración

Próximos pasos

Nuevos modelos

Nuevas características

Modo de pensamiento adaptativo

Parámetro de esfuerzo GA

API de compactación (beta)

Transmisión de herramientas de grano fino (GA)

128K tokens de salida

Controles de residencia de datos

Deprecaciones

type: "enabled" y budget_tokens

Encabezado beta interleaved-thinking-2025-05-14

output_format

Cambios importantes

Eliminación de prefill

Entrecomillado de parámetros de herramientas

Guía de migración

Próximos pasos

`type: "enabled"` y `budget_tokens`

Encabezado beta `interleaved-thinking-2025-05-14`

`output_format`

`type: "enabled"` y `budget_tokens`

Encabezado beta `interleaved-thinking-2025-05-14`

`output_format`