Claude Opus 4.6 es un reemplazo casi directo para Claude 4.5, con algunos cambios importantes que debes tener en cuenta. Para una lista completa de nuevas características, consulta Novedades en Claude 4.6.
# Migración de Opus
model="claude-opus-4-5" # Antes
model="claude-opus-4-6" # DespuésEliminación de prefill: Rellenar previamente mensajes del asistente devuelve un error 400 en modelos Claude 4.6. Usa salidas estructuradas, instrucciones de indicaciones del sistema, o output_config.format en su lugar.
Entrecomillado de parámetros de herramientas: Los modelos Claude 4.6 pueden producir un escape de cadenas JSON ligeramente diferente en argumentos de llamadas de herramientas (por ejemplo, manejo diferente de escapes Unicode o escape de barras diagonales). Si analizas la entrada de llamada de herramienta input como una cadena sin procesar en lugar de usar un analizador JSON, verifica tu lógica de análisis. Los analizadores JSON estándar (como json.loads() o JSON.parse()) manejan estas diferencias automáticamente.
Estos no son obligatorios pero mejorarán tu experiencia:
Migra al pensamiento adaptativo: thinking: {type: "enabled", budget_tokens: N} está deprecado en modelos Claude 4.6 y se eliminará en una versión futura del modelo. Cambia a thinking: {type: "adaptive"} y usa el parámetro de esfuerzo para controlar la profundidad del pensamiento. Consulta Pensamiento adaptativo.
response = client.beta.messages.create(
model="claude-opus-4-5",
max_tokens=16000,
thinking={
"type": "enabled",
"budget_tokens": 32000
},
betas=["interleaved-thinking-2025-05-14"],
messages=[...]
)Ten en cuenta que la migración también se mueve de client.beta.messages.create a client.messages.create — el pensamiento adaptativo y el esfuerzo son características GA y no requieren el espacio de nombres del SDK beta ni ningún encabezado beta.
Elimina el encabezado beta de esfuerzo: El parámetro de esfuerzo ahora es GA. Elimina betas=["effort-2025-11-24"] de tus solicitudes.
Elimina el encabezado beta de transmisión de herramientas de grano fino: La transmisión de herramientas de grano fino ahora es GA. Elimina betas=["fine-grained-tool-streaming-2025-05-14"] de tus solicitudes.
Elimina el encabezado beta de pensamiento intercalado: El pensamiento adaptativo habilita automáticamente el pensamiento intercalado. Elimina betas=["interleaved-thinking-2025-05-14"] de tus solicitudes.
Migra a output_config.format: Si usas salidas estructuradas, actualiza output_format={...} a output_config={"format": {...}}. El parámetro antiguo sigue siendo funcional pero está deprecado y se eliminará en una versión futura del modelo.
Si estás migrando de Opus 4.1, Sonnet 4, o modelos anteriores directamente a Claude 4.6, aplica los cambios importantes de Claude 4.6 anteriores más los cambios adicionales en esta sección.
# De Opus 4.1
model="claude-opus-4-1-20250805" # Antes
model="claude-opus-4-6" # Después
# De Sonnet 4
model="claude-sonnet-4-20250514" # Antes
model="claude-opus-4-6" # Después
# De Sonnet 3.7
model="claude-3-7-sonnet-20250219" # Antes
model="claude-opus-4-6" # DespuésParámetros de muestreo
Este es un cambio importante de modelos Claude 3.x.
Usa solo temperature O top_p, no ambos:
# Antes - Esto generará un error en modelos Claude 4+
response = client.messages.create(
model="claude-3-7-sonnet-20250219",
temperature=0.7,
top_p=0.9, # No se pueden usar ambos
...
)
# Después
response = client.messages.create(
model="claude-opus-4-6",
temperature=0.7, # Usa temperature O top_p, no ambos
...
)Versiones de herramientas
Este es un cambio importante de modelos Claude 3.x.
Actualiza a las últimas versiones de herramientas. Elimina cualquier código que use el comando undo_edit.
# Antes
tools=[{"type": "text_editor_20250124", "name": "str_replace_editor"}]
# Después
tools=[{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]text_editor_20250728 y str_replace_based_edit_tool. Consulta Documentación de la herramienta editor de texto para más detalles.code_execution_20250825. Consulta Documentación de la herramienta de ejecución de código para instrucciones de migración.Maneja la razón de parada refusal
Actualiza tu aplicación para manejar razones de parada refusal:
response = client.messages.create(...)
if response.stop_reason == "refusal":
# Maneja el rechazo apropiadamente
passManeja la razón de parada model_context_window_exceeded
Los modelos Claude 4.5+ devuelven una razón de parada model_context_window_exceeded cuando la generación se detiene debido a alcanzar el límite de la ventana de contexto, en lugar del límite max_tokens solicitado. Actualiza tu aplicación para manejar esta nueva razón de parada:
response = client.messages.create(...)
if response.stop_reason == "model_context_window_exceeded":
# Maneja el límite de la ventana de contexto apropiadamente
passManejo de parámetros de herramientas (saltos de línea finales)
Los modelos Claude 4.5+ preservan los saltos de línea finales en parámetros de cadena de llamadas de herramientas que fueron eliminados previamente. Si tus herramientas dependen de coincidencia exacta de cadenas contra parámetros de llamadas de herramientas, verifica que tu lógica maneje correctamente los saltos de línea finales.
Actualiza tus indicaciones para cambios de comportamiento
Los modelos Claude 4+ tienen un estilo de comunicación más conciso y directo y requieren dirección explícita. Revisa mejores prácticas de indicaciones para orientación de optimización.
token-efficient-tools-2025-02-19 y output-128k-2025-02-19 — todos los modelos Claude 4+ tienen uso de herramientas eficiente en tokens integrado y estos encabezados no tienen efecto.claude-opus-4-6output_config.format en su lugarthinking: {type: "enabled", budget_tokens: N} a thinking: {type: "adaptive"} con el parámetro de esfuerzo (budget_tokens está deprecado y se eliminará en una versión futura)effort-2025-11-24 (el esfuerzo ahora es GA)fine-grained-tool-streaming-2025-05-14interleaved-thinking-2025-05-14output_format a output_config.format (si aplica)temperature O top_ptext_editor_20250728, code_execution_20250825)refusalmodel_context_window_exceededtoken-efficient-tools-2025-02-19, output-128k-2025-02-19)Claude Sonnet 4.5 combina una inteligencia fuerte con un rendimiento rápido, lo que lo hace ideal para tareas cotidianas de codificación, análisis y contenido.
Para una descripción general completa de las capacidades, consulta la descripción general de modelos.
El precio de Sonnet 4.5 es de $3 por millón de tokens de entrada, $15 por millón de tokens de salida. Consulta Precios de Claude para más detalles.
Actualiza el nombre de tu modelo:
# De Sonnet 4
model="claude-sonnet-4-20250514" # Antes
model="claude-sonnet-4-5-20250929" # Después
# De Sonnet 3.7
model="claude-3-7-sonnet-20250219" # Antes
model="claude-sonnet-4-5-20250929" # DespuésConsidera habilitar el pensamiento extendido para mejoras significativas de rendimiento en tareas de codificación y razonamiento (deshabilitado por defecto):
response = client.messages.create(
model="claude-sonnet-4-5-20250929",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 10000},
messages=[...]
)Estos cambios importantes se aplican al migrar desde modelos Claude 3.x Sonnet.
Parámetros de muestreo
Este es un cambio importante de modelos Claude 3.x.
Usa solo temperature O top_p, no ambos.
Versiones de herramientas
Este es un cambio importante de modelos Claude 3.x.
Actualiza a las últimas versiones de herramientas (text_editor_20250728, code_execution_20250825). Elimina cualquier código que use el comando undo_edit.
Maneja la razón de parada refusal
Actualiza tu aplicación para manejar razones de parada refusal.
Actualiza tus indicaciones para cambios de comportamiento
Los modelos Claude 4 tienen un estilo de comunicación más conciso y directo. Revisa mejores prácticas de indicaciones para orientación de optimización.
claude-sonnet-4-5-20250929text_editor_20250728, code_execution_20250825) — versiones heredadas no soportadas (si estás migrando desde 3.x)undo_edit (si aplica)temperature O top_p, no ambos (si estás migrando desde 3.x)refusal en tu aplicaciónClaude Haiku 4.5 es nuestro modelo Haiku más rápido e inteligente con rendimiento casi de frontera, entregando calidad de modelo premium para aplicaciones interactivas y procesamiento de alto volumen.
Para una descripción general completa de las capacidades, consulta la descripción general de modelos.
El precio de Haiku 4.5 es de $1 por millón de tokens de entrada, $5 por millón de tokens de salida. Consulta Precios de Claude para más detalles.
Actualiza el nombre de tu modelo:
# De Haiku 3.5
model="claude-3-5-haiku-20241022" # Antes
model="claude-haiku-4-5-20251001" # DespuésRevisa los nuevos límites de velocidad: Haiku 4.5 tiene límites de velocidad separados de Haiku 3.5. Consulta Documentación de límites de velocidad para más detalles.
Considera habilitar el pensamiento extendido para mejoras significativas de rendimiento en tareas de codificación y razonamiento (deshabilitado por defecto):
response = client.messages.create(
model="claude-haiku-4-5-20251001",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 5000},
messages=[...]
)El pensamiento extendido impacta la eficiencia del almacenamiento en caché de indicaciones.
Explora nuevas capacidades: Consulta la descripción general de modelos para detalles sobre conciencia de contexto, capacidad de salida aumentada (64K tokens), inteligencia más alta y velocidad mejorada.
Estos cambios importantes se aplican al migrar desde modelos Claude 3.x Haiku.
Parámetros de muestreo
Este es un cambio importante de modelos Claude 3.x.
Usa solo temperature O top_p, no ambos.
Versiones de herramientas
Este es un cambio importante de modelos Claude 3.x.
Actualiza a las últimas versiones de herramientas (text_editor_20250728, code_execution_20250825). Elimina cualquier código que use el comando undo_edit.
Maneja la razón de parada refusal
Actualiza tu aplicación para manejar razones de parada refusal.
Actualiza tus indicaciones para cambios de comportamiento
Los modelos Claude 4 tienen un estilo de comunicación más conciso y directo. Revisa mejores prácticas de indicaciones para orientación de optimización.
claude-haiku-4-5-20251001text_editor_20250728, code_execution_20250825) — versiones heredadas no soportadasundo_edit (si aplica)temperature O top_p, no ambosrefusal en tu aplicaciónWas this page helpful?