Claude Opus 4.6 es un reemplazo casi directo para Claude 4.5, con algunos cambios importantes a tener en cuenta. Para una lista completa de nuevas características, consulta Novedades en Claude 4.6.
# Migración de Opus
model = "claude-opus-4-5" # Antes
model = "claude-opus-4-6" # DespuésEliminación de prefill: Rellenar previamente mensajes del asistente devuelve un error 400 en modelos Claude 4.6. Usa salidas estructuradas, instrucciones de indicación del sistema, u output_config.format en su lugar.
Entrecomillado de parámetros de herramientas: Los modelos Claude 4.6 pueden producir un escape JSON ligeramente diferente en argumentos de llamadas de herramientas (por ejemplo, manejo diferente de escapes Unicode o escape de barras inclinadas). Si analizas la input de llamadas de herramientas como una cadena sin procesar en lugar de usar un analizador JSON, verifica tu lógica de análisis. Los analizadores JSON estándar (como json.loads() o JSON.parse()) manejan estas diferencias automáticamente.
Estos no son obligatorios pero mejorarán tu experiencia:
Migra al pensamiento adaptativo: thinking: {type: "enabled", budget_tokens: N} está deprecado en modelos Claude 4.6 y se eliminará en una versión futura del modelo. Cambia a thinking: {type: "adaptive"} y usa el parámetro effort para controlar la profundidad del pensamiento. Consulta Pensamiento adaptativo.
response = client.beta.messages.create(
model="claude-opus-4-5",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 32000},
betas=["interleaved-thinking-2025-05-14"],
messages=[...],
)Ten en cuenta que la migración también cambia de client.beta.messages.create a client.messages.create. El pensamiento adaptativo y el effort son características GA y no requieren el espacio de nombres beta del SDK ni ningún encabezado beta.
Elimina el encabezado beta de effort: El parámetro effort ahora es GA. Elimina betas=["effort-2025-11-24"] de tus solicitudes.
Elimina el encabezado beta de transmisión de herramientas de grano fino: La transmisión de herramientas de grano fino ahora es GA. Elimina betas=["fine-grained-tool-streaming-2025-05-14"] de tus solicitudes.
Elimina el encabezado beta de pensamiento intercalado (solo Opus 4.6): El pensamiento adaptativo habilita automáticamente el pensamiento intercalado en Opus 4.6. Elimina betas=["interleaved-thinking-2025-05-14"] de tus solicitudes de Opus 4.6. Nota: Sonnet 4.6 continúa soportando este encabezado beta con pensamiento extendido manual.
Migra a output_config.format: Si usas salidas estructuradas, actualiza output_format={...} a output_config={"format": {...}}. El parámetro antiguo sigue siendo funcional pero está deprecado y se eliminará en una versión futura del modelo.
Si estás migrando de Opus 4.1, Sonnet 4, o modelos anteriores directamente a Claude 4.6, aplica los cambios importantes de Claude 4.6 anteriores más los cambios adicionales en esta sección.
# De Opus 4.1
model = "claude-opus-4-1-20250805" # Antes
model = "claude-opus-4-6" # Después
# De Sonnet 4
model = "claude-sonnet-4-20250514" # Antes
model = "claude-opus-4-6" # Después
# De Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Antes
model = "claude-opus-4-6" # DespuésActualiza parámetros de muestreo
Este es un cambio importante al migrar desde modelos Claude 3.x.
Usa solo temperature O top_p, no ambos:
# Antes - Esto generará un error en modelos Claude 4+
response = client.messages.create(
model="claude-3-7-sonnet-20250219",
temperature=0.7,
top_p=0.9, # No puedes usar ambos
# ...
)
# Después
response = client.messages.create(
model="claude-opus-4-6",
temperature=0.7, # Usa temperature O top_p, no ambos
# ...
)Actualiza versiones de herramientas
Este es un cambio importante al migrar desde modelos Claude 3.x.
Actualiza a las últimas versiones de herramientas. Elimina cualquier código que use el comando undo_edit.
# Antes
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
# Después
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]text_editor_20250728 y str_replace_based_edit_tool. Consulta Documentación de la herramienta editor de texto para obtener detalles.code_execution_20250825. Consulta Documentación de la herramienta de ejecución de código para obtener instrucciones de migración.Maneja la razón de parada refusal
Actualiza tu aplicación para manejar razones de parada refusal:
response = client.messages.create(...)
if response.stop_reason == "refusal":
# Maneja el rechazo apropiadamente
passManeja la razón de parada model_context_window_exceeded
Los modelos Claude 4.5+ devuelven una razón de parada model_context_window_exceeded cuando la generación se detiene debido a alcanzar el límite de la ventana de contexto, en lugar del límite max_tokens solicitado. Actualiza tu aplicación para manejar esta nueva razón de parada:
response = client.messages.create(...)
if response.stop_reason == "model_context_window_exceeded":
# Maneja el límite de la ventana de contexto apropiadamente
passVerifica el manejo de parámetros de herramientas (saltos de línea finales)
Los modelos Claude 4.5+ preservan los saltos de línea finales en parámetros de cadena de llamadas de herramientas que fueron eliminados previamente. Si tus herramientas dependen de coincidencia exacta de cadenas contra parámetros de llamadas de herramientas, verifica que tu lógica maneje correctamente los saltos de línea finales.
Actualiza tus indicaciones para cambios de comportamiento
Los modelos Claude 4+ tienen un estilo de comunicación más conciso y directo y requieren dirección explícita. Revisa mejores prácticas de indicaciones para obtener orientación de optimización.
token-efficient-tools-2025-02-19 y output-128k-2025-02-19. Todos los modelos Claude 4+ tienen uso de herramientas eficiente en tokens integrado y estos encabezados no tienen efecto.claude-opus-4-6output_config.format en su lugarthinking: {type: "enabled", budget_tokens: N} a thinking: {type: "adaptive"} con el parámetro effort (budget_tokens está deprecado y se eliminará en una versión futura)effort-2025-11-24 (effort ahora es GA)fine-grained-tool-streaming-2025-05-14interleaved-thinking-2025-05-14 (solo Opus 4.6; Sonnet 4.6 aún lo soporta)output_format a output_config.format (si aplica)temperature O top_ptext_editor_20250728, code_execution_20250825)refusalmodel_context_window_exceededtoken-efficient-tools-2025-02-19, output-128k-2025-02-19)Claude Sonnet 4.6 combina una inteligencia sólida con un rendimiento rápido, con capacidades mejoradas de búsqueda agéntica y ejecución de código gratuita cuando se usa con búsqueda web o búsqueda web. Es ideal para tareas cotidianas de codificación, análisis y contenido.
Para una descripción general completa de las capacidades, consulta la descripción general de modelos.
El precio de Sonnet 4.6 es de $3 por millón de tokens de entrada, $15 por millón de tokens de salida. Consulta Precios de Claude para obtener detalles.
Actualiza el nombre de tu modelo:
# De Sonnet 4.5
model = "claude-sonnet-4-5" # Antes
model = "claude-sonnet-4-6" # Después
# De Sonnet 4
model = "claude-sonnet-4-20250514" # Antes
model = "claude-sonnet-4-6" # DespuésYa no se admite rellenar previamente mensajes del asistente
Este es un cambio importante al migrar desde Sonnet 4.5 o anterior.
Rellenar previamente mensajes del asistente devuelve un error 400 en Sonnet 4.6. Usa salidas estructuradas, instrucciones de indicación del sistema, u output_config.format en su lugar.
Casos de uso comunes de prefill y migraciones:
Controlar el formato de salida (forzar salida JSON/YAML): Usa salidas estructuradas o herramientas con campos enum para tareas de clasificación.
Eliminar preámbulos (eliminar frases "Aquí está..."): Agrega instrucciones directas en la indicación del sistema: "Responde directamente sin preámbulo. No comiences con frases como 'Aquí está...', 'Basado en...', etc."
Evitar rechazos malos: Claude es mucho mejor en rechazos apropiados ahora. Las indicaciones claras en el mensaje del usuario sin prefill deberían ser suficientes.
Continuaciones (reanudar respuestas interrumpidas): Mueve la continuación al mensaje del usuario: "Tu respuesta anterior fue interrumpida y terminó con [previous_response]. Continúa desde donde lo dejaste."
Hidratación de contexto / consistencia de rol (actualizar contexto en conversaciones largas): Inyecta lo que fueron recordatorios de asistente prefill anteriormente en el turno del usuario en su lugar.
El escape JSON de parámetros de herramientas puede diferir
Este es un cambio importante al migrar desde Sonnet 4.5 o anterior.
El escape de cadena JSON en parámetros de herramientas puede diferir de modelos anteriores. Los analizadores JSON estándar manejan esto automáticamente, pero el análisis personalizado basado en cadenas puede necesitar actualizaciones.
Actualiza parámetros de muestreo
Este es un cambio importante al migrar desde modelos Claude 3.x.
Usa solo temperature O top_p, no ambos.
Actualiza versiones de herramientas
Este es un cambio importante al migrar desde modelos Claude 3.x.
Actualiza a las últimas versiones de herramientas (text_editor_20250728, code_execution_20250825). Elimina cualquier código que use el comando undo_edit.
Maneja la razón de parada refusal
Actualiza tu aplicación para manejar razones de parada refusal.
Actualiza tus indicaciones para cambios de comportamiento
Los modelos Claude 4 tienen un estilo de comunicación más conciso y directo. Revisa mejores prácticas de indicaciones para obtener orientación de optimización.
fine-grained-tool-streaming-2025-05-14 — La transmisión de herramientas de grano fino ahora es GA en Sonnet 4.6 y ya no requiere un encabezado beta.output_format a output_config.format — El parámetro output_format está deprecado. Usa output_config.format en su lugar.Te recomendamos encarecidamente migrar de Sonnet 4.5 a Sonnet 4.6, que ofrece más inteligencia al mismo precio.
Sonnet 4.6 tiene un nivel de effort predeterminado de high, en contraste con Sonnet 4.5 que no tenía parámetro de effort. Te recomendamos ajustar el parámetro effort mientras migras de Sonnet 4.5 a Sonnet 4.6. Si no se establece explícitamente, puedes experimentar una latencia más alta con el nivel de effort predeterminado.
Si no estás usando pensamiento extendido en Sonnet 4.5, puedes continuar sin él en Sonnet 4.6. Debes establecer explícitamente el effort al nivel apropiado para tu caso de uso. Con effort low y pensamiento deshabilitado, puedes esperar un rendimiento similar o mejor en relación con Sonnet 4.5 sin pensamiento extendido.
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
output_config={"effort": "low"},
messages=[{"role": "user", "content": "Your prompt here"}],
)Si estás usando pensamiento extendido en Sonnet 4.5, continúa siendo soportado en Sonnet 4.6 sin cambios necesarios en tu configuración de pensamiento. Te recomendamos mantener un presupuesto de pensamiento alrededor de 16k tokens. En la práctica, la mayoría de las tareas no usan tanto, pero proporciona espacio para problemas más difíciles sin riesgo de uso descontrolado de tokens.
Para codificación agéntica, diseño frontend, flujos de trabajo con muchas herramientas y flujos de trabajo empresariales complejos, te recomendamos comenzar con effort medium. Si encuentras que la latencia es demasiado alta, considera reducir el effort a low. Si necesitas una inteligencia más alta, considera aumentar el effort a high o migrar a Opus 4.6.
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=16384,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "medium"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)Para chat, generación de contenido, búsqueda, clasificación y otras tareas no codificadas, te recomendamos comenzar con effort low con pensamiento extendido. Si necesitas más profundidad, aumenta el effort a medium.
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "low"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)Las rutas de migración anteriores usan pensamiento extendido con budget_tokens para uso de tokens predecible. Si tu carga de trabajo se ajusta a uno de los siguientes patrones, considera probar pensamiento adaptativo en su lugar:
high. Si la latencia o el uso de tokens es una preocupación, reduce a medium.Cuando uses pensamiento adaptativo, evalúa effort medium y high en tus tareas. El nivel correcto depende del equilibrio de tu carga de trabajo entre calidad, latencia y uso de tokens.
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"},
messages=[{"role": "user", "content": "Your prompt here"}],
)Si ves comportamiento inconsistente o regresiones de calidad con pensamiento adaptativo, cambia a pensamiento extendido con budget_tokens. Esto proporciona resultados más predecibles con un límite en los costos de pensamiento.
claude-sonnet-4-6output_config.format en su lugartext_editor_20250728, code_execution_20250825); las versiones heredadas no son compatibles (si estás migrando desde 3.x)undo_edit (si aplica)temperature O top_p, no ambos (si estás migrando desde 3.x)refusal en tu aplicaciónfine-grained-tool-streaming-2025-05-14 (ahora GA)output_format a output_config.formatClaude Sonnet 4.5 combina una inteligencia sólida con un rendimiento rápido, lo que lo hace ideal para tareas cotidianas de codificación, análisis y contenido.
Para una descripción general completa de las capacidades, consulta la descripción general de modelos.
El precio de Sonnet 4.5 es de $3 por millón de tokens de entrada, $15 por millón de tokens de salida. Consulta Precios de Claude para obtener detalles.
Actualiza el nombre de tu modelo:
# De Sonnet 4
model = "claude-sonnet-4-20250514" # Antes
model = "claude-sonnet-4-5-20250929" # Después
# De Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Antes
model = "claude-sonnet-4-5-20250929" # DespuésEstos cambios importantes se aplican al migrar desde modelos Claude 3.x Sonnet.
Actualiza parámetros de muestreo
Este es un cambio importante al migrar desde modelos Claude 3.x.
Usa solo temperature O top_p, no ambos.
Actualiza versiones de herramientas
Este es un cambio importante al migrar desde modelos Claude 3.x.
Actualiza a las últimas versiones de herramientas (text_editor_20250728, code_execution_20250825). Elimina cualquier código que use el comando undo_edit.
Maneja la razón de parada refusal
Actualiza tu aplicación para manejar razones de parada refusal.
Actualiza tus indicaciones para cambios de comportamiento
Los modelos Claude 4 tienen un estilo de comunicación más conciso y directo. Revisa mejores prácticas de indicaciones para obtener orientación de optimización.
claude-sonnet-4-5-20250929text_editor_20250728, code_execution_20250825); las versiones heredadas no son compatibles (si estás migrando desde 3.x)undo_edit (si aplica)temperature O top_p, no ambos (si estás migrando desde 3.x)refusal en tu aplicaciónClaude Haiku 4.5 es el modelo Haiku más rápido e inteligente con rendimiento casi de frontera, ofreciendo calidad de modelo premium para aplicaciones interactivas y procesamiento de alto volumen.
Para una descripción general completa de las capacidades, consulta la descripción general de modelos.
El precio de Haiku 4.5 es de $1 por millón de tokens de entrada, $5 por millón de tokens de salida. Consulta Precios de Claude para obtener detalles.
Actualiza el nombre de tu modelo:
# De Haiku 3.5
model = "claude-3-5-haiku-20241022" # Antes
model = "claude-haiku-4-5-20251001" # DespuésRevisa los nuevos límites de velocidad: Haiku 4.5 tiene límites de velocidad separados de Haiku 3.5. Consulta Documentación de límites de velocidad para obtener detalles.
Para mejoras significativas de rendimiento en tareas de codificación y razonamiento, considera habilitar pensamiento extendido con thinking: {type: "enabled", budget_tokens: N}.
El pensamiento extendido impacta la eficiencia del almacenamiento en caché de indicaciones.
El pensamiento extendido está deprecado en modelos Claude 4.6 o más nuevos. Si usas modelos más nuevos, usa pensamiento adaptativo en su lugar.
Explora nuevas capacidades: Consulta la descripción general de modelos para obtener detalles sobre conciencia de contexto, capacidad de salida aumentada (64K tokens), inteligencia más alta y velocidad mejorada.
Estos cambios importantes se aplican al migrar desde modelos Claude 3.x Haiku.
Actualiza parámetros de muestreo
Este es un cambio importante al migrar desde modelos Claude 3.x.
Usa solo temperature O top_p, no ambos.
Actualiza versiones de herramientas
Este es un cambio importante al migrar desde modelos Claude 3.x.
Actualiza a las últimas versiones de herramientas (text_editor_20250728, code_execution_20250825). Elimina cualquier código que use el comando undo_edit.
Maneja la razón de parada refusal
Actualiza tu aplicación para manejar razones de parada refusal.
Actualiza tus indicaciones para cambios de comportamiento
Los modelos Claude 4 tienen un estilo de comunicación más conciso y directo. Revisa mejores prácticas de indicaciones para obtener orientación de optimización.
claude-haiku-4-5-20251001text_editor_20250728, code_execution_20250825); las versiones heredadas no son compatiblesundo_edit (si aplica)temperature O top_p, no ambosrefusal en tu aplicaciónWas this page helpful?