Was this page helpful?
Esta guía cubre la migración del código de Messages API. Si utilizas Claude Managed Agents, no se requieren cambios más allá de actualizar el nombre del modelo.
Claude Opus 4.7 es nuestro modelo más capaz disponible en general hasta la fecha. Es altamente autónomo y funciona excepcionalmente bien en trabajo agentico de largo horizonte, trabajo de conocimiento, tareas de visión y tareas de memoria. Claude Opus 4.7 debería tener un fuerte rendimiento listo para usar en prompts y evals existentes de Claude Opus 4.6 con el mismo precio de $5 / $25 por MTok, pero hay un puñado de cambios de comportamiento y API que vale la pena conocer mientras migras. Admite el mismo conjunto de características que Claude Opus 4.6, incluyendo la ventana de contexto de 1M tokens con precios estándar de API sin prima de contexto largo, 128k tokens de salida máxima, pensamiento adaptativo, almacenamiento en caché de prompts, procesamiento por lotes, Files API, soporte de PDF, visión y el conjunto completo de herramientas del lado del servidor y del lado del cliente (bash, ejecución de código, uso de computadora, editor de texto, búsqueda web, obtención web, conector MCP, memoria).
Automatiza esta migración con la habilidad Claude API. En Claude Code, ejecuta /claude-api migrate para invocar la habilidad Claude API incluida:
/claude-api migrate this project to claude-opus-4-7La habilidad aplica el cambio de ID de modelo, cambios de parámetros de ruptura, reemplazo de prefill y calibración de esfuerzo descritos a continuación en tu base de código, luego produce una lista de verificación de elementos a verificar manualmente. Te pide que confirmes el alcance de la migración (directorio de trabajo completo, un subdirectorio o una lista de archivos específica) antes de editar cualquier archivo.
# Migración de Opus
model = "claude-opus-4-6" # Antes
model = "claude-opus-4-7" # DespuésPensamiento extendido eliminado: thinking: {type: "enabled", budget_tokens: N} ya no es compatible con Claude Opus 4.7 o modelos posteriores y devuelve un error 400. Cambia a pensamiento adaptativo (thinking: {type: "adaptive"}) y usa el parámetro de esfuerzo para controlar la profundidad del pensamiento. El pensamiento adaptativo está desactivado por defecto en Claude Opus 4.7: las solicitudes sin campo thinking se ejecutan sin pensamiento, coincidiendo con el comportamiento de Opus 4.6. Establece thinking: {type: "adaptive"} explícitamente para habilitarlo.
Antes (Claude Opus 4.6):
client.messages.create(
model="claude-opus-4-6",
max_tokens=64000,
thinking={"type": "enabled", "budget_tokens": 32000},
messages=[{"role": "user", "content": "..."}],
)El parámetro de esfuerzo te permite ajustar la inteligencia de Claude versus el gasto de tokens, intercambiando capacidad por velocidad más rápida y costos más bajos. Comienza con el nuevo nivel de esfuerzo xhigh para casos de uso de codificación y agentico, y usa un mínimo de esfuerzo high para la mayoría de casos de uso sensibles a la inteligencia. Experimenta con otros niveles de esfuerzo para ajustar aún más el uso de tokens e inteligencia:
max: El esfuerzo máximo puede entregar ganancias de rendimiento en algunos casos de uso, pero puede mostrar rendimientos decrecientes del aumento del uso de tokens. Esta configuración también puede ser propensa al exceso de pensamiento. Recomendamos probar el esfuerzo máximo para tareas que demandan inteligencia.xhigh (nuevo): El esfuerzo extra alto es la mejor configuración para la mayoría de casos de uso de codificación y agentico.high: Esta configuración equilibra el uso de tokens e inteligencia. Para la mayoría de casos de uso sensibles a la inteligencia, recomendamos un mínimo de esfuerzo high.medium: Bueno para casos de uso sensibles al costo que necesitan reducir el uso de tokens mientras se compromete la inteligencia.low: Reserva para tareas cortas y limitadas y cargas de trabajo sensibles a la latencia que no son sensibles a la inteligencia.Esperamos que el esfuerzo sea más importante para este modelo que para cualquier Opus anterior, y recomendamos experimentar con él activamente cuando actualices.
Claude Opus 4.7 tiene varias diferencias de comportamiento de Claude Opus 4.6 que no son cambios de ruptura de API pero pueden requerir actualizaciones de prompts o eliminación de andamiaje.
La longitud de respuesta varía según el caso de uso: Claude Opus 4.7 calibra la longitud de respuesta a qué tan compleja juzga que es la tarea, en lugar de predeterminar una verbosidad fija. Esto generalmente significa respuestas más cortas en búsquedas simples y mucho más largas en análisis abiertos. Si tu producto depende de un cierto estilo o verbosidad de salida, es posible que necesites ajustar tus prompts. Como ejemplo, para disminuir la verbosidad, podrías agregar: "Proporciona respuestas concisas y enfocadas. Omite contexto no esencial y mantén los ejemplos mínimos." Si ves ejemplos específicos de tipos de verbosidad (es decir, sobre-explicación), puedes agregar instrucciones adicionales en tu prompt para prevenirlas. Los ejemplos positivos que muestran cómo Claude puede comunicarse con el nivel apropiado de concisión tienden a ser más efectivos que ejemplos negativos o instrucciones que le dicen al modelo qué no hacer.
Seguimiento de instrucciones más literal: Claude Opus 4.7 interpreta prompts de manera más literal y explícita que Claude Opus 4.6, particularmente en niveles de esfuerzo más bajos. No generalizará silenciosamente una instrucción de un elemento a otro, y no inferirá solicitudes que no hiciste. El lado positivo de este literalismo es la precisión y menos confusión. Generalmente funciona mejor para casos de uso de API con prompts cuidadosamente ajustados, extracción estructurada y canalizaciones donde deseas comportamiento predecible. Una revisión de prompt y arnés puede ser especialmente útil para la migración a Claude Opus 4.7.
Tono más directo: Como con cualquier modelo nuevo, el estilo de prosa en escritura de forma larga puede cambiar. Claude Opus 4.7 es más directo y opinado, con menos frases orientadas a la validación y menos emoji que el estilo más cálido de Claude Opus 4.6. Si tu producto se basa en una voz específica, reevalúa los prompts de estilo contra la nueva línea base.
Estos no son obligatorios pero mejorarán tu experiencia:
Re-evalúa max_tokens: Debido a que el mismo texto produce un conteo de tokens más alto en Claude Opus 4.7, sugerimos actualizar tus parámetros max_tokens para dar espacio adicional, incluyendo disparadores de compactación. Las intervenciones de prompting, task_budget y effort pueden ayudar a controlar costos y garantizar el uso apropiado de tokens.
Audita expectativas de conteo de tokens: Cualquier ruta de código que estime tokens del lado del cliente o asuma una relación fija de token a carácter debe ser re-probada contra Claude Opus 4.7. Usa el endpoint de conteo de tokens para verificar.
Adopta presupuestos de tarea (beta): Claude Opus 4.7 introduce presupuestos de tarea. Estos presupuestos te permiten informar a Claude cuántos tokens tiene para un bucle agentico completo, incluyendo pensamiento, llamadas de herramienta, resultados de herramienta y salida final. El modelo ve una cuenta regresiva en ejecución y la usa para priorizar trabajo y terminar la tarea gracefully a medida que se consume el presupuesto. Para usar, establece el encabezado beta task-budgets-2026-03-13 y agrega lo siguiente a tu configuración de salida:
claude-opus-4-6 a claude-opus-4-7 (o actualiza alias).temperature, top_p y top_k de las cargas útiles de solicitud.thinking: {type: "enabled", budget_tokens: N} con thinking: {type: "adaptive"} más el parámetro de esfuerzo.Si estás migrando desde Claude Opus 4.5, Opus 4.1 o un modelo anterior directamente a Claude Opus 4.7, aplica todos los cambios de Opus 4.7 anteriores más los cambios acumulativos en esta sección que entraron en vigencia entre Opus 4.5 y Opus 4.7. Si estás migrando desde Opus 4.6, solo necesitas la sección de Opus 4.7 anterior.
# Migración de Opus
model = "claude-opus-4-5" # Antes
model = "claude-opus-4-7" # DespuésEliminación de prefill se cubre en los cambios de ruptura de Opus 4.7 anteriores.
Entrecomillado de parámetro de herramienta: Los modelos Claude Opus 4.6 y posteriores pueden producir un escape JSON de cadena ligeramente diferente en argumentos de llamada de herramienta (por ejemplo, manejo diferente de escapes Unicode o escape de barra diagonal). Si analizas la input de llamada de herramienta como una cadena sin procesar en lugar de usar un analizador JSON, verifica tu lógica de análisis. Los analizadores JSON estándar (como json.loads() o JSON.parse()) manejan estas diferencias automáticamente.
Estos cambios mejoran tu experiencia en Opus 4.7. Los elementos marcados (requerido en Opus 4.7) fueron recomendaciones opcionales cuando se lanzó Opus 4.6 pero ahora son obligatorios; el resto permanece recomendado.
Migra a pensamiento adaptativo (requerido en Opus 4.7): thinking: {type: "enabled", budget_tokens: N} devuelve un error 400 en Claude Opus 4.7. Cambia a thinking: {type: "adaptive"} y usa el parámetro de esfuerzo para controlar la profundidad del pensamiento. Consulta Pensamiento adaptativo.
Si estás migrando desde Opus 4.1, Sonnet 4 (deprecado) o modelos anteriores directamente a Claude Opus 4.7, aplica los cambios de Claude Opus 4.7 en la parte superior de esta guía y los cambios acumulativos anteriores más los cambios adicionales en esta sección.
# Desde Opus 4.1
model = "claude-opus-4-1-20250805" # Antes
model = "claude-opus-4-7" # Después
# Desde Sonnet 4
model = "claude-sonnet-4-20250514" # Antes
model = "claude-opus-4-7" # Después
# Desde Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Antes
model = "claude-opus-4-7" # DespuésElimina parámetros de muestreo
Este es un cambio de ruptura al migrar desde modelos Claude 3.x.
A partir de Claude Opus 4.7, establecer temperature, top_p o top_k a cualquier valor no predeterminado devolverá un error 400. La ruta de migración más segura es omitir estos parámetros completamente de las solicitudes, y usar prompting para guiar el comportamiento del modelo. Si estabas usando temperature = 0 para determinismo, ten en cuenta que nunca garantizó salidas idénticas.
# Antes - Esto dará error en modelos Claude 4+
response = client.messages.create(
model="claude-3-7-sonnet-20250219",
temperature=0.7,
top_p=0.9, # Los parámetros de muestreo no predeterminados devuelven 400 en Opus 4.7
# ...
)
# Después
response = client.messages.create(
model="claude-opus-4-7",
# ...
)token-efficient-tools-2025-02-19 y output-128k-2025-02-19. Todos los modelos Claude 4+ tienen uso de herramienta eficiente en tokens integrado y estos encabezados no tienen efecto.claude-opus-4-7output_config.format en su lugarthinking: {type: "enabled", budget_tokens: N} con thinking: {type: "adaptive"} más el parámetro de esfuerzo (devuelve 400 en Opus 4.7)effort-2025-11-24 (el esfuerzo ahora es GA)Claude Sonnet 4.6 combina inteligencia fuerte con rendimiento rápido, presentando capacidades mejoradas de búsqueda agentica y ejecución de código gratuita cuando se usa con búsqueda web u obtención web. Es ideal para tareas cotidianas de codificación, análisis y contenido.
Para una descripción general completa de capacidades, consulta la descripción general de modelos.
El precio de Sonnet 4.6 es $3 por millón de tokens de entrada, $15 por millón de tokens de salida. Consulta Precios de Claude para más detalles.
Actualiza tu nombre de modelo:
# Desde Sonnet 4.5
model = "claude-sonnet-4-5" # Antes
model = "claude-sonnet-4-6" # Después
# Desde Sonnet 4
model = "claude-sonnet-4-20250514" # Antes
model = "claude-sonnet-4-6" # DespuésYa no se admite el relleno previo de mensajes del asistente
Este es un cambio importante al migrar desde Sonnet 4.5 o anterior.
El relleno previo de mensajes del asistente devuelve un error 400 en Sonnet 4.6. Utiliza salidas estructuradas, instrucciones de indicación del sistema, o output_config.format en su lugar.
Casos de uso comunes de relleno previo y migraciones:
Controlar el formato de salida (forzar salida JSON/YAML): Utiliza salidas estructuradas o herramientas con campos enum para tareas de clasificación.
Eliminar preámbulos (eliminar frases como "Aquí está..."): Añade instrucciones directas en la indicación del sistema: "Responde directamente sin preámbulo. No comiences con frases como 'Aquí está...', 'Basado en...', etc."
Evitar rechazos incorrectos: Claude ahora es mucho mejor en rechazos apropiados. Las indicaciones claras en el mensaje del usuario sin relleno previo deberían ser suficientes.
Actualizar parámetros de muestreo
Este es un cambio importante al migrar desde modelos Claude 3.x.
Utiliza solo temperature O top_p, no ambos.
Actualizar versiones de herramientas
Este es un cambio importante al migrar desde modelos Claude 3.x.
Actualiza a las últimas versiones de herramientas (text_editor_20250728, code_execution_20250825). Elimina cualquier código que utilice el comando undo_edit.
Manejar la razón de parada refusal
Actualiza tu aplicación para manejar razones de parada refusal.
fine-grained-tool-streaming-2025-05-14: El streaming de herramientas de grano fino ahora es GA en Sonnet 4.6 y ya no requiere un encabezado beta.output_format a output_config.format: El parámetro output_format está deprecado. Utiliza output_config.format en su lugar.Considera migrar desde Sonnet 4.5 a Sonnet 4.6, que ofrece más inteligencia al mismo precio.
Sonnet 4.6 tiene un nivel de esfuerzo predeterminado de high, en contraste con Sonnet 4.5 que no tenía parámetro de esfuerzo. Considera ajustar el parámetro de esfuerzo mientras migras desde Sonnet 4.5 a Sonnet 4.6. Si no se establece explícitamente, puedes experimentar una latencia más alta con el nivel de esfuerzo predeterminado.
Si no estás usando pensamiento extendido en Sonnet 4.5, puedes continuar sin él en Sonnet 4.6. Debes establecer explícitamente el esfuerzo al nivel apropiado para tu caso de uso. Con esfuerzo low y pensamiento deshabilitado, puedes esperar un rendimiento similar o mejor en relación con Sonnet 4.5 sin pensamiento extendido.
Si estás usando pensamiento extendido con budget_tokens en Sonnet 4.5, sigue siendo funcional en Sonnet 4.6 pero está deprecado. Migra a pensamiento adaptativo con el parámetro de esfuerzo.
Pensamiento adaptativo es el reemplazo recomendado para budget_tokens en Sonnet 4.6. Es particularmente adecuado para los siguientes patrones de carga de trabajo:
high. Si la latencia o el uso de tokens es una preocupación, reduce a medium.Cuando uses pensamiento adaptativo, evalúa esfuerzo medium y high en tus tareas. El nivel correcto depende del equilibrio de tu carga de trabajo entre calidad, latencia y uso de tokens.
Si ves comportamiento inconsistente o regresiones de calidad con pensamiento adaptativo, intenta reducir la configuración de esfuerzo o usar max_tokens como límite duro primero. El pensamiento extendido con budget_tokens sigue siendo funcional en Sonnet 4.6 pero está deprecado y ya no se recomienda.
Si necesitas mantener budget_tokens temporalmente mientras migras, un presupuesto alrededor de 16k tokens proporciona espacio para problemas más difíciles sin riesgo de uso de tokens descontrolado. Esta configuración está deprecada y será eliminada en una futura versión del modelo.
Para codificación agente, diseño frontend, flujos de trabajo pesados en herramientas, y flujos de trabajo empresariales complejos, comienza con esfuerzo medium. Si encuentras que la latencia es demasiado alta, considera reducir el esfuerzo a low. Si necesitas mayor inteligencia, considera aumentar el esfuerzo a high o migrar a Opus 4.7.
Para chat, generación de contenido, búsqueda, clasificación, y otras tareas no codificación, comienza con esfuerzo low con pensamiento extendido. Si necesitas más profundidad, aumenta el esfuerzo a medium.
claude-sonnet-4-6output_config.format en su lugartext_editor_20250728, code_execution_20250825); las versiones heredadas no son compatibles (si migras desde 3.x)undo_edit (si aplica)temperature O top_p, no ambos (si migras desde 3.x)Claude Sonnet 4.5 combina una inteligencia sólida con un rendimiento rápido, lo que lo hace ideal para tareas cotidianas de codificación, análisis y contenido.
Para una descripción general completa de capacidades, consulta la descripción general de modelos.
Los precios de Sonnet 4.5 son $3 por millón de tokens de entrada, $15 por millón de tokens de salida. Consulta precios de Claude para más detalles.
Actualiza tu nombre de modelo:
# Desde Sonnet 4
model = "claude-sonnet-4-20250514" # Antes
model = "claude-sonnet-4-5-20250929" # Después
# Desde Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Antes
model = "claude-sonnet-4-5-20250929" # DespuésEstos cambios importantes se aplican al migrar desde modelos Claude 3.x Sonnet.
Actualizar parámetros de muestreo
Este es un cambio importante al migrar desde modelos Claude 3.x.
Utiliza solo temperature O top_p, no ambos.
Actualizar versiones de herramientas
Este es un cambio importante al migrar desde modelos Claude 3.x.
Actualiza a las últimas versiones de herramientas (text_editor_20250728, code_execution_20250825). Elimina cualquier código que utilice el comando undo_edit.
Manejar la razón de parada refusal
Actualiza tu aplicación para manejar razones de parada refusal.
claude-sonnet-4-5-20250929text_editor_20250728, code_execution_20250825); las versiones heredadas no son compatibles (si migras desde 3.x)undo_edit (si aplica)temperature O top_p, no ambos (si migras desde 3.x)refusal en tu aplicaciónClaude Haiku 4.5 es el modelo Haiku más rápido e inteligente con rendimiento casi de frontera, ofreciendo calidad de modelo premium para aplicaciones interactivas y procesamiento de alto volumen.
Para una descripción general completa de capacidades, consulta la descripción general de modelos.
Los precios de Haiku 4.5 son $1 por millón de tokens de entrada, $5 por millón de tokens de salida. Consulta precios de Claude para más detalles.
Actualiza tu nombre de modelo:
# Desde Haiku 3.5
model = "claude-3-5-haiku-20241022" # Antes
model = "claude-haiku-4-5-20251001" # Después
# Desde Haiku 3
model = "claude-3-haiku-20240307" # Antes
model = "claude-haiku-4-5-20251001" # DespuésRevisar nuevos límites de velocidad: Haiku 4.5 tiene límites de velocidad separados de Haiku 3.5 y Haiku 3. Consulta documentación de límites de velocidad para más detalles.
Para mejoras significativas de rendimiento en tareas de codificación y razonamiento, considera habilitar pensamiento extendido con thinking: {type: "enabled", budget_tokens: N}.
El pensamiento extendido impacta la eficiencia del almacenamiento en caché de indicaciones.
El pensamiento extendido está deprecado en modelos Claude 4.6 o más nuevos. Si usas modelos más nuevos, utiliza pensamiento adaptativo en su lugar.
Explorar nuevas capacidades: Consulta la descripción general de modelos para detalles sobre conciencia de contexto, capacidad de salida aumentada (64k tokens), mayor inteligencia, y velocidad mejorada.
Estos cambios importantes se aplican al migrar desde modelos Claude 3.x Haiku.
Actualizar parámetros de muestreo
Este es un cambio importante al migrar desde modelos Claude 3.x.
Utiliza solo temperature O top_p, no ambos.
Actualizar versiones de herramientas
Este es un cambio importante al migrar desde modelos Claude 3.x.
Actualiza a las últimas versiones de herramientas (text_editor_20250728, code_execution_20250825). Elimina cualquier código que utilice el comando undo_edit.
Manejar la razón de parada refusal
Actualiza tu aplicación para manejar razones de parada refusal.
claude-haiku-4-5-20251001text_editor_20250728, code_execution_20250825); las versiones heredadas no son compatiblesundo_edit (si aplica)temperature O top_p, no ambosrefusal en tu aplicaciónDespués (Claude Opus 4.7):
client.messages.create(
model="claude-opus-4-7",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "high"}, # o "max", "xhigh", "medium", "low"
messages=[{"role": "user", "content": "..."}],
)El pensamiento adaptativo es controlable a través de prompting. Para orientación sobre cómo ajustar cuando el modelo piensa demasiado o muy poco, consulta Calibración de esfuerzo y profundidad de pensamiento.
Parámetros de muestreo eliminados: Establecer temperature, top_p o top_k a cualquier valor no predeterminado en Claude Opus 4.7 devuelve un error 400. La ruta de migración más segura es omitir estos parámetros completamente de las cargas útiles de solicitud. El prompting es la forma recomendada de guiar el comportamiento del modelo en Claude Opus 4.7. Si estabas usando temperature = 0 para determinismo, ten en cuenta que nunca garantizó salidas idénticas en modelos anteriores.
Contenido de pensamiento omitido por defecto: Los bloques de pensamiento aún aparecen en el flujo de respuesta en Claude Opus 4.7, pero su campo thinking está vacío a menos que optes explícitamente. Este es un cambio silencioso de Claude Opus 4.6, donde el predeterminado era devolver texto de pensamiento resumido. Para restaurar el contenido de pensamiento resumido en Claude Opus 4.7, establece thinking.display en "summarized":
thinking = {
"type": "adaptive",
"display": "summarized",
}El predeterminado es "omitted" en Claude Opus 4.7. Si tu producto transmite razonamiento a usuarios, el nuevo predeterminado aparece como una larga pausa antes de que comience la salida; establece display: "summarized" para restaurar el progreso visible durante el pensamiento. Consulta Pensamiento extendido para más detalles.
Conteo de tokens actualizado: Claude Opus 4.7 utiliza un nuevo tokenizador, contribuyendo a su rendimiento mejorado en una amplia gama de tareas. Este nuevo tokenizador puede usar aproximadamente 1x a 1.35x más tokens al procesar texto en comparación con modelos anteriores (hasta ~35% más, variando según el contenido), y /v1/messages/count_tokens devolverá un número diferente de tokens para Claude Opus 4.7 que para Claude Opus 4.6. La eficiencia de tokens de Claude Opus 4.7 puede variar según la forma de la carga de trabajo. Las intervenciones de prompting, task_budget y effort pueden ayudar a controlar costos y garantizar el uso apropiado de tokens. Ten en cuenta que estos controles pueden comprometer la inteligencia del modelo. Sugerimos actualizar tus parámetros max_tokens para dar espacio adicional, incluyendo disparadores de compactación. Claude Opus 4.7 proporciona una ventana de contexto de 1M con precios estándar de API sin prima de contexto largo.
Eliminación de prefill (heredada de Opus 4.6): Rellenar previamente mensajes de asistente devuelve un error 400 en Claude Opus 4.7. Usa salidas estructuradas, instrucciones de prompts del sistema o output_config.format en su lugar.
Actualizaciones de progreso integradas en trazas agenticas: Claude Opus 4.7 proporciona actualizaciones más regulares y de mayor calidad al usuario durante trazas agenticas largas. Si has agregado andamiaje para forzar mensajes de estado interino ("Después de cada 3 llamadas de herramienta, resume el progreso"), intenta eliminarlo. Si encuentras que la longitud o contenido de las actualizaciones orientadas al usuario de Claude Opus 4.7 no están bien calibradas para tu caso de uso, describe explícitamente cómo deberían verse estas actualizaciones en el prompt y proporciona ejemplos.
Menos subagentos generados por defecto: Claude Opus 4.7 tiende a generar menos subagentos por defecto. Sin embargo, este comportamiento es controlable a través de prompting; proporciona a Claude Opus 4.7 orientación explícita sobre cuándo los subagentos son deseables.
Calibración de esfuerzo más estricta: Cambiando significativamente de Claude Opus 4.6, Claude Opus 4.7 respeta niveles de esfuerzo estrictamente, especialmente en el extremo inferior. En low y medium, el modelo limita su trabajo a lo que se preguntó en lugar de ir más allá. Esto es bueno para latencia y costo, pero en tareas moderadamente complejas ejecutadas con esfuerzo low hay algún riesgo de sub-pensamiento. Si observas razonamiento superficial en problemas complejos, aumenta el esfuerzo a high o xhigh en lugar de hacer prompting alrededor. Si necesitas mantener el esfuerzo en low por latencia, agrega orientación dirigida: "Esta tarea implica razonamiento de múltiples pasos. Piensa cuidadosamente a través del problema antes de responder." Consulta Niveles de esfuerzo recomendados para Claude Opus 4.7.
Menos llamadas de herramienta por defecto: Claude Opus 4.7 tiene una tendencia a usar herramientas menos frecuentemente que Claude Opus 4.6 y a usar razonamiento más. Esto produce mejores resultados en la mayoría de casos. Sin embargo, aumentar la configuración de esfuerzo es una palanca útil para aumentar el nivel de uso de herramientas, especialmente en trabajo de conocimiento. Las configuraciones de esfuerzo high o xhigh muestran sustancialmente más uso de herramientas en búsqueda agentica y codificación. Para escenarios donde deseas más uso de herramientas, también puedes ajustar tu prompt para instruir explícitamente al modelo sobre cuándo y cómo usar adecuadamente sus herramientas.
Salvaguardas de ciberseguridad en tiempo real: Recién agregado en Claude Opus 4.7, las solicitudes que involucran temas prohibidos o de alto riesgo pueden llevar a rechazos. Para trabajo de seguridad legítimo como pruebas de penetración, investigación de vulnerabilidades o red-teaming, solicita al Programa de Verificación Cibernética para solicitar restricciones reducidas. Consulta Salvaguardas, advertencias y apelaciones para antecedentes.
Soporte de imagen de alta resolución: Claude Opus 4.7 es el primer modelo Claude con soporte de imagen de alta resolución, con una resolución de imagen máxima de 2576 píxeles en el borde largo (arriba de 1568 píxeles en modelos anteriores). Esto desbloquea ganancias en cargas de trabajo pesadas en visión y es particularmente valioso para uso de computadora, comprensión de capturas de pantalla y análisis de documentos. El soporte de alta resolución es automático y no requiere encabezado beta u opt-in del lado del cliente. Las imágenes de resolución completa pueden usar hasta aproximadamente 3x más tokens de imagen que en modelos anteriores (hasta 4,784 tokens por imagen, en comparación con el límite anterior de aproximadamente 1,600 tokens por imagen), así que re-presupuesta max_tokens y expectativas de costo para cargas de trabajo pesadas en imágenes, o reduce la resolución antes de enviar si no necesitas la fidelidad adicional. Las coordenadas de señalización y cuadro delimitador devueltas por el modelo son 1
output_config = {
"effort": "high",
"task_budget": {"type": "tokens", "total": 128000},
}Es posible que necesites experimentar con diferentes presupuestos de tarea para tu caso de uso. Si al modelo se le da un presupuesto de tarea que es demasiado restrictivo para una tarea dada, puede completar la tarea menos minuciosamente, haciendo referencia a su presupuesto como la restricción. Para tareas agenticas abiertas donde la calidad importa más que la velocidad, no establezca un presupuesto de tarea; reserve presupuestos de tarea para cargas de trabajo donde necesitas que el modelo limite su trabajo a una asignación de tokens. El valor mínimo para un presupuesto de tarea es 20k tokens.
Esto no es un límite duro; es una sugerencia de la que el modelo es consciente. Esto es distinto de max_tokens, que es un límite duro por solicitud en tokens generados (max_tokens no se pasa al modelo, y el modelo no es consciente de ello), mientras que task_budget es un límite asesor en el bucle agentico completo. Usa task_budget cuando desees que el modelo se auto-modere, y max_tokens como un techo duro por solicitud para limitar el uso.
Establece un max_tokens grande en esfuerzo max o xhigh: Si estás ejecutando Claude Opus 4.7 en esfuerzo max o xhigh, establece un presupuesto de token de salida máxima grande para que el modelo tenga espacio para pensar y actuar en sus subagentos y llamadas de herramienta. Recomendamos comenzar en 64k tokens y ajustar desde allí.
Reduce la resolución de imágenes si la alta resolución es innecesaria: Claude Opus 4.7 admite imágenes hasta 2576px / 3.75MP. Las imágenes de alta resolución usan más tokens. Si la fidelidad de imagen adicional es innecesaria, reduce la resolución de imágenes antes de enviar a Claude para evitar aumentos en el uso de tokens. Consulta Imágenes y visión.
max_tokensxhigh o max, aumenta max_tokens a al menos 64k como punto de partida.response = client.beta.messages.create(
model="claude-opus-4-5",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 32000},
betas=["interleaved-thinking-2025-05-14"],
messages=[...],
)Ten en cuenta que la migración también se mueve de client.beta.messages.create a client.messages.create. El pensamiento adaptativo y el esfuerzo son características GA y no requieren el espacio de nombres SDK beta ni ningún encabezado beta.
Elimina encabezado beta de esfuerzo: El parámetro de esfuerzo ahora es GA. Elimina betas=["effort-2025-11-24"] de tus solicitudes.
Elimina encabezado beta de transmisión de herramienta de grano fino: La transmisión de herramienta de grano fino ahora es GA. Elimina betas=["fine-grained-tool-streaming-2025-05-14"] de tus solicitudes.
Elimina encabezado beta de pensamiento intercalado: El pensamiento adaptativo habilita automáticamente el pensamiento intercalado en Claude Opus 4.7, Opus 4.6 y Sonnet 4.6. Elimina betas=["interleaved-thinking-2025-05-14"] de tus solicitudes. El encabezado aún es funcional en Sonnet 4.6 con pensamiento extendido manual, pero el modo manual está deprecado.
Migra a output_config.format: Si usas salidas estructuradas, actualiza output_format={...} a output_config={"format": {...}}. El parámetro antiguo permanece funcional pero está deprecado y será eliminado en una versión de modelo futura.
Actualiza versiones de herramienta
Este es un cambio de ruptura al migrar desde modelos Claude 3.x.
Actualiza a las últimas versiones de herramienta. Elimina cualquier código que use el comando undo_edit.
# Antes
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
# Después
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]text_editor_20250728 y str_replace_based_edit_tool. Consulta Documentación de herramienta de editor de texto para más detalles.code_execution_20250825. Consulta Documentación de herramienta de ejecución de código para instrucciones de migración.Maneja la razón de parada refusal
Actualiza tu aplicación para manejar razones de parada refusal:
response = client.messages.create(...)
if response.stop_reason == "refusal":
# Maneja el rechazo apropiadamente
passManeja la razón de parada model_context_window_exceeded
Los modelos Claude 4.5+ devuelven una razón de parada model_context_window_exceeded cuando la generación se detiene debido a alcanzar el límite de la ventana de contexto, en lugar del límite max_tokens solicitado. Actualiza tu aplicación para manejar esta nueva razón de parada:
response = client.messages.create(...)
if response.stop_reason == "model_context_window_exceeded":
# Maneja el límite de ventana de contexto apropiadamente
passVerifica el manejo de parámetro de herramienta (saltos de línea finales)
Los modelos Claude 4.5+ preservan saltos de línea finales en parámetros de cadena de llamada de herramienta que fueron previamente eliminados. Si tus herramientas se basan en coincidencia exacta de cadena contra parámetros de llamada de herramienta, verifica que tu lógica maneje correctamente los saltos de línea finales.
Actualiza tus prompts para cambios de comportamiento
Los modelos Claude 4+ tienen un estilo de comunicación más conciso y directo y requieren dirección explícita. Revisa mejores prácticas de prompting para orientación de optimización.
fine-grained-tool-streaming-2025-05-14interleaved-thinking-2025-05-14 (el pensamiento adaptativo habilita el pensamiento intercalado automáticamente)output_format a output_config.format (si aplica)temperature, top_p y top_k (los valores no predeterminados devuelven 400 en Opus 4.7)text_editor_20250728, code_execution_20250825)refusalmodel_context_window_exceededtoken-efficient-tools-2025-02-19, output-128k-2025-02-19)Continuaciones (reanudar respuestas interrumpidas): Mueve la continuación al mensaje del usuario: "Tu respuesta anterior fue interrumpida y terminó con [respuesta_anterior]. Continúa desde donde lo dejaste."
Hidratación de contexto / consistencia de rol (refrescar contexto en conversaciones largas): Inyecta lo que anteriormente eran recordatorios de asistente rellenados previamente en el turno del usuario en su lugar.
El escape JSON de parámetros de herramienta puede diferir
Este es un cambio importante al migrar desde Sonnet 4.5 o anterior.
El escape de cadenas JSON en parámetros de herramienta puede diferir de modelos anteriores. Los analizadores JSON estándar manejan esto automáticamente, pero el análisis personalizado basado en cadenas puede necesitar actualizaciones.
Actualizar tus indicaciones para cambios de comportamiento
Los modelos Claude 4 tienen un estilo de comunicación más conciso y directo. Revisa mejores prácticas de indicación para orientación de optimización.
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
output_config={"effort": "low"},
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"},
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=16384,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "medium"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "low"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)refusal en tu aplicaciónfine-grained-tool-streaming-2025-05-14 (ahora GA)output_format a output_config.formatthinking: {type: "enabled", budget_tokens: N} a thinking: {type: "adaptive"} con el parámetro de esfuerzo (budget_tokens está deprecado y será eliminado en una futura versión)Actualizar tus indicaciones para cambios de comportamiento
Los modelos Claude 4 tienen un estilo de comunicación más conciso y directo. Revisa mejores prácticas de indicación para orientación de optimización.
Actualizar tus indicaciones para cambios de comportamiento
Los modelos Claude 4 tienen un estilo de comunicación más conciso y directo. Revisa mejores prácticas de indicación para orientación de optimización.