Loading...
    • Construir
    • Admin
    • Modelos y precios
    • SDKs de cliente
    • Referencia de API
    Search...
    ⌘K
    Modelos
    Descripción general de modelosElegir un modeloNovedades en Claude Opus 4.7Guía de migraciónDeprecaciones de modelosTarjetas de modeloPrompts del sistema
    Precios
    Precios
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Modelos

    Guía de migración

    Guía para migrar a los modelos Claude Opus 4.7 y Claude 4.6 desde versiones anteriores de Claude

    Was this page helpful?

    • Migración a Claude Opus 4.7
    • Actualiza tu nombre de modelo
    • Cambios de ruptura
    • Elegir un nivel de esfuerzo
    • Cambios de comportamiento
    • Cambios recomendados
    • Lista de verificación de migración
    • Migración a Claude Opus 4.7 desde Opus 4.5 o anterior
    • Actualiza tu nombre de modelo
    • Cambios de ruptura
    • Cambios recomendados
    • Migración desde Claude 4.1 o anterior
    • Lista de verificación de migración (desde Opus 4.5 o anterior)
    • Migración a Claude Sonnet 4.6
    • Cambios importantes
    • Cambios recomendados
    • Migrando desde Sonnet 4.5
    • Lista de verificación de migración de Sonnet 4.6
    • Migrando a Claude Sonnet 4.5
    • Cambios importantes
    • Lista de verificación de migración de Sonnet 4.5
    • Migrando a Claude Haiku 4.5
    • Cambios importantes
    • Lista de verificación de migración de Haiku 4.5
    • Obtener ayuda

    Esta guía cubre la migración del código de Messages API. Si utilizas Claude Managed Agents, no se requieren cambios más allá de actualizar el nombre del modelo.

    Migración a Claude Opus 4.7

    Claude Opus 4.7 es nuestro modelo más capaz disponible en general hasta la fecha. Es altamente autónomo y funciona excepcionalmente bien en trabajo agentico de largo horizonte, trabajo de conocimiento, tareas de visión y tareas de memoria. Claude Opus 4.7 debería tener un fuerte rendimiento listo para usar en prompts y evals existentes de Claude Opus 4.6 con el mismo precio de $5 / $25 por MTok, pero hay un puñado de cambios de comportamiento y API que vale la pena conocer mientras migras. Admite el mismo conjunto de características que Claude Opus 4.6, incluyendo la ventana de contexto de 1M tokens con precios estándar de API sin prima de contexto largo, 128k tokens de salida máxima, pensamiento adaptativo, almacenamiento en caché de prompts, procesamiento por lotes, Files API, soporte de PDF, visión y el conjunto completo de herramientas del lado del servidor y del lado del cliente (bash, ejecución de código, uso de computadora, editor de texto, búsqueda web, obtención web, conector MCP, memoria).

    Automatiza esta migración con la habilidad Claude API. En Claude Code, ejecuta /claude-api migrate para invocar la habilidad Claude API incluida:

    /claude-api migrate this project to claude-opus-4-7

    La habilidad aplica el cambio de ID de modelo, cambios de parámetros de ruptura, reemplazo de prefill y calibración de esfuerzo descritos a continuación en tu base de código, luego produce una lista de verificación de elementos a verificar manualmente. Te pide que confirmes el alcance de la migración (directorio de trabajo completo, un subdirectorio o una lista de archivos específica) antes de editar cualquier archivo.

    Actualiza tu nombre de modelo

    # Migración de Opus
    model = "claude-opus-4-6"  # Antes
    model = "claude-opus-4-7"  # Después

    Cambios de ruptura

    1. Pensamiento extendido eliminado: thinking: {type: "enabled", budget_tokens: N} ya no es compatible con Claude Opus 4.7 o modelos posteriores y devuelve un error 400. Cambia a pensamiento adaptativo (thinking: {type: "adaptive"}) y usa el parámetro de esfuerzo para controlar la profundidad del pensamiento. El pensamiento adaptativo está desactivado por defecto en Claude Opus 4.7: las solicitudes sin campo thinking se ejecutan sin pensamiento, coincidiendo con el comportamiento de Opus 4.6. Establece thinking: {type: "adaptive"} explícitamente para habilitarlo.

      Antes (Claude Opus 4.6):

      client.messages.create(
          model="claude-opus-4-6",
          max_tokens=64000,
          thinking={"type": "enabled", "budget_tokens": 32000},
          messages=[{"role": "user", "content": "..."}],
      )

    Elegir un nivel de esfuerzo

    El parámetro de esfuerzo te permite ajustar la inteligencia de Claude versus el gasto de tokens, intercambiando capacidad por velocidad más rápida y costos más bajos. Comienza con el nuevo nivel de esfuerzo xhigh para casos de uso de codificación y agentico, y usa un mínimo de esfuerzo high para la mayoría de casos de uso sensibles a la inteligencia. Experimenta con otros niveles de esfuerzo para ajustar aún más el uso de tokens e inteligencia:

    • max: El esfuerzo máximo puede entregar ganancias de rendimiento en algunos casos de uso, pero puede mostrar rendimientos decrecientes del aumento del uso de tokens. Esta configuración también puede ser propensa al exceso de pensamiento. Recomendamos probar el esfuerzo máximo para tareas que demandan inteligencia.
    • xhigh (nuevo): El esfuerzo extra alto es la mejor configuración para la mayoría de casos de uso de codificación y agentico.
    • high: Esta configuración equilibra el uso de tokens e inteligencia. Para la mayoría de casos de uso sensibles a la inteligencia, recomendamos un mínimo de esfuerzo high.
    • medium: Bueno para casos de uso sensibles al costo que necesitan reducir el uso de tokens mientras se compromete la inteligencia.
    • low: Reserva para tareas cortas y limitadas y cargas de trabajo sensibles a la latencia que no son sensibles a la inteligencia.

    Esperamos que el esfuerzo sea más importante para este modelo que para cualquier Opus anterior, y recomendamos experimentar con él activamente cuando actualices.

    Cambios de comportamiento

    Claude Opus 4.7 tiene varias diferencias de comportamiento de Claude Opus 4.6 que no son cambios de ruptura de API pero pueden requerir actualizaciones de prompts o eliminación de andamiaje.

    1. La longitud de respuesta varía según el caso de uso: Claude Opus 4.7 calibra la longitud de respuesta a qué tan compleja juzga que es la tarea, en lugar de predeterminar una verbosidad fija. Esto generalmente significa respuestas más cortas en búsquedas simples y mucho más largas en análisis abiertos. Si tu producto depende de un cierto estilo o verbosidad de salida, es posible que necesites ajustar tus prompts. Como ejemplo, para disminuir la verbosidad, podrías agregar: "Proporciona respuestas concisas y enfocadas. Omite contexto no esencial y mantén los ejemplos mínimos." Si ves ejemplos específicos de tipos de verbosidad (es decir, sobre-explicación), puedes agregar instrucciones adicionales en tu prompt para prevenirlas. Los ejemplos positivos que muestran cómo Claude puede comunicarse con el nivel apropiado de concisión tienden a ser más efectivos que ejemplos negativos o instrucciones que le dicen al modelo qué no hacer.

    2. Seguimiento de instrucciones más literal: Claude Opus 4.7 interpreta prompts de manera más literal y explícita que Claude Opus 4.6, particularmente en niveles de esfuerzo más bajos. No generalizará silenciosamente una instrucción de un elemento a otro, y no inferirá solicitudes que no hiciste. El lado positivo de este literalismo es la precisión y menos confusión. Generalmente funciona mejor para casos de uso de API con prompts cuidadosamente ajustados, extracción estructurada y canalizaciones donde deseas comportamiento predecible. Una revisión de prompt y arnés puede ser especialmente útil para la migración a Claude Opus 4.7.

    3. Tono más directo: Como con cualquier modelo nuevo, el estilo de prosa en escritura de forma larga puede cambiar. Claude Opus 4.7 es más directo y opinado, con menos frases orientadas a la validación y menos emoji que el estilo más cálido de Claude Opus 4.6. Si tu producto se basa en una voz específica, reevalúa los prompts de estilo contra la nueva línea base.

    Cambios recomendados

    Estos no son obligatorios pero mejorarán tu experiencia:

    1. Re-evalúa max_tokens: Debido a que el mismo texto produce un conteo de tokens más alto en Claude Opus 4.7, sugerimos actualizar tus parámetros max_tokens para dar espacio adicional, incluyendo disparadores de compactación. Las intervenciones de prompting, task_budget y effort pueden ayudar a controlar costos y garantizar el uso apropiado de tokens.

    2. Audita expectativas de conteo de tokens: Cualquier ruta de código que estime tokens del lado del cliente o asuma una relación fija de token a carácter debe ser re-probada contra Claude Opus 4.7. Usa el endpoint de conteo de tokens para verificar.

    3. Adopta presupuestos de tarea (beta): Claude Opus 4.7 introduce presupuestos de tarea. Estos presupuestos te permiten informar a Claude cuántos tokens tiene para un bucle agentico completo, incluyendo pensamiento, llamadas de herramienta, resultados de herramienta y salida final. El modelo ve una cuenta regresiva en ejecución y la usa para priorizar trabajo y terminar la tarea gracefully a medida que se consume el presupuesto. Para usar, establece el encabezado beta task-budgets-2026-03-13 y agrega lo siguiente a tu configuración de salida:

    Lista de verificación de migración

    • Actualiza el nombre del modelo de claude-opus-4-6 a claude-opus-4-7 (o actualiza alias).
    • Elimina temperature, top_p y top_k de las cargas útiles de solicitud.
    • Reemplaza thinking: {type: "enabled", budget_tokens: N} con thinking: {type: "adaptive"} más el parámetro de esfuerzo.
    • Elimina cualquier prefill de mensaje de asistente.
    • Si tu interfaz de usuario muestra contenido de pensamiento, opta explícitamente por la resumición de pensamiento.
    • Re-compara costo y latencia de extremo a extremo bajo la tokenización actualizada.
    • Re-ajusta para tener en cuenta la tokenización actualizada.

    Migración a Claude Opus 4.7 desde Opus 4.5 o anterior

    Si estás migrando desde Claude Opus 4.5, Opus 4.1 o un modelo anterior directamente a Claude Opus 4.7, aplica todos los cambios de Opus 4.7 anteriores más los cambios acumulativos en esta sección que entraron en vigencia entre Opus 4.5 y Opus 4.7. Si estás migrando desde Opus 4.6, solo necesitas la sección de Opus 4.7 anterior.

    Actualiza tu nombre de modelo

    # Migración de Opus
    model = "claude-opus-4-5"  # Antes
    model = "claude-opus-4-7"  # Después

    Cambios de ruptura

    1. Eliminación de prefill se cubre en los cambios de ruptura de Opus 4.7 anteriores.

    2. Entrecomillado de parámetro de herramienta: Los modelos Claude Opus 4.6 y posteriores pueden producir un escape JSON de cadena ligeramente diferente en argumentos de llamada de herramienta (por ejemplo, manejo diferente de escapes Unicode o escape de barra diagonal). Si analizas la input de llamada de herramienta como una cadena sin procesar en lugar de usar un analizador JSON, verifica tu lógica de análisis. Los analizadores JSON estándar (como json.loads() o JSON.parse()) manejan estas diferencias automáticamente.

    Cambios recomendados

    Estos cambios mejoran tu experiencia en Opus 4.7. Los elementos marcados (requerido en Opus 4.7) fueron recomendaciones opcionales cuando se lanzó Opus 4.6 pero ahora son obligatorios; el resto permanece recomendado.

    1. Migra a pensamiento adaptativo (requerido en Opus 4.7): thinking: {type: "enabled", budget_tokens: N} devuelve un error 400 en Claude Opus 4.7. Cambia a thinking: {type: "adaptive"} y usa el parámetro de esfuerzo para controlar la profundidad del pensamiento. Consulta Pensamiento adaptativo.

    Migración desde Claude 4.1 o anterior

    Si estás migrando desde Opus 4.1, Sonnet 4 (deprecado) o modelos anteriores directamente a Claude Opus 4.7, aplica los cambios de Claude Opus 4.7 en la parte superior de esta guía y los cambios acumulativos anteriores más los cambios adicionales en esta sección.

    # Desde Opus 4.1
    model = "claude-opus-4-1-20250805"  # Antes
    model = "claude-opus-4-7"  # Después
    
    # Desde Sonnet 4
    model = "claude-sonnet-4-20250514"  # Antes
    model = "claude-opus-4-7"  # Después
    
    # Desde Sonnet 3.7
    model = "claude-3-7-sonnet-20250219"  # Antes
    model = "claude-opus-4-7"  # Después

    Cambios de ruptura adicionales

    1. Elimina parámetros de muestreo

      Este es un cambio de ruptura al migrar desde modelos Claude 3.x.

      A partir de Claude Opus 4.7, establecer temperature, top_p o top_k a cualquier valor no predeterminado devolverá un error 400. La ruta de migración más segura es omitir estos parámetros completamente de las solicitudes, y usar prompting para guiar el comportamiento del modelo. Si estabas usando temperature = 0 para determinismo, ten en cuenta que nunca garantizó salidas idénticas.

      Python
      # Antes - Esto dará error en modelos Claude 4+
      response = client.messages.create(
          model="claude-3-7-sonnet-20250219",
          temperature=0.7,
          top_p=0.9,  # Los parámetros de muestreo no predeterminados devuelven 400 en Opus 4.7
          # ...
      )
      
      # Después
      response = client.messages.create(
          model="claude-opus-4-7",
          # ...
      )

    Cambios recomendados adicionales

    • Elimina encabezados beta heredados: Elimina token-efficient-tools-2025-02-19 y output-128k-2025-02-19. Todos los modelos Claude 4+ tienen uso de herramienta eficiente en tokens integrado y estos encabezados no tienen efecto.

    Lista de verificación de migración (desde Opus 4.5 o anterior)

    • Actualiza el ID de modelo a claude-opus-4-7
    • Aplica todos los cambios de ruptura de Opus 4.7 (pensamiento extendido eliminado, parámetros de muestreo eliminados, visualización de pensamiento omitida por defecto, tokenización actualizada)
    • RUPTURA: Elimina prefills de mensaje de asistente (devuelve error 400); usa salidas estructuradas o output_config.format en su lugar
    • RUPTURA en Opus 4.7: Reemplaza thinking: {type: "enabled", budget_tokens: N} con thinking: {type: "adaptive"} más el parámetro de esfuerzo (devuelve 400 en Opus 4.7)
    • Verifica que el análisis JSON de llamada de herramienta use un analizador JSON estándar
    • Elimina encabezado beta effort-2025-11-24 (el esfuerzo ahora es GA)
    • Elimina encabezado beta

    Migración a Claude Sonnet 4.6

    Claude Sonnet 4.6 combina inteligencia fuerte con rendimiento rápido, presentando capacidades mejoradas de búsqueda agentica y ejecución de código gratuita cuando se usa con búsqueda web u obtención web. Es ideal para tareas cotidianas de codificación, análisis y contenido.

    Para una descripción general completa de capacidades, consulta la descripción general de modelos.

    El precio de Sonnet 4.6 es $3 por millón de tokens de entrada, $15 por millón de tokens de salida. Consulta Precios de Claude para más detalles.

    Actualiza tu nombre de modelo:

    # Desde Sonnet 4.5
    model = "claude-sonnet-4-5"  # Antes
    model = "claude-sonnet-4-6"  # Después
    
    # Desde Sonnet 4
    model = "claude-sonnet-4-20250514"  # Antes
    model = "claude-sonnet-4-6"  # Después

    Cambios importantes

    Al migrar desde Sonnet 4.5

    1. Ya no se admite el relleno previo de mensajes del asistente

      Este es un cambio importante al migrar desde Sonnet 4.5 o anterior.

      El relleno previo de mensajes del asistente devuelve un error 400 en Sonnet 4.6. Utiliza salidas estructuradas, instrucciones de indicación del sistema, o output_config.format en su lugar.

      Casos de uso comunes de relleno previo y migraciones:

      • Controlar el formato de salida (forzar salida JSON/YAML): Utiliza salidas estructuradas o herramientas con campos enum para tareas de clasificación.

      • Eliminar preámbulos (eliminar frases como "Aquí está..."): Añade instrucciones directas en la indicación del sistema: "Responde directamente sin preámbulo. No comiences con frases como 'Aquí está...', 'Basado en...', etc."

      • Evitar rechazos incorrectos: Claude ahora es mucho mejor en rechazos apropiados. Las indicaciones claras en el mensaje del usuario sin relleno previo deberían ser suficientes.

    Al migrar desde Claude 3.x

    1. Actualizar parámetros de muestreo

      Este es un cambio importante al migrar desde modelos Claude 3.x.

      Utiliza solo temperature O top_p, no ambos.

    2. Actualizar versiones de herramientas

      Este es un cambio importante al migrar desde modelos Claude 3.x.

      Actualiza a las últimas versiones de herramientas (text_editor_20250728, code_execution_20250825). Elimina cualquier código que utilice el comando undo_edit.

    3. Manejar la razón de parada refusal

      Actualiza tu aplicación para manejar razones de parada refusal.

    Cambios recomendados

    1. Eliminar encabezado beta fine-grained-tool-streaming-2025-05-14: El streaming de herramientas de grano fino ahora es GA en Sonnet 4.6 y ya no requiere un encabezado beta.
    2. Migrar output_format a output_config.format: El parámetro output_format está deprecado. Utiliza output_config.format en su lugar.

    Migrando desde Sonnet 4.5

    Considera migrar desde Sonnet 4.5 a Sonnet 4.6, que ofrece más inteligencia al mismo precio.

    Sonnet 4.6 tiene un nivel de esfuerzo predeterminado de high, en contraste con Sonnet 4.5 que no tenía parámetro de esfuerzo. Considera ajustar el parámetro de esfuerzo mientras migras desde Sonnet 4.5 a Sonnet 4.6. Si no se establece explícitamente, puedes experimentar una latencia más alta con el nivel de esfuerzo predeterminado.

    Si no estás usando pensamiento extendido

    Si no estás usando pensamiento extendido en Sonnet 4.5, puedes continuar sin él en Sonnet 4.6. Debes establecer explícitamente el esfuerzo al nivel apropiado para tu caso de uso. Con esfuerzo low y pensamiento deshabilitado, puedes esperar un rendimiento similar o mejor en relación con Sonnet 4.5 sin pensamiento extendido.

    Si estás usando pensamiento extendido

    Si estás usando pensamiento extendido con budget_tokens en Sonnet 4.5, sigue siendo funcional en Sonnet 4.6 pero está deprecado. Migra a pensamiento adaptativo con el parámetro de esfuerzo.

    Migrando a pensamiento adaptativo

    Pensamiento adaptativo es el reemplazo recomendado para budget_tokens en Sonnet 4.6. Es particularmente adecuado para los siguientes patrones de carga de trabajo:

    • Agentes autónomos de múltiples pasos: agentes de codificación que convierten requisitos en software funcional, canalizaciones de análisis de datos, y búsqueda de errores donde el modelo se ejecuta independientemente en muchos pasos. El pensamiento adaptativo permite que el modelo calibre su razonamiento por paso, manteniéndose en el camino en trayectorias más largas. Para estas cargas de trabajo, comienza con esfuerzo high. Si la latencia o el uso de tokens es una preocupación, reduce a medium.
    • Agentes de uso de computadora: Sonnet 4.6 logró la mejor precisión en evaluaciones de uso de computadora usando modo adaptativo.
    • Cargas de trabajo bimodales: una mezcla de tareas fáciles y difíciles donde adaptativo omite el pensamiento en consultas simples y razona profundamente en las complejas.

    Cuando uses pensamiento adaptativo, evalúa esfuerzo medium y high en tus tareas. El nivel correcto depende del equilibrio de tu carga de trabajo entre calidad, latencia y uso de tokens.

    Si ves comportamiento inconsistente o regresiones de calidad con pensamiento adaptativo, intenta reducir la configuración de esfuerzo o usar max_tokens como límite duro primero. El pensamiento extendido con budget_tokens sigue siendo funcional en Sonnet 4.6 pero está deprecado y ya no se recomienda.

    Mantener budget_tokens durante la migración

    Si necesitas mantener budget_tokens temporalmente mientras migras, un presupuesto alrededor de 16k tokens proporciona espacio para problemas más difíciles sin riesgo de uso de tokens descontrolado. Esta configuración está deprecada y será eliminada en una futura versión del modelo.

    Casos de uso de codificación y agentes

    Para codificación agente, diseño frontend, flujos de trabajo pesados en herramientas, y flujos de trabajo empresariales complejos, comienza con esfuerzo medium. Si encuentras que la latencia es demasiado alta, considera reducir el esfuerzo a low. Si necesitas mayor inteligencia, considera aumentar el esfuerzo a high o migrar a Opus 4.7.

    Casos de uso de chat y no codificación

    Para chat, generación de contenido, búsqueda, clasificación, y otras tareas no codificación, comienza con esfuerzo low con pensamiento extendido. Si necesitas más profundidad, aumenta el esfuerzo a medium.

    Lista de verificación de migración de Sonnet 4.6

    • Actualizar ID de modelo a claude-sonnet-4-6
    • IMPORTANTE: Eliminar relleno previo de mensajes del asistente; utilizar salidas estructuradas o output_config.format en su lugar
    • IMPORTANTE: Verificar que el análisis JSON de parámetros de herramienta maneje diferencias de escape
    • IMPORTANTE: Actualizar versiones de herramientas a las últimas (text_editor_20250728, code_execution_20250825); las versiones heredadas no son compatibles (si migras desde 3.x)
    • IMPORTANTE: Eliminar cualquier código que utilice el comando undo_edit (si aplica)
    • IMPORTANTE: Actualizar parámetros de muestreo para usar solo temperature O top_p, no ambos (si migras desde 3.x)

    Migrando a Claude Sonnet 4.5

    Claude Sonnet 4.5 combina una inteligencia sólida con un rendimiento rápido, lo que lo hace ideal para tareas cotidianas de codificación, análisis y contenido.

    Para una descripción general completa de capacidades, consulta la descripción general de modelos.

    Los precios de Sonnet 4.5 son $3 por millón de tokens de entrada, $15 por millón de tokens de salida. Consulta precios de Claude para más detalles.

    Actualiza tu nombre de modelo:

    # Desde Sonnet 4
    model = "claude-sonnet-4-20250514"  # Antes
    model = "claude-sonnet-4-5-20250929"  # Después
    
    # Desde Sonnet 3.7
    model = "claude-3-7-sonnet-20250219"  # Antes
    model = "claude-sonnet-4-5-20250929"  # Después

    Cambios importantes

    Estos cambios importantes se aplican al migrar desde modelos Claude 3.x Sonnet.

    1. Actualizar parámetros de muestreo

      Este es un cambio importante al migrar desde modelos Claude 3.x.

      Utiliza solo temperature O top_p, no ambos.

    2. Actualizar versiones de herramientas

      Este es un cambio importante al migrar desde modelos Claude 3.x.

      Actualiza a las últimas versiones de herramientas (text_editor_20250728, code_execution_20250825). Elimina cualquier código que utilice el comando undo_edit.

    3. Manejar la razón de parada refusal

      Actualiza tu aplicación para manejar razones de parada refusal.

    Lista de verificación de migración de Sonnet 4.5

    • Actualizar ID de modelo a claude-sonnet-4-5-20250929
    • IMPORTANTE: Actualizar versiones de herramientas a las últimas (text_editor_20250728, code_execution_20250825); las versiones heredadas no son compatibles (si migras desde 3.x)
    • IMPORTANTE: Eliminar cualquier código que utilice el comando undo_edit (si aplica)
    • IMPORTANTE: Actualizar parámetros de muestreo para usar solo temperature O top_p, no ambos (si migras desde 3.x)
    • Manejar nueva razón de parada refusal en tu aplicación
    • Revisar y actualizar indicaciones siguiendo mejores prácticas de indicación

    Migrando a Claude Haiku 4.5

    Claude Haiku 4.5 es el modelo Haiku más rápido e inteligente con rendimiento casi de frontera, ofreciendo calidad de modelo premium para aplicaciones interactivas y procesamiento de alto volumen.

    Para una descripción general completa de capacidades, consulta la descripción general de modelos.

    Los precios de Haiku 4.5 son $1 por millón de tokens de entrada, $5 por millón de tokens de salida. Consulta precios de Claude para más detalles.

    Actualiza tu nombre de modelo:

    # Desde Haiku 3.5
    model = "claude-3-5-haiku-20241022"  # Antes
    model = "claude-haiku-4-5-20251001"  # Después
    
    # Desde Haiku 3
    model = "claude-3-haiku-20240307"  # Antes
    model = "claude-haiku-4-5-20251001"  # Después

    Revisar nuevos límites de velocidad: Haiku 4.5 tiene límites de velocidad separados de Haiku 3.5 y Haiku 3. Consulta documentación de límites de velocidad para más detalles.

    Para mejoras significativas de rendimiento en tareas de codificación y razonamiento, considera habilitar pensamiento extendido con thinking: {type: "enabled", budget_tokens: N}.

    El pensamiento extendido impacta la eficiencia del almacenamiento en caché de indicaciones.

    El pensamiento extendido está deprecado en modelos Claude 4.6 o más nuevos. Si usas modelos más nuevos, utiliza pensamiento adaptativo en su lugar.

    Explorar nuevas capacidades: Consulta la descripción general de modelos para detalles sobre conciencia de contexto, capacidad de salida aumentada (64k tokens), mayor inteligencia, y velocidad mejorada.

    Cambios importantes

    Estos cambios importantes se aplican al migrar desde modelos Claude 3.x Haiku.

    1. Actualizar parámetros de muestreo

      Este es un cambio importante al migrar desde modelos Claude 3.x.

      Utiliza solo temperature O top_p, no ambos.

    2. Actualizar versiones de herramientas

      Este es un cambio importante al migrar desde modelos Claude 3.x.

      Actualiza a las últimas versiones de herramientas (text_editor_20250728, code_execution_20250825). Elimina cualquier código que utilice el comando undo_edit.

    3. Manejar la razón de parada refusal

      Actualiza tu aplicación para manejar razones de parada refusal.

    Lista de verificación de migración de Haiku 4.5

    • Actualizar ID de modelo a claude-haiku-4-5-20251001
    • IMPORTANTE: Actualizar versiones de herramientas a las últimas (text_editor_20250728, code_execution_20250825); las versiones heredadas no son compatibles
    • IMPORTANTE: Eliminar cualquier código que utilice el comando undo_edit (si aplica)
    • IMPORTANTE: Actualizar parámetros de muestreo para usar solo temperature O top_p, no ambos
    • Manejar nueva razón de parada refusal en tu aplicación
    • Revisar y ajustar para nuevos límites de velocidad (separados de Haiku 3.5)
    • Revisar y actualizar indicaciones siguiendo

    Obtener ayuda

    • Consulta la documentación de API para especificaciones detalladas
    • Revisa capacidades de modelo para comparaciones de rendimiento
    • Revisa notas de lanzamiento de API para actualizaciones de API
    • Contacta con soporte si encuentras problemas durante la migración

    Después (Claude Opus 4.7):

    client.messages.create(
        model="claude-opus-4-7",
        max_tokens=64000,
        thinking={"type": "adaptive"},
        output_config={"effort": "high"},  # o "max", "xhigh", "medium", "low"
        messages=[{"role": "user", "content": "..."}],
    )

    El pensamiento adaptativo es controlable a través de prompting. Para orientación sobre cómo ajustar cuando el modelo piensa demasiado o muy poco, consulta Calibración de esfuerzo y profundidad de pensamiento.

  1. Parámetros de muestreo eliminados: Establecer temperature, top_p o top_k a cualquier valor no predeterminado en Claude Opus 4.7 devuelve un error 400. La ruta de migración más segura es omitir estos parámetros completamente de las cargas útiles de solicitud. El prompting es la forma recomendada de guiar el comportamiento del modelo en Claude Opus 4.7. Si estabas usando temperature = 0 para determinismo, ten en cuenta que nunca garantizó salidas idénticas en modelos anteriores.

  2. Contenido de pensamiento omitido por defecto: Los bloques de pensamiento aún aparecen en el flujo de respuesta en Claude Opus 4.7, pero su campo thinking está vacío a menos que optes explícitamente. Este es un cambio silencioso de Claude Opus 4.6, donde el predeterminado era devolver texto de pensamiento resumido. Para restaurar el contenido de pensamiento resumido en Claude Opus 4.7, establece thinking.display en "summarized":

    thinking = {
        "type": "adaptive",
        "display": "summarized",
    }

    El predeterminado es "omitted" en Claude Opus 4.7. Si tu producto transmite razonamiento a usuarios, el nuevo predeterminado aparece como una larga pausa antes de que comience la salida; establece display: "summarized" para restaurar el progreso visible durante el pensamiento. Consulta Pensamiento extendido para más detalles.

  3. Conteo de tokens actualizado: Claude Opus 4.7 utiliza un nuevo tokenizador, contribuyendo a su rendimiento mejorado en una amplia gama de tareas. Este nuevo tokenizador puede usar aproximadamente 1x a 1.35x más tokens al procesar texto en comparación con modelos anteriores (hasta ~35% más, variando según el contenido), y /v1/messages/count_tokens devolverá un número diferente de tokens para Claude Opus 4.7 que para Claude Opus 4.6. La eficiencia de tokens de Claude Opus 4.7 puede variar según la forma de la carga de trabajo. Las intervenciones de prompting, task_budget y effort pueden ayudar a controlar costos y garantizar el uso apropiado de tokens. Ten en cuenta que estos controles pueden comprometer la inteligencia del modelo. Sugerimos actualizar tus parámetros max_tokens para dar espacio adicional, incluyendo disparadores de compactación. Claude Opus 4.7 proporciona una ventana de contexto de 1M con precios estándar de API sin prima de contexto largo.

  4. Eliminación de prefill (heredada de Opus 4.6): Rellenar previamente mensajes de asistente devuelve un error 400 en Claude Opus 4.7. Usa salidas estructuradas, instrucciones de prompts del sistema o output_config.format en su lugar.

  5. Actualizaciones de progreso integradas en trazas agenticas: Claude Opus 4.7 proporciona actualizaciones más regulares y de mayor calidad al usuario durante trazas agenticas largas. Si has agregado andamiaje para forzar mensajes de estado interino ("Después de cada 3 llamadas de herramienta, resume el progreso"), intenta eliminarlo. Si encuentras que la longitud o contenido de las actualizaciones orientadas al usuario de Claude Opus 4.7 no están bien calibradas para tu caso de uso, describe explícitamente cómo deberían verse estas actualizaciones en el prompt y proporciona ejemplos.

  6. Menos subagentos generados por defecto: Claude Opus 4.7 tiende a generar menos subagentos por defecto. Sin embargo, este comportamiento es controlable a través de prompting; proporciona a Claude Opus 4.7 orientación explícita sobre cuándo los subagentos son deseables.

  7. Calibración de esfuerzo más estricta: Cambiando significativamente de Claude Opus 4.6, Claude Opus 4.7 respeta niveles de esfuerzo estrictamente, especialmente en el extremo inferior. En low y medium, el modelo limita su trabajo a lo que se preguntó en lugar de ir más allá. Esto es bueno para latencia y costo, pero en tareas moderadamente complejas ejecutadas con esfuerzo low hay algún riesgo de sub-pensamiento. Si observas razonamiento superficial en problemas complejos, aumenta el esfuerzo a high o xhigh en lugar de hacer prompting alrededor. Si necesitas mantener el esfuerzo en low por latencia, agrega orientación dirigida: "Esta tarea implica razonamiento de múltiples pasos. Piensa cuidadosamente a través del problema antes de responder." Consulta Niveles de esfuerzo recomendados para Claude Opus 4.7.

  8. Menos llamadas de herramienta por defecto: Claude Opus 4.7 tiene una tendencia a usar herramientas menos frecuentemente que Claude Opus 4.6 y a usar razonamiento más. Esto produce mejores resultados en la mayoría de casos. Sin embargo, aumentar la configuración de esfuerzo es una palanca útil para aumentar el nivel de uso de herramientas, especialmente en trabajo de conocimiento. Las configuraciones de esfuerzo high o xhigh muestran sustancialmente más uso de herramientas en búsqueda agentica y codificación. Para escenarios donde deseas más uso de herramientas, también puedes ajustar tu prompt para instruir explícitamente al modelo sobre cuándo y cómo usar adecuadamente sus herramientas.

  9. Salvaguardas de ciberseguridad en tiempo real: Recién agregado en Claude Opus 4.7, las solicitudes que involucran temas prohibidos o de alto riesgo pueden llevar a rechazos. Para trabajo de seguridad legítimo como pruebas de penetración, investigación de vulnerabilidades o red-teaming, solicita al Programa de Verificación Cibernética para solicitar restricciones reducidas. Consulta Salvaguardas, advertencias y apelaciones para antecedentes.

  10. Soporte de imagen de alta resolución: Claude Opus 4.7 es el primer modelo Claude con soporte de imagen de alta resolución, con una resolución de imagen máxima de 2576 píxeles en el borde largo (arriba de 1568 píxeles en modelos anteriores). Esto desbloquea ganancias en cargas de trabajo pesadas en visión y es particularmente valioso para uso de computadora, comprensión de capturas de pantalla y análisis de documentos. El soporte de alta resolución es automático y no requiere encabezado beta u opt-in del lado del cliente. Las imágenes de resolución completa pueden usar hasta aproximadamente 3x más tokens de imagen que en modelos anteriores (hasta 4,784 tokens por imagen, en comparación con el límite anterior de aproximadamente 1,600 tokens por imagen), así que re-presupuesta max_tokens y expectativas de costo para cargas de trabajo pesadas en imágenes, o reduce la resolución antes de enviar si no necesitas la fidelidad adicional. Las coordenadas de señalización y cuadro delimitador devueltas por el modelo son 1

    con píxeles de imagen reales en Claude Opus 4.7, por lo que no se requiere conversión de factor de escala. Consulta Soporte de imagen de alta resolución en Claude Opus 4.7 para más detalles.

  11. output_config = {
        "effort": "high",
        "task_budget": {"type": "tokens", "total": 128000},
    }

    Es posible que necesites experimentar con diferentes presupuestos de tarea para tu caso de uso. Si al modelo se le da un presupuesto de tarea que es demasiado restrictivo para una tarea dada, puede completar la tarea menos minuciosamente, haciendo referencia a su presupuesto como la restricción. Para tareas agenticas abiertas donde la calidad importa más que la velocidad, no establezca un presupuesto de tarea; reserve presupuestos de tarea para cargas de trabajo donde necesitas que el modelo limite su trabajo a una asignación de tokens. El valor mínimo para un presupuesto de tarea es 20k tokens.

    Esto no es un límite duro; es una sugerencia de la que el modelo es consciente. Esto es distinto de max_tokens, que es un límite duro por solicitud en tokens generados (max_tokens no se pasa al modelo, y el modelo no es consciente de ello), mientras que task_budget es un límite asesor en el bucle agentico completo. Usa task_budget cuando desees que el modelo se auto-modere, y max_tokens como un techo duro por solicitud para limitar el uso.

  12. Establece un max_tokens grande en esfuerzo max o xhigh: Si estás ejecutando Claude Opus 4.7 en esfuerzo max o xhigh, establece un presupuesto de token de salida máxima grande para que el modelo tenga espacio para pensar y actuar en sus subagentos y llamadas de herramienta. Recomendamos comenzar en 64k tokens y ajustar desde allí.

  13. Reduce la resolución de imágenes si la alta resolución es innecesaria: Claude Opus 4.7 admite imágenes hasta 2576px / 3.75MP. Las imágenes de alta resolución usan más tokens. Si la fidelidad de imagen adicional es innecesaria, reduce la resolución de imágenes antes de enviar a Claude para evitar aumentos en el uso de tokens. Consulta Imágenes y visión.

  14. max_tokens
  15. Re-prueba cualquier estimación de conteo de tokens del lado del cliente.
  16. Si tu aplicación envía imágenes, re-presupuesta para soporte de imagen de alta resolución (hasta aproximadamente 3x más tokens de imagen por imagen de resolución completa). Reduce la resolución antes de enviar si no necesitas la fidelidad adicional. Si consumes coordenadas de señalización o cuadro delimitador del modelo, elimina cualquier conversión de factor de escala; las coordenadas son 1
    con píxeles de imagen reales en Claude Opus 4.7.
  17. Revisa prompts para los cambios de comportamiento anteriores (longitud de respuesta, literalismo, tono, actualizaciones de progreso, subagentos, calibración de esfuerzo, disparo de herramientas, salvaguardas cibernéticas, manejo de imagen de alta resolución).
  18. Re-establece la longitud de respuesta con prompts de control de longitud existentes eliminados, luego ajusta explícitamente.
  19. Si usas esfuerzo xhigh o max, aumenta max_tokens a al menos 64k como punto de partida.
  20. Considera adoptar presupuestos de tarea (beta) para flujos de trabajo agenticos.
  21. Si tu producto hace trabajo de seguridad legítimo, solicita al Programa de Verificación Cibernética acceso a restricciones más bajas en contenido cibernético.
  22. response = client.beta.messages.create(
        model="claude-opus-4-5",
        max_tokens=16000,
        thinking={"type": "enabled", "budget_tokens": 32000},
        betas=["interleaved-thinking-2025-05-14"],
        messages=[...],
    )

    Ten en cuenta que la migración también se mueve de client.beta.messages.create a client.messages.create. El pensamiento adaptativo y el esfuerzo son características GA y no requieren el espacio de nombres SDK beta ni ningún encabezado beta.

  23. Elimina encabezado beta de esfuerzo: El parámetro de esfuerzo ahora es GA. Elimina betas=["effort-2025-11-24"] de tus solicitudes.

  24. Elimina encabezado beta de transmisión de herramienta de grano fino: La transmisión de herramienta de grano fino ahora es GA. Elimina betas=["fine-grained-tool-streaming-2025-05-14"] de tus solicitudes.

  25. Elimina encabezado beta de pensamiento intercalado: El pensamiento adaptativo habilita automáticamente el pensamiento intercalado en Claude Opus 4.7, Opus 4.6 y Sonnet 4.6. Elimina betas=["interleaved-thinking-2025-05-14"] de tus solicitudes. El encabezado aún es funcional en Sonnet 4.6 con pensamiento extendido manual, pero el modo manual está deprecado.

  26. Migra a output_config.format: Si usas salidas estructuradas, actualiza output_format={...} a output_config={"format": {...}}. El parámetro antiguo permanece funcional pero está deprecado y será eliminado en una versión de modelo futura.

  27. Actualiza versiones de herramienta

    Este es un cambio de ruptura al migrar desde modelos Claude 3.x.

    Actualiza a las últimas versiones de herramienta. Elimina cualquier código que use el comando undo_edit.

    # Antes
    tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
    
    # Después
    tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]
    • Editor de texto: Usa text_editor_20250728 y str_replace_based_edit_tool. Consulta Documentación de herramienta de editor de texto para más detalles.
    • Ejecución de código: Actualiza a code_execution_20250825. Consulta Documentación de herramienta de ejecución de código para instrucciones de migración.
  28. Maneja la razón de parada refusal

    Actualiza tu aplicación para manejar razones de parada refusal:

    Python
    response = client.messages.create(...)
    
    if response.stop_reason == "refusal":
        # Maneja el rechazo apropiadamente
        pass
  29. Maneja la razón de parada model_context_window_exceeded

    Los modelos Claude 4.5+ devuelven una razón de parada model_context_window_exceeded cuando la generación se detiene debido a alcanzar el límite de la ventana de contexto, en lugar del límite max_tokens solicitado. Actualiza tu aplicación para manejar esta nueva razón de parada:

    Python
    response = client.messages.create(...)
    
    if response.stop_reason == "model_context_window_exceeded":
        # Maneja el límite de ventana de contexto apropiadamente
        pass
  30. Verifica el manejo de parámetro de herramienta (saltos de línea finales)

    Los modelos Claude 4.5+ preservan saltos de línea finales en parámetros de cadena de llamada de herramienta que fueron previamente eliminados. Si tus herramientas se basan en coincidencia exacta de cadena contra parámetros de llamada de herramienta, verifica que tu lógica maneje correctamente los saltos de línea finales.

  31. Actualiza tus prompts para cambios de comportamiento

    Los modelos Claude 4+ tienen un estilo de comunicación más conciso y directo y requieren dirección explícita. Revisa mejores prácticas de prompting para orientación de optimización.

  32. fine-grained-tool-streaming-2025-05-14
  33. Elimina encabezado beta interleaved-thinking-2025-05-14 (el pensamiento adaptativo habilita el pensamiento intercalado automáticamente)
  34. Migra output_format a output_config.format (si aplica)
  35. Si migras desde Claude 4.1 o anterior: elimina temperature, top_p y top_k (los valores no predeterminados devuelven 400 en Opus 4.7)
  36. Si migras desde Claude 4.1 o anterior: actualiza versiones de herramienta (text_editor_20250728, code_execution_20250825)
  37. Si migras desde Claude 4.1 o anterior: maneja razón de parada refusal
  38. Si migras desde Claude 4.1 o anterior: maneja razón de parada model_context_window_exceeded
  39. Si migras desde Claude 4.1 o anterior: verifica el manejo de parámetro de cadena de herramienta para saltos de línea finales
  40. Si migras desde Claude 4.1 o anterior: elimina encabezados beta heredados (token-efficient-tools-2025-02-19, output-128k-2025-02-19)
  41. Revisa y actualiza prompts siguiendo mejores prácticas de prompting
  42. Prueba en entorno de desarrollo antes de despliegue en producción
  43. Continuaciones (reanudar respuestas interrumpidas): Mueve la continuación al mensaje del usuario: "Tu respuesta anterior fue interrumpida y terminó con [respuesta_anterior]. Continúa desde donde lo dejaste."

  44. Hidratación de contexto / consistencia de rol (refrescar contexto en conversaciones largas): Inyecta lo que anteriormente eran recordatorios de asistente rellenados previamente en el turno del usuario en su lugar.

  45. El escape JSON de parámetros de herramienta puede diferir

    Este es un cambio importante al migrar desde Sonnet 4.5 o anterior.

    El escape de cadenas JSON en parámetros de herramienta puede diferir de modelos anteriores. Los analizadores JSON estándar manejan esto automáticamente, pero el análisis personalizado basado en cadenas puede necesitar actualizaciones.

  46. Actualizar tus indicaciones para cambios de comportamiento

    Los modelos Claude 4 tienen un estilo de comunicación más conciso y directo. Revisa mejores prácticas de indicación para orientación de optimización.

    response = client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=8192,
        output_config={"effort": "low"},
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
    response = client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=64000,
        thinking={"type": "adaptive"},
        output_config={"effort": "medium"},
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
    response = client.beta.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=16384,
        thinking={"type": "enabled", "budget_tokens": 16384},
        output_config={"effort": "medium"},
        betas=["interleaved-thinking-2025-05-14"],
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
    response = client.beta.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=8192,
        thinking={"type": "enabled", "budget_tokens": 16384},
        output_config={"effort": "low"},
        betas=["interleaved-thinking-2025-05-14"],
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
  47. Manejar nueva razón de parada refusal en tu aplicación
  48. Eliminar encabezado beta fine-grained-tool-streaming-2025-05-14 (ahora GA)
  49. Migrar output_format a output_config.format
  50. Revisar y actualizar indicaciones siguiendo mejores prácticas de indicación
  51. Recomendado: Migrar desde thinking: {type: "enabled", budget_tokens: N} a thinking: {type: "adaptive"} con el parámetro de esfuerzo (budget_tokens está deprecado y será eliminado en una futura versión)
  52. Probar en entorno de desarrollo antes del despliegue en producción
  53. Actualizar tus indicaciones para cambios de comportamiento

    Los modelos Claude 4 tienen un estilo de comunicación más conciso y directo. Revisa mejores prácticas de indicación para orientación de optimización.

  54. Considerar habilitar pensamiento extendido para tareas de razonamiento complejo
  55. Probar en entorno de desarrollo antes del despliegue en producción
  56. Actualizar tus indicaciones para cambios de comportamiento

    Los modelos Claude 4 tienen un estilo de comunicación más conciso y directo. Revisa mejores prácticas de indicación para orientación de optimización.

    mejores prácticas de indicación
  57. Considerar habilitar pensamiento extendido para tareas de razonamiento complejo
  58. Probar en entorno de desarrollo antes del despliegue en producción