Claude 4.5 introduce tres modelos diseñados para diferentes casos de uso:
Claude Opus 4.5 representa nuestro modelo más inteligente, combinando la máxima capacidad con un rendimiento práctico. Ofrece mejoras de cambio de paso en razonamiento, codificación y tareas complejas de resolución de problemas mientras mantiene los resultados de alta calidad esperados de la familia Opus.
Claude Opus 4.5 es el único modelo que admite el parámetro de esfuerzo, permitiéndote controlar cuántos tokens usa Claude al responder. Esto te da la capacidad de hacer compensaciones entre la exhaustividad de la respuesta y la eficiencia de tokens con un único modelo.
El parámetro de esfuerzo afecta todos los tokens en la respuesta, incluyendo respuestas de texto, llamadas de herramientas y pensamiento extendido. Puedes elegir entre:
Claude Opus 4.5 introduce capacidades mejoradas de uso de computadora con una nueva acción de zoom que permite la inspección detallada de regiones específicas de la pantalla a resolución completa. Esto permite a Claude examinar elementos de interfaz de usuario de grano fino, texto pequeño e información visual detallada que podría ser poco clara en capturas de pantalla estándar.
La capacidad de zoom es particularmente valiosa para:
Claude Opus 4.5 ofrece inteligencia de clase mundial a un punto de precio más accesible que los modelos Opus anteriores, haciendo que las capacidades avanzadas de IA estén disponibles para una gama más amplia de aplicaciones y casos de uso.
Claude Opus 4.5 preserva automáticamente todos los bloques de pensamiento anteriores a lo largo de las conversaciones, manteniendo la continuidad del razonamiento en interacciones multi-turno extendidas y sesiones de uso de herramientas. Esto asegura que Claude pueda aprovechar efectivamente su historial de razonamiento completo cuando trabaja en tareas complejas y de larga duración.
Claude Sonnet 4.5 es nuestro mejor modelo de codificación hasta la fecha, con mejoras significativas en todo el ciclo de vida del desarrollo:
Claude Sonnet 4.5 funciona significativamente mejor en tareas de codificación cuando el pensamiento extendido está habilitado. El pensamiento extendido está deshabilitado por defecto, pero recomendamos habilitarlo para trabajo de codificación complejo. Ten en cuenta que el pensamiento extendido impacta la eficiencia del almacenamiento en caché de prompts. Consulta la guía de migración para detalles de configuración.
Claude Sonnet 4.5 introduce avances importantes en capacidades de agente:
Claude Sonnet 4.5 tiene un enfoque de comunicación refinado que es conciso, directo y natural. Proporciona actualizaciones de progreso basadas en hechos y puede omitir resúmenes detallados después de llamadas de herramientas para mantener el impulso del flujo de trabajo (aunque esto puede ajustarse con prompting).
Para orientación detallada sobre cómo trabajar con este estilo de comunicación, consulta Mejores prácticas de Claude 4.
Claude Sonnet 4.5 destaca en tareas de contenido creativo:
Claude Haiku 4.5 representa un salto transformador para la familia de modelos Haiku, trayendo capacidades de frontera a nuestra clase de modelo más rápida:
Claude Haiku 4.5 ofrece rendimiento casi de frontera que iguala a Sonnet 4 a un costo significativamente menor y velocidad más rápida:
Claude Haiku 4.5 es el primer modelo Haiku que admite pensamiento extendido, trayendo capacidades de razonamiento avanzado a la familia Haiku:
El pensamiento extendido debe habilitarse explícitamente agregando un parámetro thinking a tus solicitudes de API. Consulta la documentación de pensamiento extendido para detalles de implementación.
Claude Haiku 4.5 funciona significativamente mejor en tareas de codificación y razonamiento cuando el pensamiento extendido está habilitado. El pensamiento extendido está deshabilitado por defecto, pero recomendamos habilitarlo para resolución de problemas complejos, trabajo de codificación y razonamiento multi-paso. Ten en cuenta que el pensamiento extendido impacta la eficiencia del almacenamiento en caché de prompts. Consulta la guía de migración para detalles de configuración.
Claude Haiku 4.5 presenta conciencia de contexto, permitiendo al modelo rastrear su ventana de contexto restante a lo largo de una conversación:
Este es el primer modelo Haiku con capacidades nativas de conciencia de contexto. Para orientación de prompting, consulta Mejores prácticas de Claude 4.
Claude Haiku 4.5 ofrece capacidades de codificación robustas esperadas de los modelos Claude modernos:
Haiku 4.5 está diseñado para casos de uso que demandan tanto inteligencia como eficiencia:
La llamada de herramientas programática permite a Claude escribir código que llama tus herramientas programáticamente dentro de un contenedor de ejecución de código, en lugar de requerir viajes de ida y vuelta a través del modelo para cada invocación de herramienta. Esto reduce significativamente la latencia para flujos de trabajo multi-herramienta y disminuye el consumo de tokens al permitir a Claude filtrar o procesar datos antes de que lleguen a la ventana de contexto del modelo.
tools=[
{
"type": "code_execution_20250825",
"name": "code_execution"
},
{
"name": "query_database",
"description": "Execute a SQL query against the sales database. Returns a list of rows as JSON objects.",
"input_schema": {...},
"allowed_callers": ["code_execution_20250825"] # Enable programmatic calling
}
]Beneficios clave:
advanced-tool-use-2025-11-20La herramienta de búsqueda de herramientas permite a Claude trabajar con cientos o miles de herramientas descubriendo y cargándolas dinámicamente bajo demanda. En lugar de cargar todas las definiciones de herramientas en la ventana de contexto de antemano, Claude busca tu catálogo de herramientas y carga solo las herramientas que necesita.
Hay dos variantes de búsqueda disponibles:
tool_search_tool_regex_20251119): Claude construye patrones regex para buscar nombres de herramientas, descripciones y argumentostool_search_tool_bm25_20251119): Claude usa consultas en lenguaje natural para buscar herramientastools=[
{
"type": "tool_search_tool_regex_20251119",
"name": "tool_search_tool_regex"
},
{
"name": "get_weather",
"description": "Get the weather at a specific location",
"input_schema": {...},
"defer_loading": True # Load on-demand via search
}
]Este enfoque resuelve dos desafíos críticos:
advanced-tool-use-2025-11-20El parámetro de esfuerzo te permite controlar cuántos tokens usa Claude al responder, haciendo compensaciones entre la exhaustividad de la respuesta y la eficiencia de tokens:
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{"role": "user", "content": "..."}],
output_config={
"effort": "medium" # "low", "medium", or "high"
}
)El parámetro de esfuerzo afecta todos los tokens en la respuesta, incluyendo respuestas de texto, llamadas de herramientas y pensamiento extendido. Los niveles de esfuerzo más bajos producen respuestas más concisas con explicaciones mínimas, mientras que el esfuerzo más alto proporciona razonamiento detallado y respuestas exhaustivas.
effort-2025-11-24Los ejemplos de uso de herramientas te permiten proporcionar ejemplos concretos de entradas de herramientas válidas para ayudar a Claude a entender cómo usar tus herramientas más efectivamente. Esto es particularmente útil para herramientas complejas con objetos anidados, parámetros opcionales o entradas sensibles al formato.
tools=[
{
"name": "get_weather",
"description": "Get the current weather in a given location",
"input_schema": {...},
"input_examples": [
{
"location": "San Francisco, CA",
"unit": "fahrenheit"
},
{
"location": "Tokyo, Japan",
"unit": "celsius"
},
{
"location": "New York, NY" # Demonstrates optional 'unit' parameter
}
]
}
]Los ejemplos se incluyen en el prompt junto a tu esquema de herramienta, mostrando a Claude patrones concretos para llamadas de herramientas bien formadas. Cada ejemplo debe ser válido según el input_schema de la herramienta.
advanced-tool-use-2025-11-20.La nueva herramienta de memoria permite a Claude almacenar y recuperar información fuera de la ventana de contexto:
tools=[
{
"type": "memory_20250818",
"name": "memory"
}
]Esto permite:
context-management-2025-06-27Usa edición de contexto para gestión inteligente de contexto a través de limpieza automática de llamadas de herramientas:
response = client.beta.messages.create(
betas=["context-management-2025-06-27"],
model="claude-sonnet-4-5", # or claude-haiku-4-5
max_tokens=4096,
messages=[{"role": "user", "content": "..."}],
context_management={
"edits": [
{
"type": "clear_tool_uses_20250919",
"trigger": {"type": "input_tokens", "value": 500},
"keep": {"type": "tool_uses", "value": 2},
"clear_at_least": {"type": "input_tokens", "value": 100}
}
]
},
tools=[...]
)Esta característica elimina automáticamente llamadas de herramientas más antiguas y resultados cuando se acerca a los límites de tokens, ayudando a gestionar el contexto en sesiones de agente de larga duración.
context-management-2025-06-27Los modelos Claude 4.5 introducen una nueva razón de parada model_context_window_exceeded que indica explícitamente cuándo la generación se detuvo debido a alcanzar el límite de la ventana de contexto, en lugar del límite de max_tokens solicitado. Esto facilita el manejo de límites de ventana de contexto en tu lógica de aplicación.
{
"stop_reason": "model_context_window_exceeded",
"usage": {
"input_tokens": 150000,
"output_tokens": 49950
}
}Los modelos Claude 4.5 incluyen una corrección de error que preserva el formato intencional en parámetros de cadena de llamadas de herramientas. Anteriormente, los saltos de línea finales en parámetros de cadena a veces se eliminaban incorrectamente. Esta corrección asegura que las herramientas que requieren formato preciso (como editores de texto) reciban parámetros exactamente como se pretendía.
Esta es una mejora detrás de escenas sin cambios de API requeridos. Sin embargo, las herramientas con parámetros de cadena ahora pueden recibir valores con saltos de línea finales que fueron eliminados previamente.
Ejemplo:
// Antes: Salto de línea final eliminado accidentalmente
{
"type": "tool_use",
"id": "toolu_01A09q90qw90lq917835lq9",
"name": "edit_todo",
"input": {
"file": "todo.txt",
"contents": "1. Chop onions.\n2. ???\n3. Profit"
}
}
// Después: Salto de línea final preservado como se pretendía
{
"type": "tool_use",
"id": "toolu_01A09q90qw90lq917835lq9",
"name": "edit_todo",
"input": {
"file": "todo.txt",
"contents": "1. Chop onions.\n2. ???\n3. Profit\n"
}
}Los modelos Claude 4.5 incluyen optimizaciones automáticas para mejorar el rendimiento del modelo. Estas optimizaciones pueden agregar pequeñas cantidades de tokens a las solicitudes, pero no se te cobra por estos tokens agregados por el sistema.
Las siguientes características fueron introducidas en Claude 4 y están disponibles en todos los modelos Claude 4, incluyendo Claude Sonnet 4.5 y Claude Haiku 4.5.
Los modelos Claude 4 introducen una nueva razón de parada refusal para contenido que el modelo rechaza generar por razones de seguridad:
{
"id": "msg_014XEDjypDjFzgKVWdFUXxZP",
"type": "message",
"role": "assistant",
"model": "claude-sonnet-4-5",
"content": [{"type": "text", "text": "I would be happy to assist you. You can "}],
"stop_reason": "refusal",
"stop_sequence": null,
"usage": {
"input_tokens": 564,
"cache_creation_input_tokens": 0,
"cache_read_input_tokens": 0,
"output_tokens": 22
}
}Al usar modelos Claude 4, debes actualizar tu aplicación para manejar razones de parada refusal.
Con el pensamiento extendido habilitado, la API de Mensajes para modelos Claude 4 devuelve un resumen del proceso de pensamiento completo de Claude. El pensamiento resumido proporciona los beneficios de inteligencia completa del pensamiento extendido, mientras previene el mal uso.
Aunque la API es consistente en los modelos Claude 3.7 y 4, las respuestas de streaming para pensamiento extendido podrían devolver en un patrón de entrega "fragmentada", con posibles retrasos entre eventos de streaming.
La sumarización es procesada por un modelo diferente al que apuntas en tus solicitudes. El modelo de pensamiento no ve la salida resumida.
Para más información, consulta la documentación de pensamiento extendido.
Los modelos Claude 4 admiten intercalar el uso de herramientas con pensamiento extendido, permitiendo conversaciones más naturales donde los usos de herramientas y respuestas pueden mezclarse con mensajes regulares.
El pensamiento intercalado está en beta. Para habilitar el pensamiento intercalado, agrega el encabezado beta interleaved-thinking-2025-05-14 a tu solicitud de API.
Para más información, consulta la documentación de pensamiento extendido.
Los modelos Claude 4 tienen cambios de comportamiento notables que pueden afectar cómo estructuras prompts:
Los modelos Claude 4 están entrenados para seguimiento preciso de instrucciones y requieren dirección más explícita:
Para orientación exhaustiva sobre cómo trabajar con estos modelos, consulta Mejores prácticas de ingeniería de prompts de Claude 4.
La herramienta de editor de texto ha sido actualizada para modelos Claude 4 con los siguientes cambios:
text_editor_20250728str_replace_based_edit_toolundo_edit ya no es compatibleLa herramienta de editor de texto str_replace_editor permanece igual para Claude Sonnet 3.7.
Si estás migrando desde Claude Sonnet 3.7 y usando la herramienta de editor de texto:
# Claude Sonnet 3.7
tools=[
{
"type": "text_editor_20250124",
"name": "str_replace_editor"
}
]
# Modelos Claude 4
tools=[
{
"type": "text_editor_20250728",
"name": "str_replace_based_edit_tool"
}
]Para más información, consulta la documentación de herramienta de editor de texto.
Si estás usando la herramienta de ejecución de código, asegúrate de estar usando la última versión code_execution_20250825, que agrega comandos Bash y capacidades de manipulación de archivos.
La versión heredada code_execution_20250522 (solo Python) sigue disponible pero no se recomienda para nuevas implementaciones.
Para instrucciones de migración, consulta la documentación de herramienta de ejecución de código.
Los modelos Claude 4.5 mantienen precios competitivos:
| Modelo | Entrada | Salida |
|---|---|---|
| Claude Opus 4.5 | $5 por millón de tokens | $25 por millón de tokens |
| Claude Sonnet 4.5 | $3 por millón de tokens | $15 por millón de tokens |
| Claude Haiku 4.5 | $1 por millón de tokens | $5 por millón de tokens |
Para más detalles, consulta la documentación de precios.
A partir de los modelos Claude 4.5 (Opus 4.5, Sonnet 4.5 y Haiku 4.5), AWS Bedrock y Google Vertex AI ofrecen dos tipos de puntos finales:
Este precio regional se aplica a todos los modelos Claude 4.5: Opus 4.5, Sonnet 4.5 y Haiku 4.5.
La API de Claude (1P) es global por defecto y no se ve afectada por este cambio. La API de Claude es solo global (equivalente a la oferta de punto final global y precios de otros proveedores).
Para detalles de implementación y orientación de migración:
Los modelos Claude 4.5 están disponibles en:
| Modelo | Claude API | Amazon Bedrock | Google Cloud Vertex AI |
|---|---|---|---|
| Claude Opus 4.5 | claude-opus-4-5-20251101 | anthropic.claude-opus-4-5-20251101-v1:0 | claude-opus-4-5@20251101 |
| Claude Sonnet 4.5 | claude-sonnet-4-5-20250929 | anthropic.claude-sonnet-4-5-20250929-v1:0 | claude-sonnet-4-5@20250929 |
| Claude Haiku 4.5 | claude-haiku-4-5-20251001 | anthropic.claude-haiku-4-5-20251001-v1:0 | claude-haiku-4-5@20251001 |
También disponible a través de plataformas Claude.ai y Claude Code.
Los cambios importantes y requisitos de migración varían dependiendo de qué modelo estés actualizando. Para instrucciones de migración detalladas, incluyendo guías paso a paso, cambios importantes y listas de verificación de migración, consulta Migrando a Claude 4.5.
La guía de migración cubre los siguientes escenarios: