Claude 4.5 introduz três modelos projetados para diferentes casos de uso:
Claude Opus 4.5 representa nosso modelo mais inteligente, combinando capacidade máxima com desempenho prático. Ele oferece melhorias significativas em raciocínio, codificação e tarefas complexas de resolução de problemas, mantendo os resultados de alta qualidade esperados da família Opus.
Claude Opus 4.5 é o único modelo que suporta o parâmetro de esforço, permitindo que você controle quantos tokens Claude usa ao responder. Isso lhe dá a capacidade de fazer trade-offs entre a minuciosidade da resposta e a eficiência de tokens com um único modelo.
O parâmetro de esforço afeta todos os tokens na resposta, incluindo respostas de texto, chamadas de ferramentas e pensamento estendido. Você pode escolher entre:
Claude Opus 4.5 introduz capacidades aprimoradas de uso de computador com uma nova ação de zoom que permite inspeção detalhada de regiões específicas da tela em resolução completa. Isso permite que Claude examine elementos de UI refinados, texto pequeno e informações visuais detalhadas que podem estar pouco claras em capturas de tela padrão.
A capacidade de zoom é particularmente valiosa para:
Claude Opus 4.5 oferece inteligência de ponta a um ponto de preço mais acessível do que os modelos Opus anteriores, tornando capacidades avançadas de IA disponíveis para uma gama mais ampla de aplicações e casos de uso.
Claude Opus 4.5 preserva automaticamente todos os blocos de pensamento anteriores ao longo das conversas, mantendo continuidade de raciocínio em interações multi-turno estendidas e sessões de uso de ferramentas. Isso garante que Claude possa aproveitar efetivamente seu histórico de raciocínio completo ao trabalhar em tarefas complexas e de longa duração.
Claude Sonnet 4.5 é nosso melhor modelo de codificação até o momento, com melhorias significativas em todo o ciclo de vida do desenvolvimento:
Claude Sonnet 4.5 tem desempenho significativamente melhor em tarefas de codificação quando o pensamento estendido está ativado. O pensamento estendido está desativado por padrão, mas recomendamos ativá-lo para trabalho de codificação complexo. Esteja ciente de que o pensamento estendido impacta a eficiência do cache de prompt. Veja o guia de migração para detalhes de configuração.
Claude Sonnet 4.5 introduz avanços significativos em capacidades de agentes:
Claude Sonnet 4.5 tem uma abordagem de comunicação refinada que é concisa, direta e natural. Ele fornece atualizações de progresso baseadas em fatos e pode pular resumos verbosos após chamadas de ferramentas para manter o momentum do fluxo de trabalho (embora isso possa ser ajustado com prompting).
Para orientação detalhada sobre como trabalhar com esse estilo de comunicação, veja Melhores práticas do Claude 4.
Claude Sonnet 4.5 se destaca em tarefas de conteúdo criativo:
Claude Haiku 4.5 representa um salto transformador para a família de modelos Haiku, trazendo capacidades de fronteira para nossa classe de modelo mais rápida:
Claude Haiku 4.5 oferece desempenho próximo à fronteira correspondendo ao desempenho do Sonnet 4 a custo significativamente menor e velocidade mais rápida:
Claude Haiku 4.5 é o primeiro modelo Haiku a suportar pensamento estendido, trazendo capacidades avançadas de raciocínio para a família Haiku:
O pensamento estendido deve ser ativado explicitamente adicionando um parâmetro thinking às suas solicitações de API. Veja a documentação de pensamento estendido para detalhes de implementação.
Claude Haiku 4.5 tem desempenho significativamente melhor em tarefas de codificação e raciocínio quando o pensamento estendido está ativado. O pensamento estendido está desativado por padrão, mas recomendamos ativá-lo para resolução de problemas complexos, trabalho de codificação e raciocínio multi-etapa. Esteja ciente de que o pensamento estendido impacta a eficiência do cache de prompt. Veja o guia de migração para detalhes de configuração.
Claude Haiku 4.5 apresenta conscientização de contexto, permitindo que o modelo rastreie sua janela de contexto restante ao longo de uma conversa:
Este é o primeiro modelo Haiku com capacidades nativas de conscientização de contexto. Para orientação de prompting, veja Melhores práticas do Claude 4.
Claude Haiku 4.5 oferece capacidades robustas de codificação esperadas de modelos Claude modernos:
Haiku 4.5 é projetado para casos de uso que exigem inteligência e eficiência:
Chamada de ferramenta programática permite que Claude escreva código que chama suas ferramentas programaticamente dentro de um contêiner de execução de código, em vez de exigir viagens de ida e volta através do modelo para cada invocação de ferramenta. Isso reduz significativamente a latência para fluxos de trabalho multi-ferramenta e diminui o consumo de tokens permitindo que Claude filtre ou processe dados antes que atinjam a janela de contexto do modelo.
tools=[
{
"type": "code_execution_20250825",
"name": "code_execution"
},
{
"name": "query_database",
"description": "Execute a SQL query against the sales database. Returns a list of rows as JSON objects.",
"input_schema": {...},
"allowed_callers": ["code_execution_20250825"] # Enable programmatic calling
}
]Principais benefícios:
advanced-tool-use-2025-11-20A ferramenta de busca de ferramentas permite que Claude trabalhe com centenas ou milhares de ferramentas descobrindo e carregando-as dinamicamente sob demanda. Em vez de carregar todas as definições de ferramentas na janela de contexto antecipadamente, Claude busca seu catálogo de ferramentas e carrega apenas as ferramentas que precisa.
Duas variantes de busca estão disponíveis:
tool_search_tool_regex_20251119): Claude constrói padrões regex para buscar nomes de ferramentas, descrições e argumentostool_search_tool_bm25_20251119): Claude usa consultas em linguagem natural para buscar ferramentastools=[
{
"type": "tool_search_tool_regex_20251119",
"name": "tool_search_tool_regex"
},
{
"name": "get_weather",
"description": "Get the weather at a specific location",
"input_schema": {...},
"defer_loading": True # Load on-demand via search
}
]Esta abordagem resolve dois desafios críticos:
advanced-tool-use-2025-11-20O parâmetro de esforço permite que você controle quantos tokens Claude usa ao responder, fazendo trade-offs entre minuciosidade de resposta e eficiência de tokens:
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{"role": "user", "content": "..."}],
output_config={
"effort": "medium" # "low", "medium", or "high"
}
)O parâmetro de esforço afeta todos os tokens na resposta, incluindo respostas de texto, chamadas de ferramentas e pensamento estendido. Níveis de esforço mais baixos produzem respostas mais concisas com explicações mínimas, enquanto esforço mais alto fornece raciocínio detalhado e respostas abrangentes.
effort-2025-11-24Exemplos de uso de ferramentas permitem que você forneça exemplos concretos de entradas de ferramentas válidas para ajudar Claude a entender como usar suas ferramentas mais efetivamente. Isso é particularmente útil para ferramentas complexas com objetos aninhados, parâmetros opcionais ou entradas sensíveis a formato.
tools=[
{
"name": "get_weather",
"description": "Get the current weather in a given location",
"input_schema": {...},
"input_examples": [
{
"location": "San Francisco, CA",
"unit": "fahrenheit"
},
{
"location": "Tokyo, Japan",
"unit": "celsius"
},
{
"location": "New York, NY" # Demonstrates optional 'unit' parameter
}
]
}
]Exemplos são incluídos no prompt junto com seu esquema de ferramenta, mostrando ao Claude padrões concretos para chamadas de ferramentas bem formadas. Cada exemplo deve ser válido de acordo com o input_schema da ferramenta.
advanced-tool-use-2025-11-20.A nova ferramenta de memória permite que Claude armazene e recupere informações fora da janela de contexto:
tools=[
{
"type": "memory_20250818",
"name": "memory"
}
]Isso permite:
context-management-2025-06-27Use edição de contexto para gerenciamento inteligente de contexto através de limpeza automática de chamadas de ferramentas:
response = client.beta.messages.create(
betas=["context-management-2025-06-27"],
model="claude-sonnet-4-5", # or claude-haiku-4-5
max_tokens=4096,
messages=[{"role": "user", "content": "..."}],
context_management={
"edits": [
{
"type": "clear_tool_uses_20250919",
"trigger": {"type": "input_tokens", "value": 500},
"keep": {"type": "tool_uses", "value": 2},
"clear_at_least": {"type": "input_tokens", "value": 100}
}
]
},
tools=[...]
)Este recurso remove automaticamente chamadas de ferramentas e resultados mais antigos ao se aproximar dos limites de tokens, ajudando a gerenciar contexto em sessões de agentes de longa duração.
context-management-2025-06-27Os modelos Claude 4.5 introduzem uma nova razão de parada model_context_window_exceeded que indica explicitamente quando a geração parou devido ao atingimento do limite da janela de contexto, em vez do limite max_tokens solicitado. Isso torna mais fácil lidar com limites de janela de contexto na lógica da sua aplicação.
{
"stop_reason": "model_context_window_exceeded",
"usage": {
"input_tokens": 150000,
"output_tokens": 49950
}
}Os modelos Claude 4.5 incluem uma correção de bug que preserva formatação intencional em parâmetros de string de chamada de ferramenta. Anteriormente, quebras de linha finais em parâmetros de string às vezes eram incorretamente removidas. Esta correção garante que ferramentas que exigem formatação precisa (como editores de texto) recebam parâmetros exatamente como pretendido.
Esta é uma melhoria nos bastidores sem mudanças de API necessárias. No entanto, ferramentas com parâmetros de string podem agora receber valores com quebras de linha finais que foram anteriormente removidas.
Exemplo:
// Antes: Quebra de linha final acidentalmente removida
{
"type": "tool_use",
"id": "toolu_01A09q90qw90lq917835lq9",
"name": "edit_todo",
"input": {
"file": "todo.txt",
"contents": "1. Chop onions.\n2. ???\n3. Profit"
}
}
// Depois: Quebra de linha final preservada como pretendido
{
"type": "tool_use",
"id": "toolu_01A09q90qw90lq917835lq9",
"name": "edit_todo",
"input": {
"file": "todo.txt",
"contents": "1. Chop onions.\n2. ???\n3. Profit\n"
}
}Os modelos Claude 4.5 incluem otimizações automáticas para melhorar o desempenho do modelo. Essas otimizações podem adicionar pequenas quantidades de tokens às solicitações, mas você não é cobrado por esses tokens adicionados pelo sistema.
Os seguintes recursos foram introduzidos no Claude 4 e estão disponíveis em todos os modelos Claude 4, incluindo Claude Sonnet 4.5 e Claude Haiku 4.5.
Os modelos Claude 4 introduzem uma nova razão de parada refusal para conteúdo que o modelo se recusa a gerar por razões de segurança:
{
"id": "msg_014XEDjypDjFzgKVWdFUXxZP",
"type": "message",
"role": "assistant",
"model": "claude-sonnet-4-5",
"content": [{"type": "text", "text": "I would be happy to assist you. You can "}],
"stop_reason": "refusal",
"stop_sequence": null,
"usage": {
"input_tokens": 564,
"cache_creation_input_tokens": 0,
"cache_read_input_tokens": 0,
"output_tokens": 22
}
}Ao usar modelos Claude 4, você deve atualizar sua aplicação para lidar com razões de parada refusal.
Com pensamento estendido ativado, a API de Mensagens para modelos Claude 4 retorna um resumo do processo de pensamento completo do Claude. O pensamento sumarizado fornece os benefícios de inteligência completa do pensamento estendido, enquanto previne uso indevido.
Enquanto a API é consistente entre modelos Claude 3.7 e 4, respostas de streaming para pensamento estendido podem retornar em um padrão de entrega "chunky", com possíveis atrasos entre eventos de streaming.
A sumarização é processada por um modelo diferente daquele que você alvo em suas solicitações. O modelo de pensamento não vê a saída sumarizada.
Para mais informações, veja a documentação de pensamento estendido.
Os modelos Claude 4 suportam intercalação de uso de ferramentas com pensamento estendido, permitindo conversas mais naturais onde usos de ferramentas e respostas podem ser misturados com mensagens regulares.
O pensamento intercalado está em beta. Para ativar o pensamento intercalado, adicione o cabeçalho beta interleaved-thinking-2025-05-14 à sua solicitação de API.
Para mais informações, veja a documentação de pensamento estendido.
Os modelos Claude 4 têm mudanças comportamentais notáveis que podem afetar como você estrutura prompts:
Os modelos Claude 4 são treinados para seguimento preciso de instruções e exigem direção mais explícita:
Para orientação abrangente sobre como trabalhar com esses modelos, veja Melhores práticas de engenharia de prompt do Claude 4.
A ferramenta de editor de texto foi atualizada para modelos Claude 4 com as seguintes mudanças:
text_editor_20250728str_replace_based_edit_toolundo_edit não é mais suportadoA ferramenta de editor de texto str_replace_editor permanece a mesma para Claude Sonnet 3.7.
Se você está migrando do Claude Sonnet 3.7 e usando a ferramenta de editor de texto:
# Claude Sonnet 3.7
tools=[
{
"type": "text_editor_20250124",
"name": "str_replace_editor"
}
]
# Modelos Claude 4
tools=[
{
"type": "text_editor_20250728",
"name": "str_replace_based_edit_tool"
}
]Para mais informações, veja a documentação da ferramenta de editor de texto.
Se você está usando a ferramenta de execução de código, certifique-se de estar usando a versão mais recente code_execution_20250825, que adiciona comandos Bash e capacidades de manipulação de arquivos.
A versão legada code_execution_20250522 (apenas Python) ainda está disponível mas não é recomendada para novas implementações.
Para instruções de migração, veja a documentação da ferramenta de execução de código.
Os modelos Claude 4.5 mantêm preços competitivos:
| Modelo | Entrada | Saída |
|---|---|---|
| Claude Opus 4.5 | $5 por milhão de tokens | $25 por milhão de tokens |
| Claude Sonnet 4.5 | $3 por milhão de tokens | $15 por milhão de tokens |
| Claude Haiku 4.5 | $1 por milhão de tokens | $5 por milhão de tokens |
Para mais detalhes, veja a documentação de preços.
A partir dos modelos Claude 4.5 (Opus 4.5, Sonnet 4.5 e Haiku 4.5), AWS Bedrock e Google Vertex AI oferecem dois tipos de endpoints:
Este preço regional se aplica a todos os modelos Claude 4.5: Opus 4.5, Sonnet 4.5 e Haiku 4.5.
A Claude API (1P) é global por padrão e não é afetada por essa mudança. A Claude API é apenas global (equivalente à oferta de endpoint global e preço de outros provedores).
Para detalhes de implementação e orientação de migração:
Os modelos Claude 4.5 estão disponíveis em:
| Modelo | Claude API | Amazon Bedrock | Google Cloud Vertex AI |
|---|---|---|---|
| Claude Opus 4.5 | claude-opus-4-5-20251101 | anthropic.claude-opus-4-5-20251101-v1:0 | claude-opus-4-5@20251101 |
| Claude Sonnet 4.5 | claude-sonnet-4-5-20250929 | anthropic.claude-sonnet-4-5-20250929-v1:0 | claude-sonnet-4-5@20250929 |
| Claude Haiku 4.5 | claude-haiku-4-5-20251001 | anthropic.claude-haiku-4-5-20251001-v1:0 | claude-haiku-4-5@20251001 |
Também disponível através das plataformas Claude.ai e Claude Code.
Mudanças significativas e requisitos de migração variam dependendo de qual modelo você está atualizando. Para instruções de migração detalhadas, incluindo guias passo a passo, mudanças significativas e listas de verificação de migração, veja Migrando para Claude 4.5.
O guia de migração cobre os seguintes cenários:
Atualize de modelos anteriores