O Claude Sonnet 5 é a próxima geração da família de modelos Sonnet da Anthropic. É uma atualização direta do Claude Sonnet 4.6 com três mudanças de comportamento: o pensamento adaptativo está ativado por padrão, o pensamento estendido manual agora retorna um erro 400 (foi descontinuado no Claude Sonnet 4.6), e definir parâmetros de amostragem (temperature, top_p, top_k) com valores não padrão retorna um erro 400. Esta página resume todas as novidades no lançamento, incluindo um novo tokenizador.
| Modelo | ID do modelo na API | Descrição |
|---|---|---|
| Claude Sonnet 5 | claude-sonnet-5 | A melhor combinação de velocidade e inteligência |
O Claude Sonnet 5 oferece suporte à janela de contexto de 1M de tokens por padrão (1M de tokens é tanto o padrão quanto o máximo; não há variante de contexto menor), 128k tokens máximos de saída, pensamento adaptativo e o mesmo conjunto de ferramentas e recursos de plataforma que o Claude Sonnet 4.6, exceto o Priority Tier, que não está disponível no Claude Sonnet 5.
Para preços e especificações completas, consulte a visão geral dos modelos.
No Claude Sonnet 4.6, requisições sem um campo thinking são executadas sem pensamento. No Claude Sonnet 5, as mesmas requisições são executadas com pensamento adaptativo. Para desativar o pensamento, passe thinking: {type: "disabled"}. Como max_tokens é um limite rígido para a saída total (pensamento mais texto de resposta), revise-o para cargas de trabalho que eram executadas sem pensamento no Claude Sonnet 4.6.
Definir temperature, top_p ou top_k com um valor não padrão retorna um erro 400. Remova esses parâmetros ao migrar; o valor padrão (ou omitir o parâmetro) é aceito. Use instruções no prompt do sistema para orientar o comportamento do modelo. Isso é novo para modelos da classe Sonnet; a mesma restrição foi introduzida anteriormente no Claude Opus 4.7.
O pensamento estendido manual (thinking: {type: "enabled", budget_tokens: N}) foi descontinuado no Claude Sonnet 4.6; no Claude Sonnet 5 ele foi removido e retorna um erro 400, assim como no Claude Opus 4.8 e no Claude Opus 4.7. Use o pensamento adaptativo com o parâmetro effort em vez disso.
# Não suportado no Claude Sonnet 5 (retorna 400)
thinking = {"type": "enabled", "budget_tokens": 32000}
# Use isto em vez disso
thinking = {"type": "adaptive"}O Claude Sonnet 5 usa um novo tokenizador. O mesmo texto de entrada produz aproximadamente 30% mais tokens do que no Claude Sonnet 4.6. Isso não é uma mudança na API: requisições, respostas e eventos de streaming mantêm o mesmo formato, e nenhuma alteração de código é necessária.
A mudança afeta tudo o que você mede ou orça em tokens:
usage e os resultados de contagem de tokens para o mesmo texto são maiores do que no Claude Sonnet 4.6. Não reutilize contagens medidas em modelos anteriores; reconte usando o Claude Sonnet 5.max_tokens: um limite de saída ajustado para o Claude Sonnet 4.6 pode truncar uma saída equivalente no Claude Sonnet 5. Revise limites dimensionados próximos ao comprimento de saída esperado.Esta restrição permanece inalterada em relação ao Claude Sonnet 4.6. Além das três mudanças de comportamento (consulte o Guia de migração), código que já roda no Claude Sonnet 4.6 não precisa de outras alterações.
Pré-preencher a mensagem do assistente retorna um erro 400, sem alteração em relação ao Claude Sonnet 4.6. Use saídas estruturadas, instruções no prompt do sistema ou output_config.format em vez disso.
O Claude Sonnet 5 é uma atualização de capacidade em relação ao Claude Sonnet 4.6 pelo mesmo preço. Também é uma opção para cargas de trabalho que precisam de mais capacidade do que o Claude Sonnet 4.6 oferece sem migrar para um modelo da classe Opus.
Os maiores ganhos em relação ao Claude Sonnet 4.6 estão em tarefas de programação e agênticas. Para resultados de benchmarks, consulte o Transparency Hub da Anthropic.
O Claude Sonnet 5 é o primeiro modelo da classe Sonnet com salvaguardas de cibersegurança em tempo real. Requisições que envolvem tópicos de cibersegurança proibidos ou de alto risco podem ser recusadas. Recusas retornam como uma resposta HTTP 200 bem-sucedida com stop_reason: "refusal", não como um erro. Consulte Salvaguardas, avisos e recursos para mais informações.
O Claude Sonnet 5 tem preço de US$ 3 por milhão de tokens de entrada e US$ 15 por milhão de tokens de saída, sem alteração em relação ao Claude Sonnet 4.6. Como o novo tokenizador produz aproximadamente 30% mais tokens para o mesmo texto, o custo de uma requisição equivalente pode diferir do Claude Sonnet 4.6, mesmo que o preço por token permaneça inalterado.
O preço introdutório de US$ 2/US$ 10 por milhão de tokens de entrada/saída está em vigor até 31 de agosto de 2026, após o qual o preço padrão de US$ 3/US$ 15 por milhão de tokens de entrada/saída entrará em vigor.
Consulte Preços para preços completos, incluindo taxas de processamento em lote e cache de prompt.
No lançamento, o Claude Sonnet 5 está disponível em:
InvokeModel e Converse).O Claude Sonnet 5 oferece suporte a retenção zero de dados para organizações com acordos ZDR.
O Claude Sonnet 5 é um substituto direto do Claude Sonnet 4.6. Atualize o ID do seu modelo:
model = "claude-sonnet-4-6" # Before
model = "claude-sonnet-5" # AfterEm seguida, revise o seguinte:
max_tokens dimensionados próximos ao comprimento de saída esperado.budget_tokens, migre para o pensamento adaptativo. O pensamento estendido manual (thinking: {type: "enabled"}) não é suportado e retorna um erro 400.temperature, top_p, top_k) com um valor não padrão retornam um erro 400; remova-os ao migrar. Definições de ferramentas e formatos de resposta permanecem inalterados, e o pré-preenchimento de mensagem do assistente já não era suportado no Claude Sonnet 4.6.Consulte a seção do Claude Sonnet 5 no guia de migração para mais detalhes.
Especificações e preços completos para todos os modelos Claude atuais.
Meça seus prompts com o novo tokenizador antes de migrar.
O modo de pensamento ativado recomendado no Claude Sonnet 5.
Como funciona a janela de contexto de 1M de tokens.
Preços completos, incluindo taxas de processamento em lote e cache de prompt.
Was this page helpful?