Modelos e preçosModelos

Novidades no Claude Sonnet 5

Visão geral dos novos recursos e mudanças de comportamento no Claude Sonnet 5.

O Claude Sonnet 5 é a próxima geração da família de modelos Sonnet da Anthropic. É uma atualização direta do Claude Sonnet 4.6 com três mudanças de comportamento: o pensamento adaptativo está ativado por padrão, o pensamento estendido manual agora retorna um erro 400 (foi descontinuado no Claude Sonnet 4.6), e definir parâmetros de amostragem (temperature, top_p, top_k) com valores não padrão retorna um erro 400. Esta página resume todas as novidades no lançamento, incluindo um novo tokenizador.

Novo modelo

Modelo	ID do modelo na API	Descrição
Claude Sonnet 5	`claude-sonnet-5`	A melhor combinação de velocidade e inteligência

O Claude Sonnet 5 oferece suporte à janela de contexto de 1M de tokens por padrão (1M de tokens é tanto o padrão quanto o máximo; não há variante de contexto menor), 128k tokens máximos de saída, pensamento adaptativo e o mesmo conjunto de ferramentas e recursos de plataforma que o Claude Sonnet 4.6, exceto o Priority Tier, que não está disponível no Claude Sonnet 5.

Para preços e especificações completas, consulte a visão geral dos modelos.

Mudanças de comportamento

Pensamento adaptativo ativado por padrão

No Claude Sonnet 4.6, requisições sem um campo thinking são executadas sem pensamento. No Claude Sonnet 5, as mesmas requisições são executadas com pensamento adaptativo. Para desativar o pensamento, passe thinking: {type: "disabled"}. Como max_tokens é um limite rígido para a saída total (pensamento mais texto de resposta), revise-o para cargas de trabalho que eram executadas sem pensamento no Claude Sonnet 4.6.

Parâmetros de amostragem não aceitos

Definir temperature, top_p ou top_k com um valor não padrão retorna um erro 400. Remova esses parâmetros ao migrar; o valor padrão (ou omitir o parâmetro) é aceito. Use instruções no prompt do sistema para orientar o comportamento do modelo. Isso é novo para modelos da classe Sonnet; a mesma restrição foi introduzida anteriormente no Claude Opus 4.7.

Pensamento estendido manual removido

O pensamento estendido manual (thinking: {type: "enabled", budget_tokens: N}) foi descontinuado no Claude Sonnet 4.6; no Claude Sonnet 5 ele foi removido e retorna um erro 400, assim como no Claude Opus 4.8 e no Claude Opus 4.7. Use o pensamento adaptativo com o parâmetro effort em vez disso.

Python

# Não suportado no Claude Sonnet 5 (retorna 400)
thinking = {"type": "enabled", "budget_tokens": 32000}

# Use isto em vez disso
thinking = {"type": "adaptive"}

Novo tokenizador

O Claude Sonnet 5 usa um novo tokenizador. O mesmo texto de entrada produz aproximadamente 30% mais tokens do que no Claude Sonnet 4.6. Isso não é uma mudança na API: requisições, respostas e eventos de streaming mantêm o mesmo formato, e nenhuma alteração de código é necessária.

A mudança afeta tudo o que você mede ou orça em tokens:

Contagens de tokens: os campos usage e os resultados de contagem de tokens para o mesmo texto são maiores do que no Claude Sonnet 4.6. Não reutilize contagens medidas em modelos anteriores; reconte usando o Claude Sonnet 5.
Capacidade da janela de contexto em termos de texto: a janela de contexto é de 1M de tokens, mas cada token cobre menos texto em média, então a mesma janela comporta menos texto do que no Claude Sonnet 4.6.
Orçamentos de max_tokens: um limite de saída ajustado para o Claude Sonnet 4.6 pode truncar uma saída equivalente no Claude Sonnet 5. Revise limites dimensionados próximos ao comprimento de saída esperado.
Custo por requisição: o preço por token permanece inalterado (consulte Preços), mas como o mesmo texto produz mais tokens, o custo de uma requisição equivalente pode diferir do Claude Sonnet 4.6.

Restrições de API herdadas do Claude Sonnet 4.6

Esta restrição permanece inalterada em relação ao Claude Sonnet 4.6. Além das três mudanças de comportamento (consulte o Guia de migração), código que já roda no Claude Sonnet 4.6 não precisa de outras alterações.

Pré-preenchimento de mensagem do assistente não suportado

Pré-preencher a mensagem do assistente retorna um erro 400, sem alteração em relação ao Claude Sonnet 4.6. Use saídas estruturadas, instruções no prompt do sistema ou output_config.format em vez disso.

Melhorias de capacidade

O Claude Sonnet 5 é uma atualização de capacidade em relação ao Claude Sonnet 4.6 pelo mesmo preço. Também é uma opção para cargas de trabalho que precisam de mais capacidade do que o Claude Sonnet 4.6 oferece sem migrar para um modelo da classe Opus.

Os maiores ganhos em relação ao Claude Sonnet 4.6 estão em tarefas de programação e agênticas. Para resultados de benchmarks, consulte o Transparency Hub da Anthropic.

Salvaguardas de cibersegurança

O Claude Sonnet 5 é o primeiro modelo da classe Sonnet com salvaguardas de cibersegurança em tempo real. Requisições que envolvem tópicos de cibersegurança proibidos ou de alto risco podem ser recusadas. Recusas retornam como uma resposta HTTP 200 bem-sucedida com stop_reason: "refusal", não como um erro. Consulte Salvaguardas, avisos e recursos para mais informações.

Preços

O Claude Sonnet 5 tem preço de US$ 3 por milhão de tokens de entrada e US$ 15 por milhão de tokens de saída, sem alteração em relação ao Claude Sonnet 4.6. Como o novo tokenizador produz aproximadamente 30% mais tokens para o mesmo texto, o custo de uma requisição equivalente pode diferir do Claude Sonnet 4.6, mesmo que o preço por token permaneça inalterado.

O preço introdutório de US$ 2/US$ 10 por milhão de tokens de entrada/saída está em vigor até 31 de agosto de 2026, após o qual o preço padrão de US$ 3/US$ 15 por milhão de tokens de entrada/saída entrará em vigor.

Consulte Preços para preços completos, incluindo taxas de processamento em lote e cache de prompt.

Disponibilidade

No lançamento, o Claude Sonnet 5 está disponível em:

API do Claude: disponível para todos os clientes.
AWS: disponível através do Claude no Amazon Bedrock e da Claude Platform na AWS. O Claude Sonnet 5 não está disponível no Claude no Amazon Bedrock (legado) (as APIs InvokeModel e Converse).
Google Cloud: disponível através do Claude no Google Cloud.
Microsoft Foundry (preview): disponível através do Claude no Microsoft Foundry.

O Claude Sonnet 5 oferece suporte a retenção zero de dados para organizações com acordos ZDR.

Guia de migração

O Claude Sonnet 5 é um substituto direto do Claude Sonnet 4.6. Atualize o ID do seu modelo:

model = "claude-sonnet-4-6"  # Before
model = "claude-sonnet-5"  # After

Em seguida, revise o seguinte:

Orçamentos e contagens de tokens: o novo tokenizador produz aproximadamente 30% mais tokens para o mesmo texto. Reconte os prompts com a contagem de tokens e revise os limites de max_tokens dimensionados próximos ao comprimento de saída esperado.
Pensamento estendido: se você ainda define budget_tokens, migre para o pensamento adaptativo. O pensamento estendido manual (thinking: {type: "enabled"}) não é suportado e retorna um erro 400.
Parâmetros de amostragem: requisições que definem parâmetros de amostragem (temperature, top_p, top_k) com um valor não padrão retornam um erro 400; remova-os ao migrar. Definições de ferramentas e formatos de resposta permanecem inalterados, e o pré-preenchimento de mensagem do assistente já não era suportado no Claude Sonnet 4.6.

Consulte a seção do Claude Sonnet 5 no guia de migração para mais detalhes.

Próximos passos

Visão geral dos modelos

Especificações e preços completos para todos os modelos Claude atuais.

Contagem de tokens

Meça seus prompts com o novo tokenizador antes de migrar.

Pensamento adaptativo

O modo de pensamento ativado recomendado no Claude Sonnet 5.

Janelas de contexto

Como funciona a janela de contexto de 1M de tokens.

Preços

Preços completos, incluindo taxas de processamento em lote e cache de prompt.

Was this page helpful?

Modelos e preçosModelos

Novidades no Claude Sonnet 5

Visão geral dos novos recursos e mudanças de comportamento no Claude Sonnet 5.

Novo modelo

Modelo	ID do modelo na API	Descrição
Claude Sonnet 5	`claude-sonnet-5`	A melhor combinação de velocidade e inteligência

Para preços e especificações completas, consulte a visão geral dos modelos.

Mudanças de comportamento

Pensamento adaptativo ativado por padrão

Parâmetros de amostragem não aceitos

Pensamento estendido manual removido

Python

# Não suportado no Claude Sonnet 5 (retorna 400)
thinking = {"type": "enabled", "budget_tokens": 32000}

# Use isto em vez disso
thinking = {"type": "adaptive"}

Novo tokenizador

A mudança afeta tudo o que você mede ou orça em tokens:

Contagens de tokens: os campos usage e os resultados de contagem de tokens para o mesmo texto são maiores do que no Claude Sonnet 4.6. Não reutilize contagens medidas em modelos anteriores; reconte usando o Claude Sonnet 5.
Capacidade da janela de contexto em termos de texto: a janela de contexto é de 1M de tokens, mas cada token cobre menos texto em média, então a mesma janela comporta menos texto do que no Claude Sonnet 4.6.
Orçamentos de max_tokens: um limite de saída ajustado para o Claude Sonnet 4.6 pode truncar uma saída equivalente no Claude Sonnet 5. Revise limites dimensionados próximos ao comprimento de saída esperado.
Custo por requisição: o preço por token permanece inalterado (consulte Preços), mas como o mesmo texto produz mais tokens, o custo de uma requisição equivalente pode diferir do Claude Sonnet 4.6.

Restrições de API herdadas do Claude Sonnet 4.6

Pré-preenchimento de mensagem do assistente não suportado

Melhorias de capacidade

Os maiores ganhos em relação ao Claude Sonnet 4.6 estão em tarefas de programação e agênticas. Para resultados de benchmarks, consulte o Transparency Hub da Anthropic.

Salvaguardas de cibersegurança

Preços

Consulte Preços para preços completos, incluindo taxas de processamento em lote e cache de prompt.

Disponibilidade

No lançamento, o Claude Sonnet 5 está disponível em:

API do Claude: disponível para todos os clientes.
AWS: disponível através do Claude no Amazon Bedrock e da Claude Platform na AWS. O Claude Sonnet 5 não está disponível no Claude no Amazon Bedrock (legado) (as APIs InvokeModel e Converse).
Google Cloud: disponível através do Claude no Google Cloud.
Microsoft Foundry (preview): disponível através do Claude no Microsoft Foundry.

O Claude Sonnet 5 oferece suporte a retenção zero de dados para organizações com acordos ZDR.

Guia de migração

O Claude Sonnet 5 é um substituto direto do Claude Sonnet 4.6. Atualize o ID do seu modelo:

model = "claude-sonnet-4-6"  # Before
model = "claude-sonnet-5"  # After

Em seguida, revise o seguinte:

Orçamentos e contagens de tokens: o novo tokenizador produz aproximadamente 30% mais tokens para o mesmo texto. Reconte os prompts com a contagem de tokens e revise os limites de max_tokens dimensionados próximos ao comprimento de saída esperado.
Pensamento estendido: se você ainda define budget_tokens, migre para o pensamento adaptativo. O pensamento estendido manual (thinking: {type: "enabled"}) não é suportado e retorna um erro 400.
Parâmetros de amostragem: requisições que definem parâmetros de amostragem (temperature, top_p, top_k) com um valor não padrão retornam um erro 400; remova-os ao migrar. Definições de ferramentas e formatos de resposta permanecem inalterados, e o pré-preenchimento de mensagem do assistente já não era suportado no Claude Sonnet 4.6.

Consulte a seção do Claude Sonnet 5 no guia de migração para mais detalhes.

Próximos passos

Visão geral dos modelos

Especificações e preços completos para todos os modelos Claude atuais.

Contagem de tokens

Meça seus prompts com o novo tokenizador antes de migrar.

Pensamento adaptativo

O modo de pensamento ativado recomendado no Claude Sonnet 5.

Janelas de contexto

Como funciona a janela de contexto de 1M de tokens.

Preços

Preços completos, incluindo taxas de processamento em lote e cache de prompt.

Was this page helpful?

Novo modelo

Mudanças de comportamento

Pensamento adaptativo ativado por padrão

Parâmetros de amostragem não aceitos

Pensamento estendido manual removido

Novo tokenizador

Restrições de API herdadas do Claude Sonnet 4.6

Pré-preenchimento de mensagem do assistente não suportado

Melhorias de capacidade

Salvaguardas de cibersegurança

Preços

Disponibilidade

Guia de migração

Próximos passos

Novo modelo

Mudanças de comportamento

Pensamento adaptativo ativado por padrão

Parâmetros de amostragem não aceitos

Pensamento estendido manual removido

Novo tokenizador

Restrições de API herdadas do Claude Sonnet 4.6

Pré-preenchimento de mensagem do assistente não suportado

Melhorias de capacidade

Salvaguardas de cibersegurança

Preços

Disponibilidade

Guia de migração

Próximos passos

Novo modelo

Mudanças de comportamento

Pensamento adaptativo ativado por padrão

Parâmetros de amostragem não aceitos

Pensamento estendido manual removido

Novo tokenizador

Restrições de API herdadas do Claude Sonnet 4.6

Pré-preenchimento de mensagem do assistente não suportado

Melhorias de capacidade

Salvaguardas de cibersegurança

Preços

Disponibilidade

Guia de migração

Próximos passos

Novo modelo

Mudanças de comportamento

Pensamento adaptativo ativado por padrão

Parâmetros de amostragem não aceitos

Pensamento estendido manual removido

Novo tokenizador

Restrições de API herdadas do Claude Sonnet 4.6

Pré-preenchimento de mensagem do assistente não suportado

Melhorias de capacidade

Salvaguardas de cibersegurança

Preços

Disponibilidade

Guia de migração

Próximos passos