Claude Opus 4.6 é um substituto praticamente direto para Claude 4.5, com algumas mudanças significativas a serem consideradas. Para uma lista completa de novos recursos, consulte O que há de novo no Claude 4.6.
# Migração do Opus
model="claude-opus-4-5" # Antes
model="claude-opus-4-6" # DepoisRemoção de prefill: Preencher previamente mensagens do assistente retorna um erro 400 nos modelos Claude 4.6. Use saídas estruturadas, instruções de prompt do sistema ou output_config.format em vez disso.
Citação de parâmetro de ferramenta: Os modelos Claude 4.6 podem produzir escape de string JSON ligeiramente diferente em argumentos de chamada de ferramenta (por exemplo, tratamento diferente de escapes Unicode ou escape de barra invertida). Se você analisar a entrada de chamada de ferramenta input como uma string bruta em vez de usar um analisador JSON, verifique sua lógica de análise. Os analisadores JSON padrão (como json.loads() ou JSON.parse()) lidam com essas diferenças automaticamente.
Estas não são obrigatórias, mas melhorarão sua experiência:
Migre para pensamento adaptativo: thinking: {type: "enabled", budget_tokens: N} está descontinuado nos modelos Claude 4.6 e será removido em uma versão futura do modelo. Mude para thinking: {type: "adaptive"} e use o parâmetro de esforço para controlar a profundidade do pensamento. Consulte Pensamento adaptativo.
response = client.beta.messages.create(
model="claude-opus-4-5",
max_tokens=16000,
thinking={
"type": "enabled",
"budget_tokens": 32000
},
betas=["interleaved-thinking-2025-05-14"],
messages=[...]
)Observe que a migração também muda de client.beta.messages.create para client.messages.create — pensamento adaptativo e esforço são recursos GA e não requerem o namespace beta do SDK ou nenhum cabeçalho beta.
Remova o cabeçalho beta de esforço: O parâmetro de esforço agora é GA. Remova betas=["effort-2025-11-24"] de suas solicitações.
Remova o cabeçalho beta de streaming de ferramenta refinado: O streaming de ferramenta refinado agora é GA. Remova betas=["fine-grained-tool-streaming-2025-05-14"] de suas solicitações.
Remova o cabeçalho beta de pensamento intercalado: O pensamento adaptativo ativa automaticamente o pensamento intercalado. Remova betas=["interleaved-thinking-2025-05-14"] de suas solicitações.
Migre para output_config.format: Se estiver usando saídas estruturadas, atualize output_format={...} para output_config={"format": {...}}. O parâmetro antigo permanece funcional, mas está descontinuado e será removido em uma versão futura do modelo.
Se você estiver migrando de Opus 4.1, Sonnet 4 ou modelos anteriores diretamente para Claude 4.6, aplique as mudanças significativas do Claude 4.6 acima mais as mudanças adicionais nesta seção.
# De Opus 4.1
model="claude-opus-4-1-20250805" # Antes
model="claude-opus-4-6" # Depois
# De Sonnet 4
model="claude-sonnet-4-20250514" # Antes
model="claude-opus-4-6" # Depois
# De Sonnet 3.7
model="claude-3-7-sonnet-20250219" # Antes
model="claude-opus-4-6" # DepoisParâmetros de amostragem
Esta é uma mudança significativa dos modelos Claude 3.x.
Use apenas temperature OU top_p, não ambos:
# Antes - Isto resultará em erro nos modelos Claude 4+
response = client.messages.create(
model="claude-3-7-sonnet-20250219",
temperature=0.7,
top_p=0.9, # Não é possível usar ambos
...
)
# Depois
response = client.messages.create(
model="claude-opus-4-6",
temperature=0.7, # Use temperature OU top_p, não ambos
...
)Versões de ferramenta
Esta é uma mudança significativa dos modelos Claude 3.x.
Atualize para as versões mais recentes de ferramentas. Remova qualquer código usando o comando undo_edit.
# Antes
tools=[{"type": "text_editor_20250124", "name": "str_replace_editor"}]
# Depois
tools=[{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]text_editor_20250728 e str_replace_based_edit_tool. Consulte Documentação da ferramenta editor de texto para detalhes.code_execution_20250825. Consulte Documentação da ferramenta de execução de código para instruções de migração.Lidar com o motivo de parada refusal
Atualize sua aplicação para lidar com motivos de parada refusal:
response = client.messages.create(...)
if response.stop_reason == "refusal":
# Lidar com recusa apropriadamente
passLidar com o motivo de parada model_context_window_exceeded
Os modelos Claude 4.5+ retornam um motivo de parada model_context_window_exceeded quando a geração para devido ao atingimento do limite da janela de contexto, em vez do limite max_tokens solicitado. Atualize sua aplicação para lidar com este novo motivo de parada:
response = client.messages.create(...)
if response.stop_reason == "model_context_window_exceeded":
# Lidar com limite de janela de contexto apropriadamente
passTratamento de parâmetro de ferramenta (quebras de linha finais)
Os modelos Claude 4.5+ preservam quebras de linha finais em parâmetros de string de chamada de ferramenta que foram previamente removidas. Se suas ferramentas dependem de correspondência exata de string contra parâmetros de chamada de ferramenta, verifique se sua lógica lida corretamente com quebras de linha finais.
Atualize seus prompts para mudanças comportamentais
Os modelos Claude 4+ têm um estilo de comunicação mais conciso e direto e requerem direção explícita. Revise melhores práticas de prompt para orientação de otimização.
token-efficient-tools-2025-02-19 e output-128k-2025-02-19 — todos os modelos Claude 4+ têm uso de ferramenta eficiente em tokens integrado e esses cabeçalhos não têm efeito.claude-opus-4-6output_config.format em vez dissothinking: {type: "enabled", budget_tokens: N} para thinking: {type: "adaptive"} com o parâmetro de esforço (budget_tokens está descontinuado e será removido em uma versão futura)effort-2025-11-24 (esforço agora é GA)fine-grained-tool-streaming-2025-05-14interleaved-thinking-2025-05-14output_format para output_config.format (se aplicável)temperature OU top_ptext_editor_20250728, code_execution_20250825)refusalmodel_context_window_exceededtoken-efficient-tools-2025-02-19, output-128k-2025-02-19)Claude Sonnet 4.5 combina inteligência forte com desempenho rápido, tornando-o ideal para tarefas cotidianas de codificação, análise e conteúdo.
Para uma visão geral completa de capacidades, consulte a visão geral de modelos.
O preço do Sonnet 4.5 é $3 por milhão de tokens de entrada, $15 por milhão de tokens de saída. Consulte preços do Claude para detalhes.
Atualize seu nome de modelo:
# De Sonnet 4
model="claude-sonnet-4-20250514" # Antes
model="claude-sonnet-4-5-20250929" # Depois
# De Sonnet 3.7
model="claude-3-7-sonnet-20250219" # Antes
model="claude-sonnet-4-5-20250929" # DepoisConsidere ativar pensamento estendido para melhorias significativas de desempenho em tarefas de codificação e raciocínio (desativado por padrão):
response = client.messages.create(
model="claude-sonnet-4-5-20250929",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 10000},
messages=[...]
)Essas mudanças significativas se aplicam ao migrar de modelos Claude 3.x Sonnet.
Parâmetros de amostragem
Esta é uma mudança significativa dos modelos Claude 3.x.
Use apenas temperature OU top_p, não ambos.
Versões de ferramenta
Esta é uma mudança significativa dos modelos Claude 3.x.
Atualize para as versões mais recentes de ferramentas (text_editor_20250728, code_execution_20250825). Remova qualquer código usando o comando undo_edit.
Lidar com o motivo de parada refusal
Atualize sua aplicação para lidar com motivos de parada refusal.
Atualize seus prompts para mudanças comportamentais
Os modelos Claude 4 têm um estilo de comunicação mais conciso e direto. Revise melhores práticas de prompt para orientação de otimização.
claude-sonnet-4-5-20250929text_editor_20250728, code_execution_20250825) — versões legadas não são suportadas (se migrando de 3.x)undo_edit (se aplicável)temperature OU top_p, não ambos (se migrando de 3.x)refusal em sua aplicaçãoClaude Haiku 4.5 é nosso modelo Haiku mais rápido e mais inteligente com desempenho próximo à fronteira, oferecendo qualidade de modelo premium para aplicações interativas e processamento de alto volume.
Para uma visão geral completa de capacidades, consulte a visão geral de modelos.
O preço do Haiku 4.5 é $1 por milhão de tokens de entrada, $5 por milhão de tokens de saída. Consulte preços do Claude para detalhes.
Atualize seu nome de modelo:
# De Haiku 3.5
model="claude-3-5-haiku-20241022" # Antes
model="claude-haiku-4-5-20251001" # DepoisRevise novos limites de taxa: Haiku 4.5 tem limites de taxa separados de Haiku 3.5. Consulte documentação de limites de taxa para detalhes.
Considere ativar pensamento estendido para melhorias significativas de desempenho em tarefas de codificação e raciocínio (desativado por padrão):
response = client.messages.create(
model="claude-haiku-4-5-20251001",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 5000},
messages=[...]
)O pensamento estendido impacta a eficiência do cache de prompt.
Explore novas capacidades: Consulte a visão geral de modelos para detalhes sobre consciência de contexto, capacidade de saída aumentada (64K tokens), inteligência mais alta e velocidade melhorada.
Essas mudanças significativas se aplicam ao migrar de modelos Claude 3.x Haiku.
Parâmetros de amostragem
Esta é uma mudança significativa dos modelos Claude 3.x.
Use apenas temperature OU top_p, não ambos.
Versões de ferramenta
Esta é uma mudança significativa dos modelos Claude 3.x.
Atualize para as versões mais recentes de ferramentas (text_editor_20250728, code_execution_20250825). Remova qualquer código usando o comando undo_edit.
Lidar com o motivo de parada refusal
Atualize sua aplicação para lidar com motivos de parada refusal.
Atualize seus prompts para mudanças comportamentais
Os modelos Claude 4 têm um estilo de comunicação mais conciso e direto. Revise melhores práticas de prompt para orientação de otimização.
claude-haiku-4-5-20251001text_editor_20250728, code_execution_20250825) — versões legadas não são suportadasundo_edit (se aplicável)temperature OU top_p, não ambosrefusal em sua aplicaçãoWas this page helpful?