Was this page helpful?
Claude Opus 4.6 é um substituto praticamente direto para Claude 4.5, com algumas mudanças significativas a serem observadas. Para uma lista completa de novos recursos, consulte O que há de novo no Claude 4.6.
# Migração do Opus
model = "claude-opus-4-5" # Antes
model = "claude-opus-4-6" # DepoisRemoção de prefill: Preencher previamente mensagens do assistente retorna um erro 400 nos modelos Claude 4.6. Use saídas estruturadas, instruções de prompt do sistema ou output_config.format em vez disso.
Citação de parâmetro de ferramenta: Os modelos Claude 4.6 podem produzir escape de string JSON ligeiramente diferente em argumentos de chamada de ferramenta (por exemplo, tratamento diferente de escapes Unicode ou escape de barra invertida). Se você analisar a input de chamada de ferramenta como uma string bruta em vez de usar um analisador JSON, verifique sua lógica de análise. Os analisadores JSON padrão (como json.loads() ou JSON.parse()) lidam com essas diferenças automaticamente.
Estas não são obrigatórias, mas melhorarão sua experiência:
Migre para pensamento adaptativo: thinking: {type: "enabled", budget_tokens: N} está descontinuado nos modelos Claude 4.6 e será removido em uma versão futura do modelo. Mude para thinking: {type: "adaptive"} e use o parâmetro de esforço para controlar a profundidade do pensamento. Consulte Pensamento adaptativo.
Se você está migrando de Opus 4.1, Sonnet 4 ou modelos anteriores diretamente para Claude 4.6, aplique as mudanças significativas do Claude 4.6 acima mais as mudanças adicionais nesta seção.
# De Opus 4.1
model = "claude-opus-4-1-20250805" # Antes
model = "claude-opus-4-6" # Depois
# De Sonnet 4
model = "claude-sonnet-4-20250514" # Antes
model = "claude-opus-4-6" # Depois
# De Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Antes
model = "claude-opus-4-6" # DepoisAtualize parâmetros de amostragem
Esta é uma mudança significativa ao migrar de modelos Claude 3.x.
Use apenas temperature OU top_p, não ambos:
# Antes - Isto resultará em erro nos modelos Claude 4+
response = client.messages.create(
model="claude-3-7-sonnet-20250219",
temperature=0.7,
top_p=0.9, # Não é possível usar ambos
# ...
)
# Depois
response = client.messages.create(
model="claude-opus-4-6",
temperature=0.7, # Use temperature OU top_p, não ambos
# ...
)token-efficient-tools-2025-02-19 e output-128k-2025-02-19. Todos os modelos Claude 4+ têm uso de ferramenta eficiente em tokens integrado e esses cabeçalhos não têm efeito.claude-opus-4-6output_config.format em vez dissothinking: {type: "enabled", budget_tokens: N} para thinking: {type: "adaptive"} com o parâmetro de esforço (budget_tokens está descontinuado e será removido em uma versão futura)effort-2025-11-24 (esforço agora é GA)fine-grained-tool-streaming-2025-05-14Claude Sonnet 4.6 combina inteligência forte com desempenho rápido, apresentando recursos de busca agêntica melhorados e execução de código gratuita quando usado com busca na web ou busca na web. É ideal para tarefas cotidianas de codificação, análise e conteúdo.
Para uma visão geral completa de capacidades, consulte a visão geral de modelos.
O preço do Sonnet 4.6 é $3 por milhão de tokens de entrada, $15 por milhão de tokens de saída. Consulte Preços do Claude para detalhes.
Atualize seu nome de modelo:
# De Sonnet 4.5
model = "claude-sonnet-4-5" # Antes
model = "claude-sonnet-4-6" # Depois
# De Sonnet 4
model = "claude-sonnet-4-20250514" # Antes
model = "claude-sonnet-4-6" # DepoisPreenchimento prévio de mensagens do assistente não é mais suportado
Esta é uma mudança significativa ao migrar de Sonnet 4.5 ou anterior.
Preencher previamente mensagens do assistente retorna um erro 400 no Sonnet 4.6. Use saídas estruturadas, instruções de prompt do sistema ou output_config.format em vez disso.
Casos de uso de prefill comuns e migrações:
Controlando formatação de saída (forçando saída JSON/YAML): Use saídas estruturadas ou ferramentas com campos enum para tarefas de classificação.
Eliminando preâmbulos (removendo frases "Aqui está..."): Adicione instruções diretas no prompt do sistema: "Responda diretamente sem preâmbulo. Não comece com frases como 'Aqui está...', 'Com base em...', etc."
Evitando recusas ruins: Claude é muito melhor em recusas apropriadas agora. Prompting claro na mensagem do usuário sem prefill deve ser suficiente.
Atualize parâmetros de amostragem
Esta é uma mudança significativa ao migrar de modelos Claude 3.x.
Use apenas temperature OU top_p, não ambos.
Atualize versões de ferramentas
Esta é uma mudança significativa ao migrar de modelos Claude 3.x.
Atualize para as versões mais recentes de ferramentas (text_editor_20250728, code_execution_20250825). Remova qualquer código usando o comando undo_edit.
Trate o motivo de parada refusal
Atualize sua aplicação para tratar motivos de parada refusal.
fine-grained-tool-streaming-2025-05-14 — O streaming de ferramenta refinado agora é GA no Sonnet 4.6 e não requer mais um cabeçalho beta.output_format para output_config.format — O parâmetro output_format está descontinuado. Use output_config.format em vez disso.Encorajamos fortemente a migração de Sonnet 4.5 para Sonnet 4.6, que oferece mais inteligência pelo mesmo preço.
Sonnet 4.6 usa como padrão um nível de esforço de high, em contraste com Sonnet 4.5 que não tinha parâmetro de esforço. Recomendamos ajustar o parâmetro de esforço conforme você migra de Sonnet 4.5 para Sonnet 4.6. Se não for definido explicitamente, você pode experimentar latência mais alta com o nível de esforço padrão.
Se você não estiver usando pensamento estendido no Sonnet 4.5, você pode continuar sem ele no Sonnet 4.6. Você deve definir explicitamente o esforço para o nível apropriado para seu caso de uso. Com esforço low e pensamento desabilitado, você pode esperar desempenho similar ou melhor em relação ao Sonnet 4.5 sem pensamento estendido.
Se você estiver usando pensamento estendido no Sonnet 4.5, ele continua a ser suportado no Sonnet 4.6 sem mudanças necessárias em sua configuração de pensamento. Recomendamos manter um orçamento de pensamento em torno de 16k tokens. Na prática, a maioria das tarefas não usa tanto, mas fornece espaço para problemas mais difíceis sem risco de uso de token descontrolado.
Para codificação agêntica, design de frontend, fluxos de trabalho pesados em ferramentas e fluxos de trabalho empresariais complexos, recomendamos começar com esforço medium. Se você achar que a latência é muito alta, considere reduzir o esforço para low. Se você precisar de inteligência mais alta, considere aumentar o esforço para high ou migrar para Opus 4.6.
Para chat, geração de conteúdo, busca, classificação e outras tarefas não-codificação, recomendamos começar com esforço low com pensamento estendido. Se você precisar de mais profundidade, aumente o esforço para medium.
Os caminhos de migração acima usam pensamento estendido com budget_tokens para uso de token previsível. Se sua carga de trabalho se encaixa em um dos seguintes padrões, considere tentar pensamento adaptativo em vez disso:
high. Se latência ou uso de token for uma preocupação, reduza para medium.Ao usar pensamento adaptativo, avalie esforço medium e high em suas tarefas. O nível certo depende da compensação de sua carga de trabalho entre qualidade, latência e uso de token.
Se você ver comportamento inconsistente ou regressões de qualidade com pensamento adaptativo, mude para pensamento estendido com budget_tokens. Isso fornece resultados mais previsíveis com um limite nos custos de pensamento.
claude-sonnet-4-6output_config.format em vez dissotext_editor_20250728, code_execution_20250825); versões legadas não são suportadas (se migrando de 3.x)undo_edit (se aplicável)temperature OU top_p, não ambos (se migrando de 3.x)Claude Sonnet 4.5 combina inteligência forte com desempenho rápido, tornando-o ideal para tarefas cotidianas de codificação, análise e conteúdo.
Para uma visão geral completa de capacidades, consulte a visão geral de modelos.
O preço do Sonnet 4.5 é $3 por milhão de tokens de entrada, $15 por milhão de tokens de saída. Consulte Preços do Claude para detalhes.
Atualize seu nome de modelo:
# De Sonnet 4
model = "claude-sonnet-4-20250514" # Antes
model = "claude-sonnet-4-5-20250929" # Depois
# De Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Antes
model = "claude-sonnet-4-5-20250929" # DepoisEssas mudanças significativas se aplicam ao migrar de modelos Claude 3.x Sonnet.
Atualize parâmetros de amostragem
Esta é uma mudança significativa ao migrar de modelos Claude 3.x.
Use apenas temperature OU top_p, não ambos.
Atualize versões de ferramentas
Esta é uma mudança significativa ao migrar de modelos Claude 3.x.
Atualize para as versões mais recentes de ferramentas (text_editor_20250728, code_execution_20250825). Remova qualquer código usando o comando undo_edit.
Trate o motivo de parada refusal
Atualize sua aplicação para tratar motivos de parada refusal.
claude-sonnet-4-5-20250929text_editor_20250728, code_execution_20250825); versões legadas não são suportadas (se migrando de 3.x)undo_edit (se aplicável)temperature OU top_p, não ambos (se migrando de 3.x)refusal em sua aplicaçãoClaude Haiku 4.5 é o modelo Haiku mais rápido e inteligente com desempenho próximo à fronteira, oferecendo qualidade de modelo premium para aplicações interativas e processamento de alto volume.
Para uma visão geral completa de capacidades, consulte a visão geral de modelos.
O preço do Haiku 4.5 é $1 por milhão de tokens de entrada, $5 por milhão de tokens de saída. Consulte Preços do Claude para detalhes.
Atualize seu nome de modelo:
# De Haiku 3.5
model = "claude-3-5-haiku-20241022" # Antes
model = "claude-haiku-4-5-20251001" # DepoisRevise novos limites de taxa: Haiku 4.5 tem limites de taxa separados de Haiku 3.5. Consulte Documentação de limites de taxa para detalhes.
Para melhorias significativas de desempenho em tarefas de codificação e raciocínio, considere habilitar pensamento estendido com thinking: {type: "enabled", budget_tokens: N}.
Pensamento estendido impacta a eficiência do cache de prompt.
Pensamento estendido está descontinuado em modelos Claude 4.6 ou mais recentes. Se estiver usando modelos mais recentes, use pensamento adaptativo em vez disso.
Explore novas capacidades: Consulte a visão geral de modelos para detalhes sobre consciência de contexto, capacidade de saída aumentada (64K tokens), inteligência mais alta e velocidade melhorada.
Essas mudanças significativas se aplicam ao migrar de modelos Claude 3.x Haiku.
Atualize parâmetros de amostragem
Esta é uma mudança significativa ao migrar de modelos Claude 3.x.
Use apenas temperature OU top_p, não ambos.
Atualize versões de ferramentas
Esta é uma mudança significativa ao migrar de modelos Claude 3.x.
Atualize para as versões mais recentes de ferramentas (text_editor_20250728, code_execution_20250825). Remova qualquer código usando o comando undo_edit.
Trate o motivo de parada refusal
Atualize sua aplicação para tratar motivos de parada refusal.
claude-haiku-4-5-20251001text_editor_20250728, code_execution_20250825); versões legadas não são suportadasundo_edit (se aplicável)temperature OU top_p, não ambosrefusal em sua aplicaçãoresponse = client.beta.messages.create(
model="claude-opus-4-5",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 32000},
betas=["interleaved-thinking-2025-05-14"],
messages=[...],
)Observe que a migração também muda de client.beta.messages.create para client.messages.create. Pensamento adaptativo e esforço são recursos GA e não requerem o namespace SDK beta ou nenhum cabeçalho beta.
Remova o cabeçalho beta de esforço: O parâmetro de esforço agora é GA. Remova betas=["effort-2025-11-24"] de suas solicitações.
Remova o cabeçalho beta de streaming de ferramenta refinado: O streaming de ferramenta refinado agora é GA. Remova betas=["fine-grained-tool-streaming-2025-05-14"] de suas solicitações.
Remova o cabeçalho beta de pensamento intercalado (apenas Opus 4.6): O pensamento adaptativo ativa automaticamente o pensamento intercalado no Opus 4.6. Remova betas=["interleaved-thinking-2025-05-14"] de suas solicitações do Opus 4.6. Nota: Sonnet 4.6 continua a suportar este cabeçalho beta com pensamento estendido manual.
Migre para output_config.format: Se estiver usando saídas estruturadas, atualize output_format={...} para output_config={"format": {...}}. O parâmetro antigo permanece funcional, mas está descontinuado e será removido em uma versão futura do modelo.
Atualize versões de ferramentas
Esta é uma mudança significativa ao migrar de modelos Claude 3.x.
Atualize para as versões mais recentes de ferramentas. Remova qualquer código usando o comando undo_edit.
# Antes
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
# Depois
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]text_editor_20250728 e str_replace_based_edit_tool. Consulte Documentação da ferramenta editor de texto para detalhes.code_execution_20250825. Consulte Documentação da ferramenta de execução de código para instruções de migração.Trate o motivo de parada refusal
Atualize sua aplicação para tratar motivos de parada refusal:
response = client.messages.create(...)
if response.stop_reason == "refusal":
# Trate a recusa apropriadamente
passTrate o motivo de parada model_context_window_exceeded
Os modelos Claude 4.5+ retornam um motivo de parada model_context_window_exceeded quando a geração para devido ao limite da janela de contexto, em vez do limite max_tokens solicitado. Atualize sua aplicação para tratar este novo motivo de parada:
response = client.messages.create(...)
if response.stop_reason == "model_context_window_exceeded":
# Trate o limite da janela de contexto apropriadamente
passVerifique o tratamento de parâmetro de ferramenta (quebras de linha finais)
Os modelos Claude 4.5+ preservam quebras de linha finais em parâmetros de string de chamada de ferramenta que foram anteriormente removidas. Se suas ferramentas dependem de correspondência exata de string contra parâmetros de chamada de ferramenta, verifique se sua lógica trata corretamente as quebras de linha finais.
Atualize seus prompts para mudanças comportamentais
Os modelos Claude 4+ têm um estilo de comunicação mais conciso e direto e requerem direção explícita. Revise práticas recomendadas de prompting para orientação de otimização.
interleaved-thinking-2025-05-14 (apenas Opus 4.6; Sonnet 4.6 ainda o suporta)output_format para output_config.format (se aplicável)temperature OU top_ptext_editor_20250728, code_execution_20250825)refusalmodel_context_window_exceededtoken-efficient-tools-2025-02-19, output-128k-2025-02-19)Continuações (retomando respostas interrompidas): Mova a continuação para a mensagem do usuário: "Sua resposta anterior foi interrompida e terminou com [previous_response]. Continue de onde parou."
Hidratação de contexto / consistência de papel (atualizando contexto em conversas longas): Injete o que eram anteriormente lembretes de assistente prefill na vez do usuário em vez disso.
O escape JSON de parâmetro de ferramenta pode diferir
Esta é uma mudança significativa ao migrar de Sonnet 4.5 ou anterior.
O escape de string JSON em parâmetros de ferramenta pode diferir de modelos anteriores. Os analisadores JSON padrão lidam com isso automaticamente, mas a análise personalizada baseada em string pode precisar de atualizações.
Atualize seus prompts para mudanças comportamentais
Os modelos Claude 4 têm um estilo de comunicação mais conciso e direto. Revise práticas recomendadas de prompting para orientação de otimização.
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
output_config={"effort": "low"},
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=16384,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "medium"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "low"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"},
messages=[{"role": "user", "content": "Your prompt here"}],
)refusal em sua aplicaçãofine-grained-tool-streaming-2025-05-14 (agora GA)output_format para output_config.formatAtualize seus prompts para mudanças comportamentais
Os modelos Claude 4 têm um estilo de comunicação mais conciso e direto. Revise práticas recomendadas de prompting para orientação de otimização.
Atualize seus prompts para mudanças comportamentais
Os modelos Claude 4 têm um estilo de comunicação mais conciso e direto. Revise práticas recomendadas de prompting para orientação de otimização.