• Mensagens
  • Agentes Gerenciados
  • Administração

Search...
⌘K
Modelos
Visão geral dos modelosIDs e versionamento de modelosEscolhendo um modeloApresentando o Claude Fable 5 e o Claude Mythos 5Novidades no Claude Opus 4.8Atualizar entre versões de modeloDescontinuações de modelosFichas de modelosPrompts do sistemaPreços

Log in
Atualizar entre versões de modelo
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Modelos e preços/Modelos

Guia de migração

Guia para migrar para os modelos Claude mais recentes a partir de versões anteriores do Claude


Este guia aborda a migração de código da Messages API. Se você usa Claude Managed Agents, nenhuma alteração além de atualizar o nome do modelo é necessária.



Automatize sua migração com a skill da Claude API. No Claude Code, execute /claude-api migrate para invocar a skill da Claude API incluída. Ela funciona para qualquer modelo de destino nesta página:

/claude-api migrate this project to claude-opus-4-8

A skill aplica a troca do ID do modelo e, conforme necessário, alterações de parâmetros incompatíveis, substituição de prefill e calibração de effort para o seu modelo de destino em toda a sua base de código, e então produz uma lista de verificação de itens para verificar manualmente. Ela pede que você confirme o escopo da migração (diretório de trabalho inteiro, um subdiretório ou uma lista específica de arquivos) antes de editar qualquer arquivo. A skill também detecta clientes do Amazon Bedrock, Vertex AI, Claude Platform on AWS e Microsoft Foundry e ajusta os formatos de ID de modelo e alterações de recursos para cada plataforma.

Migrando do Claude Mythos Preview para o Claude Mythos 5

O Claude Mythos 5 é o sucessor com acesso restrito do Claude Mythos Preview, a prévia de pesquisa disponível apenas por convite. Para um modelo de disponibilidade geral com as mesmas capacidades, consulte Claude Fable 5.

A migração é, em grande parte, direta. O Claude Mythos 5 usa a mesma Messages API e os mesmos padrões de uso de ferramentas que o Claude Mythos Preview, e as contagens de tokens permanecem praticamente inalteradas porque ambos os modelos usam o mesmo tokenizador. As principais alterações a verificar são os recursos que não estão mais disponíveis (listados na próxima seção) e a saída de pensamento.

Para o cronograma de descontinuação do Claude Mythos Preview, consulte Descontinuações de modelos.

Atualize o nome do seu modelo

model = "claude-mythos-preview"  # Before
model = "claude-mythos-5"  # After

Recursos não disponíveis no Claude Mythos 5

  1. Pensamento estendido e orçamentos de tokens de pensamento: O pensamento estendido manual (thinking: {type: "enabled", budget_tokens: N}) não é compatível com claude-mythos-5 e retorna um erro 400. O pensamento adaptativo está sempre ativado: o modelo determina quando e quanto pensar em cada requisição, e nenhuma configuração de thinking é necessária. thinking: {type: "disabled"} retorna um erro. budget_tokens não tem substituto direto: o pensamento é adaptativo, e o parâmetro effort é um controle separado no nível de saída, não um orçamento de pensamento.

    Antes (Claude Mythos Preview):

    client.messages.create(
        model="claude-mythos-preview",
        max_tokens=16000,
        thinking={"type": "enabled", "budget_tokens": 10000},
        messages=[{"role": "user", "content": "..."}],
    )

    Depois (Claude Mythos 5):

    client.messages.create(
        model="claude-mythos-5",
        max_tokens=16000,
        messages=[{"role": "user", "content": "..."}],
    )
  2. Prefill do assistente: O preenchimento prévio da mensagem do assistente não é compatível com claude-mythos-5 e retorna um erro 400, assim como no Claude Mythos Preview. Use instruções no prompt do sistema em vez disso.

  3. Saída de pensamento: No claude-mythos-5, a cadeia de pensamento bruta nunca é retornada, mas os blocos de pensamento ainda carregam texto resumido legível quando thinking.display está definido como summarized. Passe os blocos de pensamento de volta sem alterações ao continuar uma conversa no mesmo modelo. Consulte Saída de pensamento no Claude Fable 5 e Claude Mythos 5.

Contagem de tokens e cobrança

O claude-mythos-5 usa o mesmo tokenizador que o claude-mythos-preview (o tokenizador introduzido com o Claude Opus 4.7). As contagens de tokens permanecem praticamente inalteradas ao migrar do claude-mythos-preview. Em comparação com modelos anteriores ao Claude Opus 4.7, o mesmo conteúdo pode ser tokenizado em aproximadamente 30% mais tokens, variando conforme o conteúdo e o formato da carga de trabalho.

/v1/messages/count_tokens retorna valores praticamente inalterados para claude-mythos-5 em comparação com claude-mythos-preview. Reestabeleça a linha de base de custo e latência nas suas próprias cargas de trabalho.

Lista de verificação de migração

  • Atualize o nome do modelo de claude-mythos-preview para claude-mythos-5.
  • Remova a configuração manual de pensamento estendido (thinking: {type: "enabled", budget_tokens: N}). O pensamento adaptativo está sempre ativado, e nenhum campo thinking é necessário.
  • Remova qualquer configuração thinking: {type: "disabled"}. Desabilitar o pensamento retorna um erro no claude-mythos-5.
  • Remova budget_tokens. Ele não tem substituto direto: o pensamento é adaptativo, e o parâmetro effort é um controle separado no nível de saída, não um orçamento de pensamento.
  • Verifique se qualquer código que analisa o campo thinking o trata apenas como texto de exibição e passa os blocos de pensamento de volta sem alterações ao continuar no mesmo modelo. thinking.display tem como padrão "omitted" no claude-mythos-5, assim como no Claude Mythos Preview; defina display: "summarized" para receber resumos legíveis. Consulte Saída de pensamento no Claude Fable 5 e Claude Mythos 5.
  • Se você reproduzir o histórico de conversa em outro modelo, remova primeiro os blocos thinking e redacted_thinking dos turnos anteriores do assistente. Os blocos de pensamento do claude-mythos-5 estão vinculados ao modelo que os produziu, e modelos diferentes do Claude Fable 5 e Claude Mythos 5 os ignoram silenciosamente. A remoção mantém as requisições entre modelos mínimas e uniformes.
  • Reestabeleça a linha de base de contagens de tokens e custos nas suas próprias cargas de trabalho. As contagens de tokens permanecem praticamente inalteradas ao migrar do claude-mythos-preview.

Migrando do Claude Opus 4.8 para o Claude Fable 5

O Claude Fable 5 é o modelo mais capaz da Anthropic amplamente lançado, com disponibilidade geral na Claude API, Claude Platform on AWS, Amazon Bedrock, Vertex AI e Microsoft Foundry.

A migração é, em grande parte, direta. O Claude Fable 5 usa a mesma Messages API e os mesmos padrões de uso de ferramentas que o Claude Opus 4.8. Ele oferece suporte à mesma janela de contexto de 1M de tokens por padrão e ao mesmo máximo de 128k tokens de saída. As contagens de tokens permanecem praticamente inalteradas porque ambos os modelos usam o mesmo tokenizador.

As principais alterações a verificar são o pensamento adaptativo sempre ativado, a saída de pensamento, as recusas do classificador de segurança e os preços. Antes de migrar aborda preços e retenção de dados; O que mudou aborda o restante.

Antes de migrar

O Claude Fable 5 tem preço de US$ 10 por milhão de tokens de entrada e US$ 50 por milhão de tokens de saída, em comparação com US$ 5 e US$ 25 para o Claude Opus 4.8. Consulte Preços do Claude para obter detalhes.

O Claude Fable 5 requer retenção de dados de 30 dias e não está disponível sob acordos de "zero data retention" (retenção zero de dados), ou ZDR; ele é designado como um Modelo Coberto. Uma requisição de uma organização cuja configuração de retenção de dados não atenda a esse requisito retorna um erro 400 invalid_request_error. Organizações com um acordo ZDR devem entrar em contato com sua equipe de conta da Anthropic para discutir a configuração de retenção de dados; o Claude Opus 4.8 permanece disponível sob ZDR. Como alternativa, você pode configurar a retenção de dados por workspace; consulte Requisitos de retenção de dados específicos do modelo. No Amazon Bedrock, Vertex AI e Microsoft Foundry, a retenção de dados é regida por cada plataforma.



Se o seu código está no Claude Opus 4.7 ou anterior, primeiro aplique Migrando do Claude Opus 4.7 para o Claude Opus 4.8 e, para modelos anteriores ao Claude Opus 4.7, as etapas de migração do Claude Opus 4.7. Essas seções abordam alterações incompatíveis (parâmetros de amostragem rejeitados, pensamento estendido manual rejeitado, prefill removido, novo tokenizador) que esta seção não repete.

Atualize o nome do seu modelo

model = "claude-opus-4-8"  # Before
model = "claude-fable-5"  # After

O que mudou

Os itens nesta seção descrevem as diferenças de API e comportamento que vale a pena verificar depois de trocar o ID do modelo.

  1. O pensamento adaptativo está sempre ativado: O pensamento adaptativo é o único modo de pensamento no claude-fable-5. O modelo determina quando e quanto pensar em cada requisição, e nenhuma configuração de thinking é necessária. thinking: {type: "disabled"} retorna um erro. Use o parâmetro effort para controlar a profundidade do pensamento.

    A mudança de comportamento a verificar: no Claude Opus 4.8, requisições sem um campo thinking são executadas sem pensamento; no claude-fable-5, essas mesmas requisições são executadas com pensamento adaptativo. max_tokens continua sendo um limite rígido na saída total, pensamento mais texto de resposta, então revise-o para cargas de trabalho que eram executadas sem pensamento no Claude Opus 4.8. Consulte Controle de custos.

    Antes (Claude Opus 4.8):

    client.messages.create(
        model="claude-opus-4-8",
        max_tokens=16000,
        thinking={"type": "adaptive"},
        output_config={"effort": "high"},
        messages=[{"role": "user", "content": "..."}],
    )

    Depois (Claude Fable 5):

    client.messages.create(
        model="claude-fable-5",
        max_tokens=16000,
        output_config={"effort": "high"},
        messages=[{"role": "user", "content": "..."}],
    )
  2. Pensamento estendido e orçamentos de pensamento (inalterado): O pensamento estendido manual (thinking: {type: "enabled", budget_tokens: N}) não é compatível com claude-fable-5 e retorna um erro 400, assim como no Claude Opus 4.8. budget_tokens não tem substituto direto: o pensamento é adaptativo, e o parâmetro effort é um controle separado no nível de saída, não um orçamento de pensamento.

  3. Prefill do assistente (inalterado): O preenchimento prévio da mensagem do assistente não é compatível com claude-fable-5 e retorna um erro 400, assim como no Claude Opus 4.8. Use instruções no prompt do sistema em vez disso.

  4. Saída de pensamento: No claude-fable-5, a cadeia de pensamento bruta nunca é retornada, mas os blocos de pensamento ainda carregam texto resumido legível quando thinking.display está definido como summarized. Passe os blocos de pensamento de volta sem alterações ao continuar uma conversa no mesmo modelo. Consulte Saída de pensamento no Claude Fable 5 e Claude Mythos 5.

  5. Classificadores de segurança e o stop reason refusal: O claude-fable-5 executa classificadores de segurança nas requisições e durante a geração de respostas. Quando um classificador recusa uma requisição, a Messages API retorna stop_reason: "refusal" como uma resposta HTTP 200 bem-sucedida, não um erro. O campo stop_details.category informa qual classificador foi acionado, com categorias como "cyber", "bio" e "reasoning_extraction", ou null quando a recusa não corresponde a nenhuma categoria nomeada. Consulte a tabela de categorias de recusa para o conjunto completo.

    Você não é cobrado pelos tokens de entrada de uma requisição recusada antes de qualquer saída ser gerada. Quando um classificador é acionado no meio do stream, a entrada e a saída já transmitida são cobradas; descarte a saída parcial.

    Para reexecutar requisições recusadas em outro modelo automaticamente, passe o parâmetro opcional fallbacks, que está em beta na Claude API e no Claude Platform on AWS. O parâmetro não está disponível na Message Batches API nem no Amazon Bedrock, Vertex AI e Microsoft Foundry; nessas três plataformas, execute a nova tentativa no lado do cliente ou use o middleware de fallback de recusa do SDK. Consulte Tratamento de stop reasons.

  6. Comece com effort high: O padrão do parâmetro effort continua sendo high. No Claude Opus 4.8, a recomendação para trabalho de codificação e alta autonomia é definir xhigh explicitamente. No claude-fable-5, use high como padrão para a maioria das tarefas e reserve xhigh para as cargas de trabalho mais sensíveis à capacidade. Configurações de effort mais baixas no claude-fable-5 ainda têm bom desempenho e frequentemente superam o desempenho de xhigh em modelos anteriores. Reduza o effort se uma tarefa for concluída, mas demorar mais do que o necessário. Consulte Prompting do Claude Fable 5.

  7. Mínimo menor para cache de prompt: O comprimento mínimo de prompt armazenável em cache no claude-fable-5 é de 512 tokens, menor que os 1.024 tokens no Claude Opus 4.8. Prompts que eram curtos demais para armazenar em cache no Claude Opus 4.8 agora podem criar entradas de cache, sem necessidade de alterações no código. No Amazon Bedrock, o mínimo para claude-fable-5 é de 1.024 tokens. Consulte Cache de prompt para os mínimos por modelo.

Lista de verificação de migração

  • Se sua organização tem um acordo de "zero data retention" (ZDR), confirme a elegibilidade antes de migrar. O claude-fable-5 requer retenção de dados de 30 dias e retorna um erro 400 invalid_request_error caso contrário. Consulte Requisitos de retenção de dados específicos do modelo.
  • Atualize o nome do modelo de claude-opus-4-8 para claude-fable-5.
  • Remova qualquer configuração thinking: {type: "disabled"}. Desabilitar o pensamento retorna um erro no claude-fable-5, e requisições sem um campo thinking são executadas com pensamento adaptativo.
  • Se você removeu o pensamento estendido manual e os prefills do assistente durante migrações anteriores, nenhuma ação é necessária: ambos continuam sem suporte no claude-fable-5.
  • Verifique se qualquer código que analisa o campo thinking o trata apenas como texto de exibição e passa os blocos de pensamento de volta sem alterações ao continuar no mesmo modelo. thinking.display tem como padrão "omitted" no claude-fable-5, assim como no Claude Opus 4.8; defina display: "summarized" para receber resumos legíveis. Consulte Saída de pensamento no Claude Fable 5 e Claude Mythos 5.
  • Se você reproduzir o histórico de conversa em outro modelo, remova primeiro os blocos thinking e redacted_thinking dos turnos anteriores do assistente. Os blocos de pensamento do claude-fable-5 estão vinculados ao modelo que os produziu, e modelos diferentes do Claude Fable 5 e Claude Mythos 5 os ignoram silenciosamente. A remoção mantém as requisições entre modelos mínimas e uniformes. A exceção é o resgate de um crédito de fallback, que requer o corpo da requisição ecoado sob as regras exatas desse recurso.
  • Trate stop_reason: "refusal" e leia o campo stop_details.category. Para reexecutar requisições recusadas em outro modelo automaticamente, considere o parâmetro opcional fallbacks (beta). Consulte Tratamento de stop reasons.
  • Reavalie sua configuração de effort. Comece com high para a maioria das tarefas, incluindo cargas de trabalho que eram executadas com xhigh no Claude Opus 4.8.
  • Reestabeleça a linha de base de custo e latência nas suas próprias cargas de trabalho. As contagens de tokens permanecem praticamente inalteradas ao migrar do claude-opus-4-8; o preço por token é diferente.

Migrando do Claude Opus 4.7 para o Claude Opus 4.8

O Claude Opus 4.8 é o modelo mais capaz da Anthropic na camada Opus. Ele é construído sobre o Claude Opus 4.7.

O Claude Opus 4.8 deve ter um forte desempenho imediato em prompts e avaliações existentes do Claude Opus 4.7. Não há alterações incompatíveis na API para código que já está em execução no Claude Opus 4.7. Ele oferece suporte ao mesmo conjunto de recursos que o Claude Opus 4.7, incluindo a janela de contexto de 1M de tokens, máximo de 128k tokens de saída, pensamento adaptativo, cache de prompt, processamento em lote, a Files API, suporte a PDF, visão e o conjunto completo de ferramentas do lado do servidor e do lado do cliente. Ele também adiciona mensagens de sistema no meio da conversa e documenta publicamente os detalhes de parada de recusa.



Se o seu código está no Claude Opus 4.6 ou anterior, aplique também as etapas de migração do Claude Opus 4.7 abaixo antes de atualizar para o Claude Opus 4.8. Essas etapas incluem alterações incompatíveis (parâmetros de amostragem rejeitados, pensamento estendido manual rejeitado, novo tokenizador) que a atualização para o 4.8 sozinha não cobre.



No Microsoft Foundry, o Claude Opus 4.8 tem uma janela de contexto de 200k tokens no lançamento. A janela de contexto de 1M se aplica na Claude API, Amazon Bedrock e Vertex AI. Consulte Claude no Microsoft Foundry.

Atualize o nome do seu modelo

# Migração do Opus
model = "claude-opus-4-7"  # Before
model = "claude-opus-4-8"  # After

O que mudou

Estas não são alterações incompatíveis. O código que é executado no Claude Opus 4.7 continua funcionando sem alterações no Claude Opus 4.8. Os itens abaixo descrevem diferenças de comportamento que vale a pena verificar depois de trocar o ID do modelo.

  1. Parâmetros de amostragem (inalterado): Definir temperature, top_p ou top_k com um valor não padrão retorna um erro 400 no Claude Opus 4.8, assim como no Claude Opus 4.7. Os tipos de requisição do SDK ainda definem esses campos para compatibilidade com modelos anteriores, então o código que os define passa na verificação de tipos, mas a API rejeita a requisição no lado do servidor. Se você removeu esses parâmetros ao migrar para o Opus 4.7, nenhuma alteração adicional é necessária.

  2. O padrão de effort é high: O padrão do parâmetro effort no Claude Opus 4.8 é high em todas as superfícies, incluindo o Claude Code e a Messages API. Se você já define o effort explicitamente, sua configuração permanece inalterada. Para trabalho de codificação e alta autonomia, defina xhigh explicitamente. Reavalie sua configuração de effort em relação ao seu orçamento de latência e custo.

  3. A janela de contexto de 1M é o padrão: O Claude Opus 4.8 oferece a janela de contexto completa de 1M de tokens por padrão, sem cabeçalho beta e sem custo adicional de contexto longo. Se o seu cliente passa um cabeçalho beta de janela de contexto para compatibilidade com modelos mais antigos, você pode removê-lo no Claude Opus 4.8.

  4. Mensagens de sistema no meio da conversa: O Claude Opus 4.8 aceita mensagens role: "system" imediatamente após um turno do usuário no array messages (sujeito a regras de posicionamento). Use o campo system de nível superior para instruções que se aplicam desde o início. Modelos anteriores, incluindo o Claude Opus 4.7, rejeitam role: "system" em messages com um erro 400. Se você mantém caminhos de código que reconstroem o histórico completo de mensagens para atualizar instruções, pode simplificá-los e preservar os acertos de cache de prompt em turnos anteriores.

  5. Detalhes de parada de recusa: O objeto stop_details em respostas de recusa (disponível desde o Claude Opus 4.7) agora está documentado publicamente. Quando o modelo recusa uma requisição, ele identifica a categoria da recusa, além do stop reason refusal existente. Nenhum cabeçalho beta é necessário, e não há opção de desativação. Consulte Tratamento de stop reasons.

  6. Mínimo menor para cache de prompt: O comprimento mínimo de prompt armazenável em cache no Claude Opus 4.8 é de 1.024 tokens, menor que no Claude Opus 4.7. Prompts que eram curtos demais para armazenar em cache no Claude Opus 4.7 agora podem criar entradas de cache, sem necessidade de alterações no código. Consulte Cache de prompt para os mínimos por modelo.

  7. Níveis de effort recalibrados: A alocação de tokens por trás de cada nível de effort muda no Claude Opus 4.8 em comparação com o Claude Opus 4.7: medium permite um pouco mais de pensamento, high um pouco menos, e xhigh substancialmente mais. Se você ajustou um nível de effort com base no custo ou latência do Claude Opus 4.7, reestabeleça a linha de base no mesmo nível antes de ajustá-lo. Consulte Effort.

Lista de verificação de migração

  • Atualize o nome do modelo de claude-opus-4-7 para claude-opus-4-8 (ou atualize os aliases).
  • Se você removeu os parâmetros de amostragem durante a migração para o Opus 4.7, nenhuma ação é necessária. Se você os adicionou novamente com um caminho de nova tentativa em caso de erro 400, remova esse caminho de nova tentativa.
  • Reavalie sua configuração de effort. O padrão é high em todas as superfícies; para trabalho de codificação e alta autonomia, defina xhigh explicitamente.
  • Remova qualquer cabeçalho beta de janela de contexto. A janela de contexto de 1M é o padrão na Claude API, Amazon Bedrock e Vertex AI (200k no Microsoft Foundry).
  • Se você reconstrói o histórico de conversa para atualizar instruções, considere mudar para uma mensagem de sistema no meio da conversa para preservar os acertos de cache de prompt.
  • Verifique se o seu tratamento de stop reason lê stop_details em recusas (disponível desde o Claude Opus 4.7; agora documentado publicamente).
  • Reestabeleça a linha de base de custo e latência no nível de effort escolhido.

Migrando para o Claude Opus 4.7

O Claude Opus 4.7 é altamente autônomo e tem desempenho excepcional em trabalho agêntico de longo horizonte, trabalho de conhecimento, tarefas de visão e tarefas de memória.

O Claude Opus 4.7 deve ter um forte desempenho imediato em prompts e avaliações existentes do Claude Opus 4.6 com o mesmo preço de $5 / $25 por MTok, mas há algumas alterações comportamentais e de API que vale a pena conhecer ao migrar. Ele oferece suporte ao mesmo conjunto de recursos que o Claude Opus 4.6, incluindo:

  • Janela de contexto de 1M de tokens com preço padrão da API, sem custo adicional de contexto longo
  • Máximo de 128k tokens de saída
  • Pensamento adaptativo
  • Cache de prompt
  • Processamento em lote
  • Files API
  • Suporte a PDF
  • Visão
  • O conjunto completo de ferramentas do lado do servidor e do lado do cliente (bash, execução de código, uso de computador, editor de texto, busca na web, busca de conteúdo web, conector MCP, memória)

Atualize o nome do seu modelo

# Migração para Opus
model = "claude-opus-4-6"  # Before
model = "claude-opus-4-7"  # After

Alterações incompatíveis

  1. Pensamento estendido removido: thinking: {type: "enabled", budget_tokens: N} não é mais compatível com o Claude Opus 4.7 ou modelos posteriores e retorna um erro 400. Mude para o pensamento adaptativo (thinking: {type: "adaptive"}) e use o parâmetro effort para controlar a profundidade do pensamento. O pensamento adaptativo está desativado por padrão no Claude Opus 4.7: requisições sem campo thinking são executadas sem pensamento, correspondendo ao comportamento do Opus 4.6. Defina thinking: {type: "adaptive"} explicitamente para habilitá-lo.

    Antes (Claude Opus 4.6):

    client.messages.create(
        model="claude-opus-4-6",
        max_tokens=16000,
        thinking={"type": "enabled", "budget_tokens": 10000},
        messages=[{"role": "user", "content": "..."}],
    )

    Depois (Claude Opus 4.7):

    client.messages.create(
        model="claude-opus-4-7",
        max_tokens=16000,
        thinking={"type": "adaptive"},
        output_config={"effort": "high"},  # or "max", "xhigh", "medium", "low"
        messages=[{"role": "user", "content": "..."}],
    )

    O pensamento adaptativo é direcionável por meio de prompting. Para orientação sobre como ajustar quando o modelo pensa demais ou de menos, consulte Calibrando effort e profundidade de pensamento.

  2. Parâmetros de amostragem removidos: Definir temperature, top_p ou top_k com qualquer valor não padrão no Claude Opus 4.7 retorna um erro 400. O caminho de migração mais seguro é omitir esses parâmetros completamente dos payloads de requisição. O prompting é a forma recomendada de orientar o comportamento do modelo no Claude Opus 4.7. Se você estava usando temperature = 0 para determinismo, observe que isso nunca garantiu saídas idênticas em modelos anteriores.

  3. Conteúdo de pensamento omitido por padrão: Os blocos de pensamento ainda aparecem no stream de resposta no Claude Opus 4.7, mas o campo thinking deles fica vazio, a menos que você opte explicitamente por recebê-lo. Esta é uma mudança silenciosa em relação ao Claude Opus 4.6, onde o padrão era retornar texto de pensamento resumido. Para restaurar o conteúdo de pensamento resumido no Claude Opus 4.7, defina thinking.display como "summarized":

    thinking = {
        "type": "adaptive",
        "display": "summarized",
    }

    O padrão é "omitted" no Claude Opus 4.7. Se o seu produto transmite o raciocínio aos usuários via streaming, o novo padrão aparece como uma longa pausa antes do início da saída; defina display: "summarized" para restaurar o progresso visível durante o pensamento. Consulte Pensamento estendido para obter detalhes.

  4. Contagem de tokens atualizada: O Claude Opus 4.7 usa um novo tokenizador, contribuindo para seu desempenho aprimorado em uma ampla gama de tarefas. O novo tokenizador pode usar aproximadamente de 1x a 1,35x mais tokens ao processar texto em comparação com modelos anteriores (até ~35% a mais, variando conforme o conteúdo).

    /v1/messages/count_tokens retornará um número diferente de tokens para o Claude Opus 4.7 do que retornava para o Claude Opus 4.6. A eficiência de tokens pode variar conforme o formato da carga de trabalho.

    Intervenções de prompting, task_budget e effort podem ajudar a controlar custos e garantir o uso apropriado de tokens. Esses controles podem implicar em trocas com a inteligência do modelo. Atualize seus parâmetros max_tokens para dar margem adicional, incluindo gatilhos de compactação. O Claude Opus 4.7 oferece uma janela de contexto de 1M com preço padrão da API, sem custo adicional de contexto longo.

  5. Remoção de prefill (herdada do Opus 4.6): O preenchimento prévio de mensagens do assistente retorna um erro 400 no Claude Opus 4.7. Use saídas estruturadas, instruções no prompt do sistema ou output_config.format em vez disso.

Escolhendo um nível de effort

O parâmetro effort permite que você ajuste a inteligência do Claude em relação ao gasto de tokens, trocando capacidade por maior velocidade e custos mais baixos. Comece com o novo nível de effort xhigh para casos de uso de codificação e agênticos, e use no mínimo o effort high para a maioria dos casos de uso sensíveis à inteligência. Experimente outros níveis de effort para ajustar ainda mais o uso de tokens e a inteligência:

  • max: O effort máximo pode proporcionar ganhos de desempenho em alguns casos de uso, mas pode apresentar retornos decrescentes com o aumento do uso de tokens. Essa configuração também pode, às vezes, ser propensa a pensar demais. Teste o effort máximo para tarefas que exigem muita inteligência.
  • xhigh (novo): O effort extra alto é a melhor configuração para a maioria dos casos de uso de codificação e agênticos.
  • high: Essa configuração equilibra o uso de tokens e a inteligência. Para a maioria dos casos de uso sensíveis à inteligência, use no mínimo o effort high.
  • medium: Bom para casos de uso sensíveis a custo que precisam reduzir o uso de tokens em troca de inteligência.
  • low: Reserve para tarefas curtas e delimitadas e cargas de trabalho sensíveis à latência que não são sensíveis à inteligência.

O effort é mais importante para este modelo do que para qualquer Opus anterior. Experimente-o ativamente ao fazer a atualização.

Mudanças de comportamento

O Claude Opus 4.7 tem várias diferenças comportamentais em relação ao Claude Opus 4.6 que não são alterações incompatíveis na API, mas podem exigir atualizações de prompt ou remoção de scaffolding.

  1. O comprimento da resposta varia conforme o caso de uso: O Claude Opus 4.7 calibra o comprimento da resposta de acordo com a complexidade que julga que a tarefa tem, em vez de usar uma verbosidade fixa por padrão. Isso geralmente significa respostas mais curtas em consultas simples e muito mais longas em análises abertas.

    Se o seu produto depende de um determinado estilo ou verbosidade de saída, pode ser necessário ajustar seus prompts. Por exemplo, para diminuir a verbosidade, adicione: "Forneça respostas concisas e focadas. Pule contexto não essencial e mantenha os exemplos mínimos." Se você observar tipos específicos de explicação excessiva, adicione instruções direcionadas no seu prompt para evitá-los.

    Exemplos positivos mostrando como o Claude pode se comunicar com o nível apropriado de concisão tendem a ser mais eficazes do que exemplos negativos ou instruções que dizem ao modelo o que não fazer.

  2. Seguimento de instruções mais literal: O Claude Opus 4.7 interpreta prompts de forma mais literal e explícita do que o Claude Opus 4.6, particularmente em níveis de effort mais baixos. Ele não generalizará silenciosamente uma instrução de um item para outro e não inferirá solicitações que você não fez. A vantagem desse literalismo é precisão e menos retrabalho. Ele geralmente tem melhor desempenho para casos de uso da API com prompts cuidadosamente ajustados, extração estruturada e pipelines onde você deseja comportamento previsível. Uma revisão de prompt e harness pode ser especialmente útil para a migração para o Claude Opus 4.7.

  3. Tom mais direto: Como em qualquer novo modelo, o estilo de prosa em escrita longa pode mudar. O Claude Opus 4.7 é mais direto e opinativo, com menos frases voltadas à validação e menos emojis do que o estilo mais caloroso do Claude Opus 4.6. Se o seu produto depende de uma voz específica, reavalie os prompts de estilo em relação à nova linha de base.

  4. Atualizações de progresso integradas em traces agênticos: O Claude Opus 4.7 fornece atualizações mais regulares e de maior qualidade ao usuário ao longo de traces agênticos longos. Se você adicionou scaffolding para forçar mensagens de status intermediárias ("Após cada 3 chamadas de ferramenta, resuma o progresso"), tente removê-lo. Se você achar que o comprimento ou o conteúdo das atualizações voltadas ao usuário do Claude Opus 4.7 não estão bem calibrados para o seu caso de uso, descreva explicitamente como essas atualizações devem ser no prompt e forneça exemplos.

  5. Menos subagentes gerados por padrão: O Claude Opus 4.7 tende a gerar menos subagentes por padrão. No entanto, esse comportamento é direcionável por meio de prompting; dê ao Claude Opus 4.7 orientação explícita sobre quando subagentes são desejáveis.

  6. Calibração de effort mais rigorosa: Mudando significativamente em relação ao Claude Opus 4.6, o Claude Opus 4.7 respeita os níveis de effort de forma rigorosa, especialmente na extremidade inferior. Em low e medium, o modelo limita seu trabalho ao que foi solicitado, em vez de ir além.

    Isso é bom para latência e custo, mas em tarefas moderadamente complexas executadas com effort low há algum risco de pensamento insuficiente. Se você observar raciocínio superficial em problemas complexos, aumente o effort para high ou xhigh em vez de contornar isso via prompting.

    Se você precisar manter o effort em low por questões de latência, adicione orientação direcionada: "Esta tarefa envolve raciocínio em várias etapas. Pense cuidadosamente sobre o problema antes de responder." Consulte Níveis de effort recomendados para o Claude Opus 4.7.

  7. Menos chamadas de ferramenta por padrão: O Claude Opus 4.7 tem uma tendência a usar ferramentas com menos frequência do que o Claude Opus 4.6 e a usar mais o raciocínio. Isso produz melhores resultados na maioria dos casos.

    Para aumentar o uso de ferramentas, aumente a configuração de effort. As configurações de effort high ou xhigh mostram substancialmente mais uso de ferramentas em busca agêntica e codificação. Você também pode ajustar seu prompt para instruir explicitamente o modelo sobre quando e como usar adequadamente suas ferramentas.

  8. Salvaguardas de cibersegurança em tempo real: Recém-adicionadas no Claude Opus 4.7, requisições que envolvem tópicos proibidos ou de alto risco podem levar a recusas. Para trabalho de segurança legítimo, como testes de penetração, pesquisa de vulnerabilidades ou red-teaming, inscreva-se no Cyber Verification Program para solicitar restrições reduzidas. Consulte Salvaguardas, avisos e recursos para contexto.

  9. Suporte a imagens de alta resolução: O Claude Opus 4.7 é o primeiro modelo Claude com suporte a imagens de alta resolução. A resolução máxima de imagem é de 2576 pixels no lado mais longo, acima dos 1568 pixels em modelos anteriores. Isso desbloqueia ganhos em cargas de trabalho com uso intensivo de visão e é particularmente valioso para uso de computador, compreensão de capturas de tela e análise de documentos.

    O suporte a alta resolução é automático e não requer cabeçalho beta nem ativação no lado do cliente. Duas coisas a planejar:

    • Imagens em resolução total podem usar até aproximadamente 3x mais tokens de imagem do que em modelos anteriores (até 4.784 tokens por imagem, em comparação com o limite anterior de aproximadamente 1.600 tokens por imagem). Reajuste o orçamento de max_tokens e as expectativas de custo para cargas de trabalho com muitas imagens, ou reduza a resolução antes de enviar se você não precisar da fidelidade adicional.
    • As coordenadas de apontamento e caixas delimitadoras retornadas pelo modelo são 1:1 com os pixels reais da imagem no Claude Opus 4.7, então nenhuma conversão de fator de escala é necessária.

    Consulte Suporte a imagens de alta resolução no Claude Opus 4.7 para obter detalhes.

Mudanças recomendadas

Estas não são obrigatórias, mas melhorarão sua experiência:

  1. Reavalie max_tokens: Como o mesmo texto produz uma contagem de tokens maior no Claude Opus 4.7, atualize seus parâmetros max_tokens para dar margem adicional, incluindo gatilhos de compactação. Intervenções de prompt, task_budget e effort podem ajudar a controlar custos e garantir o uso apropriado de tokens.

  2. Audite as expectativas de contagem de tokens: Qualquer caminho de código que estime tokens no lado do cliente ou assuma uma proporção fixa de token para caractere deve ser testado novamente com o Claude Opus 4.7. Use o endpoint de contagem de tokens para verificar.

  3. Adote task budgets (beta): O Claude Opus 4.7 introduz "task budgets" (orçamentos de tarefa). Esses orçamentos permitem que você informe ao Claude quantos tokens ele tem para um loop agêntico completo, incluindo pensamento, chamadas de ferramentas, resultados de ferramentas e saída final. O modelo vê uma contagem regressiva em execução e a usa para priorizar o trabalho e concluir a tarefa de forma adequada à medida que o orçamento é consumido. Para usar, defina o cabeçalho beta task-budgets-2026-03-13 e adicione o seguinte à sua configuração de saída:

    output_config = {
        "effort": "high",
        "task_budget": {"type": "tokens", "total": 128000},
    }

    Você pode precisar experimentar diferentes orçamentos de tarefa para seu caso de uso. Se o modelo receber um orçamento de tarefa muito restritivo, ele pode concluir a tarefa de forma menos completa, referenciando seu orçamento como a restrição.

    Para tarefas agênticas abertas em que a qualidade importa mais do que a velocidade, não defina um orçamento de tarefa. Reserve orçamentos de tarefa para cargas de trabalho em que você precisa que o modelo delimite seu trabalho a uma cota de tokens. O valor mínimo para um orçamento de tarefa é 20k tokens.

    Um orçamento de tarefa não é um limite rígido; é uma sugestão da qual o modelo está ciente. Ele difere de max_tokens:

    • task_budget: um limite consultivo ao longo de todo o loop agêntico. O modelo o vê e o usa para regular seu próprio ritmo.
    • max_tokens: um teto rígido por requisição sobre tokens gerados. Não é passado ao modelo, então o modelo não está ciente dele.

    Use task_budget quando quiser que o modelo se automodere, e max_tokens como um teto rígido para limitar o uso.

  4. Defina um max_tokens grande com effort max ou xhigh: Se você estiver executando o Claude Opus 4.7 com effort max ou xhigh, defina um orçamento grande de tokens máximos de saída para que o modelo tenha espaço para pensar e agir em seus subagentes e chamadas de ferramentas. Comece com 64k tokens e ajuste a partir daí.

  5. Reduza a resolução de imagens se alta resolução for desnecessária: O Claude Opus 4.7 suporta imagens de até 2576px / 3,75MP. Imagens de alta resolução usam mais tokens. Se a fidelidade adicional da imagem for desnecessária, reduza a resolução das imagens antes de enviá-las ao Claude para evitar aumentos no uso de tokens. Consulte Imagens e visão.

Checklist de migração

  • Atualize o nome do modelo de claude-opus-4-6 para claude-opus-4-7 (ou atualize os aliases).
  • Remova temperature, top_p e top_k dos payloads de requisição.
  • Substitua thinking: {type: "enabled", budget_tokens: N} por thinking: {type: "adaptive"} mais o parâmetro effort.
  • Remova quaisquer prefills de mensagem do assistente.
  • Se sua UI exibe conteúdo de pensamento, opte explicitamente pela sumarização de pensamento.
  • Refaça o benchmark de custo e latência de ponta a ponta sob a tokenização atualizada.
  • Reajuste max_tokens para levar em conta a tokenização atualizada.
  • Teste novamente quaisquer estimativas de contagem de tokens no lado do cliente.
  • Se sua aplicação envia imagens, refaça o orçamento para suporte a imagens de alta resolução (até aproximadamente 3x mais tokens de imagem por imagem em resolução completa). Reduza a resolução antes de enviar se você não precisar da fidelidade adicional.
  • Se você consome coordenadas de apontamento ou bounding-box do modelo, remova qualquer conversão de fator de escala; as coordenadas são 1:1 com os pixels reais da imagem no Claude Opus 4.7.
  • Revise os prompts para as mudanças de comportamento acima (comprimento de resposta, literalismo, tom, atualizações de progresso, subagentes, calibração de effort, acionamento de ferramentas, salvaguardas cibernéticas, tratamento de imagens de alta resolução).
  • Restabeleça a linha de base do comprimento de resposta com os prompts existentes de controle de comprimento removidos, depois ajuste explicitamente.
  • Se estiver usando effort xhigh ou max, aumente max_tokens para pelo menos 64k como ponto de partida.
  • Considere adotar task budgets (beta) para fluxos de trabalho agênticos.
  • Se seu produto realiza trabalho legítimo de segurança, inscreva-se no Cyber Verification Program para obter acesso a restrições menores sobre conteúdo cibernético.

Migrando para o Claude Opus 4.7 a partir do Opus 4.5 ou anterior

Se você está migrando do Claude Opus 4.5, Opus 4.1 (descontinuado) ou de um modelo anterior diretamente para o Claude Opus 4.7, aplique todas as mudanças do Opus 4.7 acima mais as mudanças cumulativas nesta seção que entraram em vigor entre o Opus 4.5 e o Opus 4.7. Se você está migrando do Opus 4.6, você só precisa da seção do Opus 4.7 acima.

Atualize o nome do seu modelo

# Migração do Opus
model = "claude-opus-4-5"  # Before
model = "claude-opus-4-7"  # After

Mudanças incompatíveis

  1. Remoção de prefill é abordada nas mudanças incompatíveis do Opus 4.7 acima.

  2. Escape de parâmetros de ferramentas: O Claude Opus 4.6 e modelos posteriores podem produzir escape de strings JSON ligeiramente diferente nos argumentos de chamadas de ferramentas (por exemplo, tratamento diferente de escapes Unicode ou escape de barra). Se você analisa o input de chamadas de ferramentas como uma string bruta em vez de usar um parser JSON, verifique sua lógica de parsing. Parsers JSON padrão (como json.loads() ou JSON.parse()) lidam com essas diferenças automaticamente.

Mudanças recomendadas

Essas mudanças melhoram sua experiência no Opus 4.7. Itens marcados como (obrigatório no Opus 4.7) eram recomendações opcionais quando o Opus 4.6 foi lançado, mas agora são obrigatórios; o restante permanece recomendado.

  1. Migre para adaptive thinking (obrigatório no Opus 4.7): thinking: {type: "enabled", budget_tokens: N} retorna um erro 400 no Claude Opus 4.7. Mude para thinking: {type: "adaptive"} e use o parâmetro effort para controlar a profundidade do pensamento. Consulte Adaptive thinking.

    response = client.beta.messages.create(
        model="claude-opus-4-5",
        max_tokens=16000,
        thinking={"type": "enabled", "budget_tokens": 32000},
        betas=["interleaved-thinking-2025-05-14"],
        messages=[{"role": "user", "content": "Your prompt here"}],
    )

    Observe que a migração também muda de client.beta.messages.create para client.messages.create. Adaptive thinking e effort são recursos GA e não requerem o namespace beta do SDK nem nenhum cabeçalho beta.

  2. Remova o cabeçalho beta de effort: O parâmetro effort agora é GA. Remova betas=["effort-2025-11-24"] de suas requisições.

  3. Remova o cabeçalho beta de fine-grained tool streaming: Fine-grained tool streaming agora é GA. Remova betas=["fine-grained-tool-streaming-2025-05-14"] de suas requisições.

  4. Remova o cabeçalho beta de interleaved thinking: Adaptive thinking habilita automaticamente interleaved thinking no Claude Opus 4.7, Opus 4.6 e Sonnet 4.6. Remova betas=["interleaved-thinking-2025-05-14"] de suas requisições. O cabeçalho ainda é funcional no Sonnet 4.6 com pensamento estendido manual, mas o modo manual está descontinuado.

  5. Migre para output_config.format: Se estiver usando saídas estruturadas, atualize output_format={...} para output_config={"format": {...}}. O parâmetro antigo permanece funcional, mas está descontinuado e será removido em uma versão futura do modelo.

Migrando do Claude 4.1 ou anterior

Se você está migrando do Opus 4.1 (descontinuado), Sonnet 4 (descontinuado) ou modelos anteriores diretamente para o Claude Opus 4.7, aplique as mudanças do Claude Opus 4.7 no topo deste guia e as mudanças cumulativas acima, mais as mudanças adicionais nesta seção.

# Do Opus 4.1
model = "claude-opus-4-1-20250805"  # Before
model = "claude-opus-4-7"  # After

# Do Sonnet 4
model = "claude-sonnet-4-20250514"  # Before
model = "claude-opus-4-7"  # After

# Do Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Before
model = "claude-opus-4-7"  # After

Mudanças incompatíveis adicionais

  1. Remova parâmetros de amostragem

    

    Esta é uma mudança incompatível ao migrar de modelos Claude 3.x.

    A partir do Claude Opus 4.7, definir temperature, top_p ou top_k para qualquer valor não padrão retornará um erro 400. O caminho de migração mais seguro é omitir esses parâmetros inteiramente das requisições e usar prompts para guiar o comportamento do modelo. Se você estava usando temperature = 0 para determinismo, observe que isso nunca garantiu saídas idênticas.

    Python
    # Antes - Isso causará erro nos modelos Claude 4+
    response = client.messages.create(
        model="claude-3-7-sonnet-20250219",
        temperature=0.7,
        top_p=0.9,  # Non-default sampling params return 400 on Opus 4.7
        # ...
    )
    
    # Depois
    response = client.messages.create(
        model="claude-opus-4-7",
        # ...
    )
  2. Atualize as versões de ferramentas

    

    Esta é uma mudança incompatível ao migrar de modelos Claude 3.x.

    Atualize para as versões mais recentes de ferramentas. Remova qualquer código que use o comando undo_edit.

    # Antes
    tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
    
    # Depois
    tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]
    • Use e . Consulte a para detalhes.
  3. Trate o stop reason refusal

    Atualize sua aplicação para tratar stop reasons refusal:

    Python
    response = client.messages.create(...)
    
    if response.stop_reason == "refusal":
        # Trate a recusa adequadamente
        pass
  4. Trate o stop reason model_context_window_exceeded

    Modelos Claude 4.5+ retornam um stop reason model_context_window_exceeded quando a geração para devido ao atingimento do limite da janela de contexto, em vez do limite max_tokens solicitado. Atualize sua aplicação para tratar esse novo stop reason:

    Python
    response = client.messages.create(...)
    
    if response.stop_reason == "model_context_window_exceeded":
        # Trate o limite da janela de contexto adequadamente
        pass
  5. Verifique o tratamento de parâmetros de ferramentas (quebras de linha finais)

    Modelos Claude 4.5+ preservam quebras de linha finais em parâmetros de string de chamadas de ferramentas que anteriormente eram removidas. Se suas ferramentas dependem de correspondência exata de strings com parâmetros de chamadas de ferramentas, verifique se sua lógica trata quebras de linha finais corretamente.

  6. Atualize seus prompts para mudanças comportamentais

    Modelos Claude 4+ têm um estilo de comunicação mais conciso e direto e requerem direcionamento explícito. Revise as melhores práticas de prompting para orientações de otimização.

Mudanças recomendadas adicionais

  • Remova cabeçalhos beta legados: Remova token-efficient-tools-2025-02-19 e output-128k-2025-02-19. Todos os modelos Claude 4+ têm uso de ferramentas eficiente em tokens integrado e esses cabeçalhos não têm efeito.

Checklist de migração (a partir do Opus 4.5 ou anterior)

  • Atualize o ID do modelo para claude-opus-4-7
  • Aplique todas as mudanças incompatíveis do Opus 4.7 (pensamento estendido removido, parâmetros de amostragem removidos, exibição de pensamento omitida por padrão, tokenização atualizada)
  • INCOMPATÍVEL: Remova prefills de mensagem do assistente (retorna erro 400); use saídas estruturadas ou output_config.format em vez disso
  • INCOMPATÍVEL no Opus 4.7: Substitua thinking: {type: "enabled", budget_tokens: N} por thinking: {type: "adaptive"} mais o parâmetro effort (retorna 400 no Opus 4.7)
  • Verifique se o parsing de JSON de chamadas de ferramentas usa um parser JSON padrão
  • Remova o cabeçalho beta effort-2025-11-24 (effort agora é GA)
  • Remova o cabeçalho beta fine-grained-tool-streaming-2025-05-14
  • Remova o cabeçalho beta interleaved-thinking-2025-05-14 (adaptive thinking habilita interleaved thinking automaticamente)
  • Migre output_format para output_config.format (se aplicável)
  • Se estiver migrando do Claude 4.1 ou anterior: remova temperature, top_p e top_k (valores não padrão retornam 400 no Opus 4.7)
  • Se estiver migrando do Claude 4.1 ou anterior: atualize as versões de ferramentas (text_editor_20250728, code_execution_20250825)
  • Se estiver migrando do Claude 4.1 ou anterior: trate o stop reason refusal
  • Se estiver migrando do Claude 4.1 ou anterior: trate o stop reason model_context_window_exceeded
  • Se estiver migrando do Claude 4.1 ou anterior: verifique o tratamento de parâmetros de string de ferramentas para quebras de linha finais
  • Se estiver migrando do Claude 4.1 ou anterior: remova cabeçalhos beta legados (token-efficient-tools-2025-02-19, output-128k-2025-02-19)
  • Revise e atualize prompts seguindo as melhores práticas de prompting
  • Teste em ambiente de desenvolvimento antes da implantação em produção

Migrando para o Claude Sonnet 4.6

O Claude Sonnet 4.6 combina forte inteligência com desempenho rápido, apresentando capacidades aprimoradas de busca agêntica e execução de código gratuita quando usado com busca na web ou web fetch. É ideal para tarefas cotidianas de codificação, análise e conteúdo.

Para uma visão geral completa das capacidades, consulte a visão geral dos modelos.



O preço do Sonnet 4.6 é US$ 3 por milhão de tokens de entrada, US$ 15 por milhão de tokens de saída. Consulte Preços do Claude para detalhes.

Atualize o nome do seu modelo:

# Do Sonnet 4.5
model = "claude-sonnet-4-5"  # Before
model = "claude-sonnet-4-6"  # After

# Do Sonnet 4
model = "claude-sonnet-4-20250514"  # Before
model = "claude-sonnet-4-6"  # After

Mudanças incompatíveis

Ao migrar do Sonnet 4.5

  1. Prefill de mensagens do assistente não é mais suportado

    

    Esta é uma mudança incompatível ao migrar do Sonnet 4.5 ou anterior.

    Prefill de mensagens do assistente retorna um erro 400 no Sonnet 4.6. Use saídas estruturadas, instruções no prompt do sistema ou output_config.format em vez disso.

    Casos de uso comuns de prefill e migrações:

    • Controlar formatação de saída (forçar saída JSON/YAML): Use saídas estruturadas ou ferramentas com campos enum para tarefas de classificação.

    • Eliminar preâmbulos (remover frases como "Aqui está..."): Adicione instruções diretas no prompt do sistema: "Responda diretamente sem preâmbulo. Não comece com frases como 'Aqui está...', 'Com base em...', etc."

    • Evitar recusas inadequadas: O Claude agora é muito melhor em recusas apropriadas. Prompting claro na mensagem do usuário sem prefill deve ser suficiente.

    • Continuações (retomar respostas interrompidas): Mova a continuação para a mensagem do usuário: "Sua resposta anterior foi interrompida e terminou com [previous_response]. Continue de onde parou."

    • Hidratação de contexto / consistência de papel (atualizar contexto em conversas longas): Injete o que anteriormente eram lembretes de assistente com prefill no turno do usuário em vez disso.

  2. O escape de JSON de parâmetros de ferramentas pode diferir

    

    Esta é uma mudança incompatível ao migrar do Sonnet 4.5 ou anterior.

    O escape de strings JSON em parâmetros de ferramentas pode diferir de modelos anteriores. Parsers JSON padrão lidam com isso automaticamente, mas parsing personalizado baseado em strings pode precisar de atualizações.

Ao migrar do Claude 3.x

  1. Atualize parâmetros de amostragem

    

    Esta é uma mudança incompatível ao migrar de modelos Claude 3.x.

    Use apenas temperature OU top_p, não ambos.

  2. Atualize as versões de ferramentas

    

    Esta é uma mudança incompatível ao migrar de modelos Claude 3.x.

    Atualize para as versões mais recentes de ferramentas (text_editor_20250728, code_execution_20250825). Remova qualquer código que use o comando undo_edit.

  3. Trate o stop reason refusal

    Atualize sua aplicação para tratar stop reasons refusal.

  4. Atualize seus prompts para mudanças comportamentais

    Modelos Claude 4 têm um estilo de comunicação mais conciso e direto. Revise as melhores práticas de prompting para orientações de otimização.

Mudanças recomendadas

  1. Remova o cabeçalho beta fine-grained-tool-streaming-2025-05-14: Fine-grained tool streaming agora é GA no Sonnet 4.6 e não requer mais um cabeçalho beta.
  2. Migre output_format para output_config.format: O parâmetro output_format está descontinuado. Use output_config.format em vez disso.

Migrando do Sonnet 4.5

Considere migrar do Sonnet 4.5 para o Sonnet 4.6, que oferece mais inteligência pelo mesmo preço.



O Sonnet 4.6 tem como padrão um nível de effort high, em contraste com o Sonnet 4.5, que não tinha parâmetro effort. Considere ajustar o parâmetro effort ao migrar do Sonnet 4.5 para o Sonnet 4.6. Se não for definido explicitamente, você pode experimentar maior latência com o nível de effort padrão.

Se você não está usando pensamento estendido

Se você não está usando pensamento estendido no Sonnet 4.5, pode continuar sem ele no Sonnet 4.6. Você deve definir explicitamente o effort para o nível apropriado ao seu caso de uso. Com effort low e pensamento desabilitado, você pode esperar desempenho similar ou melhor em relação ao Sonnet 4.5 sem pensamento estendido.

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Se você está usando pensamento estendido

Se você está usando pensamento estendido com budget_tokens no Sonnet 4.5, ele ainda é funcional no Sonnet 4.6, mas está descontinuado. Migre para adaptive thinking com o parâmetro effort.

Migrando para adaptive thinking

Adaptive thinking é o substituto recomendado para budget_tokens no Sonnet 4.6. É particularmente adequado para os seguintes padrões de carga de trabalho:

  • Agentes autônomos de múltiplas etapas: agentes de codificação que transformam requisitos em software funcional, pipelines de análise de dados e localização de bugs em que o modelo executa de forma independente ao longo de muitas etapas. Adaptive thinking permite que o modelo calibre seu raciocínio por etapa, mantendo-se no caminho ao longo de trajetórias mais longas. Para essas cargas de trabalho, comece com effort high. Se latência ou uso de tokens for uma preocupação, reduza para medium.
  • Agentes de uso de computador: O Sonnet 4.6 alcançou a melhor precisão da categoria em avaliações de uso de computador usando o modo adaptive.
  • Cargas de trabalho bimodais: uma mistura de tarefas fáceis e difíceis em que o adaptive pula o pensamento em consultas simples e raciocina profundamente em consultas complexas.

Ao usar adaptive thinking, avalie effort medium e high em suas tarefas. O nível certo depende do equilíbrio da sua carga de trabalho entre qualidade, latência e uso de tokens.

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)


Se você observar comportamento inconsistente ou regressões de qualidade com adaptive thinking, tente primeiro reduzir a configuração de effort ou usar max_tokens como um limite rígido. Pensamento estendido com budget_tokens ainda é funcional no Sonnet 4.6, mas está descontinuado e não é mais recomendado.

Mantendo budget_tokens durante a migração

Se você precisar manter budget_tokens temporariamente durante a migração, um orçamento em torno de 16k tokens fornece margem para problemas mais difíceis sem risco de uso descontrolado de tokens. Essa configuração está descontinuada e será removida em uma versão futura do modelo.

Casos de uso de codificação e agênticos

Para codificação agêntica, design de frontend, fluxos de trabalho com uso intensivo de ferramentas e fluxos de trabalho empresariais complexos, comece com effort medium. Se você achar que a latência está muito alta, considere reduzir o effort para low. Se você precisar de maior inteligência, considere aumentar o effort para high ou migrar para o Opus 4.7.

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16384,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "medium"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)
Casos de uso de chat e não relacionados a codificação

Para chat, geração de conteúdo, busca, classificação e outras tarefas não relacionadas a codificação, comece com effort low com pensamento estendido. Se você precisar de mais profundidade, aumente o effort para medium.

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "low"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Checklist de migração do Sonnet 4.6

  • Atualize o ID do modelo para claude-sonnet-4-6
  • INCOMPATÍVEL: Remova prefill de mensagens do assistente; use saídas estruturadas ou output_config.format em vez disso
  • INCOMPATÍVEL: Verifique se o parsing de JSON de parâmetros de ferramentas lida com diferenças de escape
  • INCOMPATÍVEL: Atualize as versões de ferramentas para as mais recentes (text_editor_20250728, code_execution_20250825); versões legadas não são suportadas (se estiver migrando do 3.x)
  • INCOMPATÍVEL: Remova qualquer código que use o comando undo_edit (se aplicável)
  • INCOMPATÍVEL: Atualize parâmetros de amostragem para usar apenas temperature OU top_p, não ambos (se estiver migrando do 3.x)
  • Trate o novo stop reason refusal em sua aplicação
  • Remova o cabeçalho beta fine-grained-tool-streaming-2025-05-14 (agora GA)
  • Migre output_format para output_config.format
  • Revise e atualize prompts seguindo as melhores práticas de prompting
  • Recomendado: Migre de thinking: {type: "enabled", budget_tokens: N} para thinking: {type: "adaptive"} com o parâmetro effort (budget_tokens está descontinuado e será removido em uma versão futura)
  • Teste em ambiente de desenvolvimento antes da implantação em produção

Migrando para o Claude Sonnet 4.5

O Claude Sonnet 4.5 combina forte inteligência com desempenho rápido, tornando-o ideal para tarefas cotidianas de codificação, análise e conteúdo.

Para uma visão geral completa das capacidades, consulte a visão geral dos modelos.



O preço do Sonnet 4.5 é US$ 3 por milhão de tokens de entrada, US$ 15 por milhão de tokens de saída. Consulte Preços do Claude para detalhes.

Atualize o nome do seu modelo:

# Do Sonnet 4
model = "claude-sonnet-4-20250514"  # Before
model = "claude-sonnet-4-5-20250929"  # After

# Do Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Before
model = "claude-sonnet-4-5-20250929"  # After

Mudanças incompatíveis

Essas mudanças incompatíveis se aplicam ao migrar de modelos Claude 3.x Sonnet.

  1. Atualize parâmetros de amostragem

    

    Esta é uma mudança incompatível ao migrar de modelos Claude 3.x.

    Use apenas temperature OU top_p, não ambos.

  2. Atualize as versões de ferramentas

    

    Esta é uma mudança incompatível ao migrar de modelos Claude 3.x.

    Atualize para as versões mais recentes de ferramentas (text_editor_20250728, code_execution_20250825). Remova qualquer código que use o comando undo_edit.

  3. Trate o stop reason refusal

    Atualize sua aplicação para tratar stop reasons refusal.

  4. Atualize seus prompts para mudanças comportamentais

    Modelos Claude 4 têm um estilo de comunicação mais conciso e direto. Revise as melhores práticas de prompting para orientações de otimização.

Checklist de migração do Sonnet 4.5

  • Atualize o ID do modelo para claude-sonnet-4-5-20250929
  • INCOMPATÍVEL: Atualize as versões de ferramentas para as mais recentes (text_editor_20250728, code_execution_20250825); versões legadas não são suportadas (se estiver migrando do 3.x)
  • INCOMPATÍVEL: Remova qualquer código que use o comando undo_edit (se aplicável)
  • INCOMPATÍVEL: Atualize parâmetros de amostragem para usar apenas temperature OU top_p, não ambos (se estiver migrando do 3.x)
  • Trate o novo stop reason refusal em sua aplicação
  • Revise e atualize prompts seguindo as melhores práticas de prompting
  • Considere habilitar pensamento estendido para tarefas de raciocínio complexas
  • Teste em ambiente de desenvolvimento antes da implantação em produção

Migrando para o Claude Haiku 4.5

O Claude Haiku 4.5 é o modelo Haiku mais rápido e inteligente com desempenho próximo ao de fronteira, oferecendo qualidade de modelo premium para aplicações interativas e processamento de alto volume.

Para uma visão geral completa das capacidades, consulte a visão geral dos modelos.



O preço do Haiku 4.5 é US$ 1 por milhão de tokens de entrada, US$ 5 por milhão de tokens de saída. Consulte Preços do Claude para detalhes.

Atualize o nome do seu modelo:

# Do Haiku 3.5
model = "claude-3-5-haiku-20241022"  # Before
model = "claude-haiku-4-5-20251001"  # After

Revise os novos limites de taxa: O Haiku 4.5 tem limites de taxa separados do Haiku 3.5. Consulte a documentação de limites de taxa para detalhes.



Para melhorias significativas de desempenho em tarefas de codificação e raciocínio, considere habilitar pensamento estendido com thinking: {type: "enabled", budget_tokens: N}.



Pensamento estendido impacta a eficiência do cache de prompt.

Pensamento estendido está descontinuado nos modelos Claude 4.6 e removido no Claude Opus 4.7. Se estiver usando modelos mais recentes, use adaptive thinking em vez disso.

Explore novas capacidades: Consulte a visão geral dos modelos para detalhes sobre consciência de contexto, capacidade de saída aumentada (64k tokens), maior inteligência e velocidade aprimorada.

Mudanças incompatíveis

Essas mudanças incompatíveis se aplicam ao migrar de modelos Claude 3.x Haiku.

  1. Atualize parâmetros de amostragem

    

    Esta é uma mudança incompatível ao migrar de modelos Claude 3.x.

    Use apenas temperature OU top_p, não ambos.

  2. Atualize as versões de ferramentas

    

    Esta é uma mudança incompatível ao migrar de modelos Claude 3.x.

    Atualize para as versões mais recentes de ferramentas (text_editor_20250728, code_execution_20250825). Remova qualquer código que use o comando undo_edit.

  3. Trate o stop reason refusal

    Atualize sua aplicação para tratar stop reasons refusal.

  4. Atualize seus prompts para mudanças comportamentais

    Modelos Claude 4 têm um estilo de comunicação mais conciso e direto. Revise as melhores práticas de prompting para orientações de otimização.

Checklist de migração do Haiku 4.5

  • Atualize o ID do modelo para claude-haiku-4-5-20251001
  • INCOMPATÍVEL: Atualize as versões de ferramentas para as mais recentes (text_editor_20250728, code_execution_20250825); versões legadas não são suportadas
  • INCOMPATÍVEL: Remova qualquer código que use o comando undo_edit (se aplicável)
  • INCOMPATÍVEL: Atualize parâmetros de amostragem para usar apenas temperature OU top_p, não ambos
  • Trate o novo stop reason refusal em sua aplicação
  • Revise e ajuste para os novos limites de taxa (separados do Haiku 3.5)
  • Revise e atualize prompts seguindo as melhores práticas de prompting
  • Considere habilitar pensamento estendido para tarefas de raciocínio complexas
  • Teste em ambiente de desenvolvimento antes da implantação em produção

Obtenha ajuda

  • Consulte a documentação da API para especificações detalhadas
  • Revise as capacidades dos modelos para comparações de desempenho
  • Revise as notas de lançamento da API para atualizações da API
  • Entre em contato com o suporte se encontrar problemas durante a migração

Was this page helpful?

  • Migrando do Claude Mythos Preview para o Claude Mythos 5
  • Atualize o nome do seu modelo
  • Recursos não disponíveis no Claude Mythos 5
  • Contagem de tokens e cobrança
  • Lista de verificação de migração
  • Migrando do Claude Opus 4.8 para o Claude Fable 5
  • Antes de migrar
  • Atualize o nome do seu modelo
  • O que mudou
  • Lista de verificação de migração
  • Migrando do Claude Opus 4.7 para o Claude Opus 4.8
  • Atualize o nome do seu modelo
  • O que mudou
  • Lista de verificação de migração
  • Migrando para o Claude Opus 4.7
  • Atualize o nome do seu modelo
  • Alterações incompatíveis
  • Escolhendo um nível de effort
  • Mudanças de comportamento
  • Mudanças recomendadas
  • Checklist de migração
  • Migrando para o Claude Opus 4.7 a partir do Opus 4.5 ou anterior
  • Atualize o nome do seu modelo
  • Mudanças incompatíveis
  • Mudanças recomendadas
  • Migrando do Claude 4.1 ou anterior
  • Checklist de migração (a partir do Opus 4.5 ou anterior)
  • Migrando para o Claude Sonnet 4.6
  • Mudanças incompatíveis
  • Mudanças recomendadas
  • Migrando do Sonnet 4.5
  • Checklist de migração do Sonnet 4.6
  • Migrando para o Claude Sonnet 4.5
  • Mudanças incompatíveis
  • Checklist de migração do Sonnet 4.5
  • Migrando para o Claude Haiku 4.5
  • Mudanças incompatíveis
  • Checklist de migração do Haiku 4.5
  • Obtenha ajuda
Editor de texto:
text_editor_20250728
str_replace_based_edit_tool
documentação da ferramenta de editor de texto
  • Execução de código: Atualize para code_execution_20250825. Consulte a documentação da ferramenta de execução de código para instruções de migração.