Modelos e preçosModelos

O que há de novo no Claude Opus 5

Visão geral dos novos recursos e mudanças de comportamento no Claude Opus 5.

Claude Opus 5 é uma melhoria de salto qualitativo em relação ao Claude Opus 4.8, com os maiores ganhos em raciocínio profundo, tarefas agênticas e de longo horizonte, e escalonamento de computação em tempo de teste. Esta página resume tudo o que há de novo no Claude Opus 5, incluindo pensamento ativado por padrão, mudanças de ferramentas no meio da conversa e uma mudança incompatível sobre quando o pensamento pode ser desativado.

Novo modelo

Modelo	ID do modelo na API	Descrição
Claude Opus 5	`claude-opus-5`	Para codificação agêntica complexa e trabalho empresarial

Claude Opus 5 tem uma janela de contexto de 1M de tokens (1M de tokens é tanto o padrão quanto o máximo; não há variante de contexto menor), 128k de tokens máximos de saída e pensamento ativado por padrão.

Para preços e especificações completos, consulte a visão geral dos modelos.

Novos recursos

Mudanças de ferramentas no meio da conversa (beta)

Você pode adicionar ou remover ferramentas entre os turnos de uma conversa preservando o cache de prompt, em vez de reenviar uma lista fixa de ferramentas durante toda a sessão. As mudanças de ferramentas no meio da conversa estão em beta: inclua o cabeçalho beta mid-conversation-tool-changes-2026-07-01 em suas solicitações. Consulte Mudanças de ferramentas no meio da conversa para saber como usar.

Modo de fallbacks padrão

O parâmetro fallbacks suporta um novo modo "default", que aplica os modelos de fallback recomendados pela Anthropic por categoria de recusa, em vez de uma lista de modelos que você mesmo mantém. Todo o parâmetro fallbacks está em beta. Use o cabeçalho beta server-side-fallback-2026-07-01, que suporta tanto o modo "default" quanto listas explícitas de modelos (o cabeçalho anterior server-side-fallback-2026-06-01 aceita apenas listas explícitas). Consulte Recusas e fallback.

Mínimo menor para cache de prompt

O comprimento mínimo de prompt armazenável em cache no Claude Opus 5 é de 512 tokens, abaixo dos 1.024 tokens no Claude Opus 4.8. Prompts que eram curtos demais para serem armazenados em cache no Claude Opus 4.8 agora podem criar entradas de cache sem nenhuma mudança de código. Consulte Cache de prompt para os mínimos por modelo.

Modo rápido

O modo rápido (prévia de pesquisa) está disponível para o Claude Opus 5 apenas na API do Claude; atualmente não está disponível no Amazon Bedrock, Google Cloud ou Microsoft Foundry. O modo rápido para o Claude Opus 5 tem preço de US$ 10 por milhão de tokens de entrada e US$ 50 por milhão de tokens de saída. Consulte Modo rápido para acesso, modelos suportados e preços.

Mudanças de comportamento

Pensamento ativado por padrão

No Claude Opus 4.8, as solicitações são executadas sem pensamento, a menos que você defina thinking: {"type": "adaptive"}. No Claude Opus 5, as mesmas solicitações são executadas com pensamento ativado: o modelo decide quando e quanto pensar em cada turno, e o parâmetro effort é o controle para a profundidade do pensamento. O valor transmitido não muda; thinking: {"type": "adaptive"} continua válido e equivalente ao padrão.

Como max_tokens é um limite rígido sobre a saída total (pensamento mais texto de resposta), revise-o para cargas de trabalho que eram executadas sem pensamento no Claude Opus 4.8.

A API mantém a opção de desativar o pensamento, sujeita à restrição de effort abaixo.

Effort importa mais

Claude Opus 5 converte effort adicional em melhores resultados de forma mais confiável do que qualquer modelo Opus anterior, então o nível de effort que você escolhe tem mais peso. A escala completa está disponível: low, medium, high, xhigh e max, com max como o nível mais alto para o raciocínio mais profundo possível. Comece no padrão, high, e ajuste em qualquer direção com base em suas avaliações: reduza onde a qualidade se mantém para economizar tokens e latência, ou aumente para o trabalho mais exigente. Ao executar com effort xhigh ou max, defina um max_tokens grande para que o modelo tenha espaço para pensar e agir entre subagentes e chamadas de ferramentas.

Esta solicitação eleva o effort ao máximo, max:

client = anthropic.Anthropic()

with client.messages.stream(
    model="claude-opus-5",
    max_tokens=64000,
    output_config={"effort": "max"},
    messages=[
        {
            "role": "user",
            "content": "Explain why the sum of two even numbers is always even.",
        }
    ],
) as stream:
    response = stream.get_final_message()

print(response)

O pensamento está ativado por padrão no Claude Opus 5, então nenhum campo thinking é necessário.

Desativar o pensamento requer effort `high` ou inferior

No Claude Opus 5, thinking: {"type": "disabled"} é aceito apenas quando o nível de effort é high ou inferior. Definir thinking: {"type": "disabled"} com effort xhigh ou max retorna um erro 400. Este é um comportamento disponível de forma geral do Claude Opus 5 em diante, aplicado em cada solicitação, e é uma mudança incompatível em relação ao Claude Opus 4.8, onde desativar o pensamento era independente do nível de effort. Se você desativa o pensamento em níveis altos de effort hoje, mantenha o pensamento desativado e defina o effort como high ou inferior, ou mantenha o nível de effort e remova o campo thinking.

Com o pensamento desativado, o Claude Opus 5 pode ocasionalmente escrever uma chamada de ferramenta em sua saída de texto em vez de emitir um bloco tool_use, ou incluir tags XML internas em sua resposta visível. Sempre que possível, mantenha o pensamento ativado e controle o custo de tokens com níveis de effort mais baixos; para integrações que precisam manter o pensamento desativado, consulte Executando com pensamento desativado para mitigações via prompting.

Diferenças de comportamento do modelo

Além das mudanças na API acima, o Claude Opus 5 se comporta de forma diferente do Claude Opus 4.8 de maneiras que você pode notar sem alterar nenhum código. As respostas padrão voltadas ao usuário e os entregáveis escritos são mais longos. Em sessões agênticas, o modelo narra seu progresso ao usuário com mais frequência. Em frameworks multiagente, ele delega a subagentes com mais facilidade. Ele também verifica seu próprio trabalho sem que seja solicitado, então remova instruções de verificação herdadas de modelos anteriores ("inclua uma etapa final de verificação", "use um subagente para verificar"); elas causam verificação excessiva no Claude Opus 5. Para padrões de prompting que ajustam cada um desses comportamentos, consulte Prompting para Claude Opus 5.

Melhorias de capacidade

Em comparação com o Claude Opus 4.8, o Claude Opus 5 é uma melhoria de salto qualitativo em vez de incremental, e oferece inteligência de fronteira pela metade do custo do Claude Fable 5. Os maiores ganhos estão em:

Raciocínio profundo, sustentando análises de múltiplas etapas ao longo de longas cadeias de problemas.
Codificação agêntica e tarefas de longo horizonte, mantendo-se na tarefa ao longo de loops estendidos de uso de ferramentas e concluindo recursos multiarquivo, refatorações maiores e trabalho de recursos de ponta a ponta sem deixar stubs ou placeholders.
Escalonamento de computação em tempo de teste, convertendo effort adicional (até o nível max) em melhores resultados.
Eficiência em níveis de effort mais baixos, com effort low e medium produzindo qualidade sólida com uma fração dos tokens e da latência das configurações mais altas.
Revisão de código e detecção de bugs, revelando bugs reais a uma alta taxa por passagem com poucos falsos positivos, e mantendo a precisão em níveis de effort mais baixos.
Visão, compreendendo gráficos, documentos e diagramas e replicando visuais de UI e frontend, com melhor desempenho quando recebe ferramentas para analisar, recortar e verificar seu trabalho iterativamente.
Trabalho com contexto longo, com uma janela de contexto de 1M de tokens como padrão e máximo, e seguimento de instruções, chamadas de ferramentas e raciocínio consistentes ao longo de toda a janela.
Tarefas de escritório e documentos, gerando e editando planilhas complexas com múltiplas abas e fórmulas não triviais, e produzindo apresentações de slides bem estruturadas.
Coordenação multiagente, executando equipes de subagentes com padrões eficazes de escritor-verificador e poucos casos de agentes sobrescrevendo o trabalho uns dos outros.

Para os padrões de prompting que extraem o máximo dessas capacidades, consulte Prompting para Claude Opus 5.

Preços

Claude Opus 5 tem preço de US$ 5 por milhão de tokens de entrada e US$ 25 por milhão de tokens de saída, sem alteração em relação ao Claude Opus 4.8.

Consulte Preços para preços completos, incluindo processamento em lote, cache de prompt e tarifas do modo rápido.

Disponibilidade

Claude Opus 5 está disponível em:

API do Claude: disponível para todos os clientes, como claude-opus-5.
AWS: disponível através do Claude no Amazon Bedrock, como anthropic.claude-opus-5. O Claude Opus 5 também é acessível através da API InvokeModel no bedrock-runtime, servido pela mesma infraestrutura; a integração Claude no Amazon Bedrock (legado) não o inclui em sua tabela de IDs de modelo versionados por ARN.
Google Cloud: disponível através do Claude no Google Cloud, como claude-opus-5.
Microsoft Foundry: disponível através do Claude no Microsoft Foundry.

Claude Opus 4.8 continua disponível em todas essas plataformas.

Guia de migração

Para migrar do Claude Opus 4.8, atualize seu ID de modelo:

model = "claude-opus-4-8"  # Before
model = "claude-opus-5"  # After

Em seguida, revise as duas mudanças de comportamento: o pensamento está ativado por padrão, e desativar o pensamento com effort xhigh ou max retorna um erro 400. Consulte o guia de migração para instruções passo a passo.

Próximos passos

Visão geral dos modelos

Especificações e preços completos de todos os modelos Claude atuais.

Prompting para Claude Opus 5

Diferenças comportamentais e padrões de prompting específicos do Claude Opus 5.

Effort

Controle quantos tokens Claude usa ao responder, de low a max.

Pensamento

Como o pensamento funciona quando está ativado por padrão e quando pode ser desativado.

Orçamentos de tarefa

Dê ao Claude um orçamento consultivo de tokens para ritmar seu trabalho.

Guia de migração

Guia para migrar para os modelos Claude mais recentes a partir de versões anteriores do Claude.

Modo rápido

Obtenha mais tokens de saída por segundo dos modelos Claude Opus com preço premium.

Was this page helpful?

Modelos e preçosModelos

O que há de novo no Claude Opus 5

Visão geral dos novos recursos e mudanças de comportamento no Claude Opus 5.

Novo modelo

Modelo	ID do modelo na API	Descrição
Claude Opus 5	`claude-opus-5`	Para codificação agêntica complexa e trabalho empresarial

Para preços e especificações completos, consulte a visão geral dos modelos.

Novos recursos

Mudanças de ferramentas no meio da conversa (beta)

Modo de fallbacks padrão

Mínimo menor para cache de prompt

Modo rápido

Mudanças de comportamento

Pensamento ativado por padrão

Como max_tokens é um limite rígido sobre a saída total (pensamento mais texto de resposta), revise-o para cargas de trabalho que eram executadas sem pensamento no Claude Opus 4.8.

A API mantém a opção de desativar o pensamento, sujeita à restrição de effort abaixo.

Effort importa mais

Esta solicitação eleva o effort ao máximo, max:

client = anthropic.Anthropic()

with client.messages.stream(
    model="claude-opus-5",
    max_tokens=64000,
    output_config={"effort": "max"},
    messages=[
        {
            "role": "user",
            "content": "Explain why the sum of two even numbers is always even.",
        }
    ],
) as stream:
    response = stream.get_final_message()

print(response)

O pensamento está ativado por padrão no Claude Opus 5, então nenhum campo thinking é necessário.

Desativar o pensamento requer effort `high` ou inferior

Diferenças de comportamento do modelo

Melhorias de capacidade

Raciocínio profundo, sustentando análises de múltiplas etapas ao longo de longas cadeias de problemas.
Codificação agêntica e tarefas de longo horizonte, mantendo-se na tarefa ao longo de loops estendidos de uso de ferramentas e concluindo recursos multiarquivo, refatorações maiores e trabalho de recursos de ponta a ponta sem deixar stubs ou placeholders.
Escalonamento de computação em tempo de teste, convertendo effort adicional (até o nível max) em melhores resultados.
Eficiência em níveis de effort mais baixos, com effort low e medium produzindo qualidade sólida com uma fração dos tokens e da latência das configurações mais altas.
Revisão de código e detecção de bugs, revelando bugs reais a uma alta taxa por passagem com poucos falsos positivos, e mantendo a precisão em níveis de effort mais baixos.
Visão, compreendendo gráficos, documentos e diagramas e replicando visuais de UI e frontend, com melhor desempenho quando recebe ferramentas para analisar, recortar e verificar seu trabalho iterativamente.
Trabalho com contexto longo, com uma janela de contexto de 1M de tokens como padrão e máximo, e seguimento de instruções, chamadas de ferramentas e raciocínio consistentes ao longo de toda a janela.
Tarefas de escritório e documentos, gerando e editando planilhas complexas com múltiplas abas e fórmulas não triviais, e produzindo apresentações de slides bem estruturadas.
Coordenação multiagente, executando equipes de subagentes com padrões eficazes de escritor-verificador e poucos casos de agentes sobrescrevendo o trabalho uns dos outros.

Para os padrões de prompting que extraem o máximo dessas capacidades, consulte Prompting para Claude Opus 5.

Preços

Claude Opus 5 tem preço de US$ 5 por milhão de tokens de entrada e US$ 25 por milhão de tokens de saída, sem alteração em relação ao Claude Opus 4.8.

Consulte Preços para preços completos, incluindo processamento em lote, cache de prompt e tarifas do modo rápido.

Disponibilidade

Claude Opus 5 está disponível em:

API do Claude: disponível para todos os clientes, como claude-opus-5.
AWS: disponível através do Claude no Amazon Bedrock, como anthropic.claude-opus-5. O Claude Opus 5 também é acessível através da API InvokeModel no bedrock-runtime, servido pela mesma infraestrutura; a integração Claude no Amazon Bedrock (legado) não o inclui em sua tabela de IDs de modelo versionados por ARN.
Google Cloud: disponível através do Claude no Google Cloud, como claude-opus-5.
Microsoft Foundry: disponível através do Claude no Microsoft Foundry.

Claude Opus 4.8 continua disponível em todas essas plataformas.

Guia de migração

Para migrar do Claude Opus 4.8, atualize seu ID de modelo:

model = "claude-opus-4-8"  # Before
model = "claude-opus-5"  # After

Próximos passos

Visão geral dos modelos

Especificações e preços completos de todos os modelos Claude atuais.

Prompting para Claude Opus 5

Diferenças comportamentais e padrões de prompting específicos do Claude Opus 5.

Effort

Controle quantos tokens Claude usa ao responder, de low a max.

Pensamento

Como o pensamento funciona quando está ativado por padrão e quando pode ser desativado.

Orçamentos de tarefa

Dê ao Claude um orçamento consultivo de tokens para ritmar seu trabalho.

Guia de migração

Guia para migrar para os modelos Claude mais recentes a partir de versões anteriores do Claude.

Modo rápido

Obtenha mais tokens de saída por segundo dos modelos Claude Opus com preço premium.

Was this page helpful?

Novo modelo

Novos recursos

Mudanças de ferramentas no meio da conversa (beta)

Modo de fallbacks padrão

Mínimo menor para cache de prompt

Modo rápido

Mudanças de comportamento

Pensamento ativado por padrão

Effort importa mais

Desativar o pensamento requer effort high ou inferior

Diferenças de comportamento do modelo

Melhorias de capacidade

Preços

Disponibilidade

Guia de migração

Próximos passos

Novo modelo

Novos recursos

Mudanças de ferramentas no meio da conversa (beta)

Modo de fallbacks padrão

Mínimo menor para cache de prompt

Modo rápido

Mudanças de comportamento

Pensamento ativado por padrão

Effort importa mais

Desativar o pensamento requer effort high ou inferior

Diferenças de comportamento do modelo

Melhorias de capacidade

Preços

Disponibilidade

Guia de migração

Próximos passos

Novo modelo

Novos recursos

Mudanças de ferramentas no meio da conversa (beta)

Modo de fallbacks padrão

Mínimo menor para cache de prompt

Modo rápido

Mudanças de comportamento

Pensamento ativado por padrão

Effort importa mais

Desativar o pensamento requer effort `high` ou inferior

Diferenças de comportamento do modelo

Melhorias de capacidade

Preços

Disponibilidade

Guia de migração

Próximos passos

Novo modelo

Novos recursos

Mudanças de ferramentas no meio da conversa (beta)

Modo de fallbacks padrão

Mínimo menor para cache de prompt

Modo rápido

Mudanças de comportamento

Pensamento ativado por padrão

Effort importa mais

Desativar o pensamento requer effort `high` ou inferior

Diferenças de comportamento do modelo

Melhorias de capacidade

Preços

Disponibilidade

Guia de migração

Próximos passos