Claude Platform Docs
  • Mensagens
  • Agentes Gerenciados
  • Administração

Search...
⌘K
Modelos
Visão geral dos modelosIDs e versionamento de modelosEscolhendo um modeloApresentando o Claude Fable 5 e o Claude Mythos 5Novidades no Claude Opus 4.8Novidades no Claude Sonnet 5Atualizar entre versões de modeloDescontinuações de modelosFichas de modeloPrompts do sistemaPreços

Log in
Novidades no Claude Opus 4.8
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claude Platform Docs

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Claude on Google Cloud

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Modelos e preços/Modelos

Novidades no Claude Opus 4.8

Visão geral dos novos recursos e mudanças de comportamento no Claude Opus 4.8.

O Claude Opus 4.8 é o modelo mais capaz da Anthropic na categoria Opus. Ele é construído com base no Claude Opus 4.7. Esta página resume todas as novidades no lançamento, incluindo o "fast mode" (modo rápido, em prévia de pesquisa na API do Claude) e um comprimento mínimo de prompt cacheável reduzido para 1.024 tokens.

Novo modelo

ModeloID do modelo na APIDescrição
Claude Opus 4.8claude-opus-4-8O modelo mais capaz da Anthropic na categoria Opus para raciocínio complexo, codificação agêntica de longo horizonte e trabalho de alta autonomia

O Claude Opus 4.8 oferece suporte à janela de contexto de 1M de tokens por padrão na API do Claude, Amazon Bedrock, Google Cloud e Microsoft Foundry, 128k tokens máximos de saída, adaptive thinking (pensamento adaptativo) e o mesmo conjunto de ferramentas e recursos de plataforma que o Claude Opus 4.7.

Para preços e especificações completos, consulte a visão geral dos modelos.

Novos recursos

Mensagens de sistema no meio da conversa

O Claude Opus 4.8 aceita mensagens com role: "system" imediatamente após um turno do usuário no array messages (sujeito às regras de posicionamento). Isso permite que você anexe instruções atualizadas mais adiante em uma conversa de longa duração sem repetir o prompt do sistema completo. Atualizar instruções dessa forma preserva os acertos do cache de prompt nos turnos anteriores e reduz o custo de entrada em loops agênticos. Nenhum cabeçalho beta é necessário. Consulte Mensagens de sistema no meio da conversa para detalhes de uso.

Detalhes de parada em recusas

O objeto stop_details em respostas de recusa (disponível desde o Claude Opus 4.7) agora está documentado publicamente. Quando o Claude se recusa a concluir uma solicitação, esse objeto descreve a categoria da recusa, além do motivo de parada refusal já existente. Sua aplicação pode usá-lo para distinguir diferentes classes de solicitações recusadas e direcionar o usuário para o próximo passo correto. Nenhum cabeçalho beta é necessário. Consulte Recusas e fallback para a lista de categorias e Motivos de parada e fallback para orientações de tratamento.

Padrões de effort

O padrão do parâmetro effort (esforço) no Claude Opus 4.8 é high em todas as superfícies, incluindo a API do Claude e o Claude Code. Se você define o effort explicitamente hoje, sua configuração permanece inalterada. Consulte Effort para orientações por nível.

Fast mode

O fast mode (modo rápido) agora está disponível para o Claude Opus 4.8 como prévia de pesquisa na API do Claude. Defina speed: "fast" com o cabeçalho beta fast-mode-2026-02-01 para obter até 2,5x mais tokens de saída por segundo do mesmo modelo com preço premium. Consulte Fast mode para acesso, modelos compatíveis e preços.

Mínimo de cache de prompt reduzido

O comprimento mínimo de prompt cacheável no Claude Opus 4.8 é de 1.024 tokens, reduzido de 2.048 tokens no Claude Opus 4.7. Prompts que eram curtos demais para serem cacheados no Claude Opus 4.7 agora podem criar entradas de cache sem alterações de código. Consulte Cache de prompt para os mínimos por modelo.

Restrições de API herdadas do Claude Opus 4.7



Essas restrições permanecem inalteradas em relação ao Claude Opus 4.7, portanto, código que já roda no Claude Opus 4.7 não precisa de alterações. Elas se aplicam apenas à Messages API. Os Claude Managed Agents não são afetados.

Parâmetros de amostragem não suportados

Definir temperature, top_p ou top_k com um valor não padrão retorna um erro 400 no Claude Opus 4.8, assim como no Claude Opus 4.7. Omita esses parâmetros e use prompting para orientar o comportamento do modelo.

Adaptive thinking é o único modo de pensamento

Assim como o Claude Opus 4.7, o Claude Opus 4.8 não oferece suporte a orçamentos de pensamento estendido. Definir thinking: {type: "enabled", budget_tokens: N} retorna um erro 400.

O diff a seguir atualiza uma requisição escrita para o Claude Opus 4.6 ou anterior para rodar no Claude Opus 4.8. As linhas removidas (-) definem o ID do modelo antigo e o orçamento manual de pensamento que o Claude Opus 4.8 rejeita. As linhas adicionadas (+) definem o novo ID do modelo, mudam para adaptive thinking e controlam a profundidade do pensamento com o parâmetro effort, passado no campo de nível superior output_config. O modelo determina quando e quanto pensar em cada turno. Se você remover o campo thinking completamente, as requisições são executadas sem pensamento:

 import anthropic

 client = anthropic.Anthropic()

 response = client.messages.create(
-    model="claude-opus-4-6",
+    model="claude-opus-4-8",
     max_tokens=16000,
-    thinking={"type": "enabled", "budget_tokens": 10000},
+    thinking={"type": "adaptive"},
+    output_config={"effort": "high"},
     messages=[
         {
             "role": "user",
             "content": "Explain why the sum of two even numbers is always even.",
         }
     ],
 )

Melhorias de capacidade

Áreas de melhoria

Em comparação com o Claude Opus 4.7, o Claude Opus 4.8 visa melhorias comportamentais em:

  • Codificação agêntica de longo horizonte, incluindo melhor tratamento de contexto longo, menos compactações e melhor recuperação de compactação.
  • Calibração do esforço de raciocínio, com comportamento mais confiável em cada nível de effort em uma variedade de domínios.
  • Acionamento de ferramentas, com menos casos de pular uma chamada de ferramenta que a tarefa exigia.

Adaptive thinking

Com o adaptive thinking habilitado, o Claude Opus 4.8 aciona o raciocínio apenas quando determina que o turno precisa dele. Em consultas simples e etapas agênticas curtas, ele responde diretamente. Em problemas complexos de múltiplas etapas, ele raciocina antes de responder. Isso reduz tokens de pensamento desperdiçados em cargas de trabalho bimodais em comparação com o Claude Opus 4.7 no mesmo nível de effort. Assim como no Claude Opus 4.7, o pensamento fica desativado a menos que você defina explicitamente thinking: {type: "adaptive"} na sua requisição.

Mudanças de comportamento

Estas não são mudanças que quebram a API, mas podem exigir atualizações de prompt. Consulte Migrando para o Claude Opus 4.8 para orientações completas.

  • Menos tokens de pensamento desperdiçados no mesmo nível de effort quando o adaptive thinking está habilitado, porque o modelo determina por turno se deve pensar.
  • Melhor acionamento de ferramentas. O modelo tem menos probabilidade de pular uma chamada de ferramenta que a tarefa exigia, um problema que alguns usuários relataram no Claude Opus 4.7.
  • Melhor tratamento de compactação e qualidade de contexto longo. Traces agênticos longos permanecem na tarefa com menos desvios após a compactação.
  • Níveis de effort recalibrados. A alocação de tokens por trás de cada nível de effort muda em comparação com o Claude Opus 4.7: medium permite um pouco mais de pensamento, high um pouco menos, e xhigh substancialmente mais. Se você ajustou um nível de effort com base no Claude Opus 4.7, refaça a linha de base de custo e latência nesse nível antes de ajustá-lo.

Guia de migração

Para instruções de migração passo a passo e a lista de verificação completa de migração, consulte Migrando para o Claude Opus 4.8. Se você está atualizando do Claude Opus 4.6 ou anterior, aplique também as etapas de migração do Claude Opus 4.7. Essas etapas cobrem mudanças incompatíveis que a atualização para o Claude Opus 4.8 sozinha não cobre. Se você usa o Claude Code ou o Agent SDK, a skill da API do Claude pode aplicar essas etapas de migração à sua base de código automaticamente.

Próximos passos


Guia de migração

Guia para migrar para os modelos Claude mais recentes a partir de versões anteriores do Claude.

Effort

Controle quantos tokens o Claude usa ao responder com o parâmetro effort, equilibrando entre completude da resposta e eficiência de tokens.

Adaptive thinking

Deixe o Claude determinar dinamicamente quando e quanto usar o pensamento estendido com o modo de pensamento adaptativo.

Cache de prompt

Como mensagens de sistema no meio da conversa preservam acertos de cache.


Motivos de parada e fallback

Saiba o que cada valor de stop_reason significa e como lidar com truncamento, uso de ferramentas, turnos pausados e recusas na sua aplicação.


Fast mode (prévia de pesquisa)

Obtenha até 2,5x mais tokens de saída por segundo dos modelos Claude Opus.

Was this page helpful?

  • Novo modelo
  • Novos recursos
  • Mensagens de sistema no meio da conversa
  • Detalhes de parada em recusas
  • Padrões de effort
  • Fast mode
  • Mínimo de cache de prompt reduzido
  • Restrições de API herdadas do Claude Opus 4.7
  • Parâmetros de amostragem não suportados
  • Adaptive thinking é o único modo de pensamento
  • Melhorias de capacidade
  • Áreas de melhoria
  • Adaptive thinking
  • Mudanças de comportamento
  • Guia de migração
  • Próximos passos