• Mensagens
  • Agentes Gerenciados
  • Administração
Search...
⌘K
Modelos
Visão geral dos modelosIDs e versionamento de modelosEscolhendo um modeloApresentando o Claude Fable 5 e o Claude Mythos 5Novidades no Claude Opus 4.8Atualizar entre versões de modeloDescontinuações de modelosFichas de modeloPrompts do sistemaPreços
Log in
Novidades no Claude Opus 4.8
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Modelos e preços/Modelos

Novidades no Claude Opus 4.8

Visão geral dos novos recursos e mudanças de comportamento no Claude Opus 4.8.

Claude Opus 4.8 é o modelo mais capaz da Anthropic na categoria Opus. Ele é construído sobre o Claude Opus 4.7. Esta página resume todas as novidades no lançamento, incluindo o "fast mode" (modo rápido, em prévia de pesquisa na Claude API) e um comprimento mínimo de prompt cacheável reduzido para 1.024 tokens.

Novo modelo

ModeloID do modelo na APIDescrição
Claude Opus 4.8claude-opus-4-8O modelo mais capaz da Anthropic na categoria Opus para raciocínio complexo, codificação agêntica de longo horizonte e trabalho de alta autonomia

Claude Opus 4.8 oferece suporte à janela de contexto de 1M de tokens por padrão na Claude API, Amazon Bedrock e Vertex AI (200k no Microsoft Foundry), 128k tokens máximos de saída, adaptive thinking (pensamento adaptativo) e o mesmo conjunto de ferramentas e recursos de plataforma que o Claude Opus 4.7.

Para preços e especificações completas, consulte a visão geral dos modelos.

Novos recursos

Mensagens de sistema no meio da conversa

Claude Opus 4.8 aceita mensagens com role: "system" imediatamente após um turno do usuário no array messages (sujeito às regras de posicionamento). Isso permite que você anexe instruções atualizadas mais adiante em uma conversa de longa duração sem repetir o prompt do sistema completo, o que preserva os acertos do cache de prompt nos turnos anteriores e reduz o custo de entrada em loops agênticos. Nenhum cabeçalho beta é necessário. Consulte Mensagens de sistema no meio da conversa para detalhes de uso.

Detalhes de parada por recusa

O objeto stop_details em respostas de recusa (disponível desde o Claude Opus 4.7) agora está documentado publicamente. Quando Claude se recusa a concluir uma solicitação, esse objeto descreve a categoria da recusa, além do stop reason refusal já existente, facilitando para sua aplicação distinguir diferentes classes de solicitações recusadas e direcionar o usuário para o próximo passo correto. Nenhum cabeçalho beta é necessário. Consulte Tratamento de stop reasons para a lista de categorias e orientações de tratamento.

Padrões de effort

O padrão do parâmetro effort (esforço) no Claude Opus 4.8 é high em todas as superfícies, incluindo a Claude API e o Claude Code. Se você define o effort explicitamente hoje, sua configuração permanece inalterada. Consulte Effort para orientações por nível.

Fast mode

O fast mode (modo rápido) agora está disponível para o Claude Opus 4.8 como prévia de pesquisa na Claude API. Defina speed: "fast" para obter até 2,5x mais tokens de saída por segundo do mesmo modelo com preço premium. Consulte Fast mode para acesso, modelos suportados e preços.

Mínimo reduzido para cache de prompt

O comprimento mínimo de prompt cacheável no Claude Opus 4.8 é de 1.024 tokens, menor do que no Claude Opus 4.7. Prompts que eram curtos demais para serem cacheados no Claude Opus 4.7 agora podem criar entradas de cache sem alterações de código. Consulte Cache de prompt para os mínimos por modelo.

Restrições de API herdadas do Claude Opus 4.7

Essas restrições permanecem inalteradas em relação ao Claude Opus 4.7, portanto código que já roda no Claude Opus 4.7 não precisa de alterações. Elas se aplicam apenas à Messages API; Claude Managed Agents não são afetados.

Parâmetros de amostragem não suportados

Definir temperature, top_p ou top_k com um valor não padrão retorna um erro 400 no Claude Opus 4.8, assim como no Claude Opus 4.7. Omita esses parâmetros e use prompting para orientar o comportamento do modelo.

Adaptive thinking é o único modo de pensamento

Assim como o Claude Opus 4.7, o Claude Opus 4.8 não oferece suporte a orçamentos de pensamento estendido. Definir thinking: {"type": "enabled", "budget_tokens": N} retorna um erro 400. Use adaptive thinking e o parâmetro effort para controlar a profundidade do pensamento.

Python
# Antes (Opus 4.6 ou anterior)
thinking = {"type": "enabled", "budget_tokens": 32000}

# Depois (Opus 4.7 e posterior)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}

Melhorias de capacidade

Áreas de melhoria

Em comparação com o Claude Opus 4.7, o Claude Opus 4.8 visa melhorias comportamentais em:

  • Codificação agêntica de longo horizonte, incluindo melhor tratamento de contexto longo, menos compactações e melhor recuperação de compactação.
  • Calibração do esforço de raciocínio, com comportamento mais confiável em cada nível de effort em uma variedade de domínios.
  • Acionamento de ferramentas, com menos casos de pular uma chamada de ferramenta que a tarefa exigia.

Adaptive thinking

Com o adaptive thinking habilitado, o Claude Opus 4.8 aciona o raciocínio apenas quando julga que o turno precisa dele. Em consultas simples e etapas agênticas curtas, ele responde diretamente; em problemas complexos de múltiplas etapas, ele raciocina antes de responder. Isso reduz tokens de pensamento desperdiçados em cargas de trabalho bimodais em comparação com o Claude Opus 4.7 no mesmo nível de effort. Assim como no Claude Opus 4.7, o pensamento fica desativado a menos que você defina explicitamente thinking: {type: "adaptive"} na sua requisição.

Mudanças de comportamento

Estas não são mudanças que quebram a API, mas podem exigir atualizações de prompt. Consulte Migrando para o Claude Opus 4.8 para orientações completas.

  • Menos tokens de pensamento desperdiçados no mesmo nível de effort quando o adaptive thinking está habilitado, porque o modelo decide a cada turno se deve pensar.
  • Melhor acionamento de ferramentas. O modelo tem menos probabilidade de pular uma chamada de ferramenta que a tarefa exigia, um problema que alguns usuários relataram no Claude Opus 4.7.
  • Melhor tratamento de compactação e qualidade de contexto longo. Traces agênticos longos permanecem na tarefa com menos desvios após a compactação.

Guia de migração

Para instruções de migração passo a passo e a lista de verificação completa de migração, consulte Migrando para o Claude Opus 4.8. Se você usa Claude Code ou o Agent SDK, a skill da Claude API pode aplicar essas etapas de migração à sua base de código automaticamente.

Próximos passos

Guia de migração

Instruções de atualização passo a passo a partir do Claude Opus 4.7.

Effort

Orientações de effort por nível, incluindo os novos padrões.

Adaptive thinking

O único modo de pensamento ativado suportado no Claude Opus 4.8.

Cache de prompt

Como mensagens de sistema no meio da conversa preservam acertos de cache.

Tratamento de stop reasons

Detalhes de parada por recusa e como tratá-los.

Fast mode

Maior velocidade de saída com preço premium.

Was this page helpful?

  • Novo modelo
  • Novos recursos
  • Mensagens de sistema no meio da conversa
  • Detalhes de parada por recusa
  • Padrões de effort
  • Fast mode
  • Mínimo reduzido para cache de prompt
  • Restrições de API herdadas do Claude Opus 4.7
  • Parâmetros de amostragem não suportados
  • Adaptive thinking é o único modo de pensamento
  • Melhorias de capacidade
  • Áreas de melhoria
  • Adaptive thinking
  • Mudanças de comportamento
  • Guia de migração
  • Próximos passos