Claude Opus 4.8 é o modelo mais capaz da Anthropic na categoria Opus. Ele é construído sobre o Claude Opus 4.7. Esta página resume todas as novidades no lançamento, incluindo o "fast mode" (modo rápido, em prévia de pesquisa na Claude API) e um comprimento mínimo de prompt cacheável reduzido para 1.024 tokens.
| Modelo | ID do modelo na API | Descrição |
|---|---|---|
| Claude Opus 4.8 | claude-opus-4-8 | O modelo mais capaz da Anthropic na categoria Opus para raciocínio complexo, codificação agêntica de longo horizonte e trabalho de alta autonomia |
Claude Opus 4.8 oferece suporte à janela de contexto de 1M de tokens por padrão na Claude API, Amazon Bedrock e Vertex AI (200k no Microsoft Foundry), 128k tokens máximos de saída, adaptive thinking (pensamento adaptativo) e o mesmo conjunto de ferramentas e recursos de plataforma que o Claude Opus 4.7.
Para preços e especificações completas, consulte a visão geral dos modelos.
Claude Opus 4.8 aceita mensagens com role: "system" imediatamente após um turno do usuário no array messages (sujeito às regras de posicionamento). Isso permite que você anexe instruções atualizadas mais adiante em uma conversa de longa duração sem repetir o prompt do sistema completo, o que preserva os acertos do cache de prompt nos turnos anteriores e reduz o custo de entrada em loops agênticos. Nenhum cabeçalho beta é necessário. Consulte Mensagens de sistema no meio da conversa para detalhes de uso.
O objeto stop_details em respostas de recusa (disponível desde o Claude Opus 4.7) agora está documentado publicamente. Quando Claude se recusa a concluir uma solicitação, esse objeto descreve a categoria da recusa, além do stop reason refusal já existente, facilitando para sua aplicação distinguir diferentes classes de solicitações recusadas e direcionar o usuário para o próximo passo correto. Nenhum cabeçalho beta é necessário. Consulte Tratamento de stop reasons para a lista de categorias e orientações de tratamento.
O padrão do parâmetro effort (esforço) no Claude Opus 4.8 é high em todas as superfícies, incluindo a Claude API e o Claude Code. Se você define o effort explicitamente hoje, sua configuração permanece inalterada. Consulte Effort para orientações por nível.
O fast mode (modo rápido) agora está disponível para o Claude Opus 4.8 como prévia de pesquisa na Claude API. Defina speed: "fast" para obter até 2,5x mais tokens de saída por segundo do mesmo modelo com preço premium. Consulte Fast mode para acesso, modelos suportados e preços.
O comprimento mínimo de prompt cacheável no Claude Opus 4.8 é de 1.024 tokens, menor do que no Claude Opus 4.7. Prompts que eram curtos demais para serem cacheados no Claude Opus 4.7 agora podem criar entradas de cache sem alterações de código. Consulte Cache de prompt para os mínimos por modelo.
Essas restrições permanecem inalteradas em relação ao Claude Opus 4.7, portanto código que já roda no Claude Opus 4.7 não precisa de alterações. Elas se aplicam apenas à Messages API; Claude Managed Agents não são afetados.
Definir temperature, top_p ou top_k com um valor não padrão retorna um erro 400 no Claude Opus 4.8, assim como no Claude Opus 4.7. Omita esses parâmetros e use prompting para orientar o comportamento do modelo.
Assim como o Claude Opus 4.7, o Claude Opus 4.8 não oferece suporte a orçamentos de pensamento estendido. Definir thinking: {"type": "enabled", "budget_tokens": N} retorna um erro 400. Use adaptive thinking e o parâmetro effort para controlar a profundidade do pensamento.
# Antes (Opus 4.6 ou anterior)
thinking = {"type": "enabled", "budget_tokens": 32000}
# Depois (Opus 4.7 e posterior)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}Em comparação com o Claude Opus 4.7, o Claude Opus 4.8 visa melhorias comportamentais em:
Com o adaptive thinking habilitado, o Claude Opus 4.8 aciona o raciocínio apenas quando julga que o turno precisa dele. Em consultas simples e etapas agênticas curtas, ele responde diretamente; em problemas complexos de múltiplas etapas, ele raciocina antes de responder. Isso reduz tokens de pensamento desperdiçados em cargas de trabalho bimodais em comparação com o Claude Opus 4.7 no mesmo nível de effort. Assim como no Claude Opus 4.7, o pensamento fica desativado a menos que você defina explicitamente thinking: {type: "adaptive"} na sua requisição.
Estas não são mudanças que quebram a API, mas podem exigir atualizações de prompt. Consulte Migrando para o Claude Opus 4.8 para orientações completas.
Para instruções de migração passo a passo e a lista de verificação completa de migração, consulte Migrando para o Claude Opus 4.8. Se você usa Claude Code ou o Agent SDK, a skill da Claude API pode aplicar essas etapas de migração à sua base de código automaticamente.
Instruções de atualização passo a passo a partir do Claude Opus 4.7.
Orientações de effort por nível, incluindo os novos padrões.
O único modo de pensamento ativado suportado no Claude Opus 4.8.
Como mensagens de sistema no meio da conversa preservam acertos de cache.
Detalhes de parada por recusa e como tratá-los.
Maior velocidade de saída com preço premium.
Was this page helpful?