Was this page helpful?
Claude Opus 4.7 é nosso modelo mais capaz disponível em geral até o momento. É altamente autônomo e tem desempenho excepcional em trabalho agentic de longo horizonte, trabalho de conhecimento, tarefas de visão e tarefas de memória. Esta página resume tudo que é novo no lançamento.
| Modelo | ID do modelo da API | Descrição |
|---|---|---|
| Claude Opus 4.7 | claude-opus-4-7 | Nosso modelo mais capaz disponível em geral para raciocínio complexo e codificação agentic |
Claude Opus 4.7 suporta a janela de contexto de 1M tokens, 128k tokens de saída máxima, pensamento adaptativo, e o mesmo conjunto de ferramentas e recursos de plataforma que Claude Opus 4.6.
Para preços e especificações completos, consulte a visão geral dos modelos.
Claude Opus 4.7 é nosso primeiro modelo Claude com suporte a imagens de alta resolução. A resolução máxima de imagem aumentou para 2576px / 3.75MP (aumentado de nosso limite anterior de 1568px / 1.15MP). Esta mudança deve desbloquear ganhos de desempenho em cargas de trabalho com muita visão, e é particularmente importante para uso de computador e fluxos de trabalho de compreensão de screenshot/artefato/documento.
Além disso, operações como mapeamento de coordenadas para imagens agora são mais simples — as coordenadas do modelo são 1
com pixels reais, portanto não há matemática de fator de escala necessária.Imagens de alta resolução usam mais tokens. Se a fidelidade de imagem adicional for desnecessária, reduza a amostragem de imagens antes de enviar para Claude para evitar aumentos no uso de tokens.
Além da resolução, Claude Opus 4.7 também melhora em:
Consulte Imagens e visão para detalhes.
xhighO parâmetro de esforço permite que você ajuste a inteligência do Claude versus gasto de tokens, negociando capacidade por velocidade mais rápida e custos mais baixos. Comece com o novo nível de esforço xhigh para casos de uso de codificação e agentic, e use um mínimo de esforço high para a maioria dos casos de uso sensíveis à inteligência. Consulte Níveis de esforço recomendados para Claude Opus 4.7 para orientação por nível. (Apenas API de Mensagens; Claude Managed Agents lida com esforço automaticamente.)
Claude Opus 4.7 introduz orçamentos de tarefa. Um orçamento de tarefa dá ao Claude uma estimativa aproximada de quantos tokens devem ser direcionados para um loop agentic completo, incluindo pensamento, chamadas de ferramentas, resultados de ferramentas e saída final. O modelo vê uma contagem regressiva em execução e a usa para priorizar o trabalho e terminar a tarefa graciosamente conforme o orçamento é consumido. Para usar, defina o cabeçalho beta task-budgets-2026-03-13 e adicione o seguinte à sua configuração de saída:
response = client.beta.messages.create(
model="claude-opus-4-7",
max_tokens=128000,
output_config={
"effort": "high",
"task_budget": {"type": "tokens", "total": 128000},
},
messages=[
{"role": "user", "content": "Review the codebase and propose a refactor plan."}
],
betas=["task-budgets-2026-03-13"],
)Você pode precisar experimentar com diferentes orçamentos de tarefa para seu caso de uso. Se o modelo receber um orçamento de tarefa muito restritivo para uma determinada tarefa, ele pode completar a tarefa menos completamente ou recusar fazer a tarefa inteiramente.
Para tarefas agentic abertas onde a qualidade importa mais do que a velocidade, não defina um orçamento de tarefa; reserve orçamentos de tarefa para cargas de trabalho onde você precisa que o modelo escope seu trabalho para uma permissão de token. O valor mínimo para um orçamento de tarefa é 20k tokens.
Isto não é um limite rígido; é uma sugestão que o modelo está ciente. Isto é distinto de max_tokens, que é um limite rígido por solicitação em tokens gerados (max_tokens não é passado para o modelo, e o modelo não está ciente disso), enquanto task_budget é um limite consultivo em todo o loop agentic. Use task_budget quando você quiser que o modelo se auto-modere, e max_tokens como um teto rígido por solicitação para limitar o uso.
Estas mudanças significativas se aplicam apenas à API de Mensagens. Se você usar Claude Managed Agents, não há mudanças de API significativas para Claude Opus 4.7.
Os orçamentos de pensamento estendido são removidos no Claude Opus 4.7. Definir thinking: {"type": "enabled", "budget_tokens": N} retornará um erro 400. Pensamento adaptativo é o único modo de pensamento ativado, e em nossas avaliações internas ele supera consistentemente o pensamento estendido.
# Antes (Opus 4.6)
thinking = {"type": "enabled", "budget_tokens": 32000}
# Depois (Opus 4.7)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}O pensamento adaptativo está desativado por padrão no Claude Opus 4.7. Solicitações sem campo thinking são executadas sem pensamento. Defina thinking: {type: "adaptive"} explicitamente para ativá-lo.
A partir do Claude Opus 4.7, definir temperature, top_p ou top_k para qualquer valor não padrão retornará um erro 400. O caminho de migração mais seguro é omitir esses parâmetros inteiramente das solicitações e usar prompting para guiar o comportamento do modelo. Se você estava usando temperature = 0 para determinismo, observe que nunca garantiu saídas idênticas.
A partir do Claude Opus 4.7, o conteúdo de pensamento é omitido da resposta por padrão. Os blocos de pensamento ainda aparecem no fluxo de resposta, mas seu campo thinking estará vazio a menos que o chamador opte explicitamente. Esta é uma mudança silenciosa — nenhum erro é levantado — e a latência de resposta será ligeiramente melhorada. Se saídas de raciocínio forem necessárias, você pode definir display para "summarized" e optar novamente com uma mudança de uma linha:
thinking = {
"type": "adaptive",
"display": "summarized", # ou "omitted" (padrão)
}Se seu produto transmite raciocínio para usuários, o novo padrão aparecerá como uma longa pausa antes do início da saída. Defina "display": "summarized" para restaurar o progresso visível durante o pensamento.
Claude Opus 4.7 usa um novo tokenizador, contribuindo para seu desempenho melhorado em uma ampla gama de tarefas. Este novo tokenizador pode usar aproximadamente 1x a 1.35x mais tokens ao processar texto em comparação com modelos anteriores (até ~35% mais, variando por conteúdo), e /v1/messages/count_tokens retornará um número diferente de tokens para Claude Opus 4.7 do que fez para Claude Opus 4.6. A eficiência de token do Claude Opus 4.7 pode variar por forma de carga de trabalho. Intervenções de prompting, task_budget e effort podem ajudar a controlar custos e garantir uso apropriado de tokens. Tenha em mente que esses controles podem negociar inteligência do modelo.
Sugerimos atualizar seus parâmetros max_tokens para dar espaço adicional, incluindo gatilhos de compactação. Claude Opus 4.7 fornece uma janela de contexto de 1M com preços padrão da API sem prêmio de contexto longo.
Claude Opus 4.7 mostra ganhos significativos em tarefas de trabalho de conhecimento, particularmente onde o modelo precisa verificar visualmente suas próprias saídas:
Se prompts existentes tiverem mitigações nessas áreas (por exemplo, "verifique o layout do slide antes de retornar"), tente remover esse andaime e fazer uma nova linha de base.
Claude Opus 4.7 é melhor em escrever e usar memória baseada em sistema de arquivos. Se um agente mantém um bloco de rascunho, arquivo de notas ou armazenamento de memória estruturada entre turnos, esse agente deve melhorar em anotar notas para si mesmo e aproveitar suas notas em tarefas futuras. Para dar ao Claude um bloco de rascunho gerenciado sem construir o seu próprio, use a ferramenta de memória do lado do cliente.
Consulte Suporte a imagens de alta resolução acima.
Estas não são mudanças de API significativas, mas podem exigir atualizações de prompt. Consulte Migrando para Claude Opus 4.7 para orientação completa.
Para instruções de migração passo a passo e a lista de verificação de migração completa, consulte Migrando para Claude Opus 4.7. Se você usar Claude Code ou o Agent SDK, a habilidade da API Claude pode aplicar essas etapas de migração à sua base de código automaticamente.
Orientação de esforço por nível para Claude Opus 4.7.