O que há de novo no Claude Opus 4.7

Modelos e preçosModelos

O que há de novo no Claude Opus 4.7

Visão geral dos novos recursos, mudanças significativas e alterações de comportamento no Claude Opus 4.7.

Claude Opus 4.7 é nosso modelo mais capaz disponível em geral até o momento. É altamente autônomo e tem desempenho excepcional em trabalho agentic de longo horizonte, trabalho de conhecimento, tarefas de visão e tarefas de memória. Esta página resume tudo que é novo no lançamento.

Novo modelo

Modelo	ID do modelo da API	Descrição
Claude Opus 4.7	`claude-opus-4-7`	Nosso modelo mais capaz disponível em geral para raciocínio complexo e codificação agentic

Claude Opus 4.7 suporta a janela de contexto de 1M tokens, 128k tokens de saída máxima, pensamento adaptativo, e o mesmo conjunto de ferramentas e recursos de plataforma que Claude Opus 4.6.

Para preços e especificações completos, consulte a visão geral dos modelos.

Novos recursos

Suporte a imagens de alta resolução

Claude Opus 4.7 é nosso primeiro modelo Claude com suporte a imagens de alta resolução. A resolução máxima de imagem aumentou para 2576px / 3.75MP (aumentado de nosso limite anterior de 1568px / 1.15MP). Esta mudança deve desbloquear ganhos de desempenho em cargas de trabalho com muita visão, e é particularmente importante para uso de computador e fluxos de trabalho de compreensão de screenshot/artefato/documento.

Além disso, operações como mapeamento de coordenadas para imagens agora são mais simples — as coordenadas do modelo são 1

com pixels reais, portanto não há matemática de fator de escala necessária.

Imagens de alta resolução usam mais tokens. Se a fidelidade de imagem adicional for desnecessária, reduza a amostragem de imagens antes de enviar para Claude para evitar aumentos no uso de tokens.

Além da resolução, Claude Opus 4.7 também melhora em:

Percepção de baixo nível — apontamento, medição, contagem e tarefas semelhantes.
Localização de imagem — localização e detecção de caixa delimitadora de imagem natural são melhoradas.

Consulte Imagens e visão para detalhes.

Novo nível de esforço `xhigh`

O parâmetro de esforço permite que você ajuste a inteligência do Claude versus gasto de tokens, negociando capacidade por velocidade mais rápida e custos mais baixos. Comece com o novo nível de esforço xhigh para casos de uso de codificação e agentic, e use um mínimo de esforço high para a maioria dos casos de uso sensíveis à inteligência. Consulte Níveis de esforço recomendados para Claude Opus 4.7 para orientação por nível. (Apenas API de Mensagens; Claude Managed Agents lida com esforço automaticamente.)

Orçamentos de tarefa (beta)

Claude Opus 4.7 introduz orçamentos de tarefa. Um orçamento de tarefa dá ao Claude uma estimativa aproximada de quantos tokens devem ser direcionados para um loop agentic completo, incluindo pensamento, chamadas de ferramentas, resultados de ferramentas e saída final. O modelo vê uma contagem regressiva em execução e a usa para priorizar o trabalho e terminar a tarefa graciosamente conforme o orçamento é consumido. Para usar, defina o cabeçalho beta task-budgets-2026-03-13 e adicione o seguinte à sua configuração de saída:

Python

response = client.beta.messages.create(
    model="claude-opus-4-7",
    max_tokens=128000,
    output_config={
        "effort": "high",
        "task_budget": {"type": "tokens", "total": 128000},
    },
    messages=[
        {"role": "user", "content": "Review the codebase and propose a refactor plan."}
    ],
    betas=["task-budgets-2026-03-13"],
)

Você pode precisar experimentar com diferentes orçamentos de tarefa para seu caso de uso. Se o modelo receber um orçamento de tarefa muito restritivo para uma determinada tarefa, ele pode completar a tarefa menos completamente ou recusar fazer a tarefa inteiramente.

Para tarefas agentic abertas onde a qualidade importa mais do que a velocidade, não defina um orçamento de tarefa; reserve orçamentos de tarefa para cargas de trabalho onde você precisa que o modelo escope seu trabalho para uma permissão de token. O valor mínimo para um orçamento de tarefa é 20k tokens.

Isto não é um limite rígido; é uma sugestão que o modelo está ciente. Isto é distinto de max_tokens, que é um limite rígido por solicitação em tokens gerados (max_tokens não é passado para o modelo, e o modelo não está ciente disso), enquanto task_budget é um limite consultivo em todo o loop agentic. Use task_budget quando você quiser que o modelo se auto-modere, e max_tokens como um teto rígido por solicitação para limitar o uso.

Mudanças significativas

Estas mudanças significativas se aplicam apenas à API de Mensagens. Se você usar Claude Managed Agents, não há mudanças de API significativas para Claude Opus 4.7.

Orçamentos de pensamento estendido removidos

Os orçamentos de pensamento estendido são removidos no Claude Opus 4.7. Definir thinking: {"type": "enabled", "budget_tokens": N} retornará um erro 400. Pensamento adaptativo é o único modo de pensamento ativado, e em nossas avaliações internas ele supera consistentemente o pensamento estendido.

Python

# Antes (Opus 4.6)
thinking = {"type": "enabled", "budget_tokens": 32000}

# Depois (Opus 4.7)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}

O pensamento adaptativo está desativado por padrão no Claude Opus 4.7. Solicitações sem campo thinking são executadas sem pensamento. Defina thinking: {type: "adaptive"} explicitamente para ativá-lo.

Parâmetros de amostragem removidos

A partir do Claude Opus 4.7, definir temperature, top_p ou top_k para qualquer valor não padrão retornará um erro 400. O caminho de migração mais seguro é omitir esses parâmetros inteiramente das solicitações e usar prompting para guiar o comportamento do modelo. Se você estava usando temperature = 0 para determinismo, observe que nunca garantiu saídas idênticas.

Conteúdo de pensamento omitido por padrão

A partir do Claude Opus 4.7, o conteúdo de pensamento é omitido da resposta por padrão. Os blocos de pensamento ainda aparecem no fluxo de resposta, mas seu campo thinking estará vazio a menos que o chamador opte explicitamente. Esta é uma mudança silenciosa — nenhum erro é levantado — e a latência de resposta será ligeiramente melhorada. Se saídas de raciocínio forem necessárias, você pode definir display para "summarized" e optar novamente com uma mudança de uma linha:

Python

thinking = {
    "type": "adaptive",
    "display": "summarized",  # ou "omitted" (padrão)
}

Se seu produto transmite raciocínio para usuários, o novo padrão aparecerá como uma longa pausa antes do início da saída. Defina "display": "summarized" para restaurar o progresso visível durante o pensamento.

Contagem de tokens atualizada

Claude Opus 4.7 usa um novo tokenizador, contribuindo para seu desempenho melhorado em uma ampla gama de tarefas. Este novo tokenizador pode usar aproximadamente 1x a 1.35x mais tokens ao processar texto em comparação com modelos anteriores (até ~35% mais, variando por conteúdo), e /v1/messages/count_tokens retornará um número diferente de tokens para Claude Opus 4.7 do que fez para Claude Opus 4.6. A eficiência de token do Claude Opus 4.7 pode variar por forma de carga de trabalho. Intervenções de prompting, task_budget e effort podem ajudar a controlar custos e garantir uso apropriado de tokens. Tenha em mente que esses controles podem negociar inteligência do modelo.

Sugerimos atualizar seus parâmetros max_tokens para dar espaço adicional, incluindo gatilhos de compactação. Claude Opus 4.7 fornece uma janela de contexto de 1M com preços padrão da API sem prêmio de contexto longo.

Melhorias de capacidade

Trabalho de conhecimento

Claude Opus 4.7 mostra ganhos significativos em tarefas de trabalho de conhecimento, particularmente onde o modelo precisa verificar visualmente suas próprias saídas:

Redação de .docx e edição de .pptx — melhorado na produção e auto-verificação de alterações rastreadas e layouts de slides.
Análise de gráficos e figuras — melhorado em chamadas de ferramentas programáticas com bibliotecas de processamento de imagem (por exemplo, PIL) para analisar gráficos e figuras, incluindo transcrição de dados em nível de pixel.

Se prompts existentes tiverem mitigações nessas áreas (por exemplo, "verifique o layout do slide antes de retornar"), tente remover esse andaime e fazer uma nova linha de base.

Memória

Claude Opus 4.7 é melhor em escrever e usar memória baseada em sistema de arquivos. Se um agente mantém um bloco de rascunho, arquivo de notas ou armazenamento de memória estruturada entre turnos, esse agente deve melhorar em anotar notas para si mesmo e aproveitar suas notas em tarefas futuras. Para dar ao Claude um bloco de rascunho gerenciado sem construir o seu próprio, use a ferramenta de memória do lado do cliente.

Visão

Consulte Suporte a imagens de alta resolução acima.

Alterações de comportamento

Estas não são mudanças de API significativas, mas podem exigir atualizações de prompt. Consulte Migrando para Claude Opus 4.7 para orientação completa.

Seguimento de instrução mais literal, particularmente em níveis de esforço mais baixos. O modelo não generalizará silenciosamente uma instrução de um item para outro, e não inferirá solicitações que você não fez.
Comprimento de resposta se calibra à complexidade de tarefa percebida em vez de padrão para uma verbosidade fixa.
Menos chamadas de ferramentas por padrão, usando mais raciocínio. Aumentar o esforço aumenta o uso de ferramentas.
Tom mais direto e opinativo com menos fraseado de validação e menos emoji do que o estilo mais caloroso do Claude Opus 4.6.
Mais atualizações de progresso regulares para o usuário ao longo de traços agentic longos. Se você adicionou andaime para forçar mensagens de status interim, tente removê-lo.
Menos subagentos gerados por padrão. Direcionável através de prompting.
Salvaguardas de segurança cibernética em tempo real: solicitações que envolvem tópicos proibidos ou de alto risco podem levar a recusas. Para trabalho de segurança legítimo, solicite ao Programa de Verificação Cibernética.

Guia de migração

Para instruções de migração passo a passo e a lista de verificação de migração completa, consulte Migrando para Claude Opus 4.7. Se você usar Claude Code ou o Agent SDK, a habilidade da API Claude pode aplicar essas etapas de migração à sua base de código automaticamente.

Próximos passos

Orçamentos de tarefa

Dê ao Claude um orçamento de token consultivo em um loop agentic completo.

Pensamento adaptativo

O único modo de pensamento ativado suportado no Claude Opus 4.7.

Was this page helpful?

Modelos e preçosModelos

O que há de novo no Claude Opus 4.7

Visão geral dos novos recursos, mudanças significativas e alterações de comportamento no Claude Opus 4.7.

Novo modelo

Modelo	ID do modelo da API	Descrição
Claude Opus 4.7	`claude-opus-4-7`	Nosso modelo mais capaz disponível em geral para raciocínio complexo e codificação agentic

Claude Opus 4.7 suporta a janela de contexto de 1M tokens, 128k tokens de saída máxima, pensamento adaptativo, e o mesmo conjunto de ferramentas e recursos de plataforma que Claude Opus 4.6.

Para preços e especificações completos, consulte a visão geral dos modelos.

Novos recursos

Suporte a imagens de alta resolução

Além disso, operações como mapeamento de coordenadas para imagens agora são mais simples — as coordenadas do modelo são 1

com pixels reais, portanto não há matemática de fator de escala necessária.

Imagens de alta resolução usam mais tokens. Se a fidelidade de imagem adicional for desnecessária, reduza a amostragem de imagens antes de enviar para Claude para evitar aumentos no uso de tokens.

Além da resolução, Claude Opus 4.7 também melhora em:

Percepção de baixo nível — apontamento, medição, contagem e tarefas semelhantes.
Localização de imagem — localização e detecção de caixa delimitadora de imagem natural são melhoradas.

Consulte Imagens e visão para detalhes.

Novo nível de esforço `xhigh`

Orçamentos de tarefa (beta)

Python

response = client.beta.messages.create(
    model="claude-opus-4-7",
    max_tokens=128000,
    output_config={
        "effort": "high",
        "task_budget": {"type": "tokens", "total": 128000},
    },
    messages=[
        {"role": "user", "content": "Review the codebase and propose a refactor plan."}
    ],
    betas=["task-budgets-2026-03-13"],
)

Mudanças significativas

Estas mudanças significativas se aplicam apenas à API de Mensagens. Se você usar Claude Managed Agents, não há mudanças de API significativas para Claude Opus 4.7.

Orçamentos de pensamento estendido removidos

Python

# Antes (Opus 4.6)
thinking = {"type": "enabled", "budget_tokens": 32000}

# Depois (Opus 4.7)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}

Parâmetros de amostragem removidos

Conteúdo de pensamento omitido por padrão

Python

thinking = {
    "type": "adaptive",
    "display": "summarized",  # ou "omitted" (padrão)
}

Contagem de tokens atualizada

Melhorias de capacidade

Trabalho de conhecimento

Claude Opus 4.7 mostra ganhos significativos em tarefas de trabalho de conhecimento, particularmente onde o modelo precisa verificar visualmente suas próprias saídas:

Redação de .docx e edição de .pptx — melhorado na produção e auto-verificação de alterações rastreadas e layouts de slides.
Análise de gráficos e figuras — melhorado em chamadas de ferramentas programáticas com bibliotecas de processamento de imagem (por exemplo, PIL) para analisar gráficos e figuras, incluindo transcrição de dados em nível de pixel.

Se prompts existentes tiverem mitigações nessas áreas (por exemplo, "verifique o layout do slide antes de retornar"), tente remover esse andaime e fazer uma nova linha de base.

Memória

Visão

Consulte Suporte a imagens de alta resolução acima.

Alterações de comportamento

Estas não são mudanças de API significativas, mas podem exigir atualizações de prompt. Consulte Migrando para Claude Opus 4.7 para orientação completa.

Seguimento de instrução mais literal, particularmente em níveis de esforço mais baixos. O modelo não generalizará silenciosamente uma instrução de um item para outro, e não inferirá solicitações que você não fez.
Comprimento de resposta se calibra à complexidade de tarefa percebida em vez de padrão para uma verbosidade fixa.
Menos chamadas de ferramentas por padrão, usando mais raciocínio. Aumentar o esforço aumenta o uso de ferramentas.
Tom mais direto e opinativo com menos fraseado de validação e menos emoji do que o estilo mais caloroso do Claude Opus 4.6.
Mais atualizações de progresso regulares para o usuário ao longo de traços agentic longos. Se você adicionou andaime para forçar mensagens de status interim, tente removê-lo.
Menos subagentos gerados por padrão. Direcionável através de prompting.
Salvaguardas de segurança cibernética em tempo real: solicitações que envolvem tópicos proibidos ou de alto risco podem levar a recusas. Para trabalho de segurança legítimo, solicite ao Programa de Verificação Cibernética.

Guia de migração

Próximos passos

Orçamentos de tarefa

Dê ao Claude um orçamento de token consultivo em um loop agentic completo.

Pensamento adaptativo

O único modo de pensamento ativado suportado no Claude Opus 4.7.

Was this page helpful?

Novo modelo

Novos recursos

Suporte a imagens de alta resolução

Novo nível de esforço xhigh

Orçamentos de tarefa (beta)

Mudanças significativas

Orçamentos de pensamento estendido removidos

Parâmetros de amostragem removidos

Conteúdo de pensamento omitido por padrão

Contagem de tokens atualizada

Melhorias de capacidade

Trabalho de conhecimento

Memória

Visão

Alterações de comportamento

Guia de migração

Próximos passos

Novo modelo

Novos recursos

Suporte a imagens de alta resolução

Novo nível de esforço xhigh

Orçamentos de tarefa (beta)

Mudanças significativas

Orçamentos de pensamento estendido removidos

Parâmetros de amostragem removidos

Conteúdo de pensamento omitido por padrão

Contagem de tokens atualizada

Melhorias de capacidade

Trabalho de conhecimento

Memória

Visão

Alterações de comportamento

Guia de migração

Próximos passos

Novo nível de esforço `xhigh`

Novo nível de esforço `xhigh`