Claude Platform Docs
  • Messages
  • Managed Agents
  • Admin

Search...
⌘K
Primeiros passos
Introdução ao ClaudeInício rápido
Desenvolvendo com Claude
Visão geral dos recursosUsando a Messages APIMotivos de parada e fallbackRecusas e fallbackCrédito de fallback
Capacidades do modelo
Pensamento estendidoPensamento adaptativoEsforçoOrçamentos de tarefas (beta)Modo rápido (prévia de pesquisa)Saídas estruturadasCitaçõesStreaming de mensagensProcessamento em loteResultados de pesquisaStreaming de recusasSuporte multilíngueEmbeddings
Ferramentas
Visão geralComo funciona o uso de ferramentasTutorial: Crie um agente que usa ferramentasDefinir ferramentasLidar com chamadas de ferramentasUso de ferramentas em paraleloTool Runner (SDK)Uso de ferramentas estritoFerramentas de servidorFerramenta de pesquisa na webFerramenta de busca na webFerramenta de execução de códigoFerramenta de consultorFerramenta de busca de ferramentasFerramenta de memóriaFerramenta BashFerramenta de editor de textoFerramenta de uso de computadorSolução de problemas
Infraestrutura de ferramentas
Referência de ferramentasGerenciar contexto de ferramentasCombinações de ferramentasUso de ferramentas com cache de promptChamada programática de ferramentasStreaming granular de ferramentas
Gerenciamento de contexto
Janelas de contextoCompactaçãoEdição de contextoCache de promptMensagens de sistema no meio da conversaCriar um modo de orquestraçãoDiagnóstico de cache (beta)Contagem de tokens
Trabalhando com arquivos
Files APISuporte a PDF
Skills
Visão geralInício rápidoPráticas recomendadasSkills para empresasSkills na API
MCP
Servidores MCP remotosConector MCP
Claude em plataformas de nuvem
Amazon BedrockAmazon Bedrock (legado)Claude Platform na AWSGoogle CloudMicrosoft Foundry

Log in
Esforço
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claude Platform Docs

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Claude on Google Cloud

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Messages/Capacidades do modelo

Effort

Controle quantos tokens o Claude usa ao responder com o parâmetro effort, equilibrando a profundidade da resposta e a eficiência de tokens.


Este recurso é elegível para Zero Data Retention (ZDR). Quando sua organização possui um acordo de ZDR, os dados enviados por meio deste recurso não são armazenados após a resposta da API ser retornada.

O parâmetro effort permite controlar o quanto o Claude está disposto a gastar tokens ao responder a solicitações. Você pode equilibrar a profundidade da resposta e a eficiência de tokens com um único modelo. O parâmetro effort está disponível em todos os modelos suportados, sem necessidade de cabeçalho beta.



O parâmetro effort é suportado por Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5, Claude Sonnet 4.6 e Claude Opus 4.5.



Para Claude Opus 4.6 e Sonnet 4.6, effort substitui budget_tokens como a forma recomendada de controlar a profundidade do pensamento. Combine effort com adaptive thinking (pensamento adaptativo) (thinking: {type: "adaptive"}) para obter a melhor experiência. Embora budget_tokens ainda seja aceito no Opus 4.6 e Sonnet 4.6, ele está obsoleto e será removido em uma versão futura do modelo. Nos níveis de effort high (padrão) e max, o Claude quase sempre pensará. Em níveis de effort mais baixos, ele pode pular o pensamento para problemas mais simples.

Como o effort funciona

Por padrão, o Claude usa effort alto, gastando quantos tokens forem necessários para obter resultados excelentes. Você pode aumentar o nível de effort para max para obter a capacidade máxima absoluta, ou reduzi-lo para ser mais conservador com o uso de tokens, otimizando para velocidade e custo enquanto aceita alguma redução na capacidade.



Definir effort como "high" produz exatamente o mesmo comportamento que omitir o parâmetro effort completamente.

O parâmetro effort afeta todos os tokens na resposta, incluindo:

  • Respostas de texto e explicações
  • Chamadas de ferramentas e argumentos de funções
  • Pensamento estendido (quando habilitado)

Essa abordagem tem duas vantagens principais:

  1. Não requer que o pensamento esteja habilitado.
  2. Pode afetar todo o gasto de tokens, incluindo chamadas de ferramentas. Por exemplo, um effort mais baixo significaria que o Claude faz menos chamadas de ferramentas. Isso oferece um grau muito maior de controle sobre a eficiência.

Níveis de effort

NívelDescriçãoCaso de uso típico
maxCapacidade máxima absoluta sem restrições no gasto de tokens. Disponível em Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5 e Claude Sonnet 4.6.Tarefas que exigem o raciocínio mais profundo possível e a análise mais completa
xhighCapacidade estendida para trabalho de longo horizonte. Disponível em Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Opus 4.7 e Claude Sonnet 5.Tarefas agênticas e de codificação de longa duração (mais de 30 minutos) com orçamentos de tokens na casa dos milhões
highAlta capacidade. Equivalente a não definir o parâmetro.Raciocínio complexo, problemas difíceis de codificação, tarefas agênticas
mediumAbordagem equilibrada com economia moderada de tokens.Tarefas agênticas que exigem equilíbrio entre velocidade, custo e desempenho
lowMais eficiente. Economia significativa de tokens com alguma redução de capacidade.Tarefas mais simples que precisam da melhor velocidade e dos menores custos, como subagentes


Effort é um sinal comportamental, não um orçamento estrito de tokens. Em níveis de effort mais baixos, o Claude ainda pensará em problemas suficientemente difíceis, mas pensará menos do que pensaria em níveis de effort mais altos para o mesmo problema.

Níveis de effort recomendados para Claude Sonnet 5

O Claude Sonnet 5 usa effort high por padrão.

  • Effort high (padrão): Adequado para raciocínio complexo, codificação e tarefas agênticas em que a qualidade importa mais do que velocidade ou custo.
  • Effort xhigh: Para as tarefas de codificação e agênticas mais difíceis. Consulte Prompting Claude Sonnet 5.
  • Effort medium: Redução de custo em relação ao padrão. Comparável ao Claude Sonnet 4.6 com effort high.
  • Effort low: Para cargas de trabalho de alto volume ou sensíveis à latência. Adequado para chat e casos de uso que não envolvem codificação, em que um retorno mais rápido é priorizado.
  • Effort max: Para tarefas que exigem a capacidade máxima absoluta sem restrições no gasto de tokens.

Níveis de effort recomendados para Sonnet 4.6

O Sonnet 4.6 usa effort high por padrão. Defina o effort explicitamente ao usar o Sonnet 4.6 para evitar latência inesperada:

  • Effort medium (padrão recomendado): Melhor equilíbrio entre velocidade, custo e desempenho para a maioria das aplicações. Adequado para codificação agêntica, fluxos de trabalho com uso intensivo de ferramentas e geração de código.
  • Effort low: Para cargas de trabalho de alto volume ou sensíveis à latência. Adequado para chat e casos de uso que não envolvem codificação, em que um retorno mais rápido é priorizado.
  • Effort high: Para raciocínio complexo e tarefas em que a qualidade importa mais do que velocidade ou custo.
  • Effort max: Para tarefas que exigem a capacidade máxima absoluta sem restrições no gasto de tokens.

Níveis de effort recomendados para Claude Opus 4.7

Comece com xhigh para casos de uso de codificação e agênticos, e use high como mínimo para a maioria das cargas de trabalho sensíveis à inteligência. Reduza para medium em cargas de trabalho sensíveis a custo, ou aumente para max apenas quando suas avaliações mostrarem margem mensurável de melhoria em xhigh.

O padrão da API é high. Para usar xhigh, defina effort explicitamente; o valor que você passa substitui o padrão.

EffortOrientação para Claude Opus 4.7
lowEficiente, mas melhor para tarefas curtas e bem delimitadas. Combine low com checklists explícitas se sua tarefa tiver várias seções.
mediumA opção direta para o fluxo de trabalho médio em que você quer bons resultados enquanto reduz custos.
highCasos de uso avançados que ainda precisam de equilíbrio entre inteligência e consumo de tokens. Este é frequentemente o ponto ideal que equilibra qualidade e eficiência de tokens.
xhighO ponto de partida recomendado para trabalho de codificação e agêntico, e para tarefas exploratórias como chamadas repetidas de ferramentas, busca detalhada na web e busca em bases de conhecimento. Espere um uso de tokens significativamente maior do que em high.
maxReserve para problemas genuinamente de fronteira. Na maioria das cargas de trabalho, max adiciona custo significativo para ganhos de qualidade relativamente pequenos, e em algumas tarefas de saída estruturada ou menos sensíveis à inteligência pode levar a pensamento excessivo.

O Claude Opus 4.7 também respeita os níveis de effort de forma mais estrita do que o Claude Opus 4.6, especialmente em low e medium. Em níveis de effort mais baixos, o modelo limita seu trabalho ao que foi solicitado, em vez de ir além. Se você observar raciocínio superficial em problemas complexos com o Claude Opus 4.7, aumente o effort em vez de contornar isso via prompt. Se precisar manter o effort baixo por causa da latência, adicione orientação direcionada como "Esta tarefa envolve raciocínio em várias etapas. Pense cuidadosamente antes de responder."

Ao executar o Claude Opus 4.7 com effort xhigh ou max, defina um max_tokens grande para que o modelo tenha espaço para pensar e agir entre subagentes e chamadas de ferramentas. Começar com 64k tokens e ajustar a partir daí é um padrão razoável.

Níveis de effort recomendados para Claude Opus 4.8

A orientação para Claude Opus 4.7 também se aplica ao Claude Opus 4.8. Comece com xhigh para casos de uso de codificação e agênticos, use high para a maioria das outras cargas de trabalho sensíveis à inteligência, e reduza para medium ou low apenas quando tiver medido que o nível mais baixo mantém a qualidade nas suas avaliações.

O padrão da API é high. Defina effort explicitamente para usar um nível diferente; o valor que você passa substitui o padrão.

Ao executar o Claude Opus 4.8 com effort xhigh ou max, defina um max_tokens grande para que o modelo tenha espaço para pensar e agir entre subagentes e chamadas de ferramentas. Começar com 64k tokens e ajustar a partir daí é um padrão razoável.

Níveis de effort recomendados para Claude Fable 5

Effort é o controle principal para equilibrar inteligência, latência e custo no Claude Fable 5. Comece com high, o padrão, para a maioria das tarefas, use xhigh para as cargas de trabalho mais sensíveis à capacidade, e reduza para medium ou low para trabalho rotineiro. Configurações de effort mais baixas no Claude Fable 5 ainda têm bom desempenho e frequentemente superam o desempenho de xhigh em modelos anteriores. Em high e xhigh, defina um max_tokens grande: ele é um limite rígido na saída total, pensamento mais texto de resposta. Consulte Controle de custos.

Reduza o effort se uma tarefa for concluída mas demorar mais do que o necessário, ou se você quiser um estilo de trabalho mais rápido e interativo. As mesmas recomendações se aplicam ao Claude Mythos 5. Para orientação mais completa, consulte Prompting Claude Fable 5.

Uso básico

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures",
        }
    ],
    output_config={"effort": "medium"},
)

print(response.content[0].text)

Quando ajustar o parâmetro effort

  • Use effort max quando precisar da capacidade máxima absoluta sem restrições: o raciocínio mais completo e a análise mais profunda. Disponível em Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5 e Claude Sonnet 4.6.
  • Use effort xhigh para codificação avançada e trabalho agêntico complexo que exige exploração estendida, como chamadas repetidas de ferramentas e busca detalhada. Disponível em Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Opus 4.7 e Claude Sonnet 5.
  • Use effort high (o padrão) para raciocínio complexo, análise com nuances, problemas difíceis de codificação ou qualquer tarefa em que a qualidade importa mais do que velocidade ou custo.
  • Use effort medium como uma opção equilibrada quando quiser desempenho sólido sem o gasto total de tokens do effort high.
  • Use effort low quando estiver otimizando para velocidade (porque o Claude responde com menos tokens) ou custo. Por exemplo, tarefas simples de classificação, consultas rápidas ou casos de uso de alto volume em que melhorias marginais de qualidade não justificam latência ou gasto adicional.


Modo ultracode do Claude Code: ultracode aparece no menu de effort do Claude Code, mas não é um nível adicional de effort da API. Os valores documentados nesta página são o conjunto completo que a API aceita. Ultracode combina o nível de effort xhigh com permissão permanente para o Claude Code iniciar fluxos de trabalho multiagente, concedida por meio de Mensagens de sistema no meio da conversa. Para construir um comportamento semelhante com a API, consulte Construir um modo de orquestração.

Effort com uso de ferramentas

Ao usar ferramentas, o parâmetro effort afeta tanto as explicações em torno das chamadas de ferramentas quanto as próprias chamadas de ferramentas. Níveis de effort mais baixos tendem a:

  • Combinar várias operações em menos chamadas de ferramentas
  • Fazer menos chamadas de ferramentas
  • Prosseguir diretamente para a ação sem preâmbulo
  • Usar mensagens de confirmação concisas após a conclusão

Níveis de effort mais altos podem:

  • Fazer mais chamadas de ferramentas
  • Explicar o plano antes de agir
  • Fornecer resumos detalhados das alterações
  • Incluir comentários de código mais abrangentes

Effort com pensamento estendido

O parâmetro effort funciona em conjunto com o "extended thinking" (pensamento estendido). Seu comportamento depende do modelo:

  • Claude Fable 5 e Claude Mythos 5 usam adaptive thinking (pensamento adaptativo), que está sempre ativado (nenhuma configuração de thinking é necessária). thinking: {type: "disabled"} é rejeitado. Effort controla a profundidade do pensamento da mesma forma que no Opus 4.8 e Opus 4.7.
  • Claude Opus 4.8 usa adaptive thinking (thinking: {type: "adaptive"}), em que effort é o controle recomendado para a profundidade do pensamento. O pensamento estendido manual (thinking: {type: "enabled", budget_tokens: N}) não é suportado e retorna um erro 400. O modelo decide quando e quanto pensar com base em cada solicitação, então aciona o pensamento apenas quando necessário. Nos níveis de effort high, xhigh e max, o Claude quase sempre pensa profundamente. Em níveis mais baixos, ele pode pular o pensamento para problemas mais simples. Defina thinking: {type: "adaptive"} para habilitar o pensamento; sem isso, as solicitações são executadas sem pensamento.
  • Claude Mythos Preview usa adaptive thinking por padrão (nenhuma configuração de thinking é necessária). thinking: {type: "disabled"} é rejeitado. Effort controla a profundidade do pensamento da mesma forma que no Opus 4.7 e Opus 4.6.
  • Claude Opus 4.7 usa adaptive thinking (thinking: {type: "adaptive"}), em que effort é o controle recomendado para a profundidade do pensamento. O pensamento estendido manual (thinking: {type: "enabled", budget_tokens: N}) não é mais suportado no Opus 4.7; use adaptive thinking com effort em vez disso. Nos níveis de effort high, xhigh e max, o Claude quase sempre pensa profundamente. Em níveis mais baixos, ele pode pular o pensamento para problemas mais simples.
  • Claude Opus 4.6 usa adaptive thinking (thinking: {type: "adaptive"}), em que effort é o controle recomendado para a profundidade do pensamento. Embora budget_tokens ainda seja aceito no Opus 4.6, ele está obsoleto e será removido em uma versão futura. Nos níveis de effort high e max, o Claude quase sempre pensa profundamente. Em níveis mais baixos, ele pode pular o pensamento para problemas mais simples.
  • Claude Sonnet 5 usa adaptive thinking, que está ativado por padrão (nenhuma configuração de thinking é necessária), e effort é o controle recomendado para a profundidade do pensamento. O pensamento estendido manual (thinking: {type: "enabled", budget_tokens: N}) não é suportado e retorna um erro 400. Passe thinking: {type: "disabled"} para desativar o pensamento. Nos níveis de effort high (padrão), xhigh e max, o Claude quase sempre pensa profundamente. Em níveis mais baixos, ele pode pular o pensamento para problemas mais simples.
  • Claude Sonnet 4.6 usa adaptive thinking (em que effort controla a profundidade do pensamento). O pensamento manual com modo intercalado (thinking: {type: "enabled", budget_tokens: N}) ainda é funcional, mas está obsoleto.
  • Claude Opus 4.5 usa pensamento manual (thinking: {type: "enabled", budget_tokens: N}), em que effort funciona em conjunto com o orçamento de tokens de pensamento. Defina o nível de effort para sua tarefa e, em seguida, defina o orçamento de tokens de pensamento com base na complexidade da tarefa.

O parâmetro effort pode ser usado com ou sem o pensamento estendido habilitado. Quando usado sem pensamento, ele ainda controla o gasto geral de tokens para respostas de texto e chamadas de ferramentas.

Melhores práticas

  1. Defina o effort explicitamente: A API usa high por padrão, mas o ponto de partida correto depende do seu modelo e da sua carga de trabalho.
  2. Use low para tarefas sensíveis à velocidade ou simples: Quando a latência importa ou as tarefas são diretas, o effort low pode reduzir significativamente os tempos de resposta e os custos.
  3. Teste seu caso de uso: O impacto dos níveis de effort varia por tipo de tarefa. Avalie o desempenho nos seus casos de uso específicos antes de implantar.
  4. Considere effort dinâmico: Ajuste o effort com base na complexidade da tarefa. Consultas simples podem justificar effort low, enquanto codificação agêntica e raciocínio complexo se beneficiam de effort high.

Próximos passos

Orçamentos de tarefa

Dê ao Claude um orçamento consultivo de tokens para o loop agêntico completo, ajudando o modelo a se autorregular em tarefas agênticas longas.

Adaptive thinking

Deixe o Claude determinar dinamicamente quando e quanto usar o pensamento estendido com o modo de pensamento adaptativo.


Construindo com pensamento estendido

Dê ao Claude raciocínio aprimorado para tarefas complexas com orçamentos manuais de pensamento, uso de ferramentas e cache de prompt.

Was this page helpful?

  • Como o effort funciona
  • Níveis de effort
  • Níveis de effort recomendados para Claude Sonnet 5
  • Níveis de effort recomendados para Sonnet 4.6
  • Níveis de effort recomendados para Claude Opus 4.7
  • Níveis de effort recomendados para Claude Opus 4.8
  • Níveis de effort recomendados para Claude Fable 5
  • Uso básico
  • Quando ajustar o parâmetro effort
  • Effort com uso de ferramentas
  • Effort com pensamento estendido
  • Melhores práticas
  • Próximos passos