Este recurso é elegível para Zero Data Retention (ZDR). Quando sua organização possui um acordo de ZDR, os dados enviados por meio deste recurso não são armazenados após a resposta da API ser retornada.
O parâmetro effort permite controlar o quanto o Claude está disposto a gastar tokens ao responder a solicitações. Você pode equilibrar a profundidade da resposta e a eficiência de tokens com um único modelo. O parâmetro effort está disponível em todos os modelos suportados, sem necessidade de cabeçalho beta.
O parâmetro effort é suportado por Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5, Claude Sonnet 4.6 e Claude Opus 4.5.
Para Claude Opus 4.6 e Sonnet 4.6, effort substitui budget_tokens como a forma recomendada de controlar a profundidade do pensamento. Combine effort com adaptive thinking (pensamento adaptativo) (thinking: {type: "adaptive"}) para obter a melhor experiência. Embora budget_tokens ainda seja aceito no Opus 4.6 e Sonnet 4.6, ele está obsoleto e será removido em uma versão futura do modelo. Nos níveis de effort high (padrão) e max, o Claude quase sempre pensará. Em níveis de effort mais baixos, ele pode pular o pensamento para problemas mais simples.
Por padrão, o Claude usa effort alto, gastando quantos tokens forem necessários para obter resultados excelentes. Você pode aumentar o nível de effort para max para obter a capacidade máxima absoluta, ou reduzi-lo para ser mais conservador com o uso de tokens, otimizando para velocidade e custo enquanto aceita alguma redução na capacidade.
Definir effort como "high" produz exatamente o mesmo comportamento que omitir o parâmetro effort completamente.
O parâmetro effort afeta todos os tokens na resposta, incluindo:
Essa abordagem tem duas vantagens principais:
| Nível | Descrição | Caso de uso típico |
|---|---|---|
max | Capacidade máxima absoluta sem restrições no gasto de tokens. Disponível em Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5 e Claude Sonnet 4.6. | Tarefas que exigem o raciocínio mais profundo possível e a análise mais completa |
xhigh | Capacidade estendida para trabalho de longo horizonte. Disponível em Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Opus 4.7 e Claude Sonnet 5. | Tarefas agênticas e de codificação de longa duração (mais de 30 minutos) com orçamentos de tokens na casa dos milhões |
high | Alta capacidade. Equivalente a não definir o parâmetro. | Raciocínio complexo, problemas difíceis de codificação, tarefas agênticas |
medium | Abordagem equilibrada com economia moderada de tokens. | Tarefas agênticas que exigem equilíbrio entre velocidade, custo e desempenho |
low | Mais eficiente. Economia significativa de tokens com alguma redução de capacidade. | Tarefas mais simples que precisam da melhor velocidade e dos menores custos, como subagentes |
Effort é um sinal comportamental, não um orçamento estrito de tokens. Em níveis de effort mais baixos, o Claude ainda pensará em problemas suficientemente difíceis, mas pensará menos do que pensaria em níveis de effort mais altos para o mesmo problema.
O Claude Sonnet 5 usa effort high por padrão.
O Sonnet 4.6 usa effort high por padrão. Defina o effort explicitamente ao usar o Sonnet 4.6 para evitar latência inesperada:
Comece com xhigh para casos de uso de codificação e agênticos, e use high como mínimo para a maioria das cargas de trabalho sensíveis à inteligência. Reduza para medium em cargas de trabalho sensíveis a custo, ou aumente para max apenas quando suas avaliações mostrarem margem mensurável de melhoria em xhigh.
O padrão da API é high. Para usar xhigh, defina effort explicitamente; o valor que você passa substitui o padrão.
| Effort | Orientação para Claude Opus 4.7 |
|---|---|
low | Eficiente, mas melhor para tarefas curtas e bem delimitadas. Combine low com checklists explícitas se sua tarefa tiver várias seções. |
medium | A opção direta para o fluxo de trabalho médio em que você quer bons resultados enquanto reduz custos. |
high | Casos de uso avançados que ainda precisam de equilíbrio entre inteligência e consumo de tokens. Este é frequentemente o ponto ideal que equilibra qualidade e eficiência de tokens. |
xhigh | O ponto de partida recomendado para trabalho de codificação e agêntico, e para tarefas exploratórias como chamadas repetidas de ferramentas, busca detalhada na web e busca em bases de conhecimento. Espere um uso de tokens significativamente maior do que em high. |
max | Reserve para problemas genuinamente de fronteira. Na maioria das cargas de trabalho, max adiciona custo significativo para ganhos de qualidade relativamente pequenos, e em algumas tarefas de saída estruturada ou menos sensíveis à inteligência pode levar a pensamento excessivo. |
O Claude Opus 4.7 também respeita os níveis de effort de forma mais estrita do que o Claude Opus 4.6, especialmente em low e medium. Em níveis de effort mais baixos, o modelo limita seu trabalho ao que foi solicitado, em vez de ir além. Se você observar raciocínio superficial em problemas complexos com o Claude Opus 4.7, aumente o effort em vez de contornar isso via prompt. Se precisar manter o effort baixo por causa da latência, adicione orientação direcionada como "Esta tarefa envolve raciocínio em várias etapas. Pense cuidadosamente antes de responder."
Ao executar o Claude Opus 4.7 com effort xhigh ou max, defina um max_tokens grande para que o modelo tenha espaço para pensar e agir entre subagentes e chamadas de ferramentas. Começar com 64k tokens e ajustar a partir daí é um padrão razoável.
A orientação para Claude Opus 4.7 também se aplica ao Claude Opus 4.8. Comece com xhigh para casos de uso de codificação e agênticos, use high para a maioria das outras cargas de trabalho sensíveis à inteligência, e reduza para medium ou low apenas quando tiver medido que o nível mais baixo mantém a qualidade nas suas avaliações.
O padrão da API é high. Defina effort explicitamente para usar um nível diferente; o valor que você passa substitui o padrão.
Ao executar o Claude Opus 4.8 com effort xhigh ou max, defina um max_tokens grande para que o modelo tenha espaço para pensar e agir entre subagentes e chamadas de ferramentas. Começar com 64k tokens e ajustar a partir daí é um padrão razoável.
Effort é o controle principal para equilibrar inteligência, latência e custo no Claude Fable 5. Comece com high, o padrão, para a maioria das tarefas, use xhigh para as cargas de trabalho mais sensíveis à capacidade, e reduza para medium ou low para trabalho rotineiro. Configurações de effort mais baixas no Claude Fable 5 ainda têm bom desempenho e frequentemente superam o desempenho de xhigh em modelos anteriores. Em high e xhigh, defina um max_tokens grande: ele é um limite rígido na saída total, pensamento mais texto de resposta. Consulte Controle de custos.
Reduza o effort se uma tarefa for concluída mas demorar mais do que o necessário, ou se você quiser um estilo de trabalho mais rápido e interativo. As mesmas recomendações se aplicam ao Claude Mythos 5. Para orientação mais completa, consulte Prompting Claude Fable 5.
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-8",
max_tokens=4096,
messages=[
{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures",
}
],
output_config={"effort": "medium"},
)
print(response.content[0].text)Modo ultracode do Claude Code: ultracode aparece no menu de effort do Claude Code, mas não é um nível adicional de effort da API. Os valores documentados nesta página são o conjunto completo que a API aceita. Ultracode combina o nível de effort xhigh com permissão permanente para o Claude Code iniciar fluxos de trabalho multiagente, concedida por meio de Mensagens de sistema no meio da conversa. Para construir um comportamento semelhante com a API, consulte Construir um modo de orquestração.
Ao usar ferramentas, o parâmetro effort afeta tanto as explicações em torno das chamadas de ferramentas quanto as próprias chamadas de ferramentas. Níveis de effort mais baixos tendem a:
Níveis de effort mais altos podem:
O parâmetro effort funciona em conjunto com o "extended thinking" (pensamento estendido). Seu comportamento depende do modelo:
thinking é necessária). thinking: {type: "disabled"} é rejeitado. Effort controla a profundidade do pensamento da mesma forma que no Opus 4.8 e Opus 4.7.thinking: {type: "adaptive"}), em que effort é o controle recomendado para a profundidade do pensamento. O pensamento estendido manual (thinking: {type: "enabled", budget_tokens: N}) não é suportado e retorna um erro 400. O modelo decide quando e quanto pensar com base em cada solicitação, então aciona o pensamento apenas quando necessário. Nos níveis de effort high, xhigh e max, o Claude quase sempre pensa profundamente. Em níveis mais baixos, ele pode pular o pensamento para problemas mais simples. Defina thinking: {type: "adaptive"} para habilitar o pensamento; sem isso, as solicitações são executadas sem pensamento.thinking é necessária). thinking: {type: "disabled"} é rejeitado. Effort controla a profundidade do pensamento da mesma forma que no Opus 4.7 e Opus 4.6.thinking: {type: "adaptive"}), em que effort é o controle recomendado para a profundidade do pensamento. O pensamento estendido manual (thinking: {type: "enabled", budget_tokens: N}) não é mais suportado no Opus 4.7; use adaptive thinking com effort em vez disso. Nos níveis de effort high, xhigh e max, o Claude quase sempre pensa profundamente. Em níveis mais baixos, ele pode pular o pensamento para problemas mais simples.thinking: {type: "adaptive"}), em que effort é o controle recomendado para a profundidade do pensamento. Embora budget_tokens ainda seja aceito no Opus 4.6, ele está obsoleto e será removido em uma versão futura. Nos níveis de effort high e max, o Claude quase sempre pensa profundamente. Em níveis mais baixos, ele pode pular o pensamento para problemas mais simples.thinking é necessária), e effort é o controle recomendado para a profundidade do pensamento. O pensamento estendido manual (thinking: {type: "enabled", budget_tokens: N}) não é suportado e retorna um erro 400. Passe thinking: {type: "disabled"} para desativar o pensamento. Nos níveis de effort high (padrão), xhigh e max, o Claude quase sempre pensa profundamente. Em níveis mais baixos, ele pode pular o pensamento para problemas mais simples.thinking: {type: "enabled", budget_tokens: N}) ainda é funcional, mas está obsoleto.thinking: {type: "enabled", budget_tokens: N}), em que effort funciona em conjunto com o orçamento de tokens de pensamento. Defina o nível de effort para sua tarefa e, em seguida, defina o orçamento de tokens de pensamento com base na complexidade da tarefa.O parâmetro effort pode ser usado com ou sem o pensamento estendido habilitado. Quando usado sem pensamento, ele ainda controla o gasto geral de tokens para respostas de texto e chamadas de ferramentas.
high por padrão, mas o ponto de partida correto depende do seu modelo e da sua carga de trabalho.Dê ao Claude um orçamento consultivo de tokens para o loop agêntico completo, ajudando o modelo a se autorregular em tarefas agênticas longas.
Deixe o Claude determinar dinamicamente quando e quanto usar o pensamento estendido com o modo de pensamento adaptativo.
Dê ao Claude raciocínio aprimorado para tarefas complexas com orçamentos manuais de pensamento, uso de ferramentas e cache de prompt.
Was this page helpful?