O parâmetro effort permite que você controle o quanto Claude está disposto a gastar tokens ao responder a solicitações. Isso oferece a capacidade de equilibrar entre a completude da resposta e a eficiência de tokens, tudo com um único modelo.
O parâmetro effort está atualmente em beta e é suportado apenas por Claude Opus 4.5.
Você deve incluir o cabeçalho beta effort-2025-11-24 ao usar este recurso.
Por padrão, Claude usa esforço máximo—gastando quantos tokens forem necessários para o melhor resultado possível. Ao reduzir o nível de esforço, você pode instruir Claude a ser mais conservador com o uso de tokens, otimizando para velocidade e custo enquanto aceita alguma redução em capacidade.
Definir effort como "high" produz exatamente o mesmo comportamento que omitir o parâmetro effort inteiramente.
O parâmetro effort afeta todos os tokens na resposta, incluindo:
Esta abordagem tem duas grandes vantagens:
| Nível | Descrição | Caso de uso típico |
|---|---|---|
high | Capacidade máxima—Claude usa quantos tokens forem necessários para o melhor resultado possível. Equivalente a não definir o parâmetro. | Raciocínio complexo, problemas de codificação difíceis, tarefas de agentes |
medium | Abordagem equilibrada com economia moderada de tokens. | Tarefas de agentes que requerem um equilíbrio entre velocidade, custo e desempenho |
low | Mais eficiente—economia significativa de tokens com alguma redução de capacidade. | Tarefas mais simples que precisam da melhor velocidade e menores custos, como subagentos |
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)Ao usar ferramentas, o parâmetro effort afeta tanto as explicações em torno das chamadas de ferramentas quanto as próprias chamadas de ferramentas. Níveis de esforço mais baixos tendem a:
Níveis de esforço mais altos podem:
O parâmetro effort funciona junto com o orçamento de tokens de pensamento quando o pensamento estendido está ativado. Esses dois controles servem a propósitos diferentes:
O parâmetro effort pode ser usado com ou sem pensamento estendido ativado. Quando ambos estão configurados:
Para melhor desempenho em tarefas de raciocínio complexo, use esforço alto (o padrão) com um orçamento de tokens de pensamento alto. Isso permite que Claude pense profundamente e forneça respostas abrangentes.