O parâmetro effort permite que você controle o quão disposto Claude está em gastar tokens ao responder a solicitações. Isso lhe dá a capacidade de equilibrar entre a minuciosidade da resposta e a eficiência de tokens, tudo com um único modelo.
O parâmetro effort está atualmente em beta e é suportado apenas por Claude Opus 4.5.
Você deve incluir o cabeçalho beta effort-2025-11-24 ao usar este recurso.
Por padrão, Claude usa esforço máximo—gastando quantos tokens forem necessários para o melhor resultado possível. Ao reduzir o nível de esforço, você pode instruir Claude a ser mais conservador com o uso de tokens, otimizando para velocidade e custo enquanto aceita alguma redução na capacidade.
Configurar effort para "high" produz exatamente o mesmo comportamento que omitir o parâmetro effort inteiramente.
O parâmetro effort afeta todos os tokens na resposta, incluindo:
Esta abordagem tem duas grandes vantagens:
| Nível | Descrição | Caso de uso típico |
|---|---|---|
high | Capacidade máxima. Claude usa quantos tokens forem necessários para o melhor resultado possível. Equivalente a não configurar o parâmetro. | Raciocínio complexo, problemas de codificação difíceis, tarefas de agente |
medium | Abordagem equilibrada com economia moderada de tokens. | Tarefas de agente que requerem um equilíbrio entre velocidade, custo e desempenho |
low | Mais eficiente. Economia significativa de tokens com alguma redução de capacidade. | Tarefas mais simples que precisam da melhor velocidade e menores custos, como subagentos |
Ao usar ferramentas, o parâmetro effort afeta tanto as explicações em torno das chamadas de ferramentas quanto as chamadas de ferramentas em si. Níveis de esforço mais baixos tendem a:
Níveis de esforço mais altos podem:
O parâmetro effort funciona junto com o orçamento de tokens de pensamento quando o pensamento estendido está habilitado. Esses dois controles servem a propósitos diferentes:
O parâmetro effort pode ser usado com ou sem pensamento estendido habilitado. Quando ambos estão configurados:
Para melhor desempenho em tarefas de raciocínio complexo, use high effort (o padrão) com um orçamento de tokens de pensamento alto. Isso permite que Claude pense minuciosamente e forneça respostas abrangentes.
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)