O parâmetro effort permite que você controle o quão disposto Claude está em gastar tokens ao responder a solicitações. Isso oferece a capacidade de equilibrar entre a minuciosidade da resposta e a eficiência de tokens, tudo com um único modelo. O parâmetro effort está geralmente disponível em todos os modelos suportados sem exigir um cabeçalho beta.
O parâmetro effort é suportado por Claude Opus 4.6 e Claude Opus 4.5.
Para Claude Opus 4.6, effort substitui budget_tokens como a forma recomendada de controlar a profundidade do pensamento. Combine effort com adaptive thinking (thinking: {type: "adaptive"}) para a melhor experiência. Embora budget_tokens ainda seja aceito no Opus 4.6, está deprecado e será removido em um lançamento futuro do modelo. Em esforço high (padrão) e max, Claude quase sempre pensará. Em níveis de esforço mais baixos, pode pular o pensamento para problemas mais simples.
Por padrão, Claude usa esforço alto—gastando quantos tokens forem necessários para resultados excelentes. Você pode aumentar o nível de esforço para max para a capacidade absoluta mais alta, ou diminuir para ser mais conservador com o uso de tokens, otimizando para velocidade e custo enquanto aceita alguma redução na capacidade.
Definir effort como "high" produz exatamente o mesmo comportamento que omitir o parâmetro effort completamente.
Was this page helpful?
O parâmetro effort afeta todos os tokens na resposta, incluindo:
Esta abordagem tem duas grandes vantagens:
| Nível | Descrição | Caso de uso típico |
|---|---|---|
max | Capacidade máxima absoluta sem restrições no gasto de tokens. Apenas Opus 4.6 — solicitações usando max em outros modelos retornarão um erro. | Tarefas que exigem o raciocínio mais profundo possível e análise mais minuciosa |
high | Alta capacidade. Equivalente a não definir o parâmetro. | Raciocínio complexo, problemas de codificação difíceis, tarefas de agentes |
medium | Abordagem equilibrada com economia moderada de tokens. | Tarefas de agentes que exigem um equilíbrio entre velocidade, custo e desempenho |
low | Mais eficiente. Economia significativa de tokens com alguma redução de capacidade. | Tarefas mais simples que precisam da melhor velocidade e menores custos, como subagentos |
Esforço é um sinal comportamental, não um orçamento de tokens rigoroso. Em níveis de esforço mais baixos, Claude ainda pensará em problemas suficientemente difíceis — apenas pensará menos do que faria em níveis de esforço mais altos para o mesmo problema.
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)max em outros modelos retornarão um erro.Ao usar ferramentas, o parâmetro effort afeta tanto as explicações em torno das chamadas de ferramentas quanto as próprias chamadas de ferramentas. Níveis de esforço mais baixos tendem a:
Níveis de esforço mais altos podem:
O parâmetro effort funciona junto com o pensamento estendido. Seu comportamento depende do modelo:
thinking: {type: "adaptive"}), onde effort é o controle recomendado para a profundidade do pensamento. Embora budget_tokens ainda seja aceito no Opus 4.6, está deprecado e será removido em um lançamento futuro. Em esforço high e max, Claude quase sempre pensa profundamente. Em níveis mais baixos, pode pular o pensamento para problemas mais simples.thinking: {type: "enabled", budget_tokens: N}), onde effort funciona junto com o orçamento de tokens de pensamento. Defina o nível de esforço para sua tarefa, depois defina o orçamento de tokens de pensamento com base na complexidade da tarefa.O parâmetro effort pode ser usado com ou sem pensamento estendido ativado. Quando usado sem pensamento, ainda controla o gasto total de tokens para respostas de texto e chamadas de ferramentas.