This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
O parâmetro effort permite que você controle o quanto Claude está disposto a gastar tokens ao responder às solicitações. Isso oferece a capacidade de equilibrar entre a minuciosidade da resposta e a eficiência de tokens, tudo com um único modelo. O parâmetro effort está geralmente disponível em todos os modelos suportados sem necessidade de cabeçalho beta.
O parâmetro effort é suportado por Claude Mythos Preview, Claude Opus 4.6, Claude Sonnet 4.6 e Claude Opus 4.5.
Para Claude Opus 4.6 e Sonnet 4.6, effort substitui budget_tokens como a forma recomendada de controlar a profundidade do pensamento. Combine effort com adaptive thinking (thinking: {type: "adaptive"}) para a melhor experiência. Embora budget_tokens ainda seja aceito em Opus 4.6 e Sonnet 4.6, está descontinuado e será removido em uma versão futura do modelo. Em esforço high (padrão) e max, Claude quase sempre pensará. Em níveis de esforço mais baixos, pode pular o pensamento para problemas mais simples.
Por padrão, Claude usa esforço alto, gastando quantos tokens forem necessários para resultados excelentes. Você pode aumentar o nível de esforço para max para a capacidade absoluta mais alta, ou diminuir para ser mais conservador com o uso de tokens, otimizando para velocidade e custo enquanto aceita alguma redução na capacidade.
Definir effort como "high" produz exatamente o mesmo comportamento que omitir o parâmetro effort inteiramente.
O parâmetro effort afeta todos os tokens na resposta, incluindo:
Esta abordagem tem duas grandes vantagens:
| Nível | Descrição | Caso de uso típico |
|---|---|---|
max | Capacidade máxima absoluta sem restrições no gasto de tokens. Disponível em Claude Mythos Preview, Claude Opus 4.6 e Claude Sonnet 4.6. | Tarefas que requerem o raciocínio mais profundo possível e análise mais completa |
high | Alta capacidade. Equivalente a não definir o parâmetro. | Raciocínio complexo, problemas de codificação difíceis, tarefas de agentes |
medium | Abordagem equilibrada com economia moderada de tokens. | Tarefas de agentes que requerem equilíbrio entre velocidade, custo e desempenho |
low | Mais eficiente. Economia significativa de tokens com alguma redução de capacidade. | Tarefas mais simples que precisam da melhor velocidade e menores custos, como subagentos |
Esforço é um sinal comportamental, não um orçamento de tokens rigoroso. Em níveis de esforço mais baixos, Claude ainda pensará em problemas suficientemente difíceis, mas pensará menos do que faria em níveis de esforço mais altos para o mesmo problema.
Sonnet 4.6 usa como padrão esforço high. Defina explicitamente o esforço ao usar Sonnet 4.6 para evitar latência inesperada:
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-opus-4-6",
"max_tokens": 4096,
"messages": [{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
"output_config": {
"effort": "medium"
}
}'Ao usar ferramentas, o parâmetro effort afeta tanto as explicações em torno das chamadas de ferramentas quanto as próprias chamadas de ferramentas. Níveis de esforço mais baixos tendem a:
Níveis de esforço mais altos podem:
O parâmetro effort funciona junto com o pensamento estendido. Seu comportamento depende do modelo:
thinking necessária). thinking: {type: "disabled"} é rejeitado. Esforço controla a profundidade do pensamento da mesma forma que em Opus 4.6.thinking: {type: "adaptive"}), onde esforço é o controle recomendado para a profundidade do pensamento. Embora budget_tokens ainda seja aceito em Opus 4.6, está descontinuado e será removido em uma versão futura. Em esforço high e max, Claude quase sempre pensa profundamente. Em níveis mais baixos, pode pular o pensamento para problemas mais simples.thinking: {type: "enabled", budget_tokens: N}) ainda é funcional mas descontinuado.thinking: {type: "enabled", budget_tokens: N}), onde esforço funciona junto com o orçamento de tokens de pensamento. Defina o nível de esforço para sua tarefa, depois defina o orçamento de tokens de pensamento com base na complexidade da tarefa.O parâmetro effort pode ser usado com ou sem pensamento estendido habilitado. Quando usado sem pensamento, ainda controla o gasto total de tokens para respostas de texto e chamadas de ferramentas.
high, mas o ponto de partida correto depende do seu modelo e carga de trabalho.Was this page helpful?