MessagesCapacidades do modelo

Effort

Controle quantos tokens o Claude usa ao responder com o parâmetro effort, equilibrando a profundidade da resposta e a eficiência de tokens.

Este recurso é elegível para Zero Data Retention (ZDR). Quando sua organização possui um acordo de ZDR, os dados enviados por meio deste recurso não são armazenados após a resposta da API ser retornada.

O parâmetro effort permite controlar o quanto o Claude está disposto a gastar tokens ao responder a solicitações. Você pode equilibrar a profundidade da resposta e a eficiência de tokens com um único modelo. O parâmetro effort está disponível em todos os modelos suportados, sem necessidade de cabeçalho beta.

O parâmetro effort é suportado por Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5, Claude Sonnet 4.6 e Claude Opus 4.5.

Para Claude Opus 4.6 e Sonnet 4.6, effort substitui budget_tokens como a forma recomendada de controlar a profundidade do pensamento. Combine effort com adaptive thinking (pensamento adaptativo) (thinking: {type: "adaptive"}) para obter a melhor experiência. Embora budget_tokens ainda seja aceito no Opus 4.6 e Sonnet 4.6, ele está obsoleto e será removido em uma versão futura do modelo. Nos níveis de effort high (padrão) e max, o Claude quase sempre pensará. Em níveis de effort mais baixos, ele pode pular o pensamento para problemas mais simples.

Como o effort funciona

Por padrão, o Claude usa effort alto, gastando quantos tokens forem necessários para obter resultados excelentes. Você pode aumentar o nível de effort para max para obter a capacidade máxima absoluta, ou reduzi-lo para ser mais conservador com o uso de tokens, otimizando para velocidade e custo enquanto aceita alguma redução na capacidade.

Definir effort como "high" produz exatamente o mesmo comportamento que omitir o parâmetro effort completamente.

O parâmetro effort afeta todos os tokens na resposta, incluindo:

Respostas de texto e explicações
Chamadas de ferramentas e argumentos de funções
Pensamento estendido (quando habilitado)

Essa abordagem tem duas vantagens principais:

Não requer que o pensamento esteja habilitado.
Pode afetar todo o gasto de tokens, incluindo chamadas de ferramentas. Por exemplo, um effort mais baixo significaria que o Claude faz menos chamadas de ferramentas. Isso oferece um grau muito maior de controle sobre a eficiência.

Níveis de effort

Nível	Descrição	Caso de uso típico
`max`	Capacidade máxima absoluta sem restrições no gasto de tokens. Disponível em Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5 e Claude Sonnet 4.6.	Tarefas que exigem o raciocínio mais profundo possível e a análise mais completa
`xhigh`	Capacidade estendida para trabalho de longo horizonte. Disponível em Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Opus 4.7 e Claude Sonnet 5.	Tarefas agênticas e de codificação de longa duração (mais de 30 minutos) com orçamentos de tokens na casa dos milhões
`high`	Alta capacidade. Equivalente a não definir o parâmetro.	Raciocínio complexo, problemas difíceis de codificação, tarefas agênticas
`medium`	Abordagem equilibrada com economia moderada de tokens.	Tarefas agênticas que exigem equilíbrio entre velocidade, custo e desempenho
`low`	Mais eficiente. Economia significativa de tokens com alguma redução de capacidade.	Tarefas mais simples que precisam da melhor velocidade e dos menores custos, como subagentes

Effort é um sinal comportamental, não um orçamento estrito de tokens. Em níveis de effort mais baixos, o Claude ainda pensará em problemas suficientemente difíceis, mas pensará menos do que pensaria em níveis de effort mais altos para o mesmo problema.

Níveis de effort recomendados para Claude Sonnet 5

O Claude Sonnet 5 usa effort high por padrão.

Effort high (padrão): Adequado para raciocínio complexo, codificação e tarefas agênticas em que a qualidade importa mais do que velocidade ou custo.
Effort xhigh: Para as tarefas de codificação e agênticas mais difíceis. Consulte Prompting Claude Sonnet 5.
Effort medium: Redução de custo em relação ao padrão. Comparável ao Claude Sonnet 4.6 com effort high.
Effort low: Para cargas de trabalho de alto volume ou sensíveis à latência. Adequado para chat e casos de uso que não envolvem codificação, em que um retorno mais rápido é priorizado.
Effort max: Para tarefas que exigem a capacidade máxima absoluta sem restrições no gasto de tokens.

Níveis de effort recomendados para Sonnet 4.6

O Sonnet 4.6 usa effort high por padrão. Defina o effort explicitamente ao usar o Sonnet 4.6 para evitar latência inesperada:

Effort medium (padrão recomendado): Melhor equilíbrio entre velocidade, custo e desempenho para a maioria das aplicações. Adequado para codificação agêntica, fluxos de trabalho com uso intensivo de ferramentas e geração de código.
Effort low: Para cargas de trabalho de alto volume ou sensíveis à latência. Adequado para chat e casos de uso que não envolvem codificação, em que um retorno mais rápido é priorizado.
Effort high: Para raciocínio complexo e tarefas em que a qualidade importa mais do que velocidade ou custo.
Effort max: Para tarefas que exigem a capacidade máxima absoluta sem restrições no gasto de tokens.

Níveis de effort recomendados para Claude Opus 4.7

Comece com xhigh para casos de uso de codificação e agênticos, e use high como mínimo para a maioria das cargas de trabalho sensíveis à inteligência. Reduza para medium em cargas de trabalho sensíveis a custo, ou aumente para max apenas quando suas avaliações mostrarem margem mensurável de melhoria em xhigh.

O padrão da API é high. Para usar xhigh, defina effort explicitamente; o valor que você passa substitui o padrão.

Effort	Orientação para Claude Opus 4.7
`low`	Eficiente, mas melhor para tarefas curtas e bem delimitadas. Combine `low` com checklists explícitas se sua tarefa tiver várias seções.
`medium`	A opção direta para o fluxo de trabalho médio em que você quer bons resultados enquanto reduz custos.
`high`	Casos de uso avançados que ainda precisam de equilíbrio entre inteligência e consumo de tokens. Este é frequentemente o ponto ideal que equilibra qualidade e eficiência de tokens.
`xhigh`	O ponto de partida recomendado para trabalho de codificação e agêntico, e para tarefas exploratórias como chamadas repetidas de ferramentas, busca detalhada na web e busca em bases de conhecimento. Espere um uso de tokens significativamente maior do que em `high`.
`max`	Reserve para problemas genuinamente de fronteira. Na maioria das cargas de trabalho, `max` adiciona custo significativo para ganhos de qualidade relativamente pequenos, e em algumas tarefas de saída estruturada ou menos sensíveis à inteligência pode levar a pensamento excessivo.

O Claude Opus 4.7 também respeita os níveis de effort de forma mais estrita do que o Claude Opus 4.6, especialmente em low e medium. Em níveis de effort mais baixos, o modelo limita seu trabalho ao que foi solicitado, em vez de ir além. Se você observar raciocínio superficial em problemas complexos com o Claude Opus 4.7, aumente o effort em vez de contornar isso via prompt. Se precisar manter o effort baixo por causa da latência, adicione orientação direcionada como "Esta tarefa envolve raciocínio em várias etapas. Pense cuidadosamente antes de responder."

Ao executar o Claude Opus 4.7 com effort xhigh ou max, defina um max_tokens grande para que o modelo tenha espaço para pensar e agir entre subagentes e chamadas de ferramentas. Começar com 64k tokens e ajustar a partir daí é um padrão razoável.

Níveis de effort recomendados para Claude Opus 4.8

A orientação para Claude Opus 4.7 também se aplica ao Claude Opus 4.8. Comece com xhigh para casos de uso de codificação e agênticos, use high para a maioria das outras cargas de trabalho sensíveis à inteligência, e reduza para medium ou low apenas quando tiver medido que o nível mais baixo mantém a qualidade nas suas avaliações.

O padrão da API é high. Defina effort explicitamente para usar um nível diferente; o valor que você passa substitui o padrão.

Ao executar o Claude Opus 4.8 com effort xhigh ou max, defina um max_tokens grande para que o modelo tenha espaço para pensar e agir entre subagentes e chamadas de ferramentas. Começar com 64k tokens e ajustar a partir daí é um padrão razoável.

Níveis de effort recomendados para Claude Fable 5

Effort é o controle principal para equilibrar inteligência, latência e custo no Claude Fable 5. Comece com high, o padrão, para a maioria das tarefas, use xhigh para as cargas de trabalho mais sensíveis à capacidade, e reduza para medium ou low para trabalho rotineiro. Configurações de effort mais baixas no Claude Fable 5 ainda têm bom desempenho e frequentemente superam o desempenho de xhigh em modelos anteriores. Em high e xhigh, defina um max_tokens grande: ele é um limite rígido na saída total, pensamento mais texto de resposta. Consulte Controle de custos.

Reduza o effort se uma tarefa for concluída mas demorar mais do que o necessário, ou se você quiser um estilo de trabalho mais rápido e interativo. As mesmas recomendações se aplicam ao Claude Mythos 5. Para orientação mais completa, consulte Prompting Claude Fable 5.

Uso básico

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures",
        }
    ],
    output_config={"effort": "medium"},
)

print(response.content[0].text)

Quando ajustar o parâmetro effort

Use effort max quando precisar da capacidade máxima absoluta sem restrições: o raciocínio mais completo e a análise mais profunda. Disponível em Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5 e Claude Sonnet 4.6.
Use effort xhigh para codificação avançada e trabalho agêntico complexo que exige exploração estendida, como chamadas repetidas de ferramentas e busca detalhada. Disponível em Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Opus 4.7 e Claude Sonnet 5.
Use effort high (o padrão) para raciocínio complexo, análise com nuances, problemas difíceis de codificação ou qualquer tarefa em que a qualidade importa mais do que velocidade ou custo.
Use effort medium como uma opção equilibrada quando quiser desempenho sólido sem o gasto total de tokens do effort high.
Use effort low quando estiver otimizando para velocidade (porque o Claude responde com menos tokens) ou custo. Por exemplo, tarefas simples de classificação, consultas rápidas ou casos de uso de alto volume em que melhorias marginais de qualidade não justificam latência ou gasto adicional.

Modo ultracode do Claude Code: ultracode aparece no menu de effort do Claude Code, mas não é um nível adicional de effort da API. Os valores documentados nesta página são o conjunto completo que a API aceita. Ultracode combina o nível de effort xhigh com permissão permanente para o Claude Code iniciar fluxos de trabalho multiagente, concedida por meio de Mensagens de sistema no meio da conversa. Para construir um comportamento semelhante com a API, consulte Construir um modo de orquestração.

Effort com uso de ferramentas

Ao usar ferramentas, o parâmetro effort afeta tanto as explicações em torno das chamadas de ferramentas quanto as próprias chamadas de ferramentas. Níveis de effort mais baixos tendem a:

Combinar várias operações em menos chamadas de ferramentas
Fazer menos chamadas de ferramentas
Prosseguir diretamente para a ação sem preâmbulo
Usar mensagens de confirmação concisas após a conclusão

Níveis de effort mais altos podem:

Fazer mais chamadas de ferramentas
Explicar o plano antes de agir
Fornecer resumos detalhados das alterações
Incluir comentários de código mais abrangentes

Effort com pensamento estendido

O parâmetro effort funciona em conjunto com o "extended thinking" (pensamento estendido). Seu comportamento depende do modelo:

Claude Fable 5 e Claude Mythos 5 usam adaptive thinking (pensamento adaptativo), que está sempre ativado (nenhuma configuração de thinking é necessária). thinking: {type: "disabled"} é rejeitado. Effort controla a profundidade do pensamento da mesma forma que no Opus 4.8 e Opus 4.7.
Claude Opus 4.8 usa adaptive thinking (thinking: {type: "adaptive"}), em que effort é o controle recomendado para a profundidade do pensamento. O pensamento estendido manual (thinking: {type: "enabled", budget_tokens: N}) não é suportado e retorna um erro 400. O modelo decide quando e quanto pensar com base em cada solicitação, então aciona o pensamento apenas quando necessário. Nos níveis de effort high, xhigh e max, o Claude quase sempre pensa profundamente. Em níveis mais baixos, ele pode pular o pensamento para problemas mais simples. Defina thinking: {type: "adaptive"} para habilitar o pensamento; sem isso, as solicitações são executadas sem pensamento.
Claude Mythos Preview usa adaptive thinking por padrão (nenhuma configuração de thinking é necessária). thinking: {type: "disabled"} é rejeitado. Effort controla a profundidade do pensamento da mesma forma que no Opus 4.7 e Opus 4.6.
Claude Opus 4.7 usa adaptive thinking (thinking: {type: "adaptive"}), em que effort é o controle recomendado para a profundidade do pensamento. O pensamento estendido manual (thinking: {type: "enabled", budget_tokens: N}) não é mais suportado no Opus 4.7; use adaptive thinking com effort em vez disso. Nos níveis de effort high, xhigh e max, o Claude quase sempre pensa profundamente. Em níveis mais baixos, ele pode pular o pensamento para problemas mais simples.
Claude Opus 4.6 usa adaptive thinking (thinking: {type: "adaptive"}), em que effort é o controle recomendado para a profundidade do pensamento. Embora budget_tokens ainda seja aceito no Opus 4.6, ele está obsoleto e será removido em uma versão futura. Nos níveis de effort high e max, o Claude quase sempre pensa profundamente. Em níveis mais baixos, ele pode pular o pensamento para problemas mais simples.
Claude Sonnet 5 usa adaptive thinking, que está ativado por padrão (nenhuma configuração de thinking é necessária), e effort é o controle recomendado para a profundidade do pensamento. O pensamento estendido manual (thinking: {type: "enabled", budget_tokens: N}) não é suportado e retorna um erro 400. Passe thinking: {type: "disabled"} para desativar o pensamento. Nos níveis de effort high (padrão), xhigh e max, o Claude quase sempre pensa profundamente. Em níveis mais baixos, ele pode pular o pensamento para problemas mais simples.
Claude Sonnet 4.6 usa adaptive thinking (em que effort controla a profundidade do pensamento). O pensamento manual com modo intercalado (thinking: {type: "enabled", budget_tokens: N}) ainda é funcional, mas está obsoleto.
Claude Opus 4.5 usa pensamento manual (thinking: {type: "enabled", budget_tokens: N}), em que effort funciona em conjunto com o orçamento de tokens de pensamento. Defina o nível de effort para sua tarefa e, em seguida, defina o orçamento de tokens de pensamento com base na complexidade da tarefa.

O parâmetro effort pode ser usado com ou sem o pensamento estendido habilitado. Quando usado sem pensamento, ele ainda controla o gasto geral de tokens para respostas de texto e chamadas de ferramentas.

Melhores práticas

Defina o effort explicitamente: A API usa high por padrão, mas o ponto de partida correto depende do seu modelo e da sua carga de trabalho.
Use low para tarefas sensíveis à velocidade ou simples: Quando a latência importa ou as tarefas são diretas, o effort low pode reduzir significativamente os tempos de resposta e os custos.
Teste seu caso de uso: O impacto dos níveis de effort varia por tipo de tarefa. Avalie o desempenho nos seus casos de uso específicos antes de implantar.
Considere effort dinâmico: Ajuste o effort com base na complexidade da tarefa. Consultas simples podem justificar effort low, enquanto codificação agêntica e raciocínio complexo se beneficiam de effort high.

Próximos passos

Orçamentos de tarefa

Dê ao Claude um orçamento consultivo de tokens para o loop agêntico completo, ajudando o modelo a se autorregular em tarefas agênticas longas.

Adaptive thinking

Deixe o Claude determinar dinamicamente quando e quanto usar o pensamento estendido com o modo de pensamento adaptativo.

Construindo com pensamento estendido

Dê ao Claude raciocínio aprimorado para tarefas complexas com orçamentos manuais de pensamento, uso de ferramentas e cache de prompt.

Was this page helpful?

MessagesCapacidades do modelo

Effort

Controle quantos tokens o Claude usa ao responder com o parâmetro effort, equilibrando a profundidade da resposta e a eficiência de tokens.

O parâmetro effort é suportado por Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5, Claude Sonnet 4.6 e Claude Opus 4.5.

Como o effort funciona

Definir effort como "high" produz exatamente o mesmo comportamento que omitir o parâmetro effort completamente.

O parâmetro effort afeta todos os tokens na resposta, incluindo:

Respostas de texto e explicações
Chamadas de ferramentas e argumentos de funções
Pensamento estendido (quando habilitado)

Essa abordagem tem duas vantagens principais:

Não requer que o pensamento esteja habilitado.
Pode afetar todo o gasto de tokens, incluindo chamadas de ferramentas. Por exemplo, um effort mais baixo significaria que o Claude faz menos chamadas de ferramentas. Isso oferece um grau muito maior de controle sobre a eficiência.

Níveis de effort

Nível	Descrição	Caso de uso típico
`max`	Capacidade máxima absoluta sem restrições no gasto de tokens. Disponível em Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5 e Claude Sonnet 4.6.	Tarefas que exigem o raciocínio mais profundo possível e a análise mais completa
`xhigh`	Capacidade estendida para trabalho de longo horizonte. Disponível em Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Opus 4.7 e Claude Sonnet 5.	Tarefas agênticas e de codificação de longa duração (mais de 30 minutos) com orçamentos de tokens na casa dos milhões
`high`	Alta capacidade. Equivalente a não definir o parâmetro.	Raciocínio complexo, problemas difíceis de codificação, tarefas agênticas
`medium`	Abordagem equilibrada com economia moderada de tokens.	Tarefas agênticas que exigem equilíbrio entre velocidade, custo e desempenho
`low`	Mais eficiente. Economia significativa de tokens com alguma redução de capacidade.	Tarefas mais simples que precisam da melhor velocidade e dos menores custos, como subagentes

Níveis de effort recomendados para Claude Sonnet 5

O Claude Sonnet 5 usa effort high por padrão.

Effort high (padrão): Adequado para raciocínio complexo, codificação e tarefas agênticas em que a qualidade importa mais do que velocidade ou custo.
Effort xhigh: Para as tarefas de codificação e agênticas mais difíceis. Consulte Prompting Claude Sonnet 5.
Effort medium: Redução de custo em relação ao padrão. Comparável ao Claude Sonnet 4.6 com effort high.
Effort low: Para cargas de trabalho de alto volume ou sensíveis à latência. Adequado para chat e casos de uso que não envolvem codificação, em que um retorno mais rápido é priorizado.
Effort max: Para tarefas que exigem a capacidade máxima absoluta sem restrições no gasto de tokens.

Níveis de effort recomendados para Sonnet 4.6

O Sonnet 4.6 usa effort high por padrão. Defina o effort explicitamente ao usar o Sonnet 4.6 para evitar latência inesperada:

Effort medium (padrão recomendado): Melhor equilíbrio entre velocidade, custo e desempenho para a maioria das aplicações. Adequado para codificação agêntica, fluxos de trabalho com uso intensivo de ferramentas e geração de código.
Effort low: Para cargas de trabalho de alto volume ou sensíveis à latência. Adequado para chat e casos de uso que não envolvem codificação, em que um retorno mais rápido é priorizado.
Effort high: Para raciocínio complexo e tarefas em que a qualidade importa mais do que velocidade ou custo.
Effort max: Para tarefas que exigem a capacidade máxima absoluta sem restrições no gasto de tokens.

Níveis de effort recomendados para Claude Opus 4.7

O padrão da API é high. Para usar xhigh, defina effort explicitamente; o valor que você passa substitui o padrão.

Effort	Orientação para Claude Opus 4.7
`low`	Eficiente, mas melhor para tarefas curtas e bem delimitadas. Combine `low` com checklists explícitas se sua tarefa tiver várias seções.
`medium`	A opção direta para o fluxo de trabalho médio em que você quer bons resultados enquanto reduz custos.
`high`	Casos de uso avançados que ainda precisam de equilíbrio entre inteligência e consumo de tokens. Este é frequentemente o ponto ideal que equilibra qualidade e eficiência de tokens.
`xhigh`	O ponto de partida recomendado para trabalho de codificação e agêntico, e para tarefas exploratórias como chamadas repetidas de ferramentas, busca detalhada na web e busca em bases de conhecimento. Espere um uso de tokens significativamente maior do que em `high`.
`max`	Reserve para problemas genuinamente de fronteira. Na maioria das cargas de trabalho, `max` adiciona custo significativo para ganhos de qualidade relativamente pequenos, e em algumas tarefas de saída estruturada ou menos sensíveis à inteligência pode levar a pensamento excessivo.

Níveis de effort recomendados para Claude Opus 4.8

O padrão da API é high. Defina effort explicitamente para usar um nível diferente; o valor que você passa substitui o padrão.

Níveis de effort recomendados para Claude Fable 5

Uso básico

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures",
        }
    ],
    output_config={"effort": "medium"},
)

print(response.content[0].text)

Quando ajustar o parâmetro effort

Use effort max quando precisar da capacidade máxima absoluta sem restrições: o raciocínio mais completo e a análise mais profunda. Disponível em Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5 e Claude Sonnet 4.6.
Use effort xhigh para codificação avançada e trabalho agêntico complexo que exige exploração estendida, como chamadas repetidas de ferramentas e busca detalhada. Disponível em Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Opus 4.7 e Claude Sonnet 5.
Use effort high (o padrão) para raciocínio complexo, análise com nuances, problemas difíceis de codificação ou qualquer tarefa em que a qualidade importa mais do que velocidade ou custo.
Use effort medium como uma opção equilibrada quando quiser desempenho sólido sem o gasto total de tokens do effort high.
Use effort low quando estiver otimizando para velocidade (porque o Claude responde com menos tokens) ou custo. Por exemplo, tarefas simples de classificação, consultas rápidas ou casos de uso de alto volume em que melhorias marginais de qualidade não justificam latência ou gasto adicional.

Effort com uso de ferramentas

Ao usar ferramentas, o parâmetro effort afeta tanto as explicações em torno das chamadas de ferramentas quanto as próprias chamadas de ferramentas. Níveis de effort mais baixos tendem a:

Combinar várias operações em menos chamadas de ferramentas
Fazer menos chamadas de ferramentas
Prosseguir diretamente para a ação sem preâmbulo
Usar mensagens de confirmação concisas após a conclusão

Níveis de effort mais altos podem:

Fazer mais chamadas de ferramentas
Explicar o plano antes de agir
Fornecer resumos detalhados das alterações
Incluir comentários de código mais abrangentes

Effort com pensamento estendido

O parâmetro effort funciona em conjunto com o "extended thinking" (pensamento estendido). Seu comportamento depende do modelo:

Claude Fable 5 e Claude Mythos 5 usam adaptive thinking (pensamento adaptativo), que está sempre ativado (nenhuma configuração de thinking é necessária). thinking: {type: "disabled"} é rejeitado. Effort controla a profundidade do pensamento da mesma forma que no Opus 4.8 e Opus 4.7.
Claude Opus 4.8 usa adaptive thinking (thinking: {type: "adaptive"}), em que effort é o controle recomendado para a profundidade do pensamento. O pensamento estendido manual (thinking: {type: "enabled", budget_tokens: N}) não é suportado e retorna um erro 400. O modelo decide quando e quanto pensar com base em cada solicitação, então aciona o pensamento apenas quando necessário. Nos níveis de effort high, xhigh e max, o Claude quase sempre pensa profundamente. Em níveis mais baixos, ele pode pular o pensamento para problemas mais simples. Defina thinking: {type: "adaptive"} para habilitar o pensamento; sem isso, as solicitações são executadas sem pensamento.
Claude Mythos Preview usa adaptive thinking por padrão (nenhuma configuração de thinking é necessária). thinking: {type: "disabled"} é rejeitado. Effort controla a profundidade do pensamento da mesma forma que no Opus 4.7 e Opus 4.6.
Claude Opus 4.7 usa adaptive thinking (thinking: {type: "adaptive"}), em que effort é o controle recomendado para a profundidade do pensamento. O pensamento estendido manual (thinking: {type: "enabled", budget_tokens: N}) não é mais suportado no Opus 4.7; use adaptive thinking com effort em vez disso. Nos níveis de effort high, xhigh e max, o Claude quase sempre pensa profundamente. Em níveis mais baixos, ele pode pular o pensamento para problemas mais simples.
Claude Opus 4.6 usa adaptive thinking (thinking: {type: "adaptive"}), em que effort é o controle recomendado para a profundidade do pensamento. Embora budget_tokens ainda seja aceito no Opus 4.6, ele está obsoleto e será removido em uma versão futura. Nos níveis de effort high e max, o Claude quase sempre pensa profundamente. Em níveis mais baixos, ele pode pular o pensamento para problemas mais simples.
Claude Sonnet 5 usa adaptive thinking, que está ativado por padrão (nenhuma configuração de thinking é necessária), e effort é o controle recomendado para a profundidade do pensamento. O pensamento estendido manual (thinking: {type: "enabled", budget_tokens: N}) não é suportado e retorna um erro 400. Passe thinking: {type: "disabled"} para desativar o pensamento. Nos níveis de effort high (padrão), xhigh e max, o Claude quase sempre pensa profundamente. Em níveis mais baixos, ele pode pular o pensamento para problemas mais simples.
Claude Sonnet 4.6 usa adaptive thinking (em que effort controla a profundidade do pensamento). O pensamento manual com modo intercalado (thinking: {type: "enabled", budget_tokens: N}) ainda é funcional, mas está obsoleto.
Claude Opus 4.5 usa pensamento manual (thinking: {type: "enabled", budget_tokens: N}), em que effort funciona em conjunto com o orçamento de tokens de pensamento. Defina o nível de effort para sua tarefa e, em seguida, defina o orçamento de tokens de pensamento com base na complexidade da tarefa.

Melhores práticas

Defina o effort explicitamente: A API usa high por padrão, mas o ponto de partida correto depende do seu modelo e da sua carga de trabalho.
Use low para tarefas sensíveis à velocidade ou simples: Quando a latência importa ou as tarefas são diretas, o effort low pode reduzir significativamente os tempos de resposta e os custos.
Teste seu caso de uso: O impacto dos níveis de effort varia por tipo de tarefa. Avalie o desempenho nos seus casos de uso específicos antes de implantar.
Considere effort dinâmico: Ajuste o effort com base na complexidade da tarefa. Consultas simples podem justificar effort low, enquanto codificação agêntica e raciocínio complexo se beneficiam de effort high.

Próximos passos

Orçamentos de tarefa

Dê ao Claude um orçamento consultivo de tokens para o loop agêntico completo, ajudando o modelo a se autorregular em tarefas agênticas longas.

Adaptive thinking

Deixe o Claude determinar dinamicamente quando e quanto usar o pensamento estendido com o modo de pensamento adaptativo.

Construindo com pensamento estendido

Dê ao Claude raciocínio aprimorado para tarefas complexas com orçamentos manuais de pensamento, uso de ferramentas e cache de prompt.

Was this page helpful?

Como o effort funciona

Níveis de effort

Níveis de effort recomendados para Claude Sonnet 5

Níveis de effort recomendados para Sonnet 4.6

Níveis de effort recomendados para Claude Opus 4.7

Níveis de effort recomendados para Claude Opus 4.8

Níveis de effort recomendados para Claude Fable 5

Uso básico

Quando ajustar o parâmetro effort

Effort com uso de ferramentas

Effort com pensamento estendido

Melhores práticas

Próximos passos

Como o effort funciona

Níveis de effort

Níveis de effort recomendados para Claude Sonnet 5

Níveis de effort recomendados para Sonnet 4.6

Níveis de effort recomendados para Claude Opus 4.7

Níveis de effort recomendados para Claude Opus 4.8

Níveis de effort recomendados para Claude Fable 5

Uso básico

Quando ajustar o parâmetro effort

Effort com uso de ferramentas

Effort com pensamento estendido

Melhores práticas

Próximos passos

Como o effort funciona

Níveis de effort

Níveis de effort recomendados para Claude Sonnet 5

Níveis de effort recomendados para Sonnet 4.6

Níveis de effort recomendados para Claude Opus 4.7

Níveis de effort recomendados para Claude Opus 4.8

Níveis de effort recomendados para Claude Fable 5

Uso básico

Quando ajustar o parâmetro effort

Effort com uso de ferramentas

Effort com pensamento estendido

Melhores práticas

Próximos passos

Como o effort funciona

Níveis de effort

Níveis de effort recomendados para Claude Sonnet 5

Níveis de effort recomendados para Sonnet 4.6

Níveis de effort recomendados para Claude Opus 4.7

Níveis de effort recomendados para Claude Opus 4.8

Níveis de effort recomendados para Claude Fable 5

Uso básico

Quando ajustar o parâmetro effort

Effort com uso de ferramentas

Effort com pensamento estendido

Melhores práticas

Próximos passos