Loading...
    • Construir
    • Admin
    • Modelos e preços
    • SDKs do cliente
    • Referência da API
    Search...
    ⌘K
    Primeiros passos
    Introdução ao ClaudeInício rápido
    Construindo com Claude
    Visão geral dos recursosUsando a Messages APIHabilidade Claude APITratando motivos de parada
    Capacidades do modelo
    Extended thinkingAdaptive thinkingEsforçoOrçamentos de tarefas (beta)Modo rápido (beta: visualização de pesquisa)Saídas estruturadasCitaçõesStreaming de mensagensProcessamento em loteResultados de pesquisaRecusas em streamingSuporte multilíngueEmbeddings
    Ferramentas
    Visão geralComo o uso de ferramentas funcionaFerramenta de pesquisa na webFerramenta de busca na webFerramenta de execução de códigoFerramenta de consultorFerramenta de memóriaFerramenta BashFerramenta de uso de computadorFerramenta de editor de texto
    Infraestrutura de ferramentas
    Referência de ferramentasPesquisa de ferramentasChamada de ferramentas programáticaStreaming de ferramentas granular
    Gerenciamento de contexto
    Janelas de contextoCompactaçãoEdição de contextoCache de promptContagem de tokens
    Trabalhando com arquivos
    Files APISuporte a PDFImagens e visão
    Habilidades
    Visão geralInício rápidoMelhores práticasHabilidades para empresasHabilidades na API
    MCP
    Servidores MCP remotosConector MCP
    Engenharia de prompt
    Visão geralMelhores práticas de promptFerramentas de prompt do Console
    Testar e avaliar
    Definir sucesso e construir avaliaçõesUsando a ferramenta de avaliação no ConsoleReduzindo latência
    Fortalecer proteções
    Reduzir alucinaçõesAumentar consistência de saídaMitigar jailbreaksReduzir vazamento de prompt
    Recursos
    Glossário
    Notas de lançamento
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Capacidades do modelo

    Esforço

    Controle quantos tokens Claude usa ao responder com o parâmetro effort, equilibrando entre a minuciosidade da resposta e a eficiência de tokens.

    This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

    O parâmetro effort permite que você controle o quanto Claude está disposto a gastar tokens ao responder a solicitações. Isso oferece a capacidade de equilibrar entre a minuciosidade da resposta e a eficiência de tokens, tudo com um único modelo. O parâmetro effort está geralmente disponível em todos os modelos suportados sem necessidade de cabeçalho beta.

    O parâmetro effort é suportado por Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6 e Claude Opus 4.5.

    Para Claude Opus 4.6 e Sonnet 4.6, effort substitui budget_tokens como a forma recomendada de controlar a profundidade do pensamento. Combine effort com adaptive thinking (thinking: {type: "adaptive"}) para a melhor experiência. Embora budget_tokens ainda seja aceito em Opus 4.6 e Sonnet 4.6, está descontinuado e será removido em uma futura versão do modelo. Em high (padrão) e max effort, Claude quase sempre pensará. Em níveis de esforço mais baixos, pode pular o pensamento para problemas mais simples.

    Como o esforço funciona

    Por padrão, Claude usa alto esforço, gastando quantos tokens forem necessários para resultados excelentes. Você pode aumentar o nível de esforço para max para a capacidade absoluta mais alta, ou diminuir para ser mais conservador com o uso de tokens, otimizando para velocidade e custo enquanto aceita alguma redução na capacidade.

    Definir effort como "high" produz exatamente o mesmo comportamento de omitir o parâmetro effort inteiramente.

    O parâmetro effort afeta todos os tokens na resposta, incluindo:

    • Respostas de texto e explicações
    • Chamadas de ferramentas e argumentos de função
    • Pensamento estendido (quando ativado)

    Esta abordagem tem duas grandes vantagens:

    1. Não requer que o pensamento seja ativado para usá-lo.
    2. Pode afetar todo o gasto de tokens, incluindo chamadas de ferramentas. Por exemplo, esforço mais baixo significaria que Claude faz menos chamadas de ferramentas. Isso oferece um grau muito maior de controle sobre a eficiência.

    Níveis de esforço

    NívelDescriçãoCaso de uso típico
    maxCapacidade máxima absoluta sem restrições no gasto de tokens. Disponível em Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6 e Claude Sonnet 4.6.Tarefas que exigem o raciocínio mais profundo possível e análise mais minuciosa
    xhighCapacidade estendida para trabalho de longo horizonte. Disponível em Claude Opus 4.7.Tarefas de codificação e agentes de longa duração (mais de 30 minutos) com orçamentos de tokens na casa dos milhões
    highCapacidade alta. Equivalente a não definir o parâmetro.Raciocínio complexo, problemas de codificação difíceis, tarefas de agentes
    mediumAbordagem equilibrada com economia moderada de tokens.Tarefas de agentes que exigem equilíbrio entre velocidade, custo e desempenho
    lowMais eficiente. Economia significativa de tokens com alguma redução de capacidade.Tarefas mais simples que precisam da melhor velocidade e menores custos, como subagentos

    Esforço é um sinal comportamental, não um orçamento de tokens rigoroso. Em níveis de esforço mais baixos, Claude ainda pensará em problemas suficientemente difíceis, mas pensará menos do que faria em níveis de esforço mais altos para o mesmo problema.

    Níveis de esforço recomendados para Sonnet 4.6

    Sonnet 4.6 usa como padrão high effort. Defina explicitamente o esforço ao usar Sonnet 4.6 para evitar latência inesperada:

    • Esforço médio (padrão recomendado): Melhor equilíbrio de velocidade, custo e desempenho para a maioria das aplicações. Adequado para codificação de agentes, fluxos de trabalho com muitas ferramentas e geração de código.
    • Esforço baixo: Para cargas de trabalho de alto volume ou sensíveis à latência. Adequado para chat e casos de uso sem codificação onde o tempo de resposta mais rápido é priorizado.
    • Esforço alto: Para tarefas que exigem inteligência máxima de Sonnet 4.6.
    • Esforço máximo: Para tarefas que exigem a capacidade absoluta mais alta sem restrições no gasto de tokens.

    Níveis de esforço recomendados para Claude Opus 4.7

    Comece com xhigh para codificação e casos de uso de agentes, e use high como o mínimo para a maioria das cargas de trabalho sensíveis à inteligência. Diminua para medium para cargas de trabalho sensíveis ao custo, ou aumente para max apenas quando suas avaliações mostrarem espaço mensurável em xhigh.

    O padrão da API é high. Para usar xhigh, defina effort explicitamente; o valor que você passa substitui o padrão.

    EsforçoOrientação para Claude Opus 4.7
    lowEficiente, mas melhor para tarefas curtas e delimitadas. Combine low com listas de verificação explícitas se sua tarefa tiver várias seções.
    mediumA substituição para o fluxo de trabalho médio onde você deseja bons resultados enquanto reduz custos.
    highCasos de uso avançados que ainda precisam de equilíbrio entre inteligência e consumo de tokens. Este é frequentemente o ponto ideal equilibrando qualidade e eficiência de tokens.
    xhighO ponto de partida recomendado para codificação e trabalho de agentes, e para tarefas exploratórias como chamadas de ferramentas repetidas, busca web detalhada e busca em base de conhecimento. Espere uso de tokens significativamente mais alto do que high.
    maxReserve para problemas genuinamente de fronteira. Na maioria das cargas de trabalho max adiciona custo significativo para ganhos de qualidade relativamente pequenos, e em algumas tarefas de saída estruturada ou menos sensíveis à inteligência pode levar a excesso de pensamento.

    Claude Opus 4.7 também respeita os níveis de esforço de forma mais rigorosa do que Claude Opus 4.6, especialmente em low e medium. Em níveis de esforço mais baixos, o modelo limita seu trabalho ao que foi solicitado em vez de ir além. Se você observar raciocínio superficial em problemas complexos com Claude Opus 4.7, aumente o esforço em vez de contornar com prompts. Se você deve manter o esforço baixo por latência, adicione orientação direcionada como "Esta tarefa envolve raciocínio em várias etapas. Pense cuidadosamente antes de responder."

    Ao executar Claude Opus 4.7 em xhigh ou max effort, defina um grande max_tokens para que o modelo tenha espaço para pensar e agir entre subagentos e chamadas de ferramentas. Começar com 64k tokens e ajustar a partir daí é um padrão razoável.

    Uso básico

    client = anthropic.Anthropic()
    
    response = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=4096,
        messages=[
            {
                "role": "user",
                "content": "Analyze the trade-offs between microservices and monolithic architectures",
            }
        ],
        output_config={"effort": "medium"},
    )
    
    print(response.content[0].text)

    Quando ajustar o parâmetro effort

    • Use max effort quando você precisa da capacidade absoluta mais alta sem restrições: o raciocínio mais minucioso e a análise mais profunda. Disponível em Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6 e Claude Sonnet 4.6.
    • Use xhigh effort para codificação avançada e trabalho de agentes complexos que exigem exploração estendida, como chamadas de ferramentas repetidas e busca detalhada. Disponível em Claude Opus 4.7.
    • Use high effort (o padrão) quando você precisa do melhor trabalho de Claude: raciocínio complexo, análise nuançada, problemas de codificação difíceis ou qualquer tarefa onde a qualidade é a prioridade máxima.
    • Use medium effort como uma opção equilibrada quando você quer desempenho sólido sem o gasto total de tokens do high effort.
    • Use low effort quando você está otimizando para velocidade (porque Claude responde com menos tokens) ou custo. Por exemplo, tarefas simples de classificação, buscas rápidas ou casos de uso de alto volume onde melhorias marginais de qualidade não justificam latência ou gasto adicional.

    Esforço com uso de ferramentas

    Ao usar ferramentas, o parâmetro effort afeta tanto as explicações em torno das chamadas de ferramentas quanto as próprias chamadas de ferramentas. Níveis de esforço mais baixos tendem a:

    • Combinar múltiplas operações em menos chamadas de ferramentas
    • Fazer menos chamadas de ferramentas
    • Proceder diretamente à ação sem preâmbulo
    • Usar mensagens de confirmação tersas após a conclusão

    Níveis de esforço mais altos podem:

    • Fazer mais chamadas de ferramentas
    • Explicar o plano antes de tomar ação
    • Fornecer resumos detalhados de mudanças
    • Incluir comentários de código mais abrangentes

    Esforço com pensamento estendido

    O parâmetro effort funciona junto com o pensamento estendido. Seu comportamento depende do modelo:

    • Claude Mythos Preview usa adaptive thinking por padrão (nenhuma configuração de thinking necessária). thinking: {type: "disabled"} é rejeitado. Esforço controla a profundidade do pensamento da mesma forma que em Opus 4.7 e Opus 4.6.
    • Claude Opus 4.7 usa adaptive thinking (thinking: {type: "adaptive"}), onde effort é o controle recomendado para a profundidade do pensamento. Pensamento estendido manual (thinking: {type: "enabled", budget_tokens: N}) não é mais suportado em Opus 4.7; use adaptive thinking com effort em vez disso. Em high, xhigh e max effort, Claude quase sempre pensa profundamente. Em níveis mais baixos, pode pular o pensamento para problemas mais simples.
    • Claude Opus 4.6 usa adaptive thinking (thinking: {type: "adaptive"}), onde effort é o controle recomendado para a profundidade do pensamento. Embora budget_tokens ainda seja aceito em Opus 4.6, está descontinuado e será removido em uma futura versão. Em high e max effort, Claude quase sempre pensa profundamente. Em níveis mais baixos, pode pular o pensamento para problemas mais simples.
    • Claude Sonnet 4.6 usa adaptive thinking (onde effort controla a profundidade do pensamento). Pensamento manual com interleaved mode (thinking: {type: "enabled", budget_tokens: N}) ainda é funcional mas descontinuado.
    • Claude Opus 4.5 e outros modelos Claude 4 usam pensamento manual (thinking: {type: "enabled", budget_tokens: N}), onde effort funciona junto com o orçamento de tokens de pensamento. Defina o nível de esforço para sua tarefa, depois defina o orçamento de tokens de pensamento com base na complexidade da tarefa.

    O parâmetro effort pode ser usado com ou sem pensamento estendido ativado. Quando usado sem pensamento, ainda controla o gasto total de tokens para respostas de texto e chamadas de ferramentas.

    Melhores práticas

    1. Defina effort explicitamente: A API usa como padrão high, mas o ponto de partida correto depende do seu modelo e carga de trabalho.
    2. Use low para tarefas sensíveis à velocidade ou simples: Quando a latência importa ou as tarefas são diretas, low effort pode reduzir significativamente os tempos de resposta e custos.
    3. Teste seu caso de uso: O impacto dos níveis de esforço varia por tipo de tarefa. Avalie o desempenho em seus casos de uso específicos antes de implantar.
    4. Considere esforço dinâmico: Ajuste o esforço com base na complexidade da tarefa. Consultas simples podem justificar low effort enquanto codificação de agentes e raciocínio complexo se beneficiam de high effort.

    Was this page helpful?

    • Como o esforço funciona
    • Níveis de esforço
    • Níveis de esforço recomendados para Sonnet 4.6
    • Níveis de esforço recomendados para Claude Opus 4.7
    • Uso básico
    • Quando ajustar o parâmetro effort
    • Esforço com uso de ferramentas
    • Esforço com pensamento estendido
    • Melhores práticas