Loading...
    • Construir
    • Admin
    • Modelos e preços
    • SDKs de cliente
    • Referência da API
    Search...
    ⌘K
    Primeiros passos
    Introdução ao ClaudeInício rápido
    Construindo com Claude
    Visão geral dos recursosUsando a API de MensagensTratando razões de parada
    Capacidades do modelo
    Pensamento estendidoPensamento adaptativoEsforçoModo rápido (beta: prévia de pesquisa)Saídas estruturadasCitaçõesMensagens em streamingProcessamento em loteResultados de pesquisaRecusas em streamingSuporte multilíngueEmbeddings
    Ferramentas
    Visão geralComo o uso de ferramentas funcionaFerramenta de busca na webFerramenta de busca webFerramenta de execução de códigoFerramenta de memóriaFerramenta BashFerramenta de uso do computadorFerramenta de edição de texto
    Infraestrutura de ferramentas
    Busca de ferramentasChamada programática de ferramentasStreaming refinado de ferramentas
    Gerenciamento de contexto
    Janelas de contextoCompactaçãoEdição de contextoCache de promptContagem de tokens
    Trabalhando com arquivos
    Files APISuporte a PDFImagens e visão
    Skills
    Visão geralInício rápidoMelhores práticasSkills para empresasSkills na API
    MCP
    Servidores MCP remotosConector MCP
    Engenharia de prompt
    Visão geralMelhores práticas de promptingFerramentas de prompting no Console
    Testar e avaliar
    Definir sucesso e criar avaliaçõesUsando a Ferramenta de Avaliação no ConsoleReduzindo latência
    Fortalecer guardrails
    Reduzir alucinaçõesAumentar consistência de saídaMitigar jailbreaksReduzir vazamento de prompt
    Recursos
    Glossário
    Notas de versão
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Capacidades do modelo

    Esforço

    Controle quantos tokens Claude usa ao responder com o parâmetro effort, equilibrando entre a minuciosidade da resposta e a eficiência de tokens.

    This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

    O parâmetro effort permite que você controle o quanto Claude está disposto a gastar tokens ao responder às solicitações. Isso oferece a capacidade de equilibrar entre a minuciosidade da resposta e a eficiência de tokens, tudo com um único modelo. O parâmetro effort está geralmente disponível em todos os modelos suportados sem necessidade de cabeçalho beta.

    O parâmetro effort é suportado por Claude Mythos Preview, Claude Opus 4.6, Claude Sonnet 4.6 e Claude Opus 4.5.

    Para Claude Opus 4.6 e Sonnet 4.6, effort substitui budget_tokens como a forma recomendada de controlar a profundidade do pensamento. Combine effort com adaptive thinking (thinking: {type: "adaptive"}) para a melhor experiência. Embora budget_tokens ainda seja aceito em Opus 4.6 e Sonnet 4.6, está descontinuado e será removido em uma versão futura do modelo. Em esforço high (padrão) e max, Claude quase sempre pensará. Em níveis de esforço mais baixos, pode pular o pensamento para problemas mais simples.

    Como o esforço funciona

    Por padrão, Claude usa esforço alto, gastando quantos tokens forem necessários para resultados excelentes. Você pode aumentar o nível de esforço para max para a capacidade absoluta mais alta, ou diminuir para ser mais conservador com o uso de tokens, otimizando para velocidade e custo enquanto aceita alguma redução na capacidade.

    Definir effort como "high" produz exatamente o mesmo comportamento que omitir o parâmetro effort inteiramente.

    O parâmetro effort afeta todos os tokens na resposta, incluindo:

    • Respostas de texto e explicações
    • Chamadas de ferramentas e argumentos de função
    • Pensamento estendido (quando habilitado)

    Esta abordagem tem duas grandes vantagens:

    1. Não requer que o pensamento seja habilitado para usá-lo.
    2. Pode afetar todo o gasto de tokens, incluindo chamadas de ferramentas. Por exemplo, esforço mais baixo significaria que Claude faz menos chamadas de ferramentas. Isso oferece um grau muito maior de controle sobre a eficiência.

    Níveis de esforço

    NívelDescriçãoCaso de uso típico
    maxCapacidade máxima absoluta sem restrições no gasto de tokens. Disponível em Claude Mythos Preview, Claude Opus 4.6 e Claude Sonnet 4.6.Tarefas que requerem o raciocínio mais profundo possível e análise mais completa
    highAlta capacidade. Equivalente a não definir o parâmetro.Raciocínio complexo, problemas de codificação difíceis, tarefas de agentes
    mediumAbordagem equilibrada com economia moderada de tokens.Tarefas de agentes que requerem equilíbrio entre velocidade, custo e desempenho
    lowMais eficiente. Economia significativa de tokens com alguma redução de capacidade.Tarefas mais simples que precisam da melhor velocidade e menores custos, como subagentos

    Esforço é um sinal comportamental, não um orçamento de tokens rigoroso. Em níveis de esforço mais baixos, Claude ainda pensará em problemas suficientemente difíceis, mas pensará menos do que faria em níveis de esforço mais altos para o mesmo problema.

    Níveis de esforço recomendados para Sonnet 4.6

    Sonnet 4.6 usa como padrão esforço high. Defina explicitamente o esforço ao usar Sonnet 4.6 para evitar latência inesperada:

    • Esforço médio (padrão recomendado): Melhor equilíbrio de velocidade, custo e desempenho para a maioria das aplicações. Adequado para codificação de agentes, fluxos de trabalho com muitas ferramentas e geração de código.
    • Esforço baixo: Para cargas de trabalho de alto volume ou sensíveis à latência. Adequado para chat e casos de uso não relacionados a codificação onde o retorno mais rápido é priorizado.
    • Esforço alto: Para tarefas que requerem inteligência máxima do Sonnet 4.6.
    • Esforço máximo: Para tarefas que requerem a capacidade absoluta mais alta sem restrições no gasto de tokens.

    Uso básico

    curl https://api.anthropic.com/v1/messages \
        --header "x-api-key: $ANTHROPIC_API_KEY" \
        --header "anthropic-version: 2023-06-01" \
        --header "content-type: application/json" \
        --data '{
            "model": "claude-opus-4-6",
            "max_tokens": 4096,
            "messages": [{
                "role": "user",
                "content": "Analyze the trade-offs between microservices and monolithic architectures"
            }],
            "output_config": {
                "effort": "medium"
            }
        }'

    Quando ajustar o parâmetro effort

    • Use esforço máximo quando você precisa da capacidade absoluta mais alta sem restrições: o raciocínio mais completo e a análise mais profunda. Disponível em Claude Mythos Preview, Claude Opus 4.6 e Claude Sonnet 4.6.
    • Use esforço alto (o padrão) quando você precisa do melhor trabalho do Claude: raciocínio complexo, análise nuançada, problemas de codificação difíceis, ou qualquer tarefa onde a qualidade é a prioridade máxima.
    • Use esforço médio como uma opção equilibrada quando você quer desempenho sólido sem o gasto total de tokens do esforço alto.
    • Use esforço baixo quando você está otimizando para velocidade (porque Claude responde com menos tokens) ou custo. Por exemplo, tarefas simples de classificação, buscas rápidas, ou casos de uso de alto volume onde melhorias marginais de qualidade não justificam latência adicional ou gasto.

    Esforço com uso de ferramentas

    Ao usar ferramentas, o parâmetro effort afeta tanto as explicações em torno das chamadas de ferramentas quanto as próprias chamadas de ferramentas. Níveis de esforço mais baixos tendem a:

    • Combinar múltiplas operações em menos chamadas de ferramentas
    • Fazer menos chamadas de ferramentas
    • Proceder diretamente à ação sem preâmbulo
    • Usar mensagens de confirmação concisas após a conclusão

    Níveis de esforço mais altos podem:

    • Fazer mais chamadas de ferramentas
    • Explicar o plano antes de tomar ação
    • Fornecer resumos detalhados de mudanças
    • Incluir comentários de código mais abrangentes

    Esforço com pensamento estendido

    O parâmetro effort funciona junto com o pensamento estendido. Seu comportamento depende do modelo:

    • Claude Mythos Preview usa adaptive thinking por padrão (nenhuma configuração de thinking necessária). thinking: {type: "disabled"} é rejeitado. Esforço controla a profundidade do pensamento da mesma forma que em Opus 4.6.
    • Claude Opus 4.6 usa adaptive thinking (thinking: {type: "adaptive"}), onde esforço é o controle recomendado para a profundidade do pensamento. Embora budget_tokens ainda seja aceito em Opus 4.6, está descontinuado e será removido em uma versão futura. Em esforço high e max, Claude quase sempre pensa profundamente. Em níveis mais baixos, pode pular o pensamento para problemas mais simples.
    • Claude Sonnet 4.6 usa adaptive thinking (onde esforço controla a profundidade do pensamento). Pensamento manual com modo intercalado (thinking: {type: "enabled", budget_tokens: N}) ainda é funcional mas descontinuado.
    • Claude Opus 4.5 e outros modelos Claude 4 usam pensamento manual (thinking: {type: "enabled", budget_tokens: N}), onde esforço funciona junto com o orçamento de tokens de pensamento. Defina o nível de esforço para sua tarefa, depois defina o orçamento de tokens de pensamento com base na complexidade da tarefa.

    O parâmetro effort pode ser usado com ou sem pensamento estendido habilitado. Quando usado sem pensamento, ainda controla o gasto total de tokens para respostas de texto e chamadas de ferramentas.

    Melhores práticas

    1. Defina esforço explicitamente: A API usa como padrão high, mas o ponto de partida correto depende do seu modelo e carga de trabalho.
    2. Use low para tarefas sensíveis à velocidade ou simples: Quando a latência importa ou as tarefas são diretas, esforço baixo pode reduzir significativamente os tempos de resposta e custos.
    3. Teste seu caso de uso: O impacto dos níveis de esforço varia por tipo de tarefa. Avalie o desempenho em seus casos de uso específicos antes de implantar.
    4. Considere esforço dinâmico: Ajuste o esforço com base na complexidade da tarefa. Consultas simples podem justificar esforço baixo enquanto codificação de agentes e raciocínio complexo se beneficiam de esforço alto.

    Was this page helpful?

    • Como o esforço funciona
    • Níveis de esforço
    • Níveis de esforço recomendados para Sonnet 4.6
    • Uso básico
    • Quando ajustar o parâmetro effort
    • Esforço com uso de ferramentas
    • Esforço com pensamento estendido
    • Melhores práticas