Loading...
    0
    • Guia do Desenvolvedor
    • Referência da API
    • MCP
    • Recursos
    • Notas de lançamento
    Search...
    ⌘K
    Primeiros passos
    Introdução ao ClaudeInício rápido
    Modelos e preços
    Visão geral dos modelosEscolhendo um modeloNovidades no Claude 4.5Migrando para Claude 4.5Descontinuação de modelosPreços
    Construir com Claude
    Visão geral de recursosUsando a API MessagesJanelas de contextoMelhores práticas de prompting
    Capacidades
    Cache de promptEdição de contextoPensamento estendidoEsforçoStreaming de mensagensProcessamento em loteCitaçõesSuporte multilíngueContagem de tokensEmbeddingsVisãoSuporte a PDFAPI de ArquivosResultados de buscaSaídas estruturadasComplemento Google Sheets
    Ferramentas
    Visão geralComo implementar o uso de ferramentasUso de ferramentas eficiente em tokensStreaming de ferramentas granularFerramenta BashFerramenta de execução de códigoChamada de ferramentas programáticaFerramenta de uso de computadorFerramenta de editor de textoFerramenta de busca na webFerramenta de pesquisa na webFerramenta de memóriaFerramenta de busca de ferramentas
    Habilidades de agente
    Visão geralInício rápidoMelhores práticasUsando habilidades com a API
    Agent SDK
    Visão geralSDK TypeScriptSDK PythonGuia de migração
    Guias
    Entrada de streamingTratamento de permissõesGerenciamento de sessãoSaídas estruturadas no SDKHospedando o Agent SDKModificando prompts do sistemaMCP no SDKFerramentas personalizadasSubagentos no SDKComandos de barra no SDKHabilidades de agente no SDKRastreando custos e usoListas de tarefasPlugins no SDK
    MCP na API
    Conector MCPServidores MCP remotos
    Claude em plataformas de terceiros
    Amazon BedrockMicrosoft FoundryVertex AI
    Engenharia de prompts
    Visão geralGerador de promptsUsar modelos de promptMelhorador de promptsSeja claro e diretoUse exemplos (prompting multisshot)Deixe Claude pensar (CoT)Use tags XMLDê um papel ao Claude (prompts do sistema)Preencha previamente a resposta do ClaudeEncadeie prompts complexosDicas de contexto longoDicas de pensamento estendido
    Testar e avaliar
    Definir critérios de sucessoDesenvolver casos de testeUsando a ferramenta de avaliaçãoReduzindo latência
    Fortalecer proteções
    Reduzir alucinaçõesAumentar consistência de saídaMitigar ataques de jailbreakRecusas de streamingReduzir vazamento de promptManter Claude em personagem
    Administração e monitoramento
    Visão geral da API de administraçãoAPI de uso e custoAPI de análise do Claude Code
    Console
    Capacidades

    Esforço

    Controle quantos tokens Claude usa ao responder com o parâmetro effort, equilibrando entre a profundidade da resposta e a eficiência de tokens.

    O parâmetro effort permite que você controle o quanto Claude está disposto a gastar tokens ao responder a solicitações. Isso lhe dá a capacidade de equilibrar entre a profundidade da resposta e a eficiência de tokens, tudo com um único modelo.

    O parâmetro effort está atualmente em beta e é suportado apenas por Claude Opus 4.5.

    Você deve incluir o cabeçalho beta effort-2025-11-24 ao usar este recurso.

    Como o esforço funciona

    Por padrão, Claude usa esforço máximo—gastando quantos tokens forem necessários para fornecer respostas completas. Ao reduzir o nível de esforço, você pode instruir Claude a ser mais conservador com o uso de tokens, tratando tokens como um recurso mais caro.

    Definir effort como "high" produz exatamente o mesmo comportamento de omitir o parâmetro effort inteiramente.

    O parâmetro effort afeta todos os tokens na resposta, incluindo:

    • Respostas de texto e explicações
    • Chamadas de ferramentas e argumentos de função
    • Pensamento estendido (quando ativado)

    Níveis de esforço

    NívelDescriçãoCaso de uso típico
    highMáxima profundidade—Claude usa quantos tokens forem necessários. Equivalente a não definir o parâmetro.Análise complexa, explicações detalhadas, conteúdo educacional
    mediumAbordagem equilibrada com economia moderada de tokens.Maioria dos casos de produção, aplicações conscientes de custo
    lowRespostas mais eficientes em tokens.Automação de alto volume, consultas simples, quando respostas são processadas programaticamente

    Uso básico

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.beta.messages.create(
        model="claude-opus-4-5-20251101",
        betas=["effort-2025-11-24"],
        max_tokens=4096,
        messages=[{
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures"
        }],
        output_config={
            "effort": "medium"
        }
    )
    
    print(response.content[0].text)

    Comportamento por nível de esforço

    O parâmetro effort controla principalmente a verbosidade da saída e a profundidade da explicação, não a correção da resposta. Claude realiza raciocínio interno similar independentemente do nível de esforço, mas ajusta quanto desse raciocínio aparece na saída.

    Respostas com baixo esforço

    • Resposta declarada diretamente com explicação mínima
    • Respostas concisas e eficientes (1-2 frases de contexto)
    • Fórmulas mostradas mas não derivadas
    • Assume que o leitor pode verificar a resposta
    • Confirmações tersas para uso de ferramentas ("Pronto.", "Corrigido.")

    Respostas com esforço médio

    • Breve contexto antes da resposta
    • Justificativa concisa com etapas intermediárias principais
    • Pode incluir um exemplo trabalhado
    • Ainda focado em eficiência

    Respostas com alto esforço

    • Estruturado com cabeçalhos de seção
    • Configuração do problema e definições de variáveis
    • Processo de solução passo a passo
    • Verificação e verificações de sanidade
    • Formatação markdown rica

    Casos de uso

    Quando usar baixo esforço

    • Otimização de velocidade: Contagens de tokens mais baixas significam tempos de resposta mais rápidos, benéficos para aplicações sensíveis à latência
    • Pipelines automatizados: Quando respostas são processadas por código em vez de lidas por humanos
    • Aplicações de alto volume: Reduza custos em consultas rotineiras e simples
    • Usuários experientes: Quando usuários não precisam de explicações detalhadas
    • Confirmações rápidas: Respostas simples sim/não ou de status

    Quando usar esforço médio

    • APIs de produção: Equilíbrio de clareza e eficiência de custo
    • Aplicações voltadas para o usuário: Contexto suficiente sem verbosidade excessiva
    • Implantações conscientes de custo: Economias significativas com impacto mínimo na qualidade

    Quando usar alto esforço (ou nenhum parâmetro effort)

    • Análise complexa: Quando a profundidade é crítica
    • Conteúdo educacional: Quando usuários precisam entender o raciocínio
    • Documentação: Quando respostas servem como material de referência
    • Depuração: Quando explicações detalhadas ajudam a identificar problemas

    Esforço com uso de ferramentas

    Ao usar ferramentas, o parâmetro effort afeta tanto as explicações em torno de chamadas de ferramentas quanto as próprias chamadas de ferramentas. Níveis de esforço mais baixos tendem a:

    • Combinar múltiplas operações em menos chamadas de ferramentas
    • Proceder diretamente à ação sem preâmbulo
    • Usar mensagens de confirmação tersas após conclusão

    Níveis de esforço mais altos podem:

    • Explicar o plano antes de tomar ação
    • Fornecer resumos detalhados de mudanças
    • Incluir comentários de código mais abrangentes

    Esforço com pensamento estendido

    O parâmetro effort funciona junto com o orçamento de tokens de pensamento quando o pensamento estendido está ativado. Esses dois controles servem a propósitos diferentes:

    • Parâmetro effort: Controla como Claude gasta todos os tokens—incluindo tokens de pensamento, respostas de texto e chamadas de ferramentas
    • Orçamento de tokens de pensamento: Define um limite máximo em tokens de pensamento especificamente

    O parâmetro effort pode ser usado com ou sem pensamento estendido ativado. Quando ambos estão configurados:

    1. Primeiro determine o nível de esforço apropriado para sua tarefa
    2. Então defina o orçamento de tokens de pensamento com base na complexidade da tarefa

    Para melhor desempenho em tarefas de raciocínio complexo, use alto esforço (o padrão) com um orçamento de tokens de pensamento alto. Isso permite que Claude pense completamente e forneça respostas abrangentes.

    Melhores práticas

    1. Comece com médio: Para a maioria das aplicações, esforço médio fornece um bom equilíbrio de qualidade e eficiência.

    2. Use baixo para automação: Quando respostas são consumidas por código em vez de humanos, baixo esforço pode reduzir significativamente os custos sem afetar a correção.

    3. Teste seu caso de uso: O impacto dos níveis de esforço varia por tipo de tarefa. Avalie o desempenho em seus casos de uso específicos antes de implantar.

    4. Monitore a qualidade: Embora a correção seja geralmente preservada entre níveis de esforço, a qualidade da explicação varia. Certifique-se de que o nível que você escolher atenda às necessidades de seus usuários.

    5. Considere esforço dinâmico: Ajuste o esforço com base na complexidade da tarefa ou preferência do usuário. Consultas simples podem justificar baixo esforço enquanto análise complexa se beneficia de alto esforço.

    • Como o esforço funciona
    • Níveis de esforço
    • Uso básico
    • Comportamento por nível de esforço
    • Respostas com baixo esforço
    • Respostas com esforço médio
    • Respostas com alto esforço
    • Casos de uso
    • Quando usar baixo esforço
    • Quando usar esforço médio
    • Quando usar alto esforço (ou nenhum parâmetro effort)
    • Esforço com uso de ferramentas
    • Esforço com pensamento estendido
    • Melhores práticas

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy