Claude Platform Docs
  • Mensagens
  • Agentes Gerenciados
  • Administração

Search...
⌘K
Casos de uso
Visão geralRoteamento de ticketsAgente de suporte ao clienteModeração de conteúdoResumo jurídico
Engenharia de prompts
Visão geralPráticas recomendadas de promptsPrompts para o Claude Fable 5Prompts para o Claude Opus 4.8Prompts para o Claude Sonnet 5Ferramentas de prompts do Console
Testar e avaliar
Definir sucesso e criar avaliaçõesUsando a Ferramenta de Avaliação no ConsoleReduzindo a latência
Fortalecer proteções
Reduzir alucinaçõesAumentar a consistência das saídasMitigar jailbreaksReduzir vazamento de prompt
Referência
Glossário

Log in
Usando a Ferramenta de Avaliação no Console
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claude Platform Docs

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Claude on Google Cloud

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Práticas recomendadas/Testar e avaliar

Usando a Ferramenta de Avaliação

O Claude Console possui uma ferramenta de Avaliação que permite testar seus prompts em vários cenários.

Acessando o Recurso de Avaliação

Para começar a usar a ferramenta de Avaliação:

  1. Abra o Claude Console e navegue até o editor de prompts.
  2. Depois de compor seu prompt, procure a aba 'Evaluate' na parte superior da tela.

Acessando o Recurso de Avaliação



Certifique-se de que seu prompt inclua pelo menos 1-2 variáveis dinâmicas usando a sintaxe de chaves duplas: {{variable}}. Isso é necessário para criar conjuntos de testes de avaliação.

Gerando Prompts

O Console oferece um gerador de prompts integrado, alimentado pelo Claude Sonnet 4.5:

  1. 1

    Clique em 'Generate Prompt'

    Clicar na ferramenta auxiliar 'Generate Prompt' abrirá um modal que permite inserir as informações da sua tarefa.

  2. 2

    Descreva sua tarefa

    Descreva a tarefa desejada (por exemplo, "Fazer triagem de solicitações de suporte ao cliente recebidas") com o nível de detalhe que preferir. Quanto mais contexto você incluir, mais o Claude poderá adaptar o prompt gerado às suas necessidades específicas.

  3. 3

    Gere seu prompt

    Clicar no botão laranja 'Generate Prompt' na parte inferior fará com que o Claude gere um prompt de alta qualidade para você. Em seguida, você pode aprimorar ainda mais esses prompts usando a tela de Avaliação no Console.

Esse recurso facilita a criação de prompts com a sintaxe de variáveis apropriada para avaliação.

Gerador de Prompts

Criando Casos de Teste

Ao acessar a tela de Avaliação, você tem várias opções para criar casos de teste:

  1. Clique no botão '+ Add Row' no canto inferior esquerdo para adicionar um caso manualmente.
  2. Use o recurso 'Generate Test Case' para que o Claude gere casos de teste automaticamente para você.
  3. Importe casos de teste de um arquivo CSV.

Para usar o recurso 'Generate Test Case':

  1. 1

    Clique em 'Generate Test Case'

    O Claude gerará casos de teste para você, uma linha por vez a cada clique no botão.

  2. 2

    Edite a lógica de geração (opcional)

    Você também pode editar a lógica de geração de casos de teste clicando na seta suspensa à direita do botão 'Generate Test Case' e, em seguida, em 'Show generation logic' na parte superior da janela de Variáveis que aparece. Talvez seja necessário clicar em `Generate' no canto superior direito dessa janela para preencher a lógica de geração inicial.

    Editar isso permite que você personalize e ajuste os casos de teste que o Claude gera com maior precisão e especificidade.

Aqui está um exemplo de uma tela de Avaliação preenchida com vários casos de teste:

Tela de Avaliação Preenchida



Se você atualizar o texto do seu prompt original, poderá executar novamente todo o conjunto de avaliação com o novo prompt para ver como as alterações afetam o desempenho em todos os casos de teste.

Dicas para uma Avaliação Eficaz



Use a ferramenta auxiliar 'Generate a prompt' no Console para criar rapidamente prompts com a sintaxe de variáveis apropriada para avaliação.

Entendendo e comparando resultados

A ferramenta de Avaliação oferece vários recursos para ajudar você a refinar seus prompts:

  1. Comparação lado a lado: Compare as saídas de dois ou mais prompts para ver rapidamente o impacto das suas alterações.
  2. Classificação de qualidade: Classifique a qualidade das respostas em uma escala de 5 pontos para acompanhar melhorias na qualidade das respostas por prompt.
  3. Versionamento de prompts: Crie novas versões do seu prompt e execute novamente o conjunto de testes para iterar rapidamente e melhorar os resultados.

Ao revisar os resultados em todos os casos de teste e comparar diferentes versões de prompts, você pode identificar padrões e fazer ajustes informados no seu prompt com mais eficiência.

Comece a avaliar seus prompts hoje mesmo para criar aplicações de IA mais robustas com o Claude!

Was this page helpful?

  • Acessando o Recurso de Avaliação
  • Gerando Prompts
  • Criando Casos de Teste
  • Dicas para uma Avaliação Eficaz
  • Entendendo e comparando resultados