Loading...
  • Разработка
  • Администрирование
  • Модели и цены
  • Клиентские SDK
  • Справочник API
Search...
⌘K
Log in
Использование инструмента оценки в Console
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Разработка/Тестирование и оценка

Использование инструмента оценки

В Claude Console есть инструмент оценки, который позволяет вам тестировать ваши подсказки в различных сценариях.

Доступ к функции оценки

Чтобы начать работу с инструментом оценки:

  1. Откройте Claude Console и перейдите к редактору подсказок.
  2. После написания вашей подсказки найдите вкладку 'Evaluate' в верхней части экрана.

Доступ к функции оценки

Убедитесь, что ваша подсказка включает по крайней мере 1-2 динамические переменные, используя синтаксис двойных скобок: {{variable}}. Это требуется для создания наборов тестов оценки.

Генерация подсказок

Console предлагает встроенный генератор подсказок, работающий на базе Claude Opus 4.1:

  1. 1

    Нажмите 'Generate Prompt'

    Нажатие на вспомогательный инструмент 'Generate Prompt' откроет модальное окно, которое позволит вам ввести информацию о вашей задаче.

  2. 2

    Опишите вашу задачу

    Опишите желаемую задачу (например, "Сортировка входящих запросов поддержки клиентов") с любым уровнем детализации. Чем больше контекста вы включите, тем лучше Claude сможет адаптировать созданную подсказку к вашим конкретным потребностям.

  3. 3

    Создайте вашу подсказку

    Нажатие на оранжевую кнопку 'Generate Prompt' внизу приведет к тому, что Claude создаст высококачественную подсказку для вас. Затем вы можете дополнительно улучшить эти подсказки, используя экран оценки в Console.

Эта функция облегчает создание подсказок с надлежащим синтаксисом переменных для оценки.

Генератор подсказок

Создание тестовых случаев

Когда вы получаете доступ к экрану оценки, у вас есть несколько вариантов для создания тестовых случаев:

  1. Нажмите кнопку '+ Add Row' в нижнем левом углу, чтобы вручную добавить случай.
  2. Используйте функцию 'Generate Test Case', чтобы Claude автоматически создал тестовые случаи для вас.
  3. Импортируйте тестовые случаи из файла CSV.

Чтобы использовать функцию 'Generate Test Case':

  1. 1

    Нажмите на 'Generate Test Case'

    Claude создаст тестовые случаи для вас, по одной строке за раз каждый раз, когда вы нажимаете кнопку.

  2. 2

    Отредактируйте логику генерации (необязательно)

    Вы также можете отредактировать логику генерации тестовых случаев, нажав на стрелку раскрывающегося списка справа от кнопки 'Generate Test Case', а затем на 'Show generation logic' в верхней части появившегося окна переменных. Возможно, вам придется нажать `Generate' в верхнем правом углу этого окна, чтобы заполнить начальную логику генерации.

    Редактирование этого позволяет вам настроить и точно настроить тестовые случаи, которые создает Claude, с большей точностью и специфичностью.

Вот пример заполненного экрана оценки с несколькими тестовыми случаями:

Заполненный экран оценки

Если вы обновите исходный текст вашей подсказки, вы можете повторно запустить весь набор оценок для новой подсказки, чтобы увидеть, как изменения влияют на производительность во всех тестовых случаях.

Советы для эффективной оценки

Используйте вспомогательный инструмент 'Generate a prompt' в Console, чтобы быстро создавать подсказки с надлежащим синтаксисом переменных для оценки.

Понимание и сравнение результатов

Инструмент оценки предлагает несколько функций, которые помогут вам улучшить ваши подсказки:

  1. Сравнение рядом: Сравните выходные данные двух или более подсказок, чтобы быстро увидеть влияние ваших изменений.
  2. Оценка качества: Оцените качество ответа по шкале из 5 баллов, чтобы отслеживать улучшения в качестве ответов для каждой подсказки.
  3. Версионирование подсказок: Создавайте новые версии вашей подсказки и повторно запускайте набор тестов, чтобы быстро выполнять итерации и улучшать результаты.

Просматривая результаты по тестовым случаям и сравнивая различные версии подсказок, вы можете выявить закономерности и более эффективно вносить обоснованные корректировки в вашу подсказку.

Начните оценивать ваши подсказки сегодня, чтобы создавать более надежные приложения на базе Claude!

Was this page helpful?

  • Доступ к функции оценки
  • Генерация подсказок
  • Создание тестовых случаев
  • Советы для эффективной оценки
  • Понимание и сравнение результатов