• Сообщения
  • Управляемые агенты
  • Администрирование

Search...
⌘K
Сценарии использования
ОбзорМаршрутизация заявокАгент поддержки клиентовМодерация контентаЮридическое резюмирование
Инженерия подсказок
ОбзорРекомендации по составлению подсказокПодсказки для Claude Fable 5Подсказки для Claude Opus 4.8Инструменты для подсказок в Консоли
Тестирование и оценка
Определение успеха и создание оценокИспользование инструмента оценки в КонсолиСнижение задержки
Усиление защитных механизмов
Снижение галлюцинацийПовышение согласованности выводаПредотвращение джейлбрейковСнижение утечки подсказок
Справочник
Глоссарий

Log in
Использование инструмента оценки в Консоли
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Рекомендации/Тестирование и оценка

Использование инструмента оценки

В Claude Console есть инструмент оценки, который позволяет тестировать ваши подсказки в различных сценариях.

Доступ к функции оценки

Чтобы начать работу с инструментом оценки:

  1. Откройте Claude Console и перейдите к редактору подсказок.
  2. После составления подсказки найдите вкладку «Evaluate» в верхней части экрана.

Доступ к функции оценки



Убедитесь, что ваша подсказка включает хотя бы 1–2 динамические переменные, использующие синтаксис двойных фигурных скобок: {{variable}}. Это необходимо для создания наборов тестов оценки.

Генерация подсказок

Console предлагает встроенный генератор подсказок на базе Claude Sonnet 4.5:

  1. 1

    Нажмите «Generate Prompt»

    Нажатие на вспомогательный инструмент «Generate Prompt» откроет модальное окно, в котором вы сможете ввести информацию о вашей задаче.

  2. 2

    Опишите вашу задачу

    Опишите желаемую задачу (например, «Сортировка входящих запросов в службу поддержки клиентов») с любым уровнем детализации. Чем больше контекста вы включите, тем точнее Claude сможет адаптировать сгенерированную подсказку под ваши конкретные потребности.

  3. 3

    Сгенерируйте подсказку

    Нажатие на оранжевую кнопку «Generate Prompt» внизу приведёт к тому, что Claude сгенерирует для вас высококачественную подсказку. Затем вы можете дополнительно улучшить эти подсказки, используя экран оценки в Console.

Эта функция упрощает создание подсказок с правильным синтаксисом переменных для оценки.

Генератор подсказок

Создание тестовых случаев

При переходе на экран оценки у вас есть несколько вариантов создания тестовых случаев:

  1. Нажмите кнопку «+ Add Row» в нижнем левом углу, чтобы добавить случай вручную.
  2. Используйте функцию «Generate Test Case», чтобы Claude автоматически сгенерировал тестовые случаи для вас.
  3. Импортируйте тестовые случаи из CSV-файла.

Чтобы использовать функцию «Generate Test Case»:

  1. 1

    Нажмите «Generate Test Case»

    Claude будет генерировать тестовые случаи для вас — по одной строке при каждом нажатии кнопки.

  2. 2

    Отредактируйте логику генерации (необязательно)

    Вы также можете отредактировать логику генерации тестовых случаев, нажав на стрелку раскрывающегося списка справа от кнопки «Generate Test Case», а затем на «Show generation logic» в верхней части появившегося окна Variables. Возможно, вам потребуется нажать «Generate» в правом верхнем углу этого окна, чтобы заполнить начальную логику генерации.

    Редактирование этой логики позволяет настраивать и точнее контролировать тестовые случаи, которые генерирует Claude, добиваясь большей точности и специфичности.

Вот пример заполненного экрана оценки с несколькими тестовыми случаями:

Заполненный экран оценки



Если вы обновите исходный текст подсказки, вы можете повторно запустить весь набор оценок для новой подсказки, чтобы увидеть, как изменения влияют на производительность во всех тестовых случаях.

Советы по эффективной оценке



Используйте вспомогательный инструмент «Generate a prompt» в Console, чтобы быстро создавать подсказки с правильным синтаксисом переменных для оценки.

Понимание и сравнение результатов

Инструмент оценки предлагает несколько функций, которые помогут вам улучшить ваши подсказки:

  1. Сравнение бок о бок: сравнивайте выходные данные двух или более подсказок, чтобы быстро увидеть влияние ваших изменений.
  2. Оценка качества: оценивайте качество ответов по 5-балльной шкале, чтобы отслеживать улучшения качества ответов для каждой подсказки.
  3. Версионирование подсказок: создавайте новые версии вашей подсказки и повторно запускайте набор тестов, чтобы быстро итерировать и улучшать результаты.

Просматривая результаты по тестовым случаям и сравнивая разные версии подсказок, вы сможете выявлять закономерности и более эффективно вносить обоснованные корректировки в свою подсказку.

Начните оценивать свои подсказки уже сегодня, чтобы создавать более надёжные ИИ-приложения с Claude!

Was this page helpful?

  • Доступ к функции оценки
  • Генерация подсказок
  • Создание тестовых случаев
  • Советы по эффективной оценке
  • Понимание и сравнение результатов