• Messages
  • Managed Agents
  • 관리자

Search...
⌘K
사용 사례
개요티켓 라우팅고객 지원 에이전트콘텐츠 조정법률 요약
프롬프트 엔지니어링
개요프롬프트 작성 모범 사례Claude Fable 5 프롬프트 작성Claude Opus 4.8 프롬프트 작성Console 프롬프트 도구
테스트 및 평가
성공 정의 및 평가 빌드Console에서 평가 도구 사용하기지연 시간 줄이기
가드레일 강화
환각 줄이기출력 일관성 높이기탈옥 완화프롬프트 유출 줄이기
레퍼런스
용어집

Log in
Console에서 평가 도구 사용하기
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
모범 사례/테스트 및 평가

평가 도구 사용하기

Claude Console은 다양한 시나리오에서 프롬프트를 테스트할 수 있는 평가 도구를 제공합니다.

평가 기능 접근하기

평가 도구를 시작하려면:

  1. Claude Console을 열고 프롬프트 편집기로 이동하세요.
  2. 프롬프트를 작성한 후, 화면 상단에서 'Evaluate' 탭을 찾으세요.

평가 기능 접근하기



프롬프트에 이중 중괄호 구문({{variable}})을 사용하는 동적 변수가 최소 1~2개 포함되어 있는지 확인하세요. 이는 평가 테스트 세트를 생성하는 데 필요합니다.

프롬프트 생성하기

Console은 Claude Sonnet 4.5로 구동되는 내장 프롬프트 생성기를 제공합니다:

  1. 1

    'Generate Prompt' 클릭

    'Generate Prompt' 도우미 도구를 클릭하면 작업 정보를 입력할 수 있는 모달이 열립니다.

  2. 2

    작업 설명하기

    원하는 작업(예: "수신되는 고객 지원 요청 분류")을 원하는 만큼 자세하게 또는 간략하게 설명하세요. 더 많은 컨텍스트를 포함할수록 Claude가 생성하는 프롬프트를 사용자의 특정 요구 사항에 맞게 조정할 수 있습니다.

  3. 3

    프롬프트 생성하기

    하단의 주황색 'Generate Prompt' 버튼을 클릭하면 Claude가 고품질 프롬프트를 생성합니다. 그런 다음 Console의 평가 화면을 사용하여 해당 프롬프트를 더욱 개선할 수 있습니다.

이 기능을 사용하면 평가에 적합한 변수 구문으로 프롬프트를 더 쉽게 만들 수 있습니다.

프롬프트 생성기

테스트 케이스 생성하기

평가 화면에 접근하면 테스트 케이스를 생성하는 여러 옵션이 있습니다:

  1. 왼쪽 하단의 '+ Add Row' 버튼을 클릭하여 케이스를 수동으로 추가하세요.
  2. 'Generate Test Case' 기능을 사용하여 Claude가 자동으로 테스트 케이스를 생성하도록 하세요.
  3. CSV 파일에서 테스트 케이스를 가져오세요.

'Generate Test Case' 기능을 사용하려면:

  1. 1

    'Generate Test Case' 클릭

    버튼을 클릭할 때마다 Claude가 한 번에 한 행씩 테스트 케이스를 생성합니다.

  2. 2

    생성 로직 편집(선택 사항)

    'Generate Test Case' 버튼 오른쪽의 화살표 드롭다운을 클릭한 다음, 나타나는 Variables 창 상단의 'Show generation logic'을 클릭하여 테스트 케이스 생성 로직을 편집할 수도 있습니다. 초기 생성 로직을 채우려면 이 창의 오른쪽 상단에 있는 `Generate'를 클릭해야 할 수 있습니다.

    이를 편집하면 Claude가 생성하는 테스트 케이스를 더 높은 정밀도와 구체성으로 사용자 정의하고 미세 조정할 수 있습니다.

다음은 여러 테스트 케이스가 채워진 평가 화면의 예입니다:

채워진 평가 화면



원본 프롬프트 텍스트를 업데이트하면 새 프롬프트에 대해 전체 평가 스위트를 다시 실행하여 변경 사항이 모든 테스트 케이스에서 성능에 어떤 영향을 미치는지 확인할 수 있습니다.

효과적인 평가를 위한 팁



Console의 'Generate a prompt' 도우미 도구를 사용하여 평가에 적합한 변수 구문으로 프롬프트를 빠르게 생성하세요.

결과 이해 및 비교하기

평가 도구는 프롬프트를 개선하는 데 도움이 되는 여러 기능을 제공합니다:

  1. 나란히 비교: 두 개 이상의 프롬프트 출력을 비교하여 변경 사항의 영향을 빠르게 확인하세요.
  2. 품질 등급 매기기: 5점 척도로 응답 품질을 평가하여 프롬프트별 응답 품질 개선 사항을 추적하세요.
  3. 프롬프트 버전 관리: 프롬프트의 새 버전을 만들고 테스트 스위트를 다시 실행하여 빠르게 반복하고 결과를 개선하세요.

테스트 케이스 전반에 걸쳐 결과를 검토하고 다양한 프롬프트 버전을 비교함으로써 패턴을 파악하고 프롬프트를 더 효율적으로 조정할 수 있습니다.

지금 바로 프롬프트 평가를 시작하여 Claude로 더욱 강력한 AI 애플리케이션을 구축하세요!

Was this page helpful?

  • 평가 기능 접근하기
  • 프롬프트 생성하기
  • 테스트 케이스 생성하기
  • 효과적인 평가를 위한 팁
  • 결과 이해 및 비교하기