Loading...
    • 개발자 가이드
    • API 레퍼런스
    • MCP
    • 리소스
    • 릴리스 노트
    Search...
    ⌘K
    시작하기
    Claude 소개빠른 시작
    모델 및 가격
    모델 개요모델 선택Claude 4.6의 새로운 기능마이그레이션 가이드모델 지원 중단가격
    Claude로 구축하기
    기능 개요Messages API 사용중지 사유 처리프롬프트 모범 사례
    컨텍스트 관리
    컨텍스트 윈도우압축컨텍스트 편집
    기능
    프롬프트 캐싱확장 사고적응형 사고노력 수준메시지 스트리밍배치 처리인용다국어 지원토큰 카운팅임베딩비전PDF 지원Files API검색 결과구조화된 출력
    도구
    개요도구 사용 구현 방법세분화된 도구 스트리밍Bash 도구코드 실행 도구프로그래밍 방식 도구 호출컴퓨터 사용 도구텍스트 편집기 도구웹 페치 도구웹 검색 도구메모리 도구도구 검색 도구
    Agent Skills
    개요빠른 시작모범 사례엔터프라이즈용 SkillsAPI로 Skills 사용
    Agent SDK
    개요빠른 시작TypeScript SDKTypeScript V2 (미리보기)Python SDK마이그레이션 가이드
    API에서 MCP
    MCP 커넥터원격 MCP 서버
    서드파티 플랫폼의 Claude
    Amazon BedrockMicrosoft FoundryVertex AI
    프롬프트 엔지니어링
    개요프롬프트 생성기프롬프트 템플릿 사용프롬프트 개선기명확하고 직접적으로 작성예시 사용 (멀티샷 프롬프팅)Claude에게 생각하게 하기 (CoT)XML 태그 사용Claude에게 역할 부여 (시스템 프롬프트)복잡한 프롬프트 연결긴 컨텍스트 팁확장 사고 팁
    테스트 및 평가
    성공 기준 정의테스트 케이스 개발평가 도구 사용지연 시간 줄이기
    가드레일 강화
    환각 줄이기출력 일관성 높이기탈옥 방지스트리밍 거부프롬프트 유출 줄이기Claude 캐릭터 유지
    관리 및 모니터링
    Admin API 개요데이터 상주워크스페이스사용량 및 비용 APIClaude Code Analytics API제로 데이터 보존
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    테스트 및 평가

    평가 도구 사용하기

    Claude Console은 다양한 시나리오에서 프롬프트를 테스트할 수 있는 평가 도구를 제공합니다.

    평가 기능 접근하기

    평가 도구를 시작하려면:

    1. Claude Console을 열고 프롬프트 편집기로 이동합니다.
    2. 프롬프트를 작성한 후, 화면 상단의 '평가' 탭을 찾습니다.

    평가 기능 접근하기

    프롬프트에 이중 중괄호 구문을 사용하는 최소 1-2개의 동적 변수가 포함되어 있는지 확인하세요: {{variable}}. 이는 평가 테스트 세트를 생성하는 데 필요합니다.

    프롬프트 생성하기

    Console은 Claude Opus 4.1로 구동되는 내장 프롬프트 생성기를 제공합니다:

    1. 1

      '프롬프트 생성' 클릭

      '프롬프트 생성' 도우미 도구를 클릭하면 작업 정보를 입력할 수 있는 모달이 열립니다.

    2. 2

      작업 설명하기

      원하는 작업(예: "인바운드 고객 지원 요청 분류")을 원하는 만큼 자세히 또는 간단히 설명하세요. 더 많은 컨텍스트를 포함할수록 Claude가 특정 요구사항에 맞게 생성된 프롬프트를 더 잘 맞춤화할 수 있습니다.

    3. 3

      프롬프트 생성하기

      하단의 주황색 '프롬프트 생성' 버튼을 클릭하면 Claude가 고품질 프롬프트를 생성해 줍니다. 그런 다음 Console의 평가 화면을 사용하여 해당 프롬프트를 더욱 개선할 수 있습니다.

    이 기능을 사용하면 평가에 적합한 변수 구문으로 프롬프트를 더 쉽게 만들 수 있습니다.

    프롬프트 생성기

    테스트 케이스 생성하기

    평가 화면에 접근하면 테스트 케이스를 생성하는 여러 옵션이 있습니다:

    1. 왼쪽 하단의 '+ 행 추가' 버튼을 클릭하여 수동으로 케이스를 추가합니다.
    2. '테스트 케이스 생성' 기능을 사용하여 Claude가 자동으로 테스트 케이스를 생성하도록 합니다.
    3. CSV 파일에서 테스트 케이스를 가져옵니다.

    '테스트 케이스 생성' 기능을 사용하려면:

    1. 1

      '테스트 케이스 생성' 클릭

      Claude가 버튼을 클릭할 때마다 한 번에 한 행씩 테스트 케이스를 생성해 줍니다.

    2. 2

      생성 로직 편집 (선택사항)

      '테스트 케이스 생성' 버튼 오른쪽의 화살표 드롭다운을 클릭한 다음, 팝업되는 변수 창 상단의 '생성 로직 표시'를 클릭하여 테스트 케이스 생성 로직을 편집할 수도 있습니다. 초기 생성 로직을 채우려면 이 창의 오른쪽 상단에서 '생성'을 클릭해야 할 수도 있습니다.

      이를 편집하면 Claude가 생성하는 테스트 케이스를 더 정밀하고 구체적으로 사용자 정의하고 미세 조정할 수 있습니다.

    다음은 여러 테스트 케이스가 채워진 평가 화면의 예시입니다:

    채워진 평가 화면

    원본 프롬프트 텍스트를 업데이트하면 새 프롬프트에 대해 전체 평가 스위트를 다시 실행하여 모든 테스트 케이스에서 변경사항이 성능에 미치는 영향을 확인할 수 있습니다.

    효과적인 평가를 위한 팁

    Console의 '프롬프트 생성' 도우미 도구를 사용하여 평가에 적합한 변수 구문으로 프롬프트를 빠르게 생성하세요.

    결과 이해하고 비교하기

    평가 도구는 프롬프트를 개선하는 데 도움이 되는 여러 기능을 제공합니다:

    1. 나란히 비교: 두 개 이상의 프롬프트 출력을 비교하여 변경사항의 영향을 빠르게 확인합니다.
    2. 품질 등급 매기기: 5점 척도로 응답 품질을 등급 매겨 프롬프트별 응답 품질 개선을 추적합니다.
    3. 프롬프트 버전 관리: 프롬프트의 새 버전을 만들고 테스트 스위트를 다시 실행하여 빠르게 반복하고 결과를 개선합니다.

    테스트 케이스 전반의 결과를 검토하고 다양한 프롬프트 버전을 비교함으로써 패턴을 발견하고 더 효율적으로 프롬프트를 정보에 기반한 조정을 할 수 있습니다.

    Claude와 함께 더 견고한 AI 애플리케이션을 구축하기 위해 오늘부터 프롬프트 평가를 시작하세요!

    Was this page helpful?