Loading...
    • 개발자 가이드
    • API 참조
    • MCP
    • 리소스
    • 릴리스 노트
    Search...
    ⌘K
    첫 단계
    Claude 소개빠른 시작
    모델 및 가격
    모델 개요모델 선택Claude 4.5의 새로운 기능Claude 4.5로 마이그레이션모델 지원 중단가격
    Claude로 빌드
    기능 개요Messages API 사용컨텍스트 윈도우프롬프팅 모범 사례
    기능
    프롬프트 캐싱컨텍스트 편집Extended thinking노력메시지 스트리밍배치 처리인용다국어 지원토큰 계산임베딩비전PDF 지원Files API검색 결과구조화된 출력Google Sheets 애드온
    도구
    개요도구 사용 구현 방법토큰 효율적인 도구 사용세분화된 도구 스트리밍Bash 도구코드 실행 도구프로그래밍 방식 도구 호출컴퓨터 사용 도구텍스트 편집기 도구웹 페치 도구웹 검색 도구메모리 도구도구 검색 도구
    Agent Skills
    개요빠른 시작모범 사례API와 함께 Skills 사용
    Agent SDK
    개요TypeScript SDKPython SDK마이그레이션 가이드
    가이드
    스트리밍 입력권한 처리세션 관리SDK의 구조화된 출력Agent SDK 호스팅시스템 프롬프트 수정SDK의 MCP사용자 정의 도구SDK의 서브에이전트SDK의 슬래시 명령SDK의 Agent Skills비용 및 사용량 추적할 일 목록SDK의 플러그인
    API의 MCP
    MCP 커넥터원격 MCP 서버
    타사 플랫폼의 Claude
    Amazon BedrockMicrosoft FoundryVertex AI
    프롬프트 엔지니어링
    개요프롬프트 생성기프롬프트 템플릿 사용프롬프트 개선기명확하고 직접적으로예제 사용 (다중 샷 프롬프팅)Claude가 생각하도록 하기 (CoT)XML 태그 사용Claude에게 역할 부여 (시스템 프롬프트)Claude의 응답 미리 채우기복잡한 프롬프트 연결긴 컨텍스트 팁Extended thinking 팁
    테스트 및 평가
    성공 기준 정의테스트 케이스 개발평가 도구 사용지연 시간 감소
    보안 강화
    환각 감소출력 일관성 증가탈옥 완화스트리밍 거부프롬프트 유출 감소Claude 캐릭터 유지
    관리 및 모니터링
    Admin API 개요사용량 및 비용 APIClaude Code Analytics API
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    테스트 및 평가

    평가 도구 사용하기

    Claude Console은 다양한 시나리오에서 프롬프트를 테스트할 수 있는 평가 도구를 제공합니다.

    평가 기능 접근하기

    평가 도구를 시작하려면:

    1. Claude Console을 열고 프롬프트 편집기로 이동합니다.
    2. 프롬프트를 작성한 후, 화면 상단의 '평가' 탭을 찾습니다.

    평가 기능 접근하기

    프롬프트에 이중 중괄호 구문을 사용하는 최소 1-2개의 동적 변수가 포함되어 있는지 확인하세요: {{variable}}. 이는 평가 테스트 세트를 생성하는 데 필요합니다.

    프롬프트 생성하기

    Console은 Claude Opus 4.1로 구동되는 내장 프롬프트 생성기를 제공합니다:

    1. 1

      '프롬프트 생성' 클릭

      '프롬프트 생성' 도우미 도구를 클릭하면 작업 정보를 입력할 수 있는 모달이 열립니다.

    2. 2

      작업 설명하기

      원하는 작업(예: "인바운드 고객 지원 요청 분류")을 원하는 만큼 자세히 또는 간단히 설명하세요. 더 많은 컨텍스트를 포함할수록 Claude가 특정 요구사항에 맞게 생성된 프롬프트를 더 잘 맞춤화할 수 있습니다.

    3. 3

      프롬프트 생성하기

      하단의 주황색 '프롬프트 생성' 버튼을 클릭하면 Claude가 고품질 프롬프트를 생성해 줍니다. 그런 다음 Console의 평가 화면을 사용하여 해당 프롬프트를 더욱 개선할 수 있습니다.

    이 기능을 사용하면 평가에 적합한 변수 구문으로 프롬프트를 더 쉽게 만들 수 있습니다.

    프롬프트 생성기

    테스트 케이스 생성하기

    평가 화면에 접근하면 테스트 케이스를 생성하는 여러 옵션이 있습니다:

    1. 왼쪽 하단의 '+ 행 추가' 버튼을 클릭하여 수동으로 케이스를 추가합니다.
    2. '테스트 케이스 생성' 기능을 사용하여 Claude가 자동으로 테스트 케이스를 생성하도록 합니다.
    3. CSV 파일에서 테스트 케이스를 가져옵니다.

    '테스트 케이스 생성' 기능을 사용하려면:

    1. 1

      '테스트 케이스 생성' 클릭

      Claude가 버튼을 클릭할 때마다 한 번에 한 행씩 테스트 케이스를 생성해 줍니다.

    2. 2

      생성 로직 편집 (선택사항)

      '테스트 케이스 생성' 버튼 오른쪽의 화살표 드롭다운을 클릭한 다음, 팝업되는 변수 창 상단의 '생성 로직 표시'를 클릭하여 테스트 케이스 생성 로직을 편집할 수도 있습니다. 초기 생성 로직을 채우려면 이 창의 오른쪽 상단에서 '생성'을 클릭해야 할 수도 있습니다.

      이를 편집하면 Claude가 생성하는 테스트 케이스를 더 정밀하고 구체적으로 사용자 정의하고 미세 조정할 수 있습니다.

    다음은 여러 테스트 케이스가 채워진 평가 화면의 예시입니다:

    채워진 평가 화면

    원본 프롬프트 텍스트를 업데이트하면 새 프롬프트에 대해 전체 평가 스위트를 다시 실행하여 모든 테스트 케이스에서 변경사항이 성능에 미치는 영향을 확인할 수 있습니다.

    효과적인 평가를 위한 팁

    Console의 '프롬프트 생성' 도우미 도구를 사용하여 평가에 적합한 변수 구문으로 프롬프트를 빠르게 생성하세요.

    결과 이해하고 비교하기

    평가 도구는 프롬프트를 개선하는 데 도움이 되는 여러 기능을 제공합니다:

    1. 나란히 비교: 두 개 이상의 프롬프트 출력을 비교하여 변경사항의 영향을 빠르게 확인합니다.
    2. 품질 등급 매기기: 5점 척도로 응답 품질을 등급 매겨 프롬프트별 응답 품질 개선을 추적합니다.
    3. 프롬프트 버전 관리: 프롬프트의 새 버전을 만들고 테스트 스위트를 다시 실행하여 빠르게 반복하고 결과를 개선합니다.

    테스트 케이스 전반의 결과를 검토하고 다양한 프롬프트 버전을 비교함으로써 패턴을 발견하고 더 효율적으로 프롬프트를 정보에 기반한 조정을 할 수 있습니다.

    Claude와 함께 더 견고한 AI 애플리케이션을 구축하기 위해 오늘부터 프롬프트 평가를 시작하세요!