이 가이드는 조직 전체에서 Agent Skills를 관리해야 하는 엔터프라이즈 관리자와 아키텍트를 위한 것입니다. Skills를 대규모로 검증, 평가, 배포 및 관리하는 방법을 다룹니다. 작성 가이드는 모범 사례를 참조하세요. 아키텍처 세부 사항은 Skills 개요를 참조하세요.
엔터프라이즈에서 Skills를 배포하려면 두 가지 별개의 질문에 답해야 합니다:
배포를 승인하기 전에 각 Skill을 다음 위험 지표에 대해 평가하세요:
| 위험 지표 | 확인 사항 | 우려 수준 |
|---|---|---|
| 코드 실행 | Skill 디렉토리의 스크립트 (*.py, *.sh, *.js) | 높음: 스크립트가 전체 환경 접근 권한으로 실행됨 |
| 지시 조작 | 안전 규칙 무시, 사용자로부터 작업 숨기기, 또는 Claude의 동작을 조건부로 변경하는 지시문 | 높음: 보안 제어를 우회할 수 있음 |
| MCP 서버 참조 | MCP 도구를 참조하는 지시문 (ServerName:tool_name) | 높음: Skill 자체를 넘어 접근 범위를 확장함 |
| 네트워크 접근 패턴 | URL, API 엔드포인트, fetch, curl, 또는 requests 호출 | 높음: 잠재적 데이터 유출 벡터 |
| 하드코딩된 자격 증명 | Skill 파일이나 스크립트의 API 키, 토큰 또는 비밀번호 | 높음: Git 히스토리와 컨텍스트 윈도우에 비밀 정보가 노출됨 |
| 파일 시스템 접근 범위 | Skill 디렉토리 외부 경로, 광범위한 glob 패턴, 경로 탐색 (../) | 중간: 의도하지 않은 데이터에 접근할 수 있음 |
| 도구 호출 | Claude에게 bash, 파일 작업 또는 기타 도구를 사용하도록 지시하는 내용 | 중간: 어떤 작업이 수행되는지 검토 필요 |
서드파티 또는 내부 기여자의 Skill을 배포하기 전에 다음 단계를 완료하세요:
http, requests.get, urllib, curl, fetch)을 검색하세요.신뢰할 수 없는 출처의 Skills를 전체 감사 없이 배포하지 마세요. 악의적인 Skill은 Claude에게 임의의 코드를 실행하거나, 민감한 파일에 접근하거나, 외부로 데이터를 전송하도록 지시할 수 있습니다. Skill 설치를 프로덕션 시스템에 소프트웨어를 설치하는 것과 동일한 엄격함으로 다루세요.
Skills가 잘못 트리거되거나, 다른 Skills와 충돌하거나, 부적절한 지시를 제공하면 에이전트 성능이 저하될 수 있습니다. 프로덕션 배포 전에 평가를 필수로 요구하세요.
Skill을 배포하기 전에 다음 차원에 대한 승인 게이트를 설정하세요:
| 차원 | 측정 대상 | 실패 예시 |
|---|---|---|
| 트리거 정확도 | Skill이 올바른 쿼리에 활성화되고 관련 없는 쿼리에는 비활성 상태를 유지하는가? | 사용자가 단순히 데이터를 논의하고 싶을 때도 모든 스프레드시트 언급에 Skill이 트리거됨 |
| 격리 동작 | Skill이 단독으로 올바르게 작동하는가? | Skill이 디렉토리에 존재하지 않는 파일을 참조함 |
| 공존성 | 이 Skill을 추가하면 다른 Skills가 저하되는가? | 새 Skill의 설명이 너무 광범위하여 기존 Skills의 트리거를 가로챔 |
| 지시 따르기 | Claude가 Skill의 지시를 정확하게 따르는가? | Claude가 검증 단계를 건너뛰거나 잘못된 라이브러리를 사용함 |
| 출력 품질 | Skill이 정확하고 유용한 결과를 생성하는가? | 생성된 보고서에 서식 오류나 누락된 데이터가 있음 |
Skill 작성자에게 Skill당 3-5개의 대표 쿼리가 포함된 평가 스위트를 제출하도록 요구하세요. Skill이 트리거되어야 하는 경우, 트리거되지 않아야 하는 경우, 모호한 엣지 케이스를 포함해야 합니다. Skill 효과는 모델에 따라 다르므로, 조직에서 사용하는 모델(Haiku, Sonnet, Opus) 전반에 걸친 테스트를 요구하세요.
평가 구축에 대한 자세한 가이드는 모범 사례의 평가 및 반복을 참조하세요. 일반적인 평가 방법론은 테스트 케이스 개발을 참조하세요.
평가 결과는 조치가 필요한 시점을 알려줍니다:
계획
반복적이거나, 오류가 발생하기 쉽거나, 전문 지식이 필요한 워크플로를 식별하세요. 이를 조직 역할에 매핑하고 Skills 후보를 결정하세요.
생성 및 검토
테스트
격리 상태(Skill 단독)와 기존 Skills와 함께(공존성 테스트) 평가를 필수로 요구하세요. 프로덕션 승인 전에 활성 Skill 세트 전반에서 트리거 정확도, 출력 품질 및 회귀 부재를 확인하세요.
배포
워크스페이스 전체 접근을 위해 Skills API를 통해 업로드하세요. 업로드 및 버전 관리는 API로 Skills 사용하기를 참조하세요. 내부 레지스트리에 목적, 소유자 및 버전과 함께 Skill을 문서화하세요.
모니터링
사용 패턴을 추적하고 사용자로부터 피드백을 수집하세요. 워크플로와 모델이 발전함에 따라 드리프트나 회귀를 감지하기 위해 주기적으로 평가를 다시 실행하세요. 사용 분석은 현재 Skills API를 통해 제공되지 않습니다. 요청에 포함된 Skills를 추적하기 위해 애플리케이션 수준 로깅을 구현하세요.
반복 또는 폐기
새 버전을 프로모션하기 전에 전체 평가 스위트를 통과하도록 요구하세요. 워크플로가 변경되거나 평가 점수가 하락하면 Skills를 업데이트하세요. 평가가 지속적으로 실패하거나 워크플로가 폐기되면 Skills를 폐기하세요.
일반적인 가이드라인으로, 안정적인 리콜 정확도를 유지하기 위해 동시에 로드되는 Skills 수를 제한하세요. 각 Skill의 메타데이터(이름과 설명)는 시스템 프롬프트에서 주의를 두고 경쟁합니다. 너무 많은 Skills가 활성화되면 Claude가 올바른 Skill을 선택하지 못하거나 관련 Skill을 완전히 놓칠 수 있습니다. Skills를 추가하면서 평가 스위트를 사용하여 리콜 정확도를 측정하고, 성능이 저하되면 추가를 중단하세요.
API 요청은 요청당 최대 8개의 Skills를 지원합니다(API로 Skills 사용하기 참조). 역할에 단일 요청이 지원하는 것보다 더 많은 Skills가 필요한 경우, 좁은 Skills를 더 넓은 것으로 통합하거나 작업 유형에 따라 요청을 다른 Skill 세트로 라우팅하는 것을 고려하세요.
팀이 광범위한 다목적 Skills보다 좁고 워크플로에 특화된 Skills로 시작하도록 권장하세요. 조직 전반에서 패턴이 나타나면 관련 Skills를 역할 기반 번들로 통합하세요.
통합 시점을 결정하기 위해 평가를 사용하세요. 통합된 Skill의 평가가 대체하는 개별 Skills와 동등한 성능을 확인한 경우에만 좁은 Skills를 더 넓은 것으로 병합하세요.
진행 예시:
formatting-sales-reports, querying-pipeline-data, updating-crm-recordssales-operations (평가가 동등한 성능을 확인한 경우)조직 전체에서 일관된 명명 규칙을 사용하세요. 모범 사례의 명명 규칙 섹션에서 서식 가이드를 제공합니다.
각 Skill에 대해 내부 레지스트리를 유지하세요:
각 사용자의 활성 Skill 세트를 집중시키기 위해 조직 역할별로 Skills를 그룹화하세요:
각 역할 기반 번들에는 해당 역할의 일상 워크플로와 관련된 Skills만 포함되어야 합니다.
히스토리 추적, 풀 리퀘스트를 통한 코드 리뷰, 롤백 기능을 위해 Skill 디렉토리를 Git에 저장하세요. 각 Skill 디렉토리(SKILL.md 및 번들된 파일 포함)는 자연스럽게 Git 추적 폴더에 매핑됩니다.
Skills API는 워크스페이스 범위의 배포를 제공합니다. API를 통해 업로드된 Skills는 모든 워크스페이스 멤버가 사용할 수 있습니다. 업로드, 버전 관리 및 관리 엔드포인트는 API로 Skills 사용하기를 참조하세요.
커스텀 Skills는 서피스 간에 동기화되지 않습니다. API에 업로드된 Skills는 claude.ai나 Claude Code에서 사용할 수 없으며, 그 반대도 마찬가지입니다. 각 서피스는 별도의 업로드와 관리가 필요합니다.
Git에 Skill 소스 파일을 단일 진실 소스로 유지하세요. 조직이 여러 서피스에 Skills를 배포하는 경우, 일관성을 유지하기 위해 자체 동기화 프로세스를 구현하세요. 전체 세부 사항은 크로스 서피스 가용성을 참조하세요.
아키텍처 및 플랫폼 세부 사항
Skill 작성자를 위한 작성 가이드
프로그래밍 방식으로 Skills 업로드 및 관리
에이전트 배포를 위한 보안 패턴
Was this page helpful?