このガイドは、組織全体でAgent Skillsを管理する必要があるエンタープライズ管理者およびアーキテクト向けです。スキルを大規模に審査、評価、展開、管理する方法について説明します。作成に関するガイダンスについては、ベストプラクティスを参照してください。アーキテクチャの詳細については、スキルの概要を参照してください。
エンタープライズでスキルを展開するには、2つの異なる問いに答える必要があります。
展開を承認する前に、各スキルを以下のリスク指標に照らして評価してください。
| リスク指標 | 確認すべき内容 | 懸念レベル |
|---|---|---|
| コード実行 | スキルディレクトリ内のスクリプト(*.py、*.sh、*.js) | 高:スクリプトは環境への完全なアクセス権で実行されます |
| 指示の操作 | 安全ルールを無視する、ユーザーからアクションを隠す、または条件付きでClaudeの動作を変更するよう指示するディレクティブ | 高:セキュリティ制御を回避する可能性があります |
| MCPサーバー参照 | MCPツールを参照する指示(ServerName:tool_name) | 高:スキル自体を超えてアクセスを拡張します |
| ネットワークアクセスパターン | URL、APIエンドポイント、fetch、curl、またはrequests呼び出し | 高:データ流出の潜在的な経路 |
| ハードコードされた認証情報 | スキルファイルまたはスクリプト内のAPIキー、トークン、またはパスワード | 高:Git履歴およびコンテキストウィンドウでシークレットが露出します |
| ファイルシステムアクセス範囲 | スキルディレクトリ外のパス、広範なglobパターン、パストラバーサル(../) | 中:意図しないデータにアクセスする可能性があります |
| ツール呼び出し | Claudeにbash、ファイル操作、またはその他のツールを使用するよう指示する内容 | 中:どのような操作が実行されるかを確認してください |
サードパーティまたは社内コントリビューターからのスキルを展開する前に、以下の手順を完了してください。
http、requests.get、urllib、curl、fetch)を検索します。信頼できないソースからのスキルを完全な監査なしに展開しないでください。悪意のあるスキルは、Claudeに任意のコードを実行させたり、機密ファイルにアクセスさせたり、データを外部に送信させたりする可能性があります。スキルのインストールは、本番システムへのソフトウェアのインストールと同じ厳格さで扱ってください。
スキルが誤ってトリガーされたり、他のスキルと競合したり、不適切な指示を提供したりすると、エージェントのパフォーマンスが低下する可能性があります。本番展開の前に必ず評価を実施してください。
スキルを展開する前に、以下の観点について承認ゲートを設けてください。
| 観点 | 測定内容 | 失敗例 |
|---|---|---|
| トリガー精度 | スキルは適切なクエリに対してアクティブになり、無関係なクエリに対しては非アクティブのままか? | ユーザーが単にデータについて話したいだけの場合でも、スプレッドシートに言及するたびにスキルがトリガーされる |
| 単独動作 | スキルは単独で正しく動作するか? | スキルがディレクトリに存在しないファイルを参照する |
| 共存性 | このスキルを追加すると他のスキルが劣化するか? | 新しいスキルの説明が広すぎて、既存のスキルからトリガーを奪う |
| 指示の遵守 | Claudeはスキルの指示に正確に従うか? | Claudeが検証ステップをスキップしたり、間違ったライブラリを使用したりする |
| 出力品質 | スキルは正確で有用な結果を生成するか? | 生成されたレポートにフォーマットエラーやデータの欠落がある |
スキル作成者に、スキルごとに3〜5個の代表的なクエリを含む評価スイートの提出を求めてください。これには、スキルがトリガーされるべきケース、トリガーされるべきでないケース、および曖昧なエッジケースを含めます。スキルの有効性はモデルによって異なるため、組織で使用しているモデル(Haiku、Sonnet、Opus)全体でのテストを求めてください。
評価の構築に関する詳細なガイダンスについては、ベストプラクティスの評価と反復を参照してください。一般的な評価方法論については、テストケースの開発を参照してください。
評価結果は、いつ対応すべきかを示します。
計画
反復的、エラーが発生しやすい、または専門知識を必要とするワークフローを特定します。これらを組織の役割にマッピングし、どれがスキルの候補となるかを判断します。
作成とレビュー
スキル作成者がベストプラクティスに従っていることを確認します。上記のレビューチェックリストを使用したセキュリティレビューを必須とします。承認前に評価スイートを必須とします。職務分離を確立してください。スキル作成者が自身のレビュアーになるべきではありません。
テスト
単独での評価(スキル単体)と既存のスキルと並行した評価(共存テスト)を必須とします。本番承認前に、トリガー精度、出力品質、およびアクティブなスキルセット全体でのリグレッションがないことを確認します。
展開
ワークスペース全体でのアクセスのためにSkills API経由でアップロードします。アップロードとバージョン管理については、APIでのスキルの使用を参照してください。目的、所有者、バージョンとともに、スキルを内部レジストリに文書化します。
監視
使用パターンを追跡し、ユーザーからフィードバックを収集します。ワークフローやモデルの進化に伴うドリフトやリグレッションを検出するために、定期的に評価を再実行します。使用状況分析は現在Skills API経由では利用できません。どのスキルがリクエストに含まれているかを追跡するために、アプリケーションレベルのロギングを実装してください。
反復または廃止
新しいバージョンを昇格する前に、完全な評価スイートの合格を必須とします。ワークフローが変更された場合や評価スコアが低下した場合は、スキルを更新します。評価が一貫して失敗する場合やワークフローが廃止された場合は、スキルを廃止します。
一般的なガイドラインとして、信頼性の高いリコール精度を維持するために、同時にロードするスキルの数を制限してください。各スキルのメタデータ(名前と説明)は、システムプロンプト内で注意を奪い合います。アクティブなスキルが多すぎると、Claudeが適切なスキルを選択できなかったり、関連するスキルを完全に見逃したりする可能性があります。スキルを追加する際は評価スイートを使用してリコール精度を測定し、パフォーマンスが低下したら追加を停止してください。
APIリクエストは、リクエストごとに最大8個のスキルをサポートしていることに注意してください(APIでのスキルの使用を参照)。ある役割が単一のリクエストでサポートされる数より多くのスキルを必要とする場合は、狭いスキルをより広いスキルに統合するか、タスクタイプに基づいてリクエストを異なるスキルセットにルーティングすることを検討してください。
チームには、広範で多目的なスキルではなく、狭くワークフローに特化したスキルから始めることを推奨してください。組織全体でパターンが明らかになったら、関連するスキルを役割ベースのバンドルに統合します。
いつ統合するかを判断するために評価を使用してください。統合されたスキルの評価が、置き換える個々のスキルと同等のパフォーマンスを確認できた場合にのみ、狭いスキルをより広いスキルにマージしてください。
進行例:
formatting-sales-reports、querying-pipeline-data、updating-crm-recordssales-operations(評価で同等のパフォーマンスが確認された場合)組織全体で一貫した命名規則を使用してください。ベストプラクティスの命名規則セクションでフォーマットのガイダンスを提供しています。
各スキルについて、以下を含む内部レジストリを維持してください。
各ユーザーのアクティブなスキルセットを集中させるために、組織の役割ごとにスキルをグループ化します。
各役割ベースのバンドルには、その役割の日常的なワークフローに関連するスキルのみを含めるべきです。
履歴追跡、プルリクエストによるコードレビュー、およびロールバック機能のために、スキルディレクトリをGitに保存します。各スキルディレクトリ(SKILL.mdとバンドルされたファイルを含む)は、Gitで追跡されるフォルダに自然にマッピングされます。
Skills APIは、ワークスペースをスコープとした配布を提供します。API経由でアップロードされたスキルは、すべてのワークスペースメンバーが利用できます。アップロード、バージョニング、および管理エンドポイントについては、APIでのスキルの使用を参照してください。
カスタムスキルはサーフェス間で同期されません。APIにアップロードされたスキルは、claude.aiやClaude Codeでは利用できず、その逆も同様です。各サーフェスは個別のアップロードと管理が必要です。
スキルのソースファイルを唯一の信頼できる情報源としてGitで維持してください。組織が複数のサーフェスにスキルを展開する場合は、それらの一貫性を保つために独自の同期プロセスを実装してください。詳細については、サーフェス間の可用性を参照してください。
Was this page helpful?