このガイドは、組織全体でAgent Skillsを管理する必要があるエンタープライズ管理者およびアーキテクト向けです。スキルの審査、評価、デプロイ、および大規模な管理方法について説明します。オーサリングガイダンスについては、ベストプラクティスを参照してください。アーキテクチャの詳細については、スキル概要を参照してください。
エンタープライズでスキルをデプロイするには、2つの異なる質問に答える必要があります:
デプロイを承認する前に、各スキルをこれらのリスク指標に対して評価してください:
| リスク指標 | 確認すべき事項 | 懸念レベル |
|---|---|---|
| コード実行 | スキルディレクトリ内のスクリプト(*.py、*.sh、*.js) | 高:スクリプトは完全な環境アクセスで実行される |
| 指示の操作 | 安全ルールを無視する、ユーザーからアクションを隠す、またはClaudeの動作を条件付きで変更する指示 | 高:セキュリティコントロールをバイパスする可能性がある |
| MCPサーバー参照 | MCPツールを参照する指示(ServerName:tool_name) | 高:スキル自体を超えてアクセスを拡張する |
| ネットワークアクセスパターン | URL、APIエンドポイント、fetch、curl、またはrequests呼び出し | 高:データ流出の潜在的なベクトル |
| ハードコードされた認証情報 | スキルファイルまたはスクリプト内のAPIキー、トークン、またはパスワード | 高:Git履歴とコンテキストウィンドウにシークレットが露出する |
| ファイルシステムアクセス範囲 | スキルディレクトリ外のパス、広範なglobパターン、パストラバーサル(../) | 中:意図しないデータにアクセスする可能性がある |
| ツール呼び出し | Claudeにbash、ファイル操作、またはその他のツールを使用するよう指示する指示 | 中:どのような操作が実行されるかを確認する |
サードパーティまたは内部の貢献者からのスキルをデプロイする前に、以下の手順を完了してください:
http、requests.get、urllib、curl、fetch)を検索する。信頼できないソースからのスキルは、完全な監査なしにデプロイしないでください。悪意のあるスキルは、Claudeに任意のコードの実行、機密ファイルへのアクセス、または外部へのデータ送信を指示する可能性があります。スキルのインストールは、本番システムへのソフトウェアインストールと同じ厳格さで扱ってください。
スキルが誤ってトリガーされたり、他のスキルと競合したり、不適切な指示を提供したりすると、エージェントのパフォーマンスが低下する可能性があります。本番デプロイの前に評価を必須としてください。
スキルをデプロイする前に、以下の次元に対する承認ゲートを設定してください:
| 次元 | 測定内容 | 失敗例 |
|---|---|---|
| トリガー精度 | スキルが適切なクエリに対してアクティブになり、無関係なクエリに対しては非アクティブのままか? | ユーザーがデータについて議論したいだけなのに、スプレッドシートに関するすべての言及でスキルがトリガーされる |
| 分離動作 | スキルが単独で正しく動作するか? | スキルがディレクトリに存在しないファイルを参照している |
| 共存 | このスキルを追加すると他のスキルが劣化するか? | 新しいスキルの説明が広すぎて、既存のスキルからトリガーを奪っている |
| 指示遵守 | Claudeがスキルの指示に正確に従うか? | Claudeがバリデーションステップをスキップしたり、間違ったライブラリを使用したりする |
| 出力品質 | スキルが正確で有用な結果を生成するか? | 生成されたレポートにフォーマットエラーやデータの欠落がある |
スキル作成者に、スキルごとに3〜5の代表的なクエリを含む評価スイートの提出を求めてください。スキルがトリガーされるべきケース、トリガーされるべきでないケース、および曖昧なエッジケースをカバーするものです。スキルの有効性はモデルによって異なるため、組織で使用しているモデル(Haiku、Sonnet、Opus)全体でのテストを必須としてください。
評価の構築に関する詳細なガイダンスについては、ベストプラクティスの評価とイテレーションを参照してください。一般的な評価方法論については、テストケースの開発を参照してください。
評価結果は、いつ行動すべきかを示します:
計画
反復的、エラーが発生しやすい、または専門知識を必要とするワークフローを特定します。これらを組織の役割にマッピングし、スキルの候補となるものを決定します。
作成とレビュー
スキル作成者がベストプラクティスに従っていることを確認します。上記のレビューチェックリストを使用したセキュリティレビューを必須とします。承認前に評価スイートを必須とします。職務の分離を確立します:スキル作成者は自身のレビュアーであるべきではありません。
テスト
分離状態(スキル単独)および既存のスキルと並行した状態(共存テスト)での評価を必須とします。本番承認前に、アクティブなスキルセット全体でトリガー精度、出力品質、およびリグレッションの不在を確認します。
デプロイ
ワークスペース全体のアクセスのためにSkills APIを介してアップロードします。アップロードとバージョン管理については、APIでのスキルの使用を参照してください。目的、オーナー、およびバージョンとともに内部レジストリにスキルを文書化します。
監視
使用パターンを追跡し、ユーザーからのフィードバックを収集します。ワークフローやモデルの進化に伴うドリフトやリグレッションを検出するために、定期的に評価を再実行します。使用状況分析は現在Skills APIでは利用できません。リクエストに含まれるスキルを追跡するために、アプリケーションレベルのロギングを実装してください。
イテレーションまたは廃止
新しいバージョンを昇格させる前に、完全な評価スイートの合格を必須とします。ワークフローが変更されたり評価スコアが低下したりした場合にスキルを更新します。評価が一貫して失敗する場合やワークフローが廃止された場合にスキルを廃止します。
一般的なガイドラインとして、信頼性の高いリコール精度を維持するために、同時にロードされるスキルの数を制限してください。各スキルのメタデータ(名前と説明)は、システムプロンプト内で注意を競い合います。アクティブなスキルが多すぎると、Claudeが適切なスキルを選択できなかったり、関連するスキルを完全に見逃したりする可能性があります。スキルを追加する際にリコール精度を測定するために評価スイートを使用し、パフォーマンスが低下したら追加を停止してください。
APIリクエストはリクエストごとに最大8つのスキルをサポートしていることに注意してください(APIでのスキルの使用を参照)。役割が単一のリクエストでサポートされるよりも多くのスキルを必要とする場合は、狭いスキルをより広いスキルに統合するか、タスクタイプに基づいてリクエストを異なるスキルセットにルーティングすることを検討してください。
チームには、広範で多目的なスキルではなく、狭いワークフロー固有のスキルから始めることを推奨してください。組織全体でパターンが見えてきたら、関連するスキルを役割ベースのバンドルに統合します。
統合のタイミングを決定するために評価を使用してください。統合されたスキルの評価が、置き換える個々のスキルと同等のパフォーマンスを確認した場合にのみ、狭いスキルをより広いスキルにマージしてください。
進行例:
formatting-sales-reports、querying-pipeline-data、updating-crm-recordssales-operations(評価が同等のパフォーマンスを確認した場合)組織全体で一貫した命名規則を使用してください。ベストプラクティスの命名規則セクションにフォーマットのガイダンスがあります。
各スキルの内部レジストリを以下の情報で維持してください:
各ユーザーのアクティブなスキルセットを集中させるために、組織の役割ごとにスキルをグループ化してください:
各役割ベースのバンドルには、その役割の日常ワークフローに関連するスキルのみを含めるべきです。
履歴追跡、プルリクエストによるコードレビュー、およびロールバック機能のために、スキルディレクトリをGitに保存してください。各スキルディレクトリ(SKILL.mdとバンドルされたファイルを含む)は、Git追跡フォルダに自然にマッピングされます。
Skills APIはワークスペーススコープの配布を提供します。APIを介してアップロードされたスキルは、すべてのワークスペースメンバーが利用できます。アップロード、バージョニング、および管理エンドポイントについては、APIでのスキルの使用を参照してください。
カスタムスキルはサーフェス間で同期されません。APIにアップロードされたスキルはclaude.aiやClaude Codeでは利用できず、その逆も同様です。各サーフェスには個別のアップロードと管理が必要です。
Gitのスキルソースファイルを唯一の信頼できるソースとして維持してください。組織が複数のサーフェスにスキルをデプロイする場合、一貫性を保つために独自の同期プロセスを実装してください。詳細については、クロスサーフェスの可用性を参照してください。
アーキテクチャとプラットフォームの詳細
スキル作成者向けのオーサリングガイダンス
プログラムによるスキルのアップロードと管理
エージェントデプロイのセキュリティパターン
Was this page helpful?