Agent Skills

エンタープライズ向けスキル

エンタープライズ規模でAgent Skillsをデプロイするためのガバナンス、セキュリティレビュー、評価、および組織的ガイダンス。

このガイドは、組織全体でAgent Skillsを管理する必要があるエンタープライズ管理者およびアーキテクト向けです。スキルの審査、評価、デプロイ、および大規模な管理方法について説明します。オーサリングガイダンスについては、ベストプラクティスを参照してください。アーキテクチャの詳細については、スキル概要を参照してください。

セキュリティレビューと審査

エンタープライズでスキルをデプロイするには、2つの異なる質問に答える必要があります：

スキルは一般的に安全か？ プラットフォームレベルのセキュリティの詳細については、概要のセキュリティに関する考慮事項セクションを参照してください。
特定のスキルをどのように審査するか？ 以下のリスク評価とレビューチェックリストを使用してください。

リスクティア評価

デプロイを承認する前に、各スキルをこれらのリスク指標に対して評価してください：

リスク指標	確認すべき事項	懸念レベル
コード実行	スキルディレクトリ内のスクリプト（`.py`、`.sh`、`*.js`）	高：スクリプトは完全な環境アクセスで実行される
指示の操作	安全ルールを無視する、ユーザーからアクションを隠す、またはClaudeの動作を条件付きで変更する指示	高：セキュリティコントロールをバイパスする可能性がある
MCPサーバー参照	MCPツールを参照する指示（`ServerName:tool_name`）	高：スキル自体を超えてアクセスを拡張する
ネットワークアクセスパターン	URL、APIエンドポイント、`fetch`、`curl`、または`requests`呼び出し	高：データ流出の潜在的なベクトル
ハードコードされた認証情報	スキルファイルまたはスクリプト内のAPIキー、トークン、またはパスワード	高：Git履歴とコンテキストウィンドウにシークレットが露出する
ファイルシステムアクセス範囲	スキルディレクトリ外のパス、広範なglobパターン、パストラバーサル（`../`）	中：意図しないデータにアクセスする可能性がある
ツール呼び出し	Claudeにbash、ファイル操作、またはその他のツールを使用するよう指示する指示	中：どのような操作が実行されるかを確認する

レビューチェックリスト

サードパーティまたは内部の貢献者からのスキルをデプロイする前に、以下の手順を完了してください：

すべてのスキルディレクトリの内容を読む。 SKILL.md、参照されているすべてのマークダウンファイル、およびバンドルされたスクリプトやリソースを確認する。
スクリプトの動作が記載された目的と一致することを確認する。 サンドボックス環境でスクリプトを実行し、出力がスキルの説明と一致することを確認する。
敵対的な指示がないか確認する。 Claudeに安全ルールを無視する、ユーザーからアクションを隠す、レスポンスを通じてデータを流出させる、または特定の入力に基づいて動作を変更するよう指示する指示を探す。
外部URLフェッチまたはネットワーク呼び出しを確認する。 スクリプトと指示でネットワークアクセスパターン（http、requests.get、urllib、curl、fetch）を検索する。
ハードコードされた認証情報がないことを確認する。 スキルファイル内のAPIキー、トークン、またはパスワードを確認する。認証情報は環境変数またはセキュアな認証情報ストアを使用すべきであり、スキルコンテンツに含めてはならない。
スキルがClaudeに呼び出すよう指示するツールとコマンドを特定する。 すべてのbashコマンド、ファイル操作、およびツール参照をリストアップする。スキルがファイル読み取りとネットワークツールの両方を使用する場合の複合リスクを考慮する。
リダイレクト先を確認する。 スキルが外部URLを参照している場合、期待されるドメインを指していることを確認する。
データ流出パターンがないことを確認する。 機密データを読み取り、その後外部送信のために書き込み、送信、またはエンコードする指示を探す。これにはClaudeの会話レスポンスを通じたものも含まれる。

信頼できないソースからのスキルは、完全な監査なしにデプロイしないでください。悪意のあるスキルは、Claudeに任意のコードの実行、機密ファイルへのアクセス、または外部へのデータ送信を指示する可能性があります。スキルのインストールは、本番システムへのソフトウェアインストールと同じ厳格さで扱ってください。

デプロイ前のスキル評価

スキルが誤ってトリガーされたり、他のスキルと競合したり、不適切な指示を提供したりすると、エージェントのパフォーマンスが低下する可能性があります。本番デプロイの前に評価を必須としてください。

評価すべき事項

スキルをデプロイする前に、以下の次元に対する承認ゲートを設定してください：

次元	測定内容	失敗例
トリガー精度	スキルが適切なクエリに対してアクティブになり、無関係なクエリに対しては非アクティブのままか？	ユーザーがデータについて議論したいだけなのに、スプレッドシートに関するすべての言及でスキルがトリガーされる
分離動作	スキルが単独で正しく動作するか？	スキルがディレクトリに存在しないファイルを参照している
共存	このスキルを追加すると他のスキルが劣化するか？	新しいスキルの説明が広すぎて、既存のスキルからトリガーを奪っている
指示遵守	Claudeがスキルの指示に正確に従うか？	Claudeがバリデーションステップをスキップしたり、間違ったライブラリを使用したりする
出力品質	スキルが正確で有用な結果を生成するか？	生成されたレポートにフォーマットエラーやデータの欠落がある

評価要件

スキル作成者に、スキルごとに3〜5の代表的なクエリを含む評価スイートの提出を求めてください。スキルがトリガーされるべきケース、トリガーされるべきでないケース、および曖昧なエッジケースをカバーするものです。スキルの有効性はモデルによって異なるため、組織で使用しているモデル（Haiku、Sonnet、Opus）全体でのテストを必須としてください。

評価の構築に関する詳細なガイダンスについては、ベストプラクティスの評価とイテレーションを参照してください。一般的な評価方法論については、テストケースの開発を参照してください。

ライフサイクルの意思決定に評価を活用する

評価結果は、いつ行動すべきかを示します：

トリガー精度の低下： スキルの説明または指示を更新する
共存の競合： 重複するスキルを統合するか、説明を絞り込む
一貫して低い出力品質： 指示を書き直すか、バリデーションステップを追加する
更新を重ねても持続する失敗： スキルを廃止する

スキルライフサイクル管理

計画
反復的、エラーが発生しやすい、または専門知識を必要とするワークフローを特定します。これらを組織の役割にマッピングし、スキルの候補となるものを決定します。
作成とレビュー
スキル作成者がベストプラクティスに従っていることを確認します。上記のレビューチェックリストを使用したセキュリティレビューを必須とします。承認前に評価スイートを必須とします。職務の分離を確立します：スキル作成者は自身のレビュアーであるべきではありません。
テスト
分離状態（スキル単独）および既存のスキルと並行した状態（共存テスト）での評価を必須とします。本番承認前に、アクティブなスキルセット全体でトリガー精度、出力品質、およびリグレッションの不在を確認します。
デプロイ
ワークスペース全体のアクセスのためにSkills APIを介してアップロードします。アップロードとバージョン管理については、APIでのスキルの使用を参照してください。目的、オーナー、およびバージョンとともに内部レジストリにスキルを文書化します。
監視
使用パターンを追跡し、ユーザーからのフィードバックを収集します。ワークフローやモデルの進化に伴うドリフトやリグレッションを検出するために、定期的に評価を再実行します。使用状況分析は現在Skills APIでは利用できません。リクエストに含まれるスキルを追跡するために、アプリケーションレベルのロギングを実装してください。
イテレーションまたは廃止
新しいバージョンを昇格させる前に、完全な評価スイートの合格を必須とします。ワークフローが変更されたり評価スコアが低下したりした場合にスキルを更新します。評価が一貫して失敗する場合やワークフローが廃止された場合にスキルを廃止します。

大規模なスキルの整理

リコールの制限

一般的なガイドラインとして、信頼性の高いリコール精度を維持するために、同時にロードされるスキルの数を制限してください。各スキルのメタデータ（名前と説明）は、システムプロンプト内で注意を競い合います。アクティブなスキルが多すぎると、Claudeが適切なスキルを選択できなかったり、関連するスキルを完全に見逃したりする可能性があります。スキルを追加する際にリコール精度を測定するために評価スイートを使用し、パフォーマンスが低下したら追加を停止してください。

APIリクエストはリクエストごとに最大8つのスキルをサポートしていることに注意してください（APIでのスキルの使用を参照）。役割が単一のリクエストでサポートされるよりも多くのスキルを必要とする場合は、狭いスキルをより広いスキルに統合するか、タスクタイプに基づいてリクエストを異なるスキルセットにルーティングすることを検討してください。

具体的に始めて、後で統合する

チームには、広範で多目的なスキルではなく、狭いワークフロー固有のスキルから始めることを推奨してください。組織全体でパターンが見えてきたら、関連するスキルを役割ベースのバンドルに統合します。

統合のタイミングを決定するために評価を使用してください。統合されたスキルの評価が、置き換える個々のスキルと同等のパフォーマンスを確認した場合にのみ、狭いスキルをより広いスキルにマージしてください。

進行例：

開始時：formatting-sales-reports、querying-pipeline-data、updating-crm-records
統合後：sales-operations（評価が同等のパフォーマンスを確認した場合）

命名とカタログ化

組織全体で一貫した命名規則を使用してください。ベストプラクティスの命名規則セクションにフォーマットのガイダンスがあります。

各スキルの内部レジストリを以下の情報で維持してください：

目的：スキルがサポートするワークフロー
オーナー：メンテナンスを担当するチームまたは個人
バージョン：現在デプロイされているバージョン
依存関係：必要なMCPサーバー、パッケージ、または外部サービス
評価ステータス：最終評価日と結果

役割ベースのバンドル

各ユーザーのアクティブなスキルセットを集中させるために、組織の役割ごとにスキルをグループ化してください：

営業チーム：CRM操作、パイプラインレポート、提案書作成
エンジニアリング：コードレビュー、デプロイワークフロー、インシデント対応
財務：レポート生成、データバリデーション、監査準備

各役割ベースのバンドルには、その役割の日常ワークフローに関連するスキルのみを含めるべきです。

配布とバージョン管理

ソース管理

履歴追跡、プルリクエストによるコードレビュー、およびロールバック機能のために、スキルディレクトリをGitに保存してください。各スキルディレクトリ（SKILL.mdとバンドルされたファイルを含む）は、Git追跡フォルダに自然にマッピングされます。

APIベースの配布

Skills APIはワークスペーススコープの配布を提供します。APIを介してアップロードされたスキルは、すべてのワークスペースメンバーが利用できます。アップロード、バージョニング、および管理エンドポイントについては、APIでのスキルの使用を参照してください。

バージョニング戦略

本番環境：スキルを特定のバージョンに固定します。新しいバージョンを昇格させる前に、完全な評価スイートを実行します。すべての更新を、完全なセキュリティレビューが必要な新しいデプロイとして扱います。
開発とテスト：本番昇格前に変更を検証するために最新バージョンを使用します。
ロールバック計画：フォールバックとして前のバージョンを維持します。新しいバージョンが本番環境で評価に失敗した場合、直ちに最後の正常なバージョンに戻します。
整合性検証：レビュー済みスキルのチェックサムを計算し、デプロイ時に検証します。出所を確保するために、スキルリポジトリで署名付きコミットを使用します。

クロスサーフェスの考慮事項

カスタムスキルはサーフェス間で同期されません。APIにアップロードされたスキルはclaude.aiやClaude Codeでは利用できず、その逆も同様です。各サーフェスには個別のアップロードと管理が必要です。

Gitのスキルソースファイルを唯一の信頼できるソースとして維持してください。組織が複数のサーフェスにスキルをデプロイする場合、一貫性を保つために独自の同期プロセスを実装してください。詳細については、クロスサーフェスの可用性を参照してください。

次のステップ

Agent Skills概要

アーキテクチャとプラットフォームの詳細

ベストプラクティス

スキル作成者向けのオーサリングガイダンス

APIでのスキルの使用

プログラムによるスキルのアップロードと管理

AIエージェントの安全なデプロイ

エージェントデプロイのセキュリティパターン

Was this page helpful?

Agent Skills

エンタープライズ向けスキル

エンタープライズ規模でAgent Skillsをデプロイするためのガバナンス、セキュリティレビュー、評価、および組織的ガイダンス。

セキュリティレビューと審査

エンタープライズでスキルをデプロイするには、2つの異なる質問に答える必要があります：

スキルは一般的に安全か？ プラットフォームレベルのセキュリティの詳細については、概要のセキュリティに関する考慮事項セクションを参照してください。
特定のスキルをどのように審査するか？ 以下のリスク評価とレビューチェックリストを使用してください。

リスクティア評価

デプロイを承認する前に、各スキルをこれらのリスク指標に対して評価してください：

リスク指標	確認すべき事項	懸念レベル
コード実行	スキルディレクトリ内のスクリプト（`.py`、`.sh`、`*.js`）	高：スクリプトは完全な環境アクセスで実行される
指示の操作	安全ルールを無視する、ユーザーからアクションを隠す、またはClaudeの動作を条件付きで変更する指示	高：セキュリティコントロールをバイパスする可能性がある
MCPサーバー参照	MCPツールを参照する指示（`ServerName:tool_name`）	高：スキル自体を超えてアクセスを拡張する
ネットワークアクセスパターン	URL、APIエンドポイント、`fetch`、`curl`、または`requests`呼び出し	高：データ流出の潜在的なベクトル
ハードコードされた認証情報	スキルファイルまたはスクリプト内のAPIキー、トークン、またはパスワード	高：Git履歴とコンテキストウィンドウにシークレットが露出する
ファイルシステムアクセス範囲	スキルディレクトリ外のパス、広範なglobパターン、パストラバーサル（`../`）	中：意図しないデータにアクセスする可能性がある
ツール呼び出し	Claudeにbash、ファイル操作、またはその他のツールを使用するよう指示する指示	中：どのような操作が実行されるかを確認する

レビューチェックリスト

サードパーティまたは内部の貢献者からのスキルをデプロイする前に、以下の手順を完了してください：

すべてのスキルディレクトリの内容を読む。 SKILL.md、参照されているすべてのマークダウンファイル、およびバンドルされたスクリプトやリソースを確認する。
スクリプトの動作が記載された目的と一致することを確認する。 サンドボックス環境でスクリプトを実行し、出力がスキルの説明と一致することを確認する。
敵対的な指示がないか確認する。 Claudeに安全ルールを無視する、ユーザーからアクションを隠す、レスポンスを通じてデータを流出させる、または特定の入力に基づいて動作を変更するよう指示する指示を探す。
外部URLフェッチまたはネットワーク呼び出しを確認する。 スクリプトと指示でネットワークアクセスパターン（http、requests.get、urllib、curl、fetch）を検索する。
ハードコードされた認証情報がないことを確認する。 スキルファイル内のAPIキー、トークン、またはパスワードを確認する。認証情報は環境変数またはセキュアな認証情報ストアを使用すべきであり、スキルコンテンツに含めてはならない。
スキルがClaudeに呼び出すよう指示するツールとコマンドを特定する。 すべてのbashコマンド、ファイル操作、およびツール参照をリストアップする。スキルがファイル読み取りとネットワークツールの両方を使用する場合の複合リスクを考慮する。
リダイレクト先を確認する。 スキルが外部URLを参照している場合、期待されるドメインを指していることを確認する。
データ流出パターンがないことを確認する。 機密データを読み取り、その後外部送信のために書き込み、送信、またはエンコードする指示を探す。これにはClaudeの会話レスポンスを通じたものも含まれる。

デプロイ前のスキル評価

評価すべき事項

スキルをデプロイする前に、以下の次元に対する承認ゲートを設定してください：

次元	測定内容	失敗例
トリガー精度	スキルが適切なクエリに対してアクティブになり、無関係なクエリに対しては非アクティブのままか？	ユーザーがデータについて議論したいだけなのに、スプレッドシートに関するすべての言及でスキルがトリガーされる
分離動作	スキルが単独で正しく動作するか？	スキルがディレクトリに存在しないファイルを参照している
共存	このスキルを追加すると他のスキルが劣化するか？	新しいスキルの説明が広すぎて、既存のスキルからトリガーを奪っている
指示遵守	Claudeがスキルの指示に正確に従うか？	Claudeがバリデーションステップをスキップしたり、間違ったライブラリを使用したりする
出力品質	スキルが正確で有用な結果を生成するか？	生成されたレポートにフォーマットエラーやデータの欠落がある

評価要件

ライフサイクルの意思決定に評価を活用する

評価結果は、いつ行動すべきかを示します：

トリガー精度の低下： スキルの説明または指示を更新する
共存の競合： 重複するスキルを統合するか、説明を絞り込む
一貫して低い出力品質： 指示を書き直すか、バリデーションステップを追加する
更新を重ねても持続する失敗： スキルを廃止する

スキルライフサイクル管理

計画
反復的、エラーが発生しやすい、または専門知識を必要とするワークフローを特定します。これらを組織の役割にマッピングし、スキルの候補となるものを決定します。
作成とレビュー
スキル作成者がベストプラクティスに従っていることを確認します。上記のレビューチェックリストを使用したセキュリティレビューを必須とします。承認前に評価スイートを必須とします。職務の分離を確立します：スキル作成者は自身のレビュアーであるべきではありません。
テスト
分離状態（スキル単独）および既存のスキルと並行した状態（共存テスト）での評価を必須とします。本番承認前に、アクティブなスキルセット全体でトリガー精度、出力品質、およびリグレッションの不在を確認します。
デプロイ
ワークスペース全体のアクセスのためにSkills APIを介してアップロードします。アップロードとバージョン管理については、APIでのスキルの使用を参照してください。目的、オーナー、およびバージョンとともに内部レジストリにスキルを文書化します。
監視
使用パターンを追跡し、ユーザーからのフィードバックを収集します。ワークフローやモデルの進化に伴うドリフトやリグレッションを検出するために、定期的に評価を再実行します。使用状況分析は現在Skills APIでは利用できません。リクエストに含まれるスキルを追跡するために、アプリケーションレベルのロギングを実装してください。
イテレーションまたは廃止
新しいバージョンを昇格させる前に、完全な評価スイートの合格を必須とします。ワークフローが変更されたり評価スコアが低下したりした場合にスキルを更新します。評価が一貫して失敗する場合やワークフローが廃止された場合にスキルを廃止します。

大規模なスキルの整理

リコールの制限

具体的に始めて、後で統合する

進行例：

開始時：formatting-sales-reports、querying-pipeline-data、updating-crm-records
統合後：sales-operations（評価が同等のパフォーマンスを確認した場合）

命名とカタログ化

組織全体で一貫した命名規則を使用してください。ベストプラクティスの命名規則セクションにフォーマットのガイダンスがあります。

各スキルの内部レジストリを以下の情報で維持してください：

目的：スキルがサポートするワークフロー
オーナー：メンテナンスを担当するチームまたは個人
バージョン：現在デプロイされているバージョン
依存関係：必要なMCPサーバー、パッケージ、または外部サービス
評価ステータス：最終評価日と結果

役割ベースのバンドル

各ユーザーのアクティブなスキルセットを集中させるために、組織の役割ごとにスキルをグループ化してください：

営業チーム：CRM操作、パイプラインレポート、提案書作成
エンジニアリング：コードレビュー、デプロイワークフロー、インシデント対応
財務：レポート生成、データバリデーション、監査準備

各役割ベースのバンドルには、その役割の日常ワークフローに関連するスキルのみを含めるべきです。

配布とバージョン管理

ソース管理

APIベースの配布

バージョニング戦略

本番環境：スキルを特定のバージョンに固定します。新しいバージョンを昇格させる前に、完全な評価スイートを実行します。すべての更新を、完全なセキュリティレビューが必要な新しいデプロイとして扱います。
開発とテスト：本番昇格前に変更を検証するために最新バージョンを使用します。
ロールバック計画：フォールバックとして前のバージョンを維持します。新しいバージョンが本番環境で評価に失敗した場合、直ちに最後の正常なバージョンに戻します。
整合性検証：レビュー済みスキルのチェックサムを計算し、デプロイ時に検証します。出所を確保するために、スキルリポジトリで署名付きコミットを使用します。

クロスサーフェスの考慮事項

次のステップ

Agent Skills概要

アーキテクチャとプラットフォームの詳細

ベストプラクティス

スキル作成者向けのオーサリングガイダンス

APIでのスキルの使用

プログラムによるスキルのアップロードと管理

AIエージェントの安全なデプロイ

エージェントデプロイのセキュリティパターン

Was this page helpful?