Loading...
  • ビルド
  • 管理
  • モデルと料金
  • クライアントSDK
  • APIリファレンス
Search...
⌘K
Log in
エンタープライズ向けスキル
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
ビルド/スキル

エンタープライズ向けスキル

エンタープライズ規模でエージェントスキルを展開するためのガバナンス、セキュリティレビュー、評価、および組織的ガイダンス。

Was this page helpful?

  • APIベースの配布

このガイドは、組織全体でエージェントスキルを管理する必要があるエンタープライズ管理者およびアーキテクト向けです。スキルの審査、評価、展開、および大規模な管理方法について説明します。作成ガイダンスについては、ベストプラクティスを参照してください。アーキテクチャの詳細については、スキルの概要を参照してください。

セキュリティレビューと審査

エンタープライズでスキルを展開するには、2つの異なる質問に答える必要があります:

  1. スキルは一般的に安全ですか? プラットフォームレベルのセキュリティの詳細については、概要のセキュリティに関する考慮事項セクションを参照してください。
  2. 特定のスキルをどのように審査しますか? 以下のリスク評価とレビューチェックリストを使用してください。

リスク階層評価

展開を承認する前に、各スキルをこれらのリスク指標に照らして評価してください:

リスク指標確認すべき内容懸念レベル
コード実行スキルディレクトリ内のスクリプト(*.py、*.sh、*.js)高:スクリプトはフル環境アクセスで実行される
指示の操作安全ルールを無視する、ユーザーからアクションを隠す、または条件付きでClaudeの動作を変更する指令高:セキュリティコントロールをバイパスできる
MCPサーバー参照MCPツールを参照する指示(ServerName:tool_name)高:スキル自体を超えたアクセスを拡張する
ネットワークアクセスパターンURL、APIエンドポイント、fetch、curl、またはrequests呼び出し高:データ漏洩の潜在的なベクター
ハードコードされた認証情報スキルファイルまたはスクリプト内のAPIキー、トークン、またはパスワード高:Gitの履歴とコンテキストウィンドウで秘密情報が露出する
ファイルシステムアクセス範囲スキルディレクトリ外のパス、広範なglobパターン、パストラバーサル(../)中:意図しないデータにアクセスする可能性がある
ツール呼び出しClaudeにbash、ファイル操作、またはその他のツールを使用するよう指示する命令中:実行される操作を確認する

レビューチェックリスト

サードパーティまたは内部コントリビューターからのスキルを展開する前に、以下の手順を完了してください:

  1. スキルディレクトリのすべてのコンテンツを読む。 SKILL.md、参照されているすべてのmarkdownファイル、およびバンドルされているスクリプトやリソースを確認してください。
  2. スクリプトの動作が記載された目的と一致していることを確認する。 サンドボックス環境でスクリプトを実行し、出力がスキルの説明と一致していることを確認してください。
  3. 敵対的な指示を確認する。 Claudeに安全ルールを無視する、ユーザーからアクションを隠す、レスポンスを通じてデータを漏洩させる、または特定の入力に基づいて動作を変更するよう指示する命令を探してください。
  4. 外部URLフェッチまたはネットワーク呼び出しを確認する。 スクリプトと指示でネットワークアクセスパターン(http、requests.get、urllib、curl、fetch)を検索してください。
  5. ハードコードされた認証情報がないことを確認する。 スキルファイル内のAPIキー、トークン、またはパスワードを確認してください。認証情報は環境変数または安全な認証情報ストアを使用する必要があり、スキルコンテンツに直接記載してはなりません。
  6. スキルがClaudeに呼び出すよう指示するツールとコマンドを特定する。 すべてのbashコマンド、ファイル操作、およびツール参照をリストアップしてください。スキルがファイル読み取りとネットワークツールの両方を一緒に使用する場合の複合リスクを考慮してください。
  7. リダイレクト先を確認する。 スキルが外部URLを参照している場合、それらが期待されるドメインを指していることを確認してください。

完全な監査なしに信頼できないソースからスキルを展開しないでください。悪意のあるスキルは、Claudeに任意のコードを実行させたり、機密ファイルにアクセスさせたり、データを外部に送信させたりする可能性があります。スキルのインストールは、本番システムへのソフトウェアインストールと同じ厳格さで扱ってください。

展開前のスキル評価

スキルが誤ってトリガーされたり、他のスキルと競合したり、不適切な指示を提供したりすると、エージェントのパフォーマンスが低下する可能性があります。本番展開の前に評価を必須としてください。

評価すべき内容

スキルを展開する前に、以下の次元の承認ゲートを設けてください:

次元測定内容失敗例
トリガー精度スキルは適切なクエリに対してアクティブになり、無関係なものに対しては非アクティブのままですか?スキルがスプレッドシートへの言及すべてでトリガーされる(ユーザーがデータについて議論したいだけの場合でも)
分離動作スキルは単独で正しく動作しますか?スキルがディレクトリに存在しないファイルを参照する
共存このスキルを追加すると他のスキルが低下しますか?新しいスキルの説明が広すぎて、既存のスキルからトリガーを奪う
指示への従い方Claudeはスキルの指示を正確に従いますか?Claudeが検証ステップをスキップしたり、誤ったライブラリを使用したりする
出力品質スキルは正確で有用な結果を生成しますか?生成されたレポートにフォーマットエラーやデータの欠落がある

評価要件

スキル作成者に対して、スキルごとに3〜5つの代表的なクエリを含む評価スイートを提出することを求めてください。これには、スキルがトリガーされるべきケース、トリガーされるべきでないケース、および曖昧なエッジケースが含まれます。スキルの有効性はモデルによって異なるため、組織が使用するモデル(Haiku、Sonnet、Opus)全体でのテストを必須としてください。

評価の構築に関する詳細なガイダンスについては、ベストプラクティスの評価と反復を参照してください。一般的な評価方法論については、テストケースの開発を参照してください。

ライフサイクル決定のための評価の活用

評価結果は、いつ行動すべきかを示します:

  • トリガー精度の低下: スキルの説明または指示を更新する
  • 共存の競合: 重複するスキルを統合するか、説明を絞り込む
  • 一貫して低い出力品質: 指示を書き直すか、検証ステップを追加する
  • 更新を経ても持続する失敗: スキルを廃止する

スキルライフサイクル管理

  1. 1

    計画

    繰り返し行われる、エラーが発生しやすい、または専門知識が必要なワークフローを特定してください。これらを組織の役割にマッピングし、スキルの候補となるものを決定してください。

  2. 2

    作成とレビュー

    スキル作成者がベストプラクティスに従っていることを確認してください。上記のレビューチェックリストを使用したセキュリティレビューを必須としてください。承認前に評価スイートを必須としてください。職務分離を確立してください:スキル作成者は自分自身のレビュアーであってはなりません。

  3. 3

    テスト

    単独(スキルのみ)および既存のスキルと並行した評価(共存テスト)を必須としてください。本番承認前に、アクティブなスキルセット全体でトリガー精度、出力品質、およびリグレッションの不在を確認してください。

  4. 4

    展開

    ワークスペース全体のアクセスのためにSkills APIを介してアップロードしてください。アップロードとバージョン管理については、APIでのスキルの使用を参照してください。目的、オーナー、バージョンとともに、内部レジストリにスキルを文書化してください。

  5. 5

    モニタリング

    使用パターンを追跡し、ユーザーからフィードバックを収集してください。ワークフローとモデルが進化するにつれて、ドリフトやリグレッションを検出するために定期的に評価を再実行してください。使用状況の分析はSkills APIを通じて現在利用できません。どのスキルがリクエストに含まれているかを追跡するために、アプリケーションレベルのロギングを実装してください。

  6. 6

    反復または廃止

    新しいバージョンを昇格させる前に、完全な評価スイートに合格することを必須としてください。ワークフローが変更されたり評価スコアが低下したりした場合はスキルを更新してください。評価が一貫して失敗したり、ワークフローが廃止されたりした場合はスキルを廃止してください。

大規模なスキルの整理

リコール制限

一般的なガイドラインとして、信頼性の高いリコール精度を維持するために、同時にロードするスキルの数を制限してください。各スキルのメタデータ(名前と説明)は、システムプロンプト内で注意を競い合います。アクティブなスキルが多すぎると、Claudeが適切なスキルを選択できなかったり、関連するスキルを見逃したりする可能性があります。スキルを追加する際に評価スイートを使用してリコール精度を測定し、パフォーマンスが低下したら追加を停止してください。

APIリクエストはリクエストごとに最大8つのスキルをサポートしていることに注意してください(APIでのスキルの使用を参照)。役割が単一のリクエストでサポートされる以上のスキルを必要とする場合は、狭いスキルをより広いものに統合するか、タスクタイプに基づいてリクエストを異なるスキルセットにルーティングすることを検討してください。

具体的なものから始め、後で統合する

チームに対して、広範な多目的スキルではなく、狭いワークフロー固有のスキルから始めることを奨励してください。組織全体でパターンが現れるにつれて、関連するスキルを役割ベースのバンドルに統合してください。

統合するタイミングを決定するために評価を使用してください。統合されたスキルの評価が、それが置き換える個々のスキルと同等のパフォーマンスを確認した場合にのみ、狭いスキルをより広いものにマージしてください。

進行例:

  • 開始:formatting-sales-reports、querying-pipeline-data、updating-crm-records
  • 統合:sales-operations(評価が同等のパフォーマンスを確認した場合)

命名とカタログ化

組織全体で一貫した命名規則を使用してください。ベストプラクティスの命名規則セクションにフォーマットガイダンスがあります。

各スキルの内部レジストリを以下の情報とともに維持してください:

  • 目的:スキルがサポートするワークフロー
  • オーナー:メンテナンスを担当するチームまたは個人
  • バージョン:現在展開されているバージョン
  • 依存関係:必要なMCPサーバー、パッケージ、または外部サービス
  • 評価ステータス:最後の評価日と結果

役割ベースのバンドル

各ユーザーのアクティブなスキルセットを集中させるために、組織の役割ごとにスキルをグループ化してください:

  • 営業チーム:CRM操作、パイプラインレポート、提案書生成
  • エンジニアリング:コードレビュー、展開ワークフロー、インシデント対応
  • 財務:レポート生成、データ検証、監査準備

各役割ベースのバンドルには、その役割の日常的なワークフローに関連するスキルのみを含める必要があります。

配布とバージョン管理

ソース管理

履歴追跡、プルリクエストによるコードレビュー、およびロールバック機能のために、スキルディレクトリをGitに保存してください。各スキルディレクトリ(SKILL.mdとバンドルされたファイルを含む)は、Gitで追跡されるフォルダに自然にマッピングされます。

APIベースの配布

Skills APIはワークスペーススコープの配布を提供します。APIを介してアップロードされたスキルは、すべてのワークスペースメンバーが利用できます。アップロード、バージョン管理、および管理エンドポイントについては、APIでのスキルの使用を参照してください。

バージョン管理戦略

  • 本番:スキルを特定のバージョンに固定してください。新しいバージョンを昇格させる前に完全な評価スイートを実行してください。すべての更新を、完全なセキュリティレビューを必要とする新しい展開として扱ってください。
  • 開発とテスト:本番昇格前に変更を検証するために最新バージョンを使用してください。
  • ロールバック計画:フォールバックとして以前のバージョンを維持してください。新しいバージョンが本番で評価に失敗した場合は、直ちに最後の既知の良好なバージョンに戻してください。
  • 整合性検証:レビューされたスキルのチェックサムを計算し、展開時に検証してください。プロベナンスを確保するために、スキルリポジトリで署名付きコミットを使用してください。

クロスサーフェスの考慮事項

カスタムスキルはサーフェス間で同期されません。APIにアップロードされたスキルは、claude.aiやClaude Codeでは利用できず、その逆も同様です。各サーフェスには個別のアップロードと管理が必要です。

Gitにスキルソースファイルを唯一の信頼できる情報源として維持してください。組織が複数のサーフェスにスキルを展開する場合は、それらを一貫して保つための独自の同期プロセスを実装してください。詳細については、クロスサーフェスの可用性を参照してください。

次のステップ

エージェントスキルの概要

アーキテクチャとプラットフォームの詳細

ベストプラクティス

スキル作成者向けの作成ガイダンス

  • データ漏洩パターンがないことを確認する。 機密データを読み取り、Claudeの会話レスポンスを通じた送信を含む外部送信のために書き込み、送信、またはエンコードする指示を探してください。
  • APIでのスキルの使用

    プログラムによるスキルのアップロードと管理