• メッセージ
  • マネージドエージェント
  • 管理

Search...
⌘K
はじめに
Claudeの紹介クイックスタート
Claudeで構築する
機能の概要Messages APIの使用停止理由とフォールバック拒否とフォールバックフォールバッククレジット
モデルの機能
拡張思考適応型思考エフォートタスク予算(ベータ版)高速モード(リサーチプレビュー)構造化出力引用メッセージのストリーミングバッチ処理検索結果拒否のストリーミング多言語サポート埋め込み
ツール
概要ツール使用の仕組みチュートリアル:ツールを使用するエージェントの構築ツールの定義ツール呼び出しの処理並列ツール使用ツールランナー(SDK)厳密なツール使用プロンプトキャッシングを使用したツール使用サーバーツールトラブルシューティングWeb検索ツールWeb取得ツールコード実行ツールアドバイザーツールメモリツールBashツールコンピュータ使用ツールテキストエディタツール
ツールインフラストラクチャ
ツールリファレンスツールコンテキストの管理ツールの組み合わせツール検索プログラムによるツール呼び出しきめ細かいツールストリーミング
コンテキスト管理
コンテキストウィンドウコンパクションコンテキスト編集プロンプトキャッシング会話途中のシステムメッセージオーケストレーションモードの構築キャッシュ診断(ベータ版)トークンカウント
ファイルの操作
Files APIPDFサポート画像とビジョン
スキル
概要クイックスタートベストプラクティスエンタープライズ向けスキルAPIでのスキル
MCP
リモートMCPサーバーMCPコネクタ
クラウドプラットフォーム上のClaude
Amazon BedrockAmazon Bedrock(レガシー)AWS上のClaude PlatformMicrosoft FoundryVertex AI

Log in
エンタープライズ向けスキル
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
メッセージ/スキル

エンタープライズ向けスキル

エンタープライズ規模でAgent Skillsを展開するためのガバナンス、セキュリティレビュー、評価、および組織的ガイダンス。

このガイドは、組織全体でAgent Skillsを管理する必要があるエンタープライズ管理者およびアーキテクト向けです。スキルを大規模に審査、評価、展開、管理する方法について説明します。作成に関するガイダンスについては、ベストプラクティスを参照してください。アーキテクチャの詳細については、スキルの概要を参照してください。

セキュリティレビューと審査

エンタープライズでスキルを展開するには、2つの異なる問いに答える必要があります。

  1. スキルは一般的に安全か? プラットフォームレベルのセキュリティの詳細については、概要のセキュリティに関する考慮事項セクションを参照してください。
  2. 特定のスキルをどのように審査するか? 以下のリスク評価とレビューチェックリストを使用してください。

リスクティア評価

展開を承認する前に、各スキルを以下のリスク指標に照らして評価してください。

リスク指標確認すべき内容懸念レベル
コード実行スキルディレクトリ内のスクリプト(*.py、*.sh、*.js)高:スクリプトは環境への完全なアクセス権で実行されます
指示の操作安全ルールを無視する、ユーザーからアクションを隠す、または条件付きでClaudeの動作を変更するよう指示するディレクティブ高:セキュリティ制御を回避する可能性があります
MCPサーバー参照MCPツールを参照する指示(ServerName:tool_name)高:スキル自体を超えてアクセスを拡張します
ネットワークアクセスパターンURL、APIエンドポイント、fetch、curl、またはrequests呼び出し高:データ流出の潜在的な経路
ハードコードされた認証情報スキルファイルまたはスクリプト内のAPIキー、トークン、またはパスワード高:Git履歴およびコンテキストウィンドウでシークレットが露出します
ファイルシステムアクセス範囲スキルディレクトリ外のパス、広範なglobパターン、パストラバーサル(../)中:意図しないデータにアクセスする可能性があります
ツール呼び出しClaudeにbash、ファイル操作、またはその他のツールを使用するよう指示する内容中:どのような操作が実行されるかを確認してください

レビューチェックリスト

サードパーティまたは社内コントリビューターからのスキルを展開する前に、以下の手順を完了してください。

  1. スキルディレクトリのすべてのコンテンツを読む。 SKILL.md、参照されているすべてのマークダウンファイル、およびバンドルされているスクリプトやリソースを確認します。
  2. スクリプトの動作が記載された目的と一致していることを確認する。 サンドボックス環境でスクリプトを実行し、出力がスキルの説明と一致していることを確認します。
  3. 敵対的な指示がないか確認する。 Claudeに安全ルールを無視する、ユーザーからアクションを隠す、レスポンスを通じてデータを流出させる、または特定の入力に基づいて動作を変更するよう指示するディレクティブを探します。
  4. 外部URLの取得やネットワーク呼び出しがないか確認する。 スクリプトと指示内でネットワークアクセスパターン(http、requests.get、urllib、curl、fetch)を検索します。
  5. ハードコードされた認証情報がないことを確認する。 スキルファイル内のAPIキー、トークン、またはパスワードを確認します。認証情報は環境変数または安全な認証情報ストアを使用すべきであり、スキルコンテンツに含めてはいけません。
  6. スキルがClaudeに呼び出すよう指示するツールとコマンドを特定する。 すべてのbashコマンド、ファイル操作、およびツール参照をリストアップします。スキルがファイル読み取りツールとネットワークツールの両方を併用する場合の複合リスクを考慮してください。
  7. リダイレクト先を確認する。 スキルが外部URLを参照している場合、それらが想定されるドメインを指していることを確認します。


信頼できないソースからのスキルを完全な監査なしに展開しないでください。悪意のあるスキルは、Claudeに任意のコードを実行させたり、機密ファイルにアクセスさせたり、データを外部に送信させたりする可能性があります。スキルのインストールは、本番システムへのソフトウェアのインストールと同じ厳格さで扱ってください。

展開前のスキル評価

スキルが誤ってトリガーされたり、他のスキルと競合したり、不適切な指示を提供したりすると、エージェントのパフォーマンスが低下する可能性があります。本番展開の前に必ず評価を実施してください。

評価すべき内容

スキルを展開する前に、以下の観点について承認ゲートを設けてください。

観点測定内容失敗例
トリガー精度スキルは適切なクエリに対してアクティブになり、無関係なクエリに対しては非アクティブのままか?ユーザーが単にデータについて話したいだけの場合でも、スプレッドシートに言及するたびにスキルがトリガーされる
単独動作スキルは単独で正しく動作するか?スキルがディレクトリに存在しないファイルを参照する
共存性このスキルを追加すると他のスキルが劣化するか?新しいスキルの説明が広すぎて、既存のスキルからトリガーを奪う
指示の遵守Claudeはスキルの指示に正確に従うか?Claudeが検証ステップをスキップしたり、間違ったライブラリを使用したりする
出力品質スキルは正確で有用な結果を生成するか?生成されたレポートにフォーマットエラーやデータの欠落がある

評価要件

スキル作成者に、スキルごとに3〜5個の代表的なクエリを含む評価スイートの提出を求めてください。これには、スキルがトリガーされるべきケース、トリガーされるべきでないケース、および曖昧なエッジケースを含めます。スキルの有効性はモデルによって異なるため、組織で使用しているモデル(Haiku、Sonnet、Opus)全体でのテストを求めてください。

評価の構築に関する詳細なガイダンスについては、ベストプラクティスの評価と反復を参照してください。一般的な評価方法論については、テストケースの開発を参照してください。

ライフサイクル判断への評価の活用

評価結果は、いつ対応すべきかを示します。

  • トリガー精度の低下: スキルの説明または指示を更新する
  • 共存性の競合: 重複するスキルを統合するか、説明を絞り込む
  • 一貫して低い出力品質: 指示を書き直すか、検証ステップを追加する
  • 更新を重ねても継続する失敗: スキルを廃止する

スキルのライフサイクル管理

  1. 1

    計画

    反復的、エラーが発生しやすい、または専門知識を必要とするワークフローを特定します。これらを組織の役割にマッピングし、どれがスキルの候補となるかを判断します。

  2. 2

    作成とレビュー

    スキル作成者がベストプラクティスに従っていることを確認します。上記のレビューチェックリストを使用したセキュリティレビューを必須とします。承認前に評価スイートを必須とします。職務分離を確立してください。スキル作成者が自身のレビュアーになるべきではありません。

  3. 3

    テスト

    単独での評価(スキル単体)と既存のスキルと並行した評価(共存テスト)を必須とします。本番承認前に、トリガー精度、出力品質、およびアクティブなスキルセット全体でのリグレッションがないことを確認します。

  4. 4

    展開

    ワークスペース全体でのアクセスのためにSkills API経由でアップロードします。アップロードとバージョン管理については、APIでのスキルの使用を参照してください。目的、所有者、バージョンとともに、スキルを内部レジストリに文書化します。

  5. 5

    監視

    使用パターンを追跡し、ユーザーからフィードバックを収集します。ワークフローやモデルの進化に伴うドリフトやリグレッションを検出するために、定期的に評価を再実行します。使用状況分析は現在Skills API経由では利用できません。どのスキルがリクエストに含まれているかを追跡するために、アプリケーションレベルのロギングを実装してください。

  6. 6

    反復または廃止

    新しいバージョンを昇格する前に、完全な評価スイートの合格を必須とします。ワークフローが変更された場合や評価スコアが低下した場合は、スキルを更新します。評価が一貫して失敗する場合やワークフローが廃止された場合は、スキルを廃止します。

大規模なスキルの整理

リコール制限

一般的なガイドラインとして、信頼性の高いリコール精度を維持するために、同時にロードするスキルの数を制限してください。各スキルのメタデータ(名前と説明)は、システムプロンプト内で注意を奪い合います。アクティブなスキルが多すぎると、Claudeが適切なスキルを選択できなかったり、関連するスキルを完全に見逃したりする可能性があります。スキルを追加する際は評価スイートを使用してリコール精度を測定し、パフォーマンスが低下したら追加を停止してください。

APIリクエストは、リクエストごとに最大8個のスキルをサポートしていることに注意してください(APIでのスキルの使用を参照)。ある役割が単一のリクエストでサポートされる数より多くのスキルを必要とする場合は、狭いスキルをより広いスキルに統合するか、タスクタイプに基づいてリクエストを異なるスキルセットにルーティングすることを検討してください。

具体的に始めて、後で統合する

チームには、広範で多目的なスキルではなく、狭くワークフローに特化したスキルから始めることを推奨してください。組織全体でパターンが明らかになったら、関連するスキルを役割ベースのバンドルに統合します。



いつ統合するかを判断するために評価を使用してください。統合されたスキルの評価が、置き換える個々のスキルと同等のパフォーマンスを確認できた場合にのみ、狭いスキルをより広いスキルにマージしてください。

進行例:

  • 開始:formatting-sales-reports、querying-pipeline-data、updating-crm-records
  • 統合:sales-operations(評価で同等のパフォーマンスが確認された場合)

命名とカタログ化

組織全体で一貫した命名規則を使用してください。ベストプラクティスの命名規則セクションでフォーマットのガイダンスを提供しています。

各スキルについて、以下を含む内部レジストリを維持してください。

  • 目的:スキルがサポートするワークフロー
  • 所有者:メンテナンスを担当するチームまたは個人
  • バージョン:現在展開されているバージョン
  • 依存関係:必要なMCPサーバー、パッケージ、または外部サービス
  • 評価ステータス:最終評価日と結果

役割ベースのバンドル

各ユーザーのアクティブなスキルセットを集中させるために、組織の役割ごとにスキルをグループ化します。

  • 営業チーム:CRM操作、パイプラインレポート、提案書生成
  • エンジニアリング:コードレビュー、デプロイワークフロー、インシデント対応
  • 財務:レポート生成、データ検証、監査準備

各役割ベースのバンドルには、その役割の日常的なワークフローに関連するスキルのみを含めるべきです。

配布とバージョン管理

ソース管理

履歴追跡、プルリクエストによるコードレビュー、およびロールバック機能のために、スキルディレクトリをGitに保存します。各スキルディレクトリ(SKILL.mdとバンドルされたファイルを含む)は、Gitで追跡されるフォルダに自然にマッピングされます。

APIベースの配布

Skills APIは、ワークスペースをスコープとした配布を提供します。API経由でアップロードされたスキルは、すべてのワークスペースメンバーが利用できます。アップロード、バージョニング、および管理エンドポイントについては、APIでのスキルの使用を参照してください。

バージョニング戦略

  • 本番環境:スキルを特定のバージョンに固定します。新しいバージョンを昇格する前に、完全な評価スイートを実行します。すべての更新を、完全なセキュリティレビューを必要とする新しい展開として扱います。
  • 開発およびテスト:本番昇格前に変更を検証するために、最新バージョンを使用します。
  • ロールバック計画:フォールバックとして前のバージョンを維持します。新しいバージョンが本番環境で評価に失敗した場合は、直ちに最後の正常なバージョンに戻します。
  • 整合性検証:レビュー済みスキルのチェックサムを計算し、展開時に検証します。スキルリポジトリで署名付きコミットを使用して、出所を保証します。

サーフェス間の考慮事項



カスタムスキルはサーフェス間で同期されません。APIにアップロードされたスキルは、claude.aiやClaude Codeでは利用できず、その逆も同様です。各サーフェスは個別のアップロードと管理が必要です。

スキルのソースファイルを唯一の信頼できる情報源としてGitで維持してください。組織が複数のサーフェスにスキルを展開する場合は、それらの一貫性を保つために独自の同期プロセスを実装してください。詳細については、サーフェス間の可用性を参照してください。

次のステップ

Agent Skillsの概要

アーキテクチャとプラットフォームの詳細

ベストプラクティス

スキル作成者向けの作成ガイダンス


APIでのスキルの使用

プログラムによるスキルのアップロードと管理

Was this page helpful?

  • セキュリティレビューと審査
  • リスクティア評価
  • レビューチェックリスト
  • 展開前のスキル評価
  • 評価すべき内容
  • 評価要件
  • ライフサイクル判断への評価の活用
  • スキルのライフサイクル管理
  • 大規模なスキルの整理
  • リコール制限
  • 具体的に始めて、後で統合する
  • 命名とカタログ化
  • 役割ベースのバンドル
  • 配布とバージョン管理
  • ソース管理
  • APIベースの配布
  • バージョニング戦略
  • サーフェス間の考慮事項
  • 次のステップ
  • データ流出パターンがないことを確認する。 機密データを読み取り、その後それを外部送信のために書き込み、送信、またはエンコードする指示(Claudeの会話レスポンスを通じたものを含む)を探します。