Diese Anleitung richtet sich an Unternehmensadministratoren und Architekten, die Agent Skills in einer Organisation verwalten müssen. Sie behandelt, wie Sie Skills in großem Maßstab überprüfen, evaluieren, bereitstellen und verwalten. Weitere Informationen zur Erstellung finden Sie unter Best Practices. Weitere Architekturdetails finden Sie in der Skills-Übersicht.
Die Bereitstellung von Skills in einem Unternehmen erfordert die Beantwortung von zwei unterschiedlichen Fragen:
Evaluieren Sie jeden Skill anhand dieser Risikoindikatoren, bevor Sie die Bereitstellung genehmigen:
| Risikoindikator | Worauf Sie achten sollten | Besorgnisniveau |
|---|---|---|
| Code-Ausführung | Skripte im Skill-Verzeichnis (*.py, *.sh, *.js) | Hoch: Skripte werden mit vollständigem Umgebungszugriff ausgeführt |
| Anweisungsmanipulation | Direktiven zum Ignorieren von Sicherheitsregeln, zum Verbergen von Aktionen vor Benutzern oder zum bedingten Ändern des Claude-Verhaltens | Hoch: kann Sicherheitskontrollen umgehen |
| MCP-Server-Referenzen | Anweisungen, die auf MCP-Tools verweisen (ServerName:tool_name) | Hoch: erweitert den Zugriff über den Skill hinaus |
| Netzwerkzugriffsmuster | URLs, API-Endpunkte, fetch-, curl- oder requests-Aufrufe | Hoch: potenzieller Vektor für Datenexfiltration |
| Hartcodierte Anmeldedaten | API-Schlüssel, Token oder Passwörter in Skill-Dateien oder Skripten | Hoch: Geheimnisse sind in der Git-Historie und im Kontextfenster verfügbar |
| Dateisystem-Zugriffsspanne | Pfade außerhalb des Skill-Verzeichnisses, breite Glob-Muster, Pfadtraversal (../) | Mittel: kann auf unbeabsichtigte Daten zugreifen |
| Tool-Aufrufe | Anweisungen, die Claude anweisen, Bash, Dateivorgänge oder andere Tools zu verwenden | Mittel: überprüfen Sie, welche Vorgänge ausgeführt werden |
Bevor Sie einen Skill von einem Drittanbieter oder internen Mitwirkenden bereitstellen, führen Sie diese Schritte aus:
http, requests.get, urllib, curl, fetch).Stellen Sie niemals Skills aus nicht vertrauenswürdigen Quellen ohne vollständige Prüfung bereit. Ein böswilliger Skill kann Claude anweisen, beliebigen Code auszuführen, auf sensible Dateien zuzugreifen oder Daten extern zu übertragen. Behandeln Sie die Skill-Installation mit der gleichen Sorgfalt wie die Installation von Software auf Produktionssystemen.
Skills können die Agent-Leistung beeinträchtigen, wenn sie falsch ausgelöst werden, mit anderen Skills in Konflikt geraten oder schlechte Anweisungen bieten. Fordern Sie eine Evaluierung vor jeder Produktionsbereitstellung an.
Richten Sie Genehmigungsgates für diese Dimensionen ein, bevor Sie einen Skill bereitstellen:
| Dimension | Was es misst | Beispielfehlschlag |
|---|---|---|
| Auslösegenauigkeit | Wird der Skill für die richtigen Abfragen aktiviert und bleibt er für nicht verwandte inaktiv? | Skill wird bei jeder Tabellenkalkulationserwähnung ausgelöst, auch wenn der Benutzer nur über Daten diskutieren möchte |
| Isolierungsverhalten | Funktioniert der Skill korrekt allein? | Skill verweist auf Dateien, die nicht in seinem Verzeichnis vorhanden sind |
| Koexistenz | Verschlechtert das Hinzufügen dieses Skills andere Skills? | Die Beschreibung des neuen Skills ist zu breit und stiehlt Auslöser von bestehenden Skills |
| Befolgung von Anweisungen | Folgt Claude den Anweisungen des Skills genau? | Claude überspringt Validierungsschritte oder verwendet falsche Bibliotheken |
| Ausgabequalität | Erzeugt der Skill korrekte, nützliche Ergebnisse? | Generierte Berichte haben Formatierungsfehler oder fehlende Daten |
Fordern Sie von Skill-Autoren ein, dass sie Evaluierungssuites mit 3-5 repräsentativen Abfragen pro Skill einreichen, die Fälle abdecken, in denen der Skill ausgelöst werden sollte, nicht ausgelöst werden sollte und mehrdeutige Grenzfälle. Fordern Sie Tests über die Modelle an, die Ihre Organisation verwendet (Haiku, Sonnet, Opus), da die Skill-Effektivität je nach Modell variiert.
Detaillierte Anleitung zum Erstellen von Evaluierungen finden Sie unter Evaluierung und Iteration in Best Practices. Allgemeine Evaluierungsmethodik finden Sie unter Testfälle entwickeln.
Evaluierungsergebnisse signalisieren, wann Maßnahmen erforderlich sind:
Planen
Identifizieren Sie Workflows, die repetitiv, fehleranfällig oder spezialisiertes Wissen erfordern. Ordnen Sie diese organisatorischen Rollen zu und bestimmen Sie, welche Kandidaten für Skills sind.
Erstellen und überprüfen
Stellen Sie sicher, dass der Skill-Autor Best Practices befolgt. Fordern Sie eine Sicherheitsprüfung mit der Überprüfungscheckliste oben an. Fordern Sie eine Evaluierungssuite vor der Genehmigung an. Etablieren Sie eine Aufgabentrennung: Skill-Autoren sollten nicht ihre eigenen Reviewer sein.
Testen
Fordern Sie Evaluierungen isoliert an (Skill allein) und neben bestehenden Skills (Koexistenztests). Überprüfen Sie die Auslösegenauigkeit, Ausgabequalität und das Fehlen von Regressionen über Ihren aktiven Skill-Satz, bevor Sie die Genehmigung für die Produktion erteilen.
Bereitstellen
Laden Sie über die Skills API für arbeitsbereichsweiten Zugriff hoch. Weitere Informationen finden Sie unter Verwendung von Skills mit der API für Upload- und Versionsverwaltung. Dokumentieren Sie den Skill in Ihrer internen Registrierung mit Zweck, Besitzer und Version.
Überwachen
Verfolgen Sie Nutzungsmuster und sammeln Sie Feedback von Benutzern. Führen Sie Evaluierungen regelmäßig erneut aus, um Drift oder Regressionen zu erkennen, wenn sich Workflows und Modelle entwickeln. Nutzungsanalysen sind derzeit nicht über die Skills API verfügbar. Implementieren Sie Logging auf Anwendungsebene, um zu verfolgen, welche Skills in Anfragen enthalten sind.
Iterieren oder veralten
Fordern Sie an, dass die vollständige Evaluierungssuite vor der Förderung neuer Versionen besteht. Aktualisieren Sie Skills, wenn sich Workflows ändern oder Evaluierungsergebnisse sinken. Veralten Sie Skills, wenn Evaluierungen konsistent fehlschlagen oder der Workflow eingestellt wird.
Begrenzen Sie als allgemeine Richtlinie die Anzahl der gleichzeitig geladenen Skills, um eine zuverlässige Abrufgenauigkeit zu gewährleisten. Die Metadaten jedes Skills (Name und Beschreibung) konkurrieren um Aufmerksamkeit in der Systemaufforderung. Bei zu vielen aktiven Skills kann Claude möglicherweise den richtigen Skill nicht auswählen oder relevante ganz übersehen. Verwenden Sie Ihre Evaluierungssuite, um die Abrufgenauigkeit zu messen, wenn Sie Skills hinzufügen, und hören Sie auf zu addieren, wenn die Leistung sinkt.
Beachten Sie, dass API-Anfragen maximal 8 Skills pro Anfrage unterstützen (siehe Verwendung von Skills mit der API). Wenn eine Rolle mehr Skills benötigt, als eine einzelne Anfrage unterstützt, erwägen Sie, enge Skills in breitere zu konsolidieren oder Anfragen basierend auf dem Aufgabentyp an verschiedene Skill-Sätze weiterzuleiten.
Ermutigen Sie Teams, mit engen, workflow-spezifischen Skills zu beginnen, anstatt mit breiten, mehrzweckigen. Wenn Muster in Ihrer Organisation entstehen, konsolidieren Sie verwandte Skills in rollenbasierte Bündel.
Verwenden Sie Evaluierungen, um zu entscheiden, wann konsolidiert werden soll. Führen Sie enge Skills nur dann in einen breiteren zusammen, wenn die Evaluierungen des konsolidierten Skills eine gleichwertige Leistung zu den einzelnen Skills bestätigen, die er ersetzt.
Beispielfortschritt:
formatting-sales-reports, querying-pipeline-data, updating-crm-recordssales-operations (wenn Evaluierungen gleichwertige Leistung bestätigen)Verwenden Sie konsistente Benennungskonventionen in Ihrer Organisation. Der Abschnitt Benennungskonventionen in Best Practices bietet Formatierungsanleitung.
Führen Sie eine interne Registrierung für jeden Skill mit:
Gruppieren Sie Skills nach organisatorischer Rolle, um den aktiven Skill-Satz jedes Benutzers fokussiert zu halten:
Jedes rollenbasierte Bündel sollte nur die Skills enthalten, die für die täglichen Workflows dieser Rolle relevant sind.
Speichern Sie Skill-Verzeichnisse in Git für Verlaufsverfolgung, Code-Überprüfung über Pull Requests und Rollback-Fähigkeit. Jedes Skill-Verzeichnis (mit SKILL.md und allen gebündelten Dateien) wird natürlich einem Git-verfolgten Ordner zugeordnet.
Die Skills API bietet arbeitsbereichsbegrenzte Verteilung. Skills, die über die API hochgeladen werden, sind für alle Workspace-Mitglieder verfügbar. Weitere Informationen finden Sie unter Verwendung von Skills mit der API für Upload-, Versions- und Verwaltungsendpunkte.
Benutzerdefinierte Skills werden nicht über Oberflächen hinweg synchronisiert. Skills, die zur API hochgeladen werden, sind nicht auf claude.ai oder in Claude Code verfügbar und umgekehrt. Jede Oberfläche erfordert separate Uploads und Verwaltung.
Führen Sie Skill-Quelldateien in Git als einzelne Quelle der Wahrheit. Wenn Ihre Organisation Skills über mehrere Oberflächen bereitstellt, implementieren Sie Ihren eigenen Synchronisierungsprozess, um sie konsistent zu halten. Vollständige Details finden Sie unter Verfügbarkeit über mehrere Oberflächen.
Architektur- und Plattformdetails
Erstellungsanleitung für Skill-Ersteller
Laden Sie Skills programmgesteuert hoch und verwalten Sie sie
Sicherheitsmuster für die Agent-Bereitstellung
Was this page helpful?