Loading...
    • Entwicklerleitfaden
    • API-Referenz
    • MCP
    • Ressourcen
    • Versionshinweise
    Search...
    ⌘K
    Erste Schritte
    Einführung in ClaudeSchnelleinstieg
    Modelle & Preise
    ModellübersichtModell auswählenNeuerungen in Claude 4.6MigrationsleitfadenModellabschreibungenPreise
    Mit Claude entwickeln
    FunktionsübersichtMessages API verwendenStop-Gründe verarbeitenBest Practices für Prompts
    Modellfähigkeiten
    Extended ThinkingAdaptive ThinkingAufwandFast Mode (Research Preview)Strukturierte AusgabenZitateStreaming MessagesBatch-VerarbeitungPDF-UnterstützungSuchergebnisseMehrsprachige UnterstützungEmbeddingsVision
    Tools
    ÜbersichtTool-Nutzung implementierenWeb-Such-ToolWeb-Abruf-ToolCode-Ausführungs-ToolMemory-ToolBash-ToolComputer-Use-ToolText-Editor-Tool
    Tool-Infrastruktur
    Tool-SucheProgrammgesteuerte Tool-AufrufeFeingranulares Tool-Streaming
    Kontextverwaltung
    KontextfensterKomprimierungKontextbearbeitungPrompt CachingToken-Zählung
    Dateien & Assets
    Files API
    Agent Skills
    ÜbersichtSchnelleinstiegBest PracticesSkills für UnternehmenSkills mit der API verwenden
    Agent SDK
    ÜbersichtSchnelleinstiegTypeScript SDKTypeScript V2 (Preview)Python SDKMigrationsleitfaden
    MCP in der API
    MCP-ConnectorRemote MCP-Server
    Claude auf Plattformen von Drittanbietern
    Amazon BedrockMicrosoft FoundryVertex AI
    Prompt Engineering
    ÜbersichtPrompt-GeneratorPrompt-Vorlagen verwendenPrompt-VerbessererKlar und direkt seinBeispiele verwenden (Multishot Prompting)Claude denken lassen (CoT)XML-Tags verwendenClaude eine Rolle geben (System Prompts)Komplexe Prompts verkettenTipps für lange KontexteTipps für Extended Thinking
    Testen & Evaluieren
    Erfolgskriterien definierenTestfälle entwickelnEvaluierungstool verwendenLatenz reduzieren
    Schutzmaßnahmen verstärken
    Halluzinationen reduzierenAusgabekonsistenz erhöhenJailbreaks abschwächenStreaming-AblehnungenPrompt-Lecks reduzierenClaude im Charakter halten
    Verwaltung und Überwachung
    Admin API ÜbersichtDatenspeicherortArbeitsbereicheUsage and Cost APIClaude Code Analytics APIZero Data Retention
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Agent Skills

    Skills für Unternehmen

    Governance, Sicherheitsprüfung, Evaluierung und organisatorische Anleitung für die Bereitstellung von Agent Skills im Unternehmensmaßstab.

    Diese Anleitung richtet sich an Unternehmensadministratoren und Architekten, die Agent Skills in einer Organisation verwalten müssen. Sie behandelt, wie Sie Skills in großem Maßstab überprüfen, evaluieren, bereitstellen und verwalten. Weitere Informationen zur Erstellung finden Sie unter Best Practices. Weitere Architekturdetails finden Sie in der Skills-Übersicht.

    Sicherheitsprüfung und Überprüfung

    Die Bereitstellung von Skills in einem Unternehmen erfordert die Beantwortung von zwei unterschiedlichen Fragen:

    1. Sind Skills grundsätzlich sicher? Weitere Informationen finden Sie im Abschnitt Sicherheitsaspekte in der Übersicht für Details zur Sicherheit auf Plattformebene.
    2. Wie überprüfe ich einen bestimmten Skill? Verwenden Sie die Risikobewertung und die Überprüfungscheckliste unten.

    Risikostufenbewertung

    Evaluieren Sie jeden Skill anhand dieser Risikoindikatoren, bevor Sie die Bereitstellung genehmigen:

    RisikoindikatorWorauf Sie achten solltenBesorgnisniveau
    Code-AusführungSkripte im Skill-Verzeichnis (*.py, *.sh, *.js)Hoch: Skripte werden mit vollständigem Umgebungszugriff ausgeführt
    AnweisungsmanipulationDirektiven zum Ignorieren von Sicherheitsregeln, zum Verbergen von Aktionen vor Benutzern oder zum bedingten Ändern des Claude-VerhaltensHoch: kann Sicherheitskontrollen umgehen
    MCP-Server-ReferenzenAnweisungen, die auf MCP-Tools verweisen (ServerName:tool_name)Hoch: erweitert den Zugriff über den Skill hinaus
    NetzwerkzugriffsmusterURLs, API-Endpunkte, fetch-, curl- oder requests-AufrufeHoch: potenzieller Vektor für Datenexfiltration
    Hartcodierte AnmeldedatenAPI-Schlüssel, Token oder Passwörter in Skill-Dateien oder SkriptenHoch: Geheimnisse sind in der Git-Historie und im Kontextfenster verfügbar
    Dateisystem-ZugriffsspannePfade außerhalb des Skill-Verzeichnisses, breite Glob-Muster, Pfadtraversal (../)Mittel: kann auf unbeabsichtigte Daten zugreifen
    Tool-AufrufeAnweisungen, die Claude anweisen, Bash, Dateivorgänge oder andere Tools zu verwendenMittel: überprüfen Sie, welche Vorgänge ausgeführt werden

    Überprüfungscheckliste

    Bevor Sie einen Skill von einem Drittanbieter oder internen Mitwirkenden bereitstellen, führen Sie diese Schritte aus:

    1. Lesen Sie den gesamten Skill-Verzeichnisinhalt. Überprüfen Sie SKILL.md, alle referenzierten Markdown-Dateien und alle gebündelten Skripte oder Ressourcen.
    2. Überprüfen Sie, dass das Skriptverhalten dem angegebenen Zweck entspricht. Führen Sie Skripte in einer isolierten Umgebung aus und bestätigen Sie, dass die Ausgaben mit der Beschreibung des Skills übereinstimmen.
    3. Überprüfen Sie auf gegnerische Anweisungen. Suchen Sie nach Direktiven, die Claude anweisen, Sicherheitsregeln zu ignorieren, Aktionen vor Benutzern zu verbergen, Daten durch Antworten zu exfiltrieren oder das Verhalten basierend auf bestimmten Eingaben zu ändern.
    4. Überprüfen Sie auf externe URL-Abrufe oder Netzwerkaufrufe. Durchsuchen Sie Skripte und Anweisungen nach Netzwerkzugriffsmustern (http, requests.get, urllib, curl, fetch).
    5. Überprüfen Sie, dass keine hartcodierten Anmeldedaten vorhanden sind. Überprüfen Sie Skill-Dateien auf API-Schlüssel, Token oder Passwörter. Anmeldedaten sollten Umgebungsvariablen oder sichere Anmeldedatenspeicher verwenden und niemals in Skill-Inhalten angezeigt werden.
    6. Identifizieren Sie Tools und Befehle, die der Skill Claude anweist, aufzurufen. Listen Sie alle Bash-Befehle, Dateivorgänge und Tool-Referenzen auf. Berücksichtigen Sie das kombinierte Risiko, wenn ein Skill sowohl Datei-Lese- als auch Netzwerk-Tools zusammen verwendet.
    7. Bestätigen Sie Umleitungsziele. Wenn der Skill auf externe URLs verweist, überprüfen Sie, dass sie auf erwartete Domänen verweisen.
    8. Überprüfen Sie auf keine Datenexfiltrationsmuster. Suchen Sie nach Anweisungen, die sensible Daten lesen und diese dann für externe Übertragung schreiben, senden oder codieren, einschließlich durch Claudes Gesprächsantworten.

    Stellen Sie niemals Skills aus nicht vertrauenswürdigen Quellen ohne vollständige Prüfung bereit. Ein böswilliger Skill kann Claude anweisen, beliebigen Code auszuführen, auf sensible Dateien zuzugreifen oder Daten extern zu übertragen. Behandeln Sie die Skill-Installation mit der gleichen Sorgfalt wie die Installation von Software auf Produktionssystemen.

    Evaluierung von Skills vor der Bereitstellung

    Skills können die Agent-Leistung beeinträchtigen, wenn sie falsch ausgelöst werden, mit anderen Skills in Konflikt geraten oder schlechte Anweisungen bieten. Fordern Sie eine Evaluierung vor jeder Produktionsbereitstellung an.

    Was zu evaluieren ist

    Richten Sie Genehmigungsgates für diese Dimensionen ein, bevor Sie einen Skill bereitstellen:

    DimensionWas es misstBeispielfehlschlag
    AuslösegenauigkeitWird der Skill für die richtigen Abfragen aktiviert und bleibt er für nicht verwandte inaktiv?Skill wird bei jeder Tabellenkalkulationserwähnung ausgelöst, auch wenn der Benutzer nur über Daten diskutieren möchte
    IsolierungsverhaltenFunktioniert der Skill korrekt allein?Skill verweist auf Dateien, die nicht in seinem Verzeichnis vorhanden sind
    KoexistenzVerschlechtert das Hinzufügen dieses Skills andere Skills?Die Beschreibung des neuen Skills ist zu breit und stiehlt Auslöser von bestehenden Skills
    Befolgung von AnweisungenFolgt Claude den Anweisungen des Skills genau?Claude überspringt Validierungsschritte oder verwendet falsche Bibliotheken
    AusgabequalitätErzeugt der Skill korrekte, nützliche Ergebnisse?Generierte Berichte haben Formatierungsfehler oder fehlende Daten

    Evaluierungsanforderungen

    Fordern Sie von Skill-Autoren ein, dass sie Evaluierungssuites mit 3-5 repräsentativen Abfragen pro Skill einreichen, die Fälle abdecken, in denen der Skill ausgelöst werden sollte, nicht ausgelöst werden sollte und mehrdeutige Grenzfälle. Fordern Sie Tests über die Modelle an, die Ihre Organisation verwendet (Haiku, Sonnet, Opus), da die Skill-Effektivität je nach Modell variiert.

    Detaillierte Anleitung zum Erstellen von Evaluierungen finden Sie unter Evaluierung und Iteration in Best Practices. Allgemeine Evaluierungsmethodik finden Sie unter Testfälle entwickeln.

    Verwendung von Evaluierungen für Lebenszyklusentscheidungen

    Evaluierungsergebnisse signalisieren, wann Maßnahmen erforderlich sind:

    • Sinkende Auslösegenauigkeit: Aktualisieren Sie die Beschreibung oder Anweisungen des Skills
    • Koexistenzkonflikt: Konsolidieren Sie überlappende Skills oder verengen Sie Beschreibungen
    • Konsistent niedrige Ausgabequalität: Schreiben Sie Anweisungen um oder fügen Sie Validierungsschritte hinzu
    • Anhaltende Fehler über Updates hinweg: Veralten Sie den Skill

    Skill-Lebenszyklusverwaltung

    1. 1

      Planen

      Identifizieren Sie Workflows, die repetitiv, fehleranfällig oder spezialisiertes Wissen erfordern. Ordnen Sie diese organisatorischen Rollen zu und bestimmen Sie, welche Kandidaten für Skills sind.

    2. 2

      Erstellen und überprüfen

      Stellen Sie sicher, dass der Skill-Autor Best Practices befolgt. Fordern Sie eine Sicherheitsprüfung mit der Überprüfungscheckliste oben an. Fordern Sie eine Evaluierungssuite vor der Genehmigung an. Etablieren Sie eine Aufgabentrennung: Skill-Autoren sollten nicht ihre eigenen Reviewer sein.

    3. 3

      Testen

      Fordern Sie Evaluierungen isoliert an (Skill allein) und neben bestehenden Skills (Koexistenztests). Überprüfen Sie die Auslösegenauigkeit, Ausgabequalität und das Fehlen von Regressionen über Ihren aktiven Skill-Satz, bevor Sie die Genehmigung für die Produktion erteilen.

    4. 4

      Bereitstellen

      Laden Sie über die Skills API für arbeitsbereichsweiten Zugriff hoch. Weitere Informationen finden Sie unter Verwendung von Skills mit der API für Upload- und Versionsverwaltung. Dokumentieren Sie den Skill in Ihrer internen Registrierung mit Zweck, Besitzer und Version.

    5. 5

      Überwachen

      Verfolgen Sie Nutzungsmuster und sammeln Sie Feedback von Benutzern. Führen Sie Evaluierungen regelmäßig erneut aus, um Drift oder Regressionen zu erkennen, wenn sich Workflows und Modelle entwickeln. Nutzungsanalysen sind derzeit nicht über die Skills API verfügbar. Implementieren Sie Logging auf Anwendungsebene, um zu verfolgen, welche Skills in Anfragen enthalten sind.

    6. 6

      Iterieren oder veralten

      Fordern Sie an, dass die vollständige Evaluierungssuite vor der Förderung neuer Versionen besteht. Aktualisieren Sie Skills, wenn sich Workflows ändern oder Evaluierungsergebnisse sinken. Veralten Sie Skills, wenn Evaluierungen konsistent fehlschlagen oder der Workflow eingestellt wird.

    Organisation von Skills im großen Maßstab

    Abrufgrenzen

    Begrenzen Sie als allgemeine Richtlinie die Anzahl der gleichzeitig geladenen Skills, um eine zuverlässige Abrufgenauigkeit zu gewährleisten. Die Metadaten jedes Skills (Name und Beschreibung) konkurrieren um Aufmerksamkeit in der Systemaufforderung. Bei zu vielen aktiven Skills kann Claude möglicherweise den richtigen Skill nicht auswählen oder relevante ganz übersehen. Verwenden Sie Ihre Evaluierungssuite, um die Abrufgenauigkeit zu messen, wenn Sie Skills hinzufügen, und hören Sie auf zu addieren, wenn die Leistung sinkt.

    Beachten Sie, dass API-Anfragen maximal 8 Skills pro Anfrage unterstützen (siehe Verwendung von Skills mit der API). Wenn eine Rolle mehr Skills benötigt, als eine einzelne Anfrage unterstützt, erwägen Sie, enge Skills in breitere zu konsolidieren oder Anfragen basierend auf dem Aufgabentyp an verschiedene Skill-Sätze weiterzuleiten.

    Beginnen Sie spezifisch, konsolidieren Sie später

    Ermutigen Sie Teams, mit engen, workflow-spezifischen Skills zu beginnen, anstatt mit breiten, mehrzweckigen. Wenn Muster in Ihrer Organisation entstehen, konsolidieren Sie verwandte Skills in rollenbasierte Bündel.

    Verwenden Sie Evaluierungen, um zu entscheiden, wann konsolidiert werden soll. Führen Sie enge Skills nur dann in einen breiteren zusammen, wenn die Evaluierungen des konsolidierten Skills eine gleichwertige Leistung zu den einzelnen Skills bestätigen, die er ersetzt.

    Beispielfortschritt:

    • Start: formatting-sales-reports, querying-pipeline-data, updating-crm-records
    • Konsolidieren: sales-operations (wenn Evaluierungen gleichwertige Leistung bestätigen)

    Benennung und Katalogisierung

    Verwenden Sie konsistente Benennungskonventionen in Ihrer Organisation. Der Abschnitt Benennungskonventionen in Best Practices bietet Formatierungsanleitung.

    Führen Sie eine interne Registrierung für jeden Skill mit:

    • Zweck: Welcher Workflow wird vom Skill unterstützt
    • Besitzer: Team oder Person, die für die Wartung verantwortlich ist
    • Version: Aktuell bereitgestellte Version
    • Abhängigkeiten: MCP-Server, Pakete oder erforderliche externe Dienste
    • Evaluierungsstatus: Letztes Evaluierungsdatum und Ergebnisse

    Rollenbasierte Bündel

    Gruppieren Sie Skills nach organisatorischer Rolle, um den aktiven Skill-Satz jedes Benutzers fokussiert zu halten:

    • Vertriebsteam: CRM-Vorgänge, Pipeline-Berichterstattung, Angebotsgeneration
    • Engineering: Code-Überprüfung, Bereitstellungs-Workflows, Incident Response
    • Finanzen: Berichtsgenerierung, Datenvalidierung, Audit-Vorbereitung

    Jedes rollenbasierte Bündel sollte nur die Skills enthalten, die für die täglichen Workflows dieser Rolle relevant sind.

    Verteilung und Versionskontrolle

    Quellkontrolle

    Speichern Sie Skill-Verzeichnisse in Git für Verlaufsverfolgung, Code-Überprüfung über Pull Requests und Rollback-Fähigkeit. Jedes Skill-Verzeichnis (mit SKILL.md und allen gebündelten Dateien) wird natürlich einem Git-verfolgten Ordner zugeordnet.

    API-basierte Verteilung

    Die Skills API bietet arbeitsbereichsbegrenzte Verteilung. Skills, die über die API hochgeladen werden, sind für alle Workspace-Mitglieder verfügbar. Weitere Informationen finden Sie unter Verwendung von Skills mit der API für Upload-, Versions- und Verwaltungsendpunkte.

    Versionierungsstrategie

    • Produktion: Heften Sie Skills an spezifische Versionen. Führen Sie die vollständige Evaluierungssuite aus, bevor Sie eine neue Version fördern. Behandeln Sie jedes Update als eine neue Bereitstellung, die eine vollständige Sicherheitsprüfung erfordert.
    • Entwicklung und Tests: Verwenden Sie die neuesten Versionen, um Änderungen vor der Produktionsförderung zu validieren.
    • Rollback-Plan: Behalten Sie die vorherige Version als Fallback. Wenn eine neue Version die Evaluierungen in der Produktion nicht besteht, kehren Sie sofort zur letzten bekannten guten Version zurück.
    • Integritätsprüfung: Berechnen Sie Prüfsummen überprüfter Skills und überprüfen Sie diese zum Bereitstellungszeitpunkt. Verwenden Sie signierte Commits in Ihrem Skill-Repository, um die Herkunft sicherzustellen.

    Überlegungen zu mehreren Oberflächen

    Benutzerdefinierte Skills werden nicht über Oberflächen hinweg synchronisiert. Skills, die zur API hochgeladen werden, sind nicht auf claude.ai oder in Claude Code verfügbar und umgekehrt. Jede Oberfläche erfordert separate Uploads und Verwaltung.

    Führen Sie Skill-Quelldateien in Git als einzelne Quelle der Wahrheit. Wenn Ihre Organisation Skills über mehrere Oberflächen bereitstellt, implementieren Sie Ihren eigenen Synchronisierungsprozess, um sie konsistent zu halten. Vollständige Details finden Sie unter Verfügbarkeit über mehrere Oberflächen.

    Nächste Schritte

    Agent Skills-Übersicht

    Architektur- und Plattformdetails

    Best Practices

    Erstellungsanleitung für Skill-Ersteller

    Verwendung von Skills mit der API

    Laden Sie Skills programmgesteuert hoch und verwalten Sie sie

    Sichere Bereitstellung von KI-Agenten

    Sicherheitsmuster für die Agent-Bereitstellung

    Was this page helpful?

    • Sicherheitsprüfung und Überprüfung
    • Risikostufenbewertung
    • Überprüfungscheckliste
    • Evaluierung von Skills vor der Bereitstellung
    • Was zu evaluieren ist
    • Evaluierungsanforderungen
    • Verwendung von Evaluierungen für Lebenszyklusentscheidungen
    • Skill-Lebenszyklusverwaltung
    • Organisation von Skills im großen Maßstab
    • Abrufgrenzen
    • Beginnen Sie spezifisch, konsolidieren Sie später
    • Benennung und Katalogisierung
    • Rollenbasierte Bündel
    • Verteilung und Versionskontrolle
    • Quellkontrolle
    • API-basierte Verteilung
    • Versionierungsstrategie
    • Überlegungen zu mehreren Oberflächen
    • Nächste Schritte