Loading...
    • Guía para desarrolladores
    • Referencia de API
    • MCP
    • Recursos
    • Notas de la versión
    Search...
    ⌘K
    Primeros pasos
    Introducción a ClaudeInicio rápido
    Modelos y precios
    Descripción general de modelosElegir un modeloNovedades en Claude 4.6Guía de migraciónModelos deprecadosPrecios
    Crear con Claude
    Descripción general de característicasUsar la API de MessagesManejar razones de paradaMejores prácticas de prompting
    Gestión de contexto
    Ventanas de contextoCompactaciónEdición de contexto
    Capacidades
    Almacenamiento en caché de promptsPensamiento extendidoPensamiento adaptativoEsfuerzoStreaming de MessagesProcesamiento por lotesCitasSoporte multilingüeConteo de tokensEmbeddingsVisiónSoporte de PDFAPI de FilesResultados de búsquedaSalidas estructuradas
    Herramientas
    Descripción generalCómo implementar el uso de herramientasStreaming de herramientas de grano finoHerramienta BashHerramienta de ejecución de códigoLlamada de herramientas programáticaHerramienta de uso de computadoraHerramienta de editor de textoHerramienta de búsqueda webHerramienta de búsqueda webHerramienta de memoriaHerramienta de búsqueda de herramientas
    Agent Skills
    Descripción generalInicio rápidoMejores prácticasSkills para empresasUsar Skills con la API
    Agent SDK
    Descripción generalInicio rápidoSDK de TypeScriptTypeScript V2 (vista previa)SDK de PythonGuía de migración
    MCP en la API
    Conector MCPServidores MCP remotos
    Claude en plataformas de terceros
    Amazon BedrockMicrosoft FoundryVertex AI
    Ingeniería de prompts
    Descripción generalGenerador de promptsUsar plantillas de promptsMejorador de promptsSer claro y directoUsar ejemplos (prompting multishot)Dejar que Claude piense (CoT)Usar etiquetas XMLDar a Claude un rol (prompts del sistema)Encadenar prompts complejosConsejos de contexto largoConsejos de pensamiento extendido
    Probar y evaluar
    Definir criterios de éxitoDesarrollar casos de pruebaUsar la herramienta de evaluaciónReducir latencia
    Fortalecer protecciones
    Reducir alucinacionesAumentar consistencia de salidaMitigar ataques de jailbreakRechazos de streamingReducir fuga de promptsMantener a Claude en personaje
    Administración y monitoreo
    Descripción general de Admin APIResidencia de datosEspacios de trabajoAPI de uso y costosAPI de Claude Code AnalyticsRetención de datos cero
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Agent Skills

    Habilidades para empresas

    Gobernanza, revisión de seguridad, evaluación y orientación organizacional para implementar Agent Skills a escala empresarial.

    Esta guía es para administradores y arquitectos empresariales que necesitan gobernar Agent Skills en toda una organización. Cubre cómo revisar, evaluar, implementar y gestionar Skills a escala. Para orientación sobre autoría, consulta mejores prácticas. Para detalles de arquitectura, consulta la descripción general de Skills.

    Revisión de seguridad y evaluación

    Implementar Skills en una empresa requiere responder dos preguntas distintas:

    1. ¿Son las Skills seguras en general? Consulta la sección consideraciones de seguridad en la descripción general para detalles de seguridad a nivel de plataforma.
    2. ¿Cómo evalúo una Skill específica? Utiliza la evaluación de riesgos y la lista de verificación de revisión a continuación.

    Evaluación de nivel de riesgo

    Evalúa cada Skill contra estos indicadores de riesgo antes de aprobar la implementación:

    Indicador de riesgoQué buscarNivel de preocupación
    Ejecución de códigoScripts en el directorio de Skill (*.py, *.sh, *.js)Alto: los scripts se ejecutan con acceso completo al entorno
    Manipulación de instruccionesDirectivas para ignorar reglas de seguridad, ocultar acciones a los usuarios o alterar el comportamiento de Claude condicionalmenteAlto: puede eludir controles de seguridad
    Referencias de servidor MCPInstrucciones que hacen referencia a herramientas MCP (ServerName:tool_name)Alto: extiende el acceso más allá de la Skill en sí
    Patrones de acceso de redURLs, puntos finales de API, llamadas fetch, curl o requestsAlto: vector potencial de exfiltración de datos
    Credenciales codificadasClaves de API, tokens o contraseñas en archivos de Skill o scriptsAlto: secretos expuestos en el historial de Git y la ventana de contexto
    Alcance de acceso al sistema de archivosRutas fuera del directorio de Skill, patrones glob amplios, recorrido de ruta (../)Medio: puede acceder a datos no deseados
    Invocaciones de herramientasInstrucciones que dirigen a Claude a usar bash, operaciones de archivo u otras herramientasMedio: revisar qué operaciones se realizan

    Lista de verificación de revisión

    Antes de implementar cualquier Skill de un tercero o colaborador interno, completa estos pasos:

    1. Lee todo el contenido del directorio de Skill. Revisa SKILL.md, todos los archivos markdown referenciados y cualquier script o recurso incluido.
    2. Verifica que el comportamiento del script coincida con el propósito indicado. Ejecuta scripts en un entorno aislado y confirma que los resultados se alineen con la descripción de la Skill.
    3. Busca instrucciones adversariales. Busca directivas que le digan a Claude que ignore reglas de seguridad, oculte acciones a los usuarios, exfiltre datos a través de respuestas o altere el comportamiento según entradas específicas.
    4. Busca búsquedas de URL externas o llamadas de red. Busca en scripts e instrucciones patrones de acceso de red (http, requests.get, urllib, curl, fetch).
    5. Verifica que no haya credenciales codificadas. Busca claves de API, tokens o contraseñas en archivos de Skill. Las credenciales deben usar variables de entorno o almacenes de credenciales seguros, nunca aparecer en contenido de Skill.
    6. Identifica herramientas y comandos que la Skill instruye a Claude a invocar. Lista todos los comandos bash, operaciones de archivo y referencias de herramientas. Considera el riesgo combinado cuando una Skill usa herramientas de lectura de archivos y de red juntas.
    7. Confirma destinos de redirección. Si la Skill hace referencia a URLs externas, verifica que apunten a dominios esperados.
    8. Verifica que no haya patrones de exfiltración de datos. Busca instrucciones que lean datos sensibles y luego los escriban, envíen o codifiquen para transmisión externa, incluyendo a través de respuestas conversacionales de Claude.

    Nunca implementes Skills de fuentes no confiables sin una auditoría completa. Una Skill maliciosa puede dirigir a Claude a ejecutar código arbitrario, acceder a archivos sensibles o transmitir datos externamente. Trata la instalación de Skill con el mismo rigor que instalar software en sistemas de producción.

    Evaluación de Skills antes de la implementación

    Las Skills pueden degradar el rendimiento del agente si se activan incorrectamente, entran en conflicto con otras Skills o proporcionan instrucciones deficientes. Requiere evaluación antes de cualquier implementación en producción.

    Qué evaluar

    Establece puertas de aprobación para estas dimensiones antes de implementar cualquier Skill:

    DimensiónQué mideEjemplo de fallo
    Precisión de activación¿Se activa la Skill para las consultas correctas y permanece inactiva para las no relacionadas?La Skill se activa en cada mención de hoja de cálculo, incluso cuando el usuario solo quiere discutir datos
    Comportamiento de aislamiento¿Funciona la Skill correctamente por sí sola?La Skill hace referencia a archivos que no existen en su directorio
    Coexistencia¿Agregar esta Skill degrada otras Skills?La descripción de la nueva Skill es demasiado amplia, robando activadores de Skills existentes
    Seguimiento de instrucciones¿Sigue Claude las instrucciones de la Skill con precisión?Claude omite pasos de validación o usa bibliotecas incorrectas
    Calidad de salida¿Produce la Skill resultados correctos y útiles?Los informes generados tienen errores de formato o datos faltantes

    Requisitos de evaluación

    Requiere que los autores de Skill envíen suites de evaluación con 3-5 consultas representativas por Skill, cubriendo casos donde la Skill debe activarse, no debe activarse y casos límite ambiguos. Requiere pruebas en los modelos que tu organización utiliza (Haiku, Sonnet, Opus), ya que la efectividad de la Skill varía según el modelo.

    Para orientación detallada sobre la construcción de evaluaciones, consulta evaluación e iteración en mejores prácticas. Para metodología de evaluación general, consulta desarrollar casos de prueba.

    Usar evaluaciones para decisiones de ciclo de vida

    Los resultados de evaluación señalan cuándo actuar:

    • Precisión de activación decreciente: Actualiza la descripción o instrucciones de la Skill
    • Conflictos de coexistencia: Consolida Skills superpuestas o estrecha descripciones
    • Calidad de salida consistentemente baja: Reescribe instrucciones o agrega pasos de validación
    • Fallos persistentes en actualizaciones: Depreca la Skill

    Gestión del ciclo de vida de Skill

    1. 1

      Planificar

      Identifica flujos de trabajo que son repetitivos, propensos a errores o requieren conocimiento especializado. Asigna estos a roles organizacionales y determina cuáles son candidatos para Skills.

    2. 2

      Crear y revisar

      Asegúrate de que el autor de la Skill siga mejores prácticas. Requiere una revisión de seguridad usando la lista de verificación de revisión anterior. Requiere una suite de evaluación antes de la aprobación. Establece separación de funciones: los autores de Skill no deben ser sus propios revisores.

    3. 3

      Probar

      Requiere evaluaciones en aislamiento (Skill sola) y junto con Skills existentes (pruebas de coexistencia). Verifica la precisión de activación, la calidad de salida y la ausencia de regresiones en tu conjunto de Skills activo antes de aprobar para producción.

    4. 4

      Implementar

      Carga a través de la API de Skills para acceso en toda el área de trabajo. Consulta Usar Skills con la API para carga y gestión de versiones. Documenta la Skill en tu registro interno con propósito, propietario y versión.

    5. 5

      Monitorear

      Rastrea patrones de uso y recopila comentarios de los usuarios. Vuelve a ejecutar evaluaciones periódicamente para detectar desviación o regresiones a medida que los flujos de trabajo y modelos evolucionan. Las analíticas de uso no están disponibles actualmente a través de la API de Skills. Implementa registro a nivel de aplicación para rastrear qué Skills se incluyen en solicitudes.

    6. 6

      Iterar o deprecar

      Requiere que la suite de evaluación completa pase antes de promover nuevas versiones. Actualiza Skills cuando los flujos de trabajo cambian o las puntuaciones de evaluación disminuyen. Depreca Skills cuando las evaluaciones fallan consistentemente o el flujo de trabajo se retira.

    Organización de Skills a escala

    Límites de recuperación

    Como pauta general, limita el número de Skills cargadas simultáneamente para mantener la precisión de recuperación confiable. Los metadatos de cada Skill (nombre y descripción) compiten por atención en el mensaje del sistema. Con demasiadas Skills activas, Claude puede no seleccionar la Skill correcta o perder las relevantes por completo. Utiliza tu suite de evaluación para medir la precisión de recuperación a medida que agregas Skills y detente cuando el rendimiento se degrade.

    Ten en cuenta que las solicitudes de API admiten un máximo de 8 Skills por solicitud (consulta Usar Skills con la API). Si un rol requiere más Skills de las que una sola solicitud admite, considera consolidar Skills estrechas en más amplias o enrutar solicitudes a diferentes conjuntos de Skills según el tipo de tarea.

    Comienza específico, consolida después

    Anima a los equipos a comenzar con Skills estrechas y específicas del flujo de trabajo en lugar de amplias y multipropósito. A medida que emergen patrones en tu organización, consolida Skills relacionadas en paquetes basados en roles.

    Utiliza evaluaciones para decidir cuándo consolidar. Fusiona Skills estrechas en una más amplia solo cuando las evaluaciones de la Skill consolidada confirmen rendimiento equivalente a las Skills individuales que reemplaza.

    Ejemplo de progresión:

    • Inicio: formatting-sales-reports, querying-pipeline-data, updating-crm-records
    • Consolidar: sales-operations (cuando las evaluaciones confirmen rendimiento equivalente)

    Nomenclatura y catalogación

    Utiliza convenciones de nomenclatura consistentes en toda tu organización. La sección convenciones de nomenclatura en mejores prácticas proporciona orientación de formato.

    Mantén un registro interno para cada Skill con:

    • Propósito: Qué flujo de trabajo admite la Skill
    • Propietario: Equipo o individuo responsable del mantenimiento
    • Versión: Versión implementada actual
    • Dependencias: Servidores MCP, paquetes o servicios externos requeridos
    • Estado de evaluación: Fecha de última evaluación y resultados

    Paquetes basados en roles

    Agrupa Skills por rol organizacional para mantener el conjunto de Skills activo de cada usuario enfocado:

    • Equipo de ventas: Operaciones de CRM, informes de canalización, generación de propuestas
    • Ingeniería: Revisión de código, flujos de trabajo de implementación, respuesta a incidentes
    • Finanzas: Generación de informes, validación de datos, preparación de auditoría

    Cada paquete basado en roles debe contener solo las Skills relevantes para los flujos de trabajo diarios de ese rol.

    Distribución y control de versiones

    Control de fuente

    Almacena directorios de Skill en Git para seguimiento de historial, revisión de código a través de solicitudes de extracción y capacidad de reversión. Cada directorio de Skill (que contiene SKILL.md y cualquier archivo incluido) se asigna naturalmente a una carpeta rastreada por Git.

    Distribución basada en API

    La API de Skills proporciona distribución con alcance de área de trabajo. Las Skills cargadas a través de la API están disponibles para todos los miembros del área de trabajo. Consulta Usar Skills con la API para carga, versionado y puntos finales de gestión.

    Estrategia de versionado

    • Producción: Fija Skills a versiones específicas. Ejecuta la suite de evaluación completa antes de promover una nueva versión. Trata cada actualización como una nueva implementación que requiere revisión de seguridad completa.
    • Desarrollo y pruebas: Utiliza las últimas versiones para validar cambios antes de la promoción a producción.
    • Plan de reversión: Mantén la versión anterior como respaldo. Si una nueva versión falla evaluaciones en producción, revierte a la última versión conocida como buena inmediatamente.
    • Verificación de integridad: Calcula sumas de verificación de Skills revisadas y verifica en el momento de la implementación. Utiliza commits firmados en tu repositorio de Skill para asegurar la procedencia.

    Consideraciones entre superficies

    Las Skills personalizadas no se sincronizan entre superficies. Las Skills cargadas a la API no están disponibles en claude.ai o en Claude Code, y viceversa. Cada superficie requiere cargas y gestión separadas.

    Mantén archivos de fuente de Skill en Git como la única fuente de verdad. Si tu organización implementa Skills en múltiples superficies, implementa tu propio proceso de sincronización para mantenerlas consistentes. Para detalles completos, consulta disponibilidad entre superficies.

    Próximos pasos

    Descripción general de Agent Skills

    Detalles de arquitectura y plataforma

    Mejores prácticas

    Orientación de autoría para creadores de Skill

    Usar Skills con la API

    Carga y gestiona Skills programáticamente

    Implementación segura de agentes de IA

    Patrones de seguridad para implementación de agentes

    Was this page helpful?

    • Revisión de seguridad y evaluación
    • Evaluación de nivel de riesgo
    • Lista de verificación de revisión
    • Evaluación de Skills antes de la implementación
    • Qué evaluar
    • Requisitos de evaluación
    • Usar evaluaciones para decisiones de ciclo de vida
    • Gestión del ciclo de vida de Skill
    • Organización de Skills a escala
    • Límites de recuperación
    • Comienza específico, consolida después
    • Nomenclatura y catalogación
    • Paquetes basados en roles
    • Distribución y control de versiones
    • Control de fuente
    • Distribución basada en API
    • Estrategia de versionado
    • Consideraciones entre superficies
    • Próximos pasos