Esta guía está dirigida a administradores y arquitectos empresariales que necesitan gobernar Agent Skills en toda una organización. Cubre cómo examinar, evaluar, implementar y gestionar Skills a escala. Para obtener orientación sobre la creación, consulta las mejores prácticas. Para obtener detalles sobre la arquitectura, consulta la descripción general de Skills.
Implementar Skills en una empresa requiere responder dos preguntas distintas:
Evalúa cada Skill según estos indicadores de riesgo antes de aprobar su implementación:
| Indicador de riesgo | Qué buscar | Nivel de preocupación |
|---|---|---|
| Ejecución de código | Scripts en el directorio de la Skill (*.py, *.sh, *.js) | Alto: los scripts se ejecutan con acceso completo al entorno |
| Manipulación de instrucciones | Directivas para ignorar reglas de seguridad, ocultar acciones a los usuarios o alterar el comportamiento de Claude de forma condicional | Alto: puede eludir los controles de seguridad |
| Referencias a servidores MCP | Instrucciones que hacen referencia a herramientas MCP (ServerName:tool_name) | Alto: extiende el acceso más allá de la propia Skill |
| Patrones de acceso a la red | URLs, endpoints de API, llamadas a fetch, curl o requests | Alto: posible vector de exfiltración de datos |
| Credenciales codificadas de forma fija | Claves de API, tokens o contraseñas en archivos o scripts de la Skill | Alto: secretos expuestos en el historial de Git y en la ventana de contexto |
| Alcance de acceso al sistema de archivos | Rutas fuera del directorio de la Skill, patrones glob amplios, recorrido de rutas (../) | Medio: puede acceder a datos no previstos |
| Invocaciones de herramientas | Instrucciones que indican a Claude que use bash, operaciones de archivos u otras herramientas | Medio: revisa qué operaciones se realizan |
Antes de implementar cualquier Skill de un tercero o colaborador interno, completa estos pasos:
http, requests.get, urllib, curl, fetch).Nunca implementes Skills de fuentes no confiables sin una auditoría completa. Una Skill maliciosa puede indicar a Claude que ejecute código arbitrario, acceda a archivos sensibles o transmita datos externamente. Trata la instalación de Skills con el mismo rigor que la instalación de software en sistemas de producción.
Las Skills pueden degradar el rendimiento del agente si se activan incorrectamente, entran en conflicto con otras Skills o proporcionan instrucciones deficientes. Exige una evaluación antes de cualquier implementación en producción.
Establece puntos de aprobación para estas dimensiones antes de implementar cualquier Skill:
| Dimensión | Qué mide | Ejemplo de fallo |
|---|---|---|
| Precisión de activación | ¿Se activa la Skill para las consultas correctas y permanece inactiva para las no relacionadas? | La Skill se activa con cada mención de hoja de cálculo, incluso cuando el usuario solo quiere hablar sobre datos |
| Comportamiento en aislamiento | ¿Funciona correctamente la Skill por sí sola? | La Skill hace referencia a archivos que no existen en su directorio |
| Coexistencia | ¿Agregar esta Skill degrada otras Skills? | La descripción de la nueva Skill es demasiado amplia y roba activaciones de Skills existentes |
| Seguimiento de instrucciones | ¿Sigue Claude las instrucciones de la Skill con precisión? | Claude omite pasos de validación o usa bibliotecas incorrectas |
| Calidad de salida | ¿Produce la Skill resultados correctos y útiles? | Los informes generados tienen errores de formato o datos faltantes |
Exige a los autores de Skills que envíen conjuntos de evaluación con 3-5 consultas representativas por Skill, cubriendo casos en los que la Skill debería activarse, no debería activarse y casos límite ambiguos. Exige pruebas en todos los modelos que usa tu organización (Haiku, Sonnet, Opus), ya que la efectividad de las Skills varía según el modelo.
Para obtener orientación detallada sobre cómo crear evaluaciones, consulta evaluación e iteración en las mejores prácticas. Para conocer la metodología general de evaluación, consulta desarrollar casos de prueba.
Los resultados de la evaluación indican cuándo actuar:
Planificar
Identifica flujos de trabajo que sean repetitivos, propensos a errores o que requieran conocimiento especializado. Asigna estos a roles organizacionales y determina cuáles son candidatos para Skills.
Crear y revisar
Asegúrate de que el autor de la Skill siga las mejores prácticas. Exige una revisión de seguridad usando la lista de verificación de revisión anterior. Exige un conjunto de evaluación antes de la aprobación. Establece separación de funciones: los autores de Skills no deben ser sus propios revisores.
Probar
Exige evaluaciones en aislamiento (la Skill sola) y junto con Skills existentes (pruebas de coexistencia). Verifica la precisión de activación, la calidad de salida y la ausencia de regresiones en tu conjunto activo de Skills antes de aprobar para producción.
Implementar
Carga mediante la API de Skills para acceso a nivel de espacio de trabajo. Consulta Usar Skills con la API para la carga y gestión de versiones. Documenta la Skill en tu registro interno con propósito, propietario y versión.
Monitorear
Rastrea patrones de uso y recopila comentarios de los usuarios. Vuelve a ejecutar evaluaciones periódicamente para detectar desviaciones o regresiones a medida que evolucionan los flujos de trabajo y los modelos. Las analíticas de uso no están disponibles actualmente a través de la API de Skills. Implementa registro a nivel de aplicación para rastrear qué Skills se incluyen en las solicitudes.
Iterar o depreciar
Exige que el conjunto completo de evaluación pase antes de promover nuevas versiones. Actualiza las Skills cuando los flujos de trabajo cambien o las puntuaciones de evaluación disminuyan. Deprecia las Skills cuando las evaluaciones fallen consistentemente o el flujo de trabajo se retire.
Como pauta general, limita el número de Skills cargadas simultáneamente para mantener una precisión de recuperación confiable. Los metadatos de cada Skill (nombre y descripción) compiten por atención en la indicación del sistema. Con demasiadas Skills activas, Claude puede no seleccionar la Skill correcta o pasar por alto las relevantes por completo. Usa tu conjunto de evaluación para medir la precisión de recuperación a medida que agregas Skills, y deja de agregar cuando el rendimiento se degrade.
Ten en cuenta que las solicitudes de API admiten un máximo de 8 Skills por solicitud (consulta Usar Skills con la API). Si un rol requiere más Skills de las que admite una sola solicitud, considera consolidar Skills específicas en otras más amplias o enrutar las solicitudes a diferentes conjuntos de Skills según el tipo de tarea.
Anima a los equipos a comenzar con Skills específicas para flujos de trabajo concretos en lugar de Skills amplias y multipropósito. A medida que surjan patrones en tu organización, consolida las Skills relacionadas en paquetes basados en roles.
Usa evaluaciones para decidir cuándo consolidar. Fusiona Skills específicas en una más amplia solo cuando las evaluaciones de la Skill consolidada confirmen un rendimiento equivalente al de las Skills individuales que reemplaza.
Ejemplo de progresión:
formatting-sales-reports, querying-pipeline-data, updating-crm-recordssales-operations (cuando las evaluaciones confirmen un rendimiento equivalente)Usa convenciones de nomenclatura consistentes en toda tu organización. La sección de convenciones de nomenclatura en las mejores prácticas proporciona orientación sobre el formato.
Mantén un registro interno para cada Skill con:
Agrupa las Skills por rol organizacional para mantener enfocado el conjunto activo de Skills de cada usuario:
Cada paquete basado en roles debe contener solo las Skills relevantes para los flujos de trabajo diarios de ese rol.
Almacena los directorios de Skills en Git para el seguimiento del historial, la revisión de código mediante pull requests y la capacidad de reversión. Cada directorio de Skill (que contiene SKILL.md y cualquier archivo incluido) se corresponde naturalmente con una carpeta rastreada por Git.
La API de Skills proporciona distribución con alcance de espacio de trabajo. Las Skills cargadas a través de la API están disponibles para todos los miembros del espacio de trabajo. Consulta Usar Skills con la API para conocer los endpoints de carga, versionado y gestión.
Las Skills personalizadas no se sincronizan entre superficies. Las Skills cargadas en la API no están disponibles en claude.ai ni en Claude Code, y viceversa. Cada superficie requiere cargas y gestión por separado.
Mantén los archivos fuente de las Skills en Git como única fuente de verdad. Si tu organización implementa Skills en múltiples superficies, implementa tu propio proceso de sincronización para mantenerlas consistentes. Para obtener detalles completos, consulta disponibilidad entre superficies.
Detalles de arquitectura y plataforma
Orientación de creación para autores de Skills
Carga y gestiona Skills de forma programática
Was this page helpful?