Panduan ini ditujukan untuk admin dan arsitek enterprise yang perlu mengelola Agent Skills di seluruh organisasi. Panduan ini mencakup cara memeriksa, mengevaluasi, menerapkan, dan mengelola Skills dalam skala besar. Untuk panduan penulisan, lihat praktik terbaik. Untuk detail arsitektur, lihat ikhtisar Skills.
Menerapkan Skills di lingkungan enterprise memerlukan jawaban atas dua pertanyaan yang berbeda:
Evaluasi setiap Skill terhadap indikator risiko berikut sebelum menyetujui penerapan:
| Indikator risiko | Apa yang perlu dicari | Tingkat kekhawatiran |
|---|---|---|
| Eksekusi kode | Skrip dalam direktori Skill (*.py, *.sh, *.js) | Tinggi: skrip berjalan dengan akses penuh ke lingkungan |
| Manipulasi instruksi | Arahan untuk mengabaikan aturan keamanan, menyembunyikan tindakan dari pengguna, atau mengubah perilaku Claude secara kondisional | Tinggi: dapat melewati kontrol keamanan |
| Referensi server MCP | Instruksi yang mereferensikan alat MCP (ServerName:tool_name) | Tinggi: memperluas akses di luar Skill itu sendiri |
| Pola akses jaringan | URL, endpoint API, panggilan fetch, curl, atau requests | Tinggi: potensi vektor eksfiltrasi data |
| Kredensial yang di-hardcode | Kunci API, token, atau kata sandi dalam file atau skrip Skill | Tinggi: rahasia terekspos dalam riwayat Git dan jendela konteks |
| Cakupan akses sistem file | Path di luar direktori Skill, pola glob yang luas, path traversal (../) | Sedang: dapat mengakses data yang tidak diinginkan |
| Pemanggilan alat | Instruksi yang mengarahkan Claude untuk menggunakan bash, operasi file, atau alat lainnya | Sedang: tinjau operasi apa yang dilakukan |
Sebelum menerapkan Skill apa pun dari pihak ketiga atau kontributor internal, selesaikan langkah-langkah berikut:
http, requests.get, urllib, curl, fetch).Jangan pernah menerapkan Skills dari sumber yang tidak tepercaya tanpa audit penuh. Skill yang berbahaya dapat mengarahkan Claude untuk mengeksekusi kode arbitrer, mengakses file sensitif, atau mentransmisikan data secara eksternal. Perlakukan instalasi Skill dengan ketelitian yang sama seperti menginstal perangkat lunak pada sistem produksi.
Skills dapat menurunkan kinerja agen jika terpicu secara tidak tepat, berkonflik dengan Skills lain, atau memberikan instruksi yang buruk. Wajibkan evaluasi sebelum penerapan produksi apa pun.
Tetapkan gerbang persetujuan untuk dimensi-dimensi berikut sebelum menerapkan Skill apa pun:
| Dimensi | Apa yang diukur | Contoh kegagalan |
|---|---|---|
| Akurasi pemicuan | Apakah Skill aktif untuk kueri yang tepat dan tetap tidak aktif untuk kueri yang tidak terkait? | Skill terpicu pada setiap penyebutan spreadsheet, bahkan ketika pengguna hanya ingin membahas data |
| Perilaku isolasi | Apakah Skill bekerja dengan benar secara mandiri? | Skill mereferensikan file yang tidak ada dalam direktorinya |
| Koeksistensi | Apakah menambahkan Skill ini menurunkan kinerja Skills lain? | Deskripsi Skill baru terlalu luas, mengambil alih pemicu dari Skills yang sudah ada |
| Kepatuhan instruksi | Apakah Claude mengikuti instruksi Skill secara akurat? | Claude melewatkan langkah validasi atau menggunakan library yang salah |
| Kualitas output | Apakah Skill menghasilkan hasil yang benar dan berguna? | Laporan yang dihasilkan memiliki kesalahan format atau data yang hilang |
Wajibkan penulis Skill untuk menyerahkan rangkaian evaluasi dengan 3-5 kueri representatif per Skill, yang mencakup kasus di mana Skill seharusnya terpicu, seharusnya tidak terpicu, dan kasus tepi yang ambigu. Wajibkan pengujian di seluruh model yang digunakan organisasi Anda (Haiku, Sonnet, Opus), karena efektivitas Skill bervariasi menurut model.
Untuk panduan terperinci tentang membangun evaluasi, lihat evaluasi dan iterasi di praktik terbaik. Untuk metodologi evaluasi umum, lihat mengembangkan kasus uji.
Hasil evaluasi memberi sinyal kapan harus bertindak:
Rencanakan
Identifikasi alur kerja yang repetitif, rentan kesalahan, atau memerlukan pengetahuan khusus. Petakan alur kerja ini ke peran organisasi dan tentukan mana yang menjadi kandidat untuk Skills.
Buat dan tinjau
Pastikan penulis Skill mengikuti praktik terbaik. Wajibkan tinjauan keamanan menggunakan daftar periksa tinjauan di atas. Wajibkan rangkaian evaluasi sebelum persetujuan. Tetapkan pemisahan tugas: penulis Skill tidak boleh menjadi peninjau mereka sendiri.
Uji
Wajibkan evaluasi secara terisolasi (Skill sendiri) dan bersama Skills yang sudah ada (pengujian koeksistensi). Verifikasi akurasi pemicuan, kualitas output, dan tidak adanya regresi di seluruh kumpulan Skill aktif Anda sebelum menyetujui untuk produksi.
Terapkan
Unggah melalui Skills API untuk akses di seluruh workspace. Lihat Menggunakan Skills dengan API untuk pengunggahan dan manajemen versi. Dokumentasikan Skill dalam registri internal Anda dengan tujuan, pemilik, dan versi.
Pantau
Lacak pola penggunaan dan kumpulkan umpan balik dari pengguna. Jalankan kembali evaluasi secara berkala untuk mendeteksi drift atau regresi seiring berkembangnya alur kerja dan model. Analitik penggunaan saat ini tidak tersedia melalui Skills API. Terapkan logging tingkat aplikasi untuk melacak Skills mana yang disertakan dalam permintaan.
Iterasi atau hentikan
Wajibkan rangkaian evaluasi lengkap untuk lulus sebelum mempromosikan versi baru. Perbarui Skills ketika alur kerja berubah atau skor evaluasi menurun. Hentikan penggunaan Skills ketika evaluasi secara konsisten gagal atau alur kerja tersebut sudah tidak digunakan.
Sebagai pedoman umum, batasi jumlah Skills yang dimuat secara bersamaan untuk menjaga akurasi "recall" (pemanggilan kembali) yang andal. Metadata setiap Skill (nama dan deskripsi) bersaing untuk mendapatkan perhatian dalam prompt sistem. Dengan terlalu banyak Skills yang aktif, Claude mungkin gagal memilih Skill yang tepat atau melewatkan Skill yang relevan sepenuhnya. Gunakan rangkaian evaluasi Anda untuk mengukur akurasi recall saat Anda menambahkan Skills, dan berhenti menambahkan ketika kinerja menurun.
Perhatikan bahwa permintaan API mendukung maksimum 8 Skills per permintaan (lihat Menggunakan Skills dengan API). Jika suatu peran memerlukan lebih banyak Skills daripada yang didukung oleh satu permintaan, pertimbangkan untuk mengonsolidasikan Skills yang sempit menjadi yang lebih luas atau merutekan permintaan ke kumpulan Skill yang berbeda berdasarkan jenis tugas.
Dorong tim untuk memulai dengan Skills yang sempit dan spesifik untuk alur kerja daripada yang luas dan multiguna. Seiring munculnya pola di seluruh organisasi Anda, konsolidasikan Skills terkait menjadi bundel berbasis peran.
Gunakan evaluasi untuk memutuskan kapan harus mengonsolidasikan. Gabungkan Skills yang sempit menjadi satu yang lebih luas hanya ketika evaluasi Skill yang dikonsolidasikan mengonfirmasi kinerja yang setara dengan Skills individual yang digantikannya.
Contoh perkembangan:
formatting-sales-reports, querying-pipeline-data, updating-crm-recordssales-operations (ketika evaluasi mengonfirmasi kinerja yang setara)Gunakan konvensi penamaan yang konsisten di seluruh organisasi Anda. Bagian konvensi penamaan di praktik terbaik menyediakan panduan format.
Pelihara registri internal untuk setiap Skill dengan:
Kelompokkan Skills berdasarkan peran organisasi untuk menjaga kumpulan Skill aktif setiap pengguna tetap terfokus:
Setiap bundel berbasis peran hanya boleh berisi Skills yang relevan dengan alur kerja harian peran tersebut.
Simpan direktori Skill di Git untuk pelacakan riwayat, tinjauan kode melalui pull request, dan kemampuan rollback. Setiap direktori Skill (yang berisi SKILL.md dan file apa pun yang disertakan) secara alami dipetakan ke folder yang dilacak Git.
Skills API menyediakan distribusi dengan cakupan workspace. Skills yang diunggah melalui API tersedia untuk semua anggota workspace. Lihat Menggunakan Skills dengan API untuk endpoint pengunggahan, versioning, dan manajemen.
Skills kustom tidak tersinkronisasi antar surface. Skills yang diunggah ke API tidak tersedia di claude.ai atau di Claude Code, dan sebaliknya. Setiap surface memerlukan pengunggahan dan manajemen terpisah.
Pelihara file sumber Skill di Git sebagai satu-satunya sumber kebenaran. Jika organisasi Anda menerapkan Skills di beberapa surface, terapkan proses sinkronisasi Anda sendiri untuk menjaganya tetap konsisten. Untuk detail lengkap, lihat ketersediaan lintas surface.
Detail arsitektur dan platform
Panduan penulisan untuk pembuat Skill
Unggah dan kelola Skills secara terprogram
Was this page helpful?