Panduan ini ditujukan untuk admin perusahaan dan arsitek yang perlu mengatur Agent Skills di seluruh organisasi. Panduan ini mencakup cara memverifikasi, mengevaluasi, menerapkan, dan mengelola Skills dalam skala besar. Untuk panduan penulisan, lihat praktik terbaik. Untuk detail arsitektur, lihat ringkasan Skills.
Menerapkan Skills di perusahaan memerlukan menjawab dua pertanyaan yang berbeda:
Evaluasi setiap Skill terhadap indikator risiko ini sebelum menyetujui penerapan:
| Indikator risiko | Apa yang harus dicari | Tingkat kekhawatiran |
|---|---|---|
| Eksekusi kode | Skrip di direktori Skill (*.py, *.sh, *.js) | Tinggi: skrip berjalan dengan akses lingkungan penuh |
| Manipulasi instruksi | Arahan untuk mengabaikan aturan keamanan, menyembunyikan tindakan dari pengguna, atau mengubah perilaku Claude secara kondisional | Tinggi: dapat melewati kontrol keamanan |
| Referensi server MCP | Instruksi yang mereferensikan alat MCP (ServerName:tool_name) | Tinggi: memperluas akses di luar Skill itu sendiri |
| Pola akses jaringan | URL, titik akhir API, panggilan fetch, curl, atau requests | Tinggi: vektor potensi eksfiltrasi data |
| Kredensial hardcoded | Kunci API, token, atau kata sandi dalam file Skill atau skrip | Tinggi: rahasia terekspos dalam riwayat Git dan jendela konteks |
| Cakupan akses sistem file | Jalur di luar direktori Skill, pola glob luas, traversal jalur (../) | Sedang: dapat mengakses data yang tidak dimaksudkan |
| Invokasi alat | Instruksi yang mengarahkan Claude untuk menggunakan bash, operasi file, atau alat lainnya | Sedang: tinjau operasi apa yang dilakukan |
Sebelum menerapkan Skill apa pun dari pihak ketiga atau kontributor internal, selesaikan langkah-langkah berikut:
http, requests.get, urllib, curl, fetch).Jangan pernah menerapkan Skills dari sumber yang tidak terpercaya tanpa audit lengkap. Skill yang berbahaya dapat mengarahkan Claude untuk menjalankan kode arbitrer, mengakses file sensitif, atau mengirimkan data secara eksternal. Perlakukan instalasi Skill dengan ketelitian yang sama seperti menginstal perangkat lunak pada sistem produksi.
Skills dapat menurunkan kinerja agen jika mereka dipicu secara tidak benar, bertentangan dengan Skills lain, atau memberikan instruksi yang buruk. Perlukan evaluasi sebelum penerapan produksi apa pun.
Tetapkan gerbang persetujuan untuk dimensi ini sebelum menerapkan Skill apa pun:
| Dimensi | Apa yang diukur | Contoh kegagalan |
|---|---|---|
| Akurasi pemicu | Apakah Skill diaktifkan untuk kueri yang tepat dan tetap tidak aktif untuk kueri yang tidak terkait? | Skill dipicu pada setiap penyebutan spreadsheet, bahkan ketika pengguna hanya ingin membahas data |
| Perilaku isolasi | Apakah Skill berfungsi dengan benar sendiri? | Skill mereferensikan file yang tidak ada di direktorinya |
| Koeksistensi | Apakah menambahkan Skill ini menurunkan Skills lain? | Deskripsi Skill baru terlalu luas, mencuri pemicu dari Skills yang ada |
| Mengikuti instruksi | Apakah Claude mengikuti instruksi Skill dengan akurat? | Claude melewati langkah validasi atau menggunakan perpustakaan yang salah |
| Kualitas output | Apakah Skill menghasilkan hasil yang benar dan berguna? | Laporan yang dihasilkan memiliki kesalahan pemformatan atau data yang hilang |
Perlukan penulis Skill untuk mengirimkan suite evaluasi dengan 3-5 kueri perwakilan per Skill, mencakup kasus di mana Skill harus dipicu, tidak boleh dipicu, dan kasus tepi yang ambigu. Perlukan pengujian di seluruh model yang digunakan organisasi Anda (Haiku, Sonnet, Opus), karena efektivitas Skill bervariasi menurut model.
Untuk panduan terperinci tentang membangun evaluasi, lihat evaluasi dan iterasi dalam praktik terbaik. Untuk metodologi evaluasi umum, lihat mengembangkan kasus uji.
Hasil evaluasi menandakan kapan harus bertindak:
Rencanakan
Identifikasi alur kerja yang berulang, rawan kesalahan, atau memerlukan pengetahuan khusus. Petakan ini ke peran organisasi dan tentukan mana yang merupakan kandidat untuk Skills.
Buat dan tinjau
Pastikan penulis Skill mengikuti praktik terbaik. Perlukan tinjauan keamanan menggunakan daftar periksa tinjauan di atas. Perlukan suite evaluasi sebelum persetujuan. Tetapkan pemisahan tugas: penulis Skill tidak boleh menjadi peninjau mereka sendiri.
Uji
Perlukan evaluasi secara terisolasi (Skill sendiri) dan bersama Skills yang ada (pengujian koeksistensi). Verifikasi akurasi pemicu, kualitas output, dan tidak adanya regresi di seluruh set Skill aktif Anda sebelum menyetujui untuk produksi.
Terapkan
Unggah melalui Skills API untuk akses di seluruh ruang kerja. Lihat Menggunakan Skills dengan API untuk manajemen unggahan dan versi. Dokumentasikan Skill dalam registri internal Anda dengan tujuan, pemilik, dan versi.
Pantau
Lacak pola penggunaan dan kumpulkan umpan balik dari pengguna. Jalankan kembali evaluasi secara berkala untuk mendeteksi pergeseran atau regresi saat alur kerja dan model berkembang. Analitik penggunaan saat ini tidak tersedia melalui Skills API. Implementasikan pencatatan tingkat aplikasi untuk melacak Skills mana yang disertakan dalam permintaan.
Iterasi atau hentikan
Perlukan suite evaluasi lengkap untuk lulus sebelum mempromosikan versi baru. Perbarui Skills ketika alur kerja berubah atau skor evaluasi menurun. Hentikan Skills ketika evaluasi secara konsisten gagal atau alur kerja dihentikan.
Sebagai pedoman umum, batasi jumlah Skills yang dimuat secara bersamaan untuk mempertahankan akurasi penarikan kembali yang andal. Metadata setiap Skill (nama dan deskripsi) bersaing untuk perhatian dalam prompt sistem. Dengan terlalu banyak Skills aktif, Claude mungkin gagal memilih Skill yang tepat atau melewatkan yang relevan sepenuhnya. Gunakan suite evaluasi Anda untuk mengukur akurasi penarikan kembali saat Anda menambahkan Skills, dan berhenti menambahkan ketika kinerja menurun.
Perhatikan bahwa permintaan API mendukung maksimal 8 Skills per permintaan (lihat Menggunakan Skills dengan API). Jika peran memerlukan lebih banyak Skills daripada yang didukung permintaan tunggal, pertimbangkan untuk menggabungkan Skills sempit menjadi yang lebih luas atau merutekan permintaan ke set Skill yang berbeda berdasarkan jenis tugas.
Dorong tim untuk memulai dengan Skills yang sempit dan spesifik alur kerja daripada yang luas dan multi-tujuan. Saat pola muncul di seluruh organisasi Anda, konsolidasikan Skills terkait menjadi bundel berbasis peran.
Gunakan evaluasi untuk memutuskan kapan harus menggabungkan. Gabungkan Skills sempit menjadi yang lebih luas hanya ketika evaluasi Skill yang dikonsolidasikan mengkonfirmasi kinerja setara dengan Skills individual yang digantikannya.
Contoh perkembangan:
formatting-sales-reports, querying-pipeline-data, updating-crm-recordssales-operations (ketika evals mengkonfirmasi kinerja setara)Gunakan konvensi penamaan yang konsisten di seluruh organisasi Anda. Bagian konvensi penamaan dalam praktik terbaik memberikan panduan pemformatan.
Pertahankan registri internal untuk setiap Skill dengan:
Kelompokkan Skills menurut peran organisasi untuk menjaga set Skill aktif setiap pengguna tetap fokus:
Setiap bundel berbasis peran harus berisi hanya Skills yang relevan dengan alur kerja harian peran tersebut.
Simpan direktori Skill di Git untuk pelacakan riwayat, tinjauan kode melalui permintaan tarik, dan kemampuan rollback. Setiap direktori Skill (berisi SKILL.md dan file bundel apa pun) memetakan secara alami ke folder yang dilacak Git.
Skills API menyediakan distribusi dengan cakupan ruang kerja. Skills yang diunggah melalui API tersedia untuk semua anggota ruang kerja. Lihat Menggunakan Skills dengan API untuk unggahan, versioning, dan titik akhir manajemen.
Custom Skills tidak disinkronkan di seluruh permukaan. Skills yang diunggah ke API tidak tersedia di claude.ai atau di Claude Code, dan sebaliknya. Setiap permukaan memerlukan unggahan dan manajemen terpisah.
Pertahankan file sumber Skill di Git sebagai sumber kebenaran tunggal. Jika organisasi Anda menerapkan Skills di beberapa permukaan, implementasikan proses sinkronisasi Anda sendiri untuk menjaganya tetap konsisten. Untuk detail lengkap, lihat ketersediaan lintas permukaan.
Detail arsitektur dan platform
Panduan penulisan untuk pembuat Skill
Unggah dan kelola Skills secara terprogram
Pola keamanan untuk penerapan agen
Was this page helpful?