Loading...
  • Bangun
  • Admin
  • Model & harga
  • Client SDK
  • Referensi API
Search...
⌘K
Log in
Keahlian untuk perusahaan
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Bangun/Keahlian

Keterampilan untuk perusahaan

Tata kelola, tinjauan keamanan, evaluasi, dan panduan organisasi untuk menerapkan Agent Skills pada skala perusahaan.

Panduan ini ditujukan untuk admin perusahaan dan arsitek yang perlu mengatur Agent Skills di seluruh organisasi. Panduan ini mencakup cara memeriksa, mengevaluasi, menerapkan, dan mengelola Skills dalam skala besar. Untuk panduan penulisan, lihat praktik terbaik. Untuk detail arsitektur, lihat ringkasan Skills.

Tinjauan keamanan dan penyaringan

Menerapkan Skills di perusahaan memerlukan menjawab dua pertanyaan yang berbeda:

  1. Apakah Skills aman secara umum? Lihat bagian pertimbangan keamanan dalam ringkasan untuk detail keamanan tingkat platform.
  2. Bagaimana cara saya memeriksa Skill tertentu? Gunakan penilaian risiko dan daftar periksa tinjauan di bawah ini.

Penilaian tingkat risiko

Evaluasi setiap Skill terhadap indikator risiko ini sebelum menyetujui penerapan:

Indikator risikoApa yang harus dicariTingkat kekhawatiran
Eksekusi kodeSkrip dalam direktori Skill (*.py, *.sh, *.js)Tinggi: skrip berjalan dengan akses lingkungan penuh
Manipulasi instruksiArahan untuk mengabaikan aturan keamanan, menyembunyikan tindakan dari pengguna, atau mengubah perilaku Claude secara kondisionalTinggi: dapat melewati kontrol keamanan
Referensi server MCPInstruksi yang mereferensikan alat MCP (ServerName:tool_name)Tinggi: memperluas akses di luar Skill itu sendiri
Pola akses jaringanURL, titik akhir API, panggilan fetch, curl, atau requestsTinggi: vektor potensi eksfiltrasi data
Kredensial hardcodedKunci API, token, atau kata sandi dalam file Skill atau skripTinggi: rahasia terekspos dalam riwayat Git dan jendela konteks
Cakupan akses sistem fileJalur di luar direktori Skill, pola glob luas, traversal jalur (../)Sedang: dapat mengakses data yang tidak dimaksudkan
Invokasi alatInstruksi yang mengarahkan Claude untuk menggunakan bash, operasi file, atau alat lainnyaSedang: tinjau operasi apa yang dilakukan

Daftar periksa tinjauan

Sebelum menerapkan Skill apa pun dari pihak ketiga atau kontributor internal, selesaikan langkah-langkah berikut:

  1. Baca semua konten direktori Skill. Tinjau SKILL.md, semua file markdown yang direferensikan, dan skrip atau sumber daya bundel apa pun.
  2. Verifikasi perilaku skrip sesuai dengan tujuan yang dinyatakan. Jalankan skrip di lingkungan sandbox dan konfirmasi output selaras dengan deskripsi Skill.
  3. Periksa instruksi yang bersifat adversarial. Cari arahan yang memberi tahu Claude untuk mengabaikan aturan keamanan, menyembunyikan tindakan dari pengguna, mengeksfiltrasi data melalui respons, atau mengubah perilaku berdasarkan input tertentu.
  4. Periksa pengambilan URL eksternal atau panggilan jaringan. Cari skrip dan instruksi untuk pola akses jaringan (http, requests.get, urllib, curl, fetch).
  5. Verifikasi tidak ada kredensial hardcoded. Periksa kunci API, token, atau kata sandi dalam file Skill. Kredensial harus menggunakan variabel lingkungan atau penyimpanan kredensial aman, tidak pernah muncul dalam konten Skill.
  6. Identifikasi alat dan perintah yang diinstruksikan Skill kepada Claude untuk dipanggil. Buat daftar semua perintah bash, operasi file, dan referensi alat. Pertimbangkan risiko gabungan ketika Skill menggunakan alat pembacaan file dan jaringan bersama-sama.
  7. Konfirmasi tujuan pengalihan. Jika Skill mereferensikan URL eksternal, verifikasi bahwa mereka menunjuk ke domain yang diharapkan.
  8. Verifikasi tidak ada pola eksfiltrasi data. Cari instruksi yang membaca data sensitif dan kemudian menulis, mengirim, atau mengkodekannya untuk transmisi eksternal, termasuk melalui respons percakapan Claude.

Jangan pernah menerapkan Skills dari sumber yang tidak terpercaya tanpa audit lengkap. Skill yang berbahaya dapat mengarahkan Claude untuk menjalankan kode arbitrer, mengakses file sensitif, atau mengirimkan data secara eksternal. Perlakukan instalasi Skill dengan ketelitian yang sama seperti menginstal perangkat lunak pada sistem produksi.

Mengevaluasi Skills sebelum penerapan

Skills dapat menurunkan kinerja agen jika mereka dipicu secara tidak benar, bertentangan dengan Skills lain, atau memberikan instruksi yang buruk. Memerlukan evaluasi sebelum penerapan produksi apa pun.

Apa yang harus dievaluasi

Tetapkan gerbang persetujuan untuk dimensi ini sebelum menerapkan Skill apa pun:

DimensiApa yang diukurContoh kegagalan
Akurasi pemicuApakah Skill diaktifkan untuk kueri yang tepat dan tetap tidak aktif untuk kueri yang tidak terkait?Skill dipicu pada setiap penyebutan spreadsheet, bahkan ketika pengguna hanya ingin membahas data
Perilaku isolasiApakah Skill bekerja dengan benar sendiri?Skill mereferensikan file yang tidak ada di direktorinya
KoeksistensiApakah menambahkan Skill ini menurunkan Skills lain?Deskripsi Skill baru terlalu luas, mencuri pemicu dari Skills yang ada
Mengikuti instruksiApakah Claude mengikuti instruksi Skill dengan akurat?Claude melewatkan langkah validasi atau menggunakan perpustakaan yang salah
Kualitas outputApakah Skill menghasilkan hasil yang benar dan berguna?Laporan yang dihasilkan memiliki kesalahan pemformatan atau data yang hilang

Persyaratan evaluasi

Memerlukan penulis Skill untuk mengirimkan suite evaluasi dengan 3-5 kueri perwakilan per Skill, mencakup kasus di mana Skill harus dipicu, tidak boleh dipicu, dan kasus tepi yang ambigu. Memerlukan pengujian di seluruh model yang digunakan organisasi Anda (Haiku, Sonnet, Opus), karena efektivitas Skill bervariasi menurut model.

Untuk panduan terperinci tentang membangun evaluasi, lihat evaluasi dan iterasi dalam praktik terbaik. Untuk metodologi evaluasi umum, lihat mengembangkan kasus uji.

Menggunakan evaluasi untuk keputusan siklus hidup

Hasil evaluasi menandakan kapan harus bertindak:

  • Akurasi pemicu menurun: Perbarui deskripsi atau instruksi Skill
  • Konflik koeksistensi: Konsolidasikan Skills yang tumpang tindih atau persempit deskripsi
  • Kualitas output konsisten rendah: Tulis ulang instruksi atau tambahkan langkah validasi
  • Kegagalan persisten di seluruh pembaruan: Hentikan Skill

Manajemen siklus hidup Skill

  1. 1

    Rencanakan

    Identifikasi alur kerja yang berulang, rentan kesalahan, atau memerlukan pengetahuan khusus. Petakan ini ke peran organisasi dan tentukan mana yang merupakan kandidat untuk Skills.

  2. 2

    Buat dan tinjau

    Pastikan penulis Skill mengikuti praktik terbaik. Memerlukan tinjauan keamanan menggunakan daftar periksa tinjauan di atas. Memerlukan suite evaluasi sebelum persetujuan. Tetapkan pemisahan tugas: penulis Skill tidak boleh menjadi peninjau mereka sendiri.

  3. 3

    Uji

    Memerlukan evaluasi secara terisolasi (Skill sendiri) dan bersama Skills yang ada (pengujian koeksistensi). Verifikasi akurasi pemicu, kualitas output, dan tidak adanya regresi di seluruh set Skill aktif Anda sebelum menyetujui untuk produksi.

  4. 4

    Terapkan

    Unggah melalui Skills API untuk akses di seluruh ruang kerja. Lihat Menggunakan Skills dengan API untuk manajemen unggahan dan versi. Dokumentasikan Skill dalam registri internal Anda dengan tujuan, pemilik, dan versi.

  5. 5

    Pantau

    Lacak pola penggunaan dan kumpulkan umpan balik dari pengguna. Jalankan kembali evaluasi secara berkala untuk mendeteksi pergeseran atau regresi saat alur kerja dan model berkembang. Analitik penggunaan saat ini tidak tersedia melalui Skills API. Implementasikan pencatatan tingkat aplikasi untuk melacak Skills mana yang disertakan dalam permintaan.

  6. 6

    Iterasi atau hentikan

    Memerlukan suite evaluasi lengkap untuk lulus sebelum mempromosikan versi baru. Perbarui Skills ketika alur kerja berubah atau skor evaluasi menurun. Hentikan Skills ketika evaluasi secara konsisten gagal atau alur kerja dihentikan.

Mengorganisir Skills dalam skala besar

Batas penarikan kembali

Sebagai panduan umum, batasi jumlah Skills yang dimuat secara bersamaan untuk mempertahankan akurasi penarikan kembali yang andal. Metadata setiap Skill (nama dan deskripsi) bersaing untuk perhatian dalam prompt sistem. Dengan terlalu banyak Skills aktif, Claude mungkin gagal memilih Skill yang tepat atau melewatkan yang relevan sepenuhnya. Gunakan suite evaluasi Anda untuk mengukur akurasi penarikan kembali saat Anda menambahkan Skills, dan berhenti menambahkan ketika kinerja menurun.

Perhatikan bahwa permintaan API mendukung maksimum 8 Skills per permintaan (lihat Menggunakan Skills dengan API). Jika peran memerlukan lebih banyak Skills daripada yang didukung permintaan tunggal, pertimbangkan untuk menggabungkan Skills sempit menjadi yang lebih luas atau merutekan permintaan ke set Skills yang berbeda berdasarkan jenis tugas.

Mulai spesifik, konsolidasikan nanti

Dorong tim untuk memulai dengan Skills yang sempit dan spesifik alur kerja daripada yang luas dan multi-tujuan. Saat pola muncul di seluruh organisasi Anda, konsolidasikan Skills terkait menjadi bundel berbasis peran.

Gunakan evaluasi untuk memutuskan kapan harus menggabungkan. Gabungkan Skills sempit menjadi yang lebih luas hanya ketika evaluasi Skill yang dikonsolidasikan mengkonfirmasi kinerja setara dengan Skills individual yang digantikannya.

Contoh perkembangan:

  • Mulai: formatting-sales-reports, querying-pipeline-data, updating-crm-records
  • Konsolidasikan: sales-operations (ketika evals mengkonfirmasi kinerja setara)

Penamaan dan katalogisasi

Gunakan konvensi penamaan yang konsisten di seluruh organisasi Anda. Bagian konvensi penamaan dalam praktik terbaik menyediakan panduan pemformatan.

Pertahankan registri internal untuk setiap Skill dengan:

  • Tujuan: Alur kerja apa yang didukung Skill
  • Pemilik: Tim atau individu yang bertanggung jawab untuk pemeliharaan
  • Versi: Versi yang saat ini diterapkan
  • Dependensi: Server MCP, paket, atau layanan eksternal yang diperlukan
  • Status evaluasi: Tanggal evaluasi terakhir dan hasil

Bundel berbasis peran

Kelompokkan Skills menurut peran organisasi untuk menjaga set Skill aktif setiap pengguna tetap fokus:

  • Tim penjualan: Operasi CRM, pelaporan pipeline, pembuatan proposal
  • Teknik: Tinjauan kode, alur kerja penerapan, respons insiden
  • Keuangan: Pembuatan laporan, validasi data, persiapan audit

Setiap bundel berbasis peran harus berisi hanya Skills yang relevan dengan alur kerja harian peran tersebut.

Distribusi dan kontrol versi

Kontrol sumber

Simpan direktori Skill di Git untuk pelacakan riwayat, tinjauan kode melalui permintaan tarik, dan kemampuan rollback. Setiap direktori Skill (berisi SKILL.md dan file bundel apa pun) memetakan secara alami ke folder yang dilacak Git.

Distribusi berbasis API

Skills API menyediakan distribusi berskop ruang kerja. Skills yang diunggah melalui API tersedia untuk semua anggota ruang kerja. Lihat Menggunakan Skills dengan API untuk unggahan, versioning, dan titik akhir manajemen.

Strategi versioning

  • Produksi: Sematkan Skills ke versi tertentu. Jalankan suite evaluasi lengkap sebelum mempromosikan versi baru. Perlakukan setiap pembaruan sebagai penerapan baru yang memerlukan tinjauan keamanan lengkap.
  • Pengembangan dan pengujian: Gunakan versi terbaru untuk memvalidasi perubahan sebelum promosi produksi.
  • Rencana rollback: Pertahankan versi sebelumnya sebagai fallback. Jika versi baru gagal evaluasi dalam produksi, kembalikan ke versi terakhir yang diketahui baik segera.
  • Verifikasi integritas: Hitung checksum Skills yang ditinjau dan verifikasi saat waktu penerapan. Gunakan komit yang ditandatangani dalam repositori Skill Anda untuk memastikan provenance.

Pertimbangan lintas permukaan

Custom Skills tidak disinkronkan di seluruh permukaan. Skills yang diunggah ke API tidak tersedia di claude.ai atau di Claude Code, dan sebaliknya. Setiap permukaan memerlukan unggahan dan manajemen terpisah.

Pertahankan file sumber Skill di Git sebagai sumber kebenaran tunggal. Jika organisasi Anda menerapkan Skills di beberapa permukaan, implementasikan proses sinkronisasi Anda sendiri untuk menjaganya tetap konsisten. Untuk detail lengkap, lihat ketersediaan lintas permukaan.

Langkah berikutnya

Ringkasan Agent Skills

Detail arsitektur dan platform

Praktik terbaik

Panduan penulisan untuk pembuat Skill

Menggunakan Skills dengan API

Unggah dan kelola Skills secara terprogram

Was this page helpful?

  • Tinjauan keamanan dan penyaringan
  • Penilaian tingkat risiko
  • Daftar periksa tinjauan
  • Mengevaluasi Skills sebelum penerapan
  • Apa yang harus dievaluasi
  • Persyaratan evaluasi
  • Menggunakan evaluasi untuk keputusan siklus hidup
  • Manajemen siklus hidup Skill
  • Mengorganisir Skills dalam skala besar
  • Batas penarikan kembali
  • Mulai spesifik, konsolidasikan nanti
  • Penamaan dan katalogisasi
  • Bundel berbasis peran
  • Distribusi dan kontrol versi
  • Kontrol sumber
  • Distribusi berbasis API
  • Strategi versioning
  • Pertimbangan lintas permukaan
  • Langkah berikutnya