Loading...
  • Bangun
  • Admin
  • Model & harga
  • Client SDK
  • Referensi API
Search...
⌘K
Log in
Kelola konteks alat
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Bangun/Infrastruktur alat

Kelola konteks alat

Pilih antara pencarian alat, pemanggilan alat terprogram, penyimpanan prompt, dan pengeditan konteks untuk mengelola pembengkakan konteks.

Definisi alat dan blok tool_result yang terakumulasi mengonsumsi jendela konteks Anda. Agen yang berjalan lama dengan banyak alat atau banyak putaran dapat menghabiskan konteks yang tersedia sebelum tugas selesai. Empat pendekatan mengatasi ini di berbagai titik dalam pipeline.

Empat pendekatan

Setiap pendekatan menargetkan sumber tekanan konteks yang berbeda. Pilih yang sesuai dengan kemana token Anda pergi.

PendekatanApa yang dikurangiKapan cocokPelajari lebih lanjut
Pencarian alatDefinisi alat dimuat di awalSet alat besar (20+ alat) di mana sebagian besar alat tidak diperlukan setiap putaranAlat pencarian alat
Pemanggilan alat terprogramRoundtrip tool_resultRantai pemanggilan alat yang dapat dieksekusi sebagai satu skripPemanggilan alat terprogram
Penyimpanan promptBiaya token dari definisi alat yang diulangSet alat stabil di seluruh banyak permintaanPenggunaan alat dengan penyimpanan prompt
Pengeditan konteksBlok tool_result lama dalam riwayatPercakapan panjang di mana hasil awal tidak lagi relevanPengeditan konteks

Pencarian alat

Pencarian alat membuat definisi alat tetap keluar dari jendela konteks sampai Claude memintanya. Alih-alih mengirim 50 skema alat di awal, Anda mengirim satu alat tool_search dan membiarkan Claude menemukan sisanya sesuai permintaan. Ini menukar sejumlah kecil latensi (satu putaran ekstra untuk mencari alat) dengan pengurangan besar dalam penggunaan konteks dasar.

Pemanggilan alat terprogram

Pemanggilan alat terprogram meruntuhkan urutan pemanggilan alat menjadi satu blok kode yang Claude tulis dan sandbox eksekusi kode Anthropic jalankan. Alih-alih lima roundtrip tool_use dan tool_result, Claude mengeluarkan satu skrip yang memanggil semua lima fungsi dari dalam sandbox. Hasil perantara tidak pernah memasuki riwayat percakapan.

Penyimpanan prompt

Penyimpanan prompt tidak mengurangi jumlah token dalam konteks, tetapi mengurangi apa yang Anda bayar untuk mereka pada permintaan berikutnya. Jika definisi alat Anda stabil, simpan cache sekali dan gunakan kembali awalan cache di seluruh ribuan permintaan. Ini adalah pilihan yang tepat ketika set alat besar tetapi tetap.

Pengeditan konteks

Pengeditan konteks menghapus blok tool_result lama dari riwayat percakapan setelah mereka telah melayani tujuan mereka. Loop agen yang panjang mungkin menghasilkan ratusan hasil perantara yang berguna pada saat itu tetapi sekarang adalah beban mati. Pengeditan konteks memungkinkan Anda memangkasnya tanpa memulai ulang percakapan.

Menggabungkan pendekatan

Pendekatan-pendekatan ini dapat digabungkan. Agen yang berjalan lama mungkin menggunakan pencarian alat untuk membuat set alat tetap ramping, penyimpanan prompt untuk mengamortisasi biaya definisi yang tersisa, dan pengeditan konteks untuk memangkas hasil yang sudah usang saat percakapan berkembang. Masing-masing menyelesaikan bagian berbeda dari masalah, jadi tidak ada konflik dalam menggunakannya bersama.

Titik awal yang masuk akal untuk agen volume tinggi:

  1. Aktifkan penyimpanan prompt pada definisi alat Anda sejak hari pertama. Penulisan cache membawa markup 25% di atas harga input dasar, yang terbayar pada permintaan kedua yang mencapai cache.
  2. Tambahkan pencarian alat setelah set alat Anda tumbuh melampaui kira-kira 20 alat atau penggunaan konteks dasar Anda menjadi terlihat.
  3. Tambahkan pengeditan konteks setelah percakapan individual mulai berjalan cukup lama sehingga hasil awal menjadi tidak relevan.
  4. Pertimbangkan pemanggilan alat terprogram jika Anda melihat rantai berulang dari pemanggilan alat kecil yang dapat dijalankan sebagai satu batch.

Langkah berikutnya

Alat pencarian alat

Muat definisi alat sesuai permintaan alih-alih di awal.

Pemanggilan alat terprogram

Runtuhkan rantai pemanggilan alat menjadi satu skrip yang dapat dieksekusi.

Penggunaan alat dengan penyimpanan prompt

Simpan cache definisi alat di seluruh permintaan untuk mengurangi biaya token.

Pengeditan konteks

Pangkas hasil alat yang sudah usang dari percakapan yang berjalan lama.

Was this page helpful?

  • Empat pendekatan
  • Pencarian alat
  • Pemanggilan alat terprogram
  • Penyimpanan prompt
  • Pengeditan konteks
  • Menggabungkan pendekatan
  • Langkah berikutnya