Loading...
    • Bangun
    • Admin
    • Model & harga
    • Client SDK
    • Referensi API
    Search...
    ⌘K
    Langkah pertama
    Pengantar ClaudeMulai Cepat
    Membangun dengan Claude
    Ikhtisar fiturMenggunakan Messages APIKeahlian Claude APIMenangani alasan berhenti
    Kemampuan model
    Pemikiran diperluasPemikiran adaptifUpayaAnggaran tugas (beta)Mode cepat (beta: pratinjau riset)Output terstrukturKutipanStreaming PesanPemrosesan batchHasil pencarianPenolakan streamingDukungan multibahasaEmbeddings
    Alat
    IkhtisarCara kerja penggunaan alatTutorial: Bangun agen menggunakan alatDefinisikan alatTangani panggilan alatPenggunaan alat paralelTool Runner (SDK)Penggunaan alat ketatPenggunaan alat dengan prompt cachingAlat serverPemecahan masalahAlat pencarian webAlat pengambilan webAlat eksekusi kodeAlat penasihatAlat memoriAlat BashAlat penggunaan komputerAlat editor teks
    Infrastruktur alat
    Referensi alatKelola konteks alatKombinasi alatPencarian alatPemanggilan alat terprogramStreaming alat berbutir halus
    Manajemen konteks
    Jendela konteksPemadatanPengeditan konteksPrompt cachingPenghitungan token
    Bekerja dengan file
    Files APIDukungan PDFGambar dan visi
    Keahlian
    IkhtisarMulai CepatPraktik terbaikKeahlian untuk perusahaanKeahlian di API
    MCP
    Server MCP jarak jauhKonektor MCP
    Rekayasa prompt
    IkhtisarPraktik terbaik promptingAlat prompting Console
    Uji dan evaluasi
    Tentukan keberhasilan dan bangun evaluasiMenggunakan Alat Evaluasi di ConsoleMengurangi latensi
    Perkuat pembatas
    Kurangi halusinasiTingkatkan konsistensi outputMitigasi jailbreakKurangi kebocoran prompt
    Sumber daya
    Glosarium
    Catatan rilis
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Infrastruktur alat

    Kelola konteks alat

    Pilih antara pencarian alat, pemanggilan alat terprogram, penyimpanan prompt, dan pengeditan konteks untuk mengelola pembengkakan konteks.

    Definisi alat dan blok tool_result yang terakumulasi mengonsumsi jendela konteks Anda. Agen yang berjalan lama dengan banyak alat atau banyak putaran dapat menghabiskan konteks yang tersedia sebelum tugas selesai. Empat pendekatan mengatasi ini di berbagai titik dalam pipeline.

    Empat pendekatan

    Setiap pendekatan menargetkan sumber tekanan konteks yang berbeda. Pilih yang sesuai dengan kemana token Anda pergi.

    PendekatanApa yang dikurangiKapan cocokPelajari lebih lanjut
    Pencarian alatDefinisi alat dimuat di awalSet alat besar (20+ alat) di mana sebagian besar alat tidak diperlukan setiap putaranAlat pencarian alat
    Pemanggilan alat terprogramRoundtrip tool_resultRantai pemanggilan alat yang dapat dieksekusi sebagai satu skripPemanggilan alat terprogram
    Penyimpanan promptBiaya token dari definisi alat yang diulangSet alat stabil di seluruh banyak permintaanPenggunaan alat dengan penyimpanan prompt
    Pengeditan konteksBlok tool_result lama dalam riwayatPercakapan panjang di mana hasil awal tidak lagi relevanPengeditan konteks

    Pencarian alat

    Pencarian alat membuat definisi alat tetap keluar dari jendela konteks sampai Claude memintanya. Alih-alih mengirim 50 skema alat di awal, Anda mengirim satu alat tool_search dan membiarkan Claude menemukan sisanya sesuai permintaan. Ini menukar sejumlah kecil latensi (satu putaran ekstra untuk mencari alat) dengan pengurangan besar dalam penggunaan konteks dasar.

    Pemanggilan alat terprogram

    Pemanggilan alat terprogram meruntuhkan urutan pemanggilan alat menjadi satu blok kode yang Claude tulis dan sandbox eksekusi kode Anthropic jalankan. Alih-alih lima roundtrip tool_use dan tool_result, Claude mengeluarkan satu skrip yang memanggil semua lima fungsi dari dalam sandbox. Hasil perantara tidak pernah memasuki riwayat percakapan.

    Penyimpanan prompt

    Penyimpanan prompt tidak mengurangi jumlah token dalam konteks, tetapi mengurangi apa yang Anda bayar untuk mereka pada permintaan berikutnya. Jika definisi alat Anda stabil, simpan cache sekali dan gunakan kembali awalan cache di seluruh ribuan permintaan. Ini adalah pilihan yang tepat ketika set alat besar tetapi tetap.

    Pengeditan konteks

    Pengeditan konteks menghapus blok tool_result lama dari riwayat percakapan setelah mereka telah melayani tujuan mereka. Loop agen yang panjang mungkin menghasilkan ratusan hasil perantara yang berguna pada saat itu tetapi sekarang adalah beban mati. Pengeditan konteks memungkinkan Anda memangkasnya tanpa memulai ulang percakapan.

    Menggabungkan pendekatan

    Pendekatan-pendekatan ini dapat digabungkan. Agen yang berjalan lama mungkin menggunakan pencarian alat untuk membuat set alat tetap ramping, penyimpanan prompt untuk mengamortisasi biaya definisi yang tersisa, dan pengeditan konteks untuk memangkas hasil yang sudah usang saat percakapan berkembang. Masing-masing menyelesaikan bagian berbeda dari masalah, jadi tidak ada konflik dalam menggunakannya bersama.

    Titik awal yang masuk akal untuk agen volume tinggi:

    1. Aktifkan penyimpanan prompt pada definisi alat Anda sejak hari pertama. Penulisan cache membawa markup 25% di atas harga input dasar, yang terbayar pada permintaan kedua yang mencapai cache.
    2. Tambahkan pencarian alat setelah set alat Anda tumbuh melampaui kira-kira 20 alat atau penggunaan konteks dasar Anda menjadi terlihat.
    3. Tambahkan pengeditan konteks setelah percakapan individual mulai berjalan cukup lama sehingga hasil awal menjadi tidak relevan.
    4. Pertimbangkan pemanggilan alat terprogram jika Anda melihat rantai berulang dari pemanggilan alat kecil yang dapat dijalankan sebagai satu batch.

    Langkah berikutnya

    Alat pencarian alat

    Muat definisi alat sesuai permintaan alih-alih di awal.

    Pemanggilan alat terprogram

    Runtuhkan rantai pemanggilan alat menjadi satu skrip yang dapat dieksekusi.

    Penggunaan alat dengan penyimpanan prompt

    Simpan cache definisi alat di seluruh permintaan untuk mengurangi biaya token.

    Pengeditan konteks

    Pangkas hasil alat yang sudah usang dari percakapan yang berjalan lama.

    Was this page helpful?

    • Empat pendekatan
    • Pencarian alat
    • Pemanggilan alat terprogram
    • Penyimpanan prompt
    • Pengeditan konteks
    • Menggabungkan pendekatan
    • Langkah berikutnya