Loading...
  • Bangun
  • Admin
  • Model & harga
  • Client SDK
  • Referensi API
Search...
⌘K
Log in
Penggunaan alat dengan prompt caching
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Bangun/Alat

Penggunaan alat dengan prompt caching

Cache definisi alat di seluruh turn dan pahami apa yang membatalkan cache Anda.

Halaman ini mencakup prompt caching untuk definisi alat: di mana menempatkan breakpoint cache_control, bagaimana defer_loading menjaga cache Anda, dan apa yang membatalkannya. Untuk prompt caching umum, lihat Prompt caching.

cache_control pada definisi alat

Tempatkan cache_control: {"type": "ephemeral"} pada alat terakhir dalam array tools Anda. Ini melakukan cache pada seluruh prefix definisi alat, dari alat pertama melalui breakpoint yang ditandai:

{
  "tools": [
    {
      "name": "get_weather",
      "description": "Get the current weather in a given location",
      "input_schema": {
        "type": "object",
        "properties": {
          "location": { "type": "string" }
        },
        "required": ["location"]
      }
    },
    {
      "name": "get_time",
      "description": "Get the current time in a given time zone",
      "input_schema": {
        "type": "object",
        "properties": {
          "timezone": { "type": "string" }
        },
        "required": ["timezone"]
      },
      "cache_control": { "type": "ephemeral" }
    }
  ]
}

Untuk mcp_toolset, breakpoint cache_control berada pada alat terakhir dalam set. Anda tidak mengontrol urutan alat dalam toolset MCP, jadi tempatkan breakpoint pada entri mcp_toolset itu sendiri dan API menerapkannya pada alat yang diperluas terakhir.

defer_loading dan preservasi cache

Alat yang ditunda tidak disertakan dalam prefix system-prompt. Ketika model menemukan alat yang ditunda melalui tool search, definisi ditambahkan inline sebagai blok tool_reference dalam riwayat percakapan. Prefix tetap tidak tersentuh, sehingga prompt caching dipertahankan.

Ini berarti menambahkan alat secara dinamis melalui tool search tidak merusak cache Anda. Anda dapat memulai percakapan dengan set kecil alat yang selalu dimuat (cached), membiarkan model menemukan alat tambahan sesuai kebutuhan, dan menjaga cache hit yang sama di setiap turn.

defer_loading juga bertindak secara independen dari konstruksi grammar untuk strict mode. Grammar dibangun dari toolset lengkap terlepas dari alat mana yang ditunda, sehingga prompt caching dan grammar caching keduanya dipertahankan ketika alat dimuat secara dinamis.

Apa yang membatalkan cache Anda

Cache mengikuti hierarki prefix (tools → system → messages), jadi perubahan pada satu level membatalkan level itu dan semuanya setelahnya:

PerubahanMembatalkan
Memodifikasi definisi alatSeluruh cache (tools, system, messages)
Mengalihkan web search atau citationsCache system dan messages
Mengubah tool_choiceCache messages
Mengubah disable_parallel_tool_useCache messages
Mengalihkan kehadiran gambarCache messages
Mengubah parameter thinkingCache messages

Jika Anda perlu memvariasikan tool_choice di tengah percakapan, pertimbangkan untuk menempatkan breakpoint cache sebelum titik variasi.

Tabel interaksi per-alat

AlatPertimbangan Caching
Web searchMengaktifkan atau menonaktifkan membatalkan cache system dan messages
Web fetchMengaktifkan atau menonaktifkan membatalkan cache system dan messages
Code executionStatus container independen dari prompt cache
Tool searchAlat yang ditemukan dimuat sebagai blok tool_reference, menjaga cache prefix
Computer useKehadiran screenshot mempengaruhi cache messages
Text editorAlat klien standar, tidak ada interaksi caching khusus
BashAlat klien standar, tidak ada interaksi caching khusus
MemoryAlat klien standar, tidak ada interaksi caching khusus

Langkah berikutnya

Prompt caching

Pelajari model prompt caching lengkap, termasuk TTL dan pricing.

Tool search

Muat alat sesuai permintaan tanpa merusak cache Anda.

Tool reference

Jelajahi semua alat yang tersedia dan parameternya.

Was this page helpful?

  • cache_control pada definisi alat
  • defer_loading dan preservasi cache
  • Apa yang membatalkan cache Anda
  • Tabel interaksi per-alat
  • Langkah berikutnya