Loading...
  • Разработка
  • Администрирование
  • Модели и цены
  • Клиентские SDK
  • Справочник API
Search...
⌘K
Log in
Управление контекстом инструментов
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Разработка/Инфраструктура инструментов

Управление контекстом инструментов

Выберите между поиском инструментов, программным вызовом инструментов, кешированием подсказок и редактированием контекста для управления переполнением контекста.

Определения инструментов и накопленные блоки tool_result потребляют ваше окно контекста. Долгоживущие агенты с множеством инструментов или множеством ходов могут исчерпать доступный контекст до завершения задачи. Четыре подхода решают эту проблему в разных точках конвейера.

Четыре подхода

Каждый подход нацелен на другой источник давления на контекст. Выберите тот, который соответствует тому, куда идут ваши токены.

ПодходЧто он сокращаетКогда он подходитУзнать больше
Поиск инструментовОпределения инструментов, загруженные заранееБольшие наборы инструментов (20+ инструментов), где большинство инструментов не требуются каждый ходИнструмент поиска инструментов
Программный вызов инструментовЦиклы tool_resultЦепочки вызовов инструментов, которые могут выполняться как один скриптПрограммный вызов инструментов
Кеширование подсказокСтоимость токенов повторяющихся определений инструментовСтабильные наборы инструментов в разных запросахИспользование инструментов с кешированием подсказок
Редактирование контекстаСтарые блоки tool_result в историиДлительные беседы, где ранние результаты больше не актуальныРедактирование контекста

Поиск инструментов

Поиск инструментов держит определения инструментов вне окна контекста до тех пор, пока Claude их не запросит. Вместо отправки 50 схем инструментов заранее, вы отправляете один инструмент tool_search и позволяете Claude обнаруживать остальное по требованию. Это обменивает небольшое количество задержки (один дополнительный ход для поиска инструмента) на большое сокращение базового использования контекста.

Программный вызов инструментов

Программный вызов инструментов сворачивает последовательность вызовов инструментов в один блок кода, который Claude пишет, а песочница выполнения кода Anthropic запускает. Вместо пяти циклов tool_use и tool_result, Claude выдает один скрипт, который вызывает все пять функций из песочницы. Промежуточные результаты никогда не попадают в историю беседы.

Кеширование подсказок

Кеширование подсказок не сокращает количество токенов в контексте, но снижает стоимость их использования при последующих запросах. Если ваши определения инструментов стабильны, кешируйте их один раз и повторно используйте кешированный префикс в тысячах запросов. Это правильный выбор, когда набор инструментов большой, но фиксированный.

Редактирование контекста

Редактирование контекста удаляет старые блоки tool_result из истории беседы после того, как они выполнили свою функцию. Длительный цикл агента может создать сотни промежуточных результатов, которые были полезны в то время, но теперь являются мертвым грузом. Редактирование контекста позволяет вам их обрезать без перезагрузки беседы.

Комбинирование подходов

Эти подходы хорошо сочетаются. Долгоживущий агент может использовать поиск инструментов, чтобы держать набор инструментов в тонусе, кеширование подсказок для амортизации стоимости оставшихся определений и редактирование контекста для обрезания устаревших результатов по мере роста беседы. Каждый решает другую часть проблемы, поэтому нет конфликта в их совместном использовании.

Разумная отправная точка для высокопроизводительного агента:

  1. Включите кеширование подсказок для определений инструментов с первого дня. Записи кеша имеют надбавку 25% к базовой цене входа, которая окупается при втором запросе, попадающем в кеш.
  2. Добавьте поиск инструментов, когда ваш набор инструментов вырастет примерно до 20 инструментов или когда базовое использование контекста станет заметным.
  3. Добавьте редактирование контекста, когда отдельные беседы начнут работать достаточно долго, чтобы ранние результаты стали неактуальными.
  4. Рассмотрите программный вызов инструментов, если вы заметите повторяющиеся цепочки небольших вызовов инструментов, которые могли бы выполняться как один пакет.

Следующие шаги

Инструмент поиска инструментов

Загружайте определения инструментов по требованию вместо заранее.

Программный вызов инструментов

Сворачивайте цепочки вызовов инструментов в один исполняемый скрипт.

Использование инструментов с кешированием подсказок

Кешируйте определения инструментов в разных запросах, чтобы сократить затраты на токены.

Редактирование контекста

Обрезайте устаревшие результаты инструментов из долгоживущих беседы.

Was this page helpful?

  • Четыре подхода
  • Поиск инструментов
  • Программный вызов инструментов
  • Кеширование подсказок
  • Редактирование контекста
  • Комбинирование подходов
  • Следующие шаги