Loading...
    • Разработка
    • Администрирование
    • Модели и цены
    • Клиентские SDK
    • Справочник API
    Search...
    ⌘K
    Первые шаги
    Введение в ClaudeБыстрый старт
    Разработка с Claude
    Обзор возможностейИспользование Messages APIОбработка причин остановки
    Возможности модели
    Расширенное мышлениеАдаптивное мышлениеУсилиеБыстрый режим (бета: предварительный просмотр)Структурированные выходные данныеЦитированияПотоковые сообщенияПакетная обработкаРезультаты поискаПотоковые отказыМногоязычная поддержкаЭмбеддинги
    Инструменты
    ОбзорКак работает использование инструментовИнструмент веб-поискаИнструмент веб-загрузкиИнструмент выполнения кодаИнструмент памятиИнструмент BashИнструмент управления компьютеромИнструмент текстового редактора
    Инфраструктура инструментов
    Поиск инструментовПрограммный вызов инструментовДетальная потоковая передача инструментов
    Управление контекстом
    Контекстные окнаСжатиеРедактирование контекстаКэширование промптовПодсчёт токенов
    Работа с файлами
    Files APIПоддержка PDFИзображения и зрение
    Навыки
    ОбзорБыстрый стартЛучшие практикиНавыки для предприятийНавыки в API
    MCP
    Удалённые MCP-серверыMCP-коннектор
    Инжиниринг промптов
    ОбзорЛучшие практики промптингаИнструменты промптинга в Console
    Тестирование и оценка
    Определение успеха и создание оценокИспользование инструмента оценки в ConsoleСнижение задержки
    Укрепление ограничений
    Снижение галлюцинацийПовышение согласованности выводаЗащита от джейлбрейковСнижение утечки промптов
    Ресурсы
    Глоссарий
    Примечания к выпуску
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Возможности модели

    Усилие

    Управляйте количеством токенов, которые Claude использует при ответе, с помощью параметра effort, балансируя между полнотой ответа и эффективностью использования токенов.

    Was this page helpful?

    • Как работает effort
    • Уровни усилия
    • Рекомендуемые уровни усилия для Sonnet 4.6
    • Базовое использование
    • Когда следует изменять параметр effort
    • Усилие при использовании инструментов
    • Усилие с расширенным мышлением
    • Лучшие практики

    This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

    Параметр effort позволяет управлять тем, насколько активно Claude расходует токены при ответе на запросы. Это даёт возможность балансировать между полнотой ответа и эффективностью использования токенов — всё в рамках одной модели. Параметр effort доступен на всех поддерживаемых моделях без необходимости использования бета-заголовка.

    Параметр effort поддерживается Claude Mythos Preview, Claude Opus 4.6, Claude Sonnet 4.6 и Claude Opus 4.5.

    Для Claude Opus 4.6 и Sonnet 4.6 параметр effort заменяет budget_tokens как рекомендуемый способ управления глубиной мышления. Сочетайте effort с адаптивным мышлением (thinking: {type: "adaptive"}) для наилучшего результата. Хотя budget_tokens по-прежнему принимается в Opus 4.6 и Sonnet 4.6, он устарел и будет удалён в будущем выпуске модели. При high (по умолчанию) и max усилии Claude почти всегда будет думать. При более низких уровнях усилия он может пропускать мышление для более простых задач.

    Как работает effort

    По умолчанию Claude использует высокое усилие, расходуя столько токенов, сколько необходимо для отличных результатов. Вы можете повысить уровень усилия до max для достижения максимальной производительности или снизить его, чтобы быть более экономным с токенами, оптимизируя скорость и стоимость при некотором снижении возможностей.

    Установка effort в значение "high" даёт точно такое же поведение, как и полное отсутствие параметра effort.

    Параметр effort влияет на все токены в ответе, включая:

    • Текстовые ответы и пояснения
    • Вызовы инструментов и аргументы функций
    • Расширенное мышление (когда включено)

    Этот подход имеет два основных преимущества:

    1. Для его использования не требуется включать мышление.
    2. Он может влиять на все расходы токенов, включая вызовы инструментов. Например, более низкое усилие означает, что Claude делает меньше вызовов инструментов. Это даёт значительно больший контроль над эффективностью.

    Уровни усилия

    УровеньОписаниеТипичный сценарий использования
    maxАбсолютный максимум возможностей без ограничений на расход токенов. Доступно на Claude Mythos Preview, Claude Opus 4.6 и Claude Sonnet 4.6.Задачи, требующие максимально глубокого рассуждения и наиболее тщательного анализа
    highВысокие возможности. Эквивалентно отсутствию параметра.Сложные рассуждения, трудные задачи по программированию, агентные задачи
    mediumСбалансированный подход с умеренной экономией токенов.Агентные задачи, требующие баланса скорости, стоимости и производительности
    lowМаксимальная эффективность. Значительная экономия токенов при некотором снижении возможностей.Более простые задачи, требующие наилучшей скорости и минимальных затрат, например субагенты

    Усилие — это поведенческий сигнал, а не строгий бюджет токенов. При более низких уровнях усилия Claude всё равно будет думать над достаточно сложными задачами, но будет думать меньше, чем при более высоких уровнях усилия для той же задачи.

    Рекомендуемые уровни усилия для Sonnet 4.6

    Sonnet 4.6 по умолчанию использует усилие high. Явно задавайте усилие при использовании Sonnet 4.6, чтобы избежать неожиданных задержек:

    • Среднее усилие (рекомендуемое по умолчанию): Наилучший баланс скорости, стоимости и производительности для большинства приложений. Подходит для агентного программирования, рабочих процессов с интенсивным использованием инструментов и генерации кода.
    • Низкое усилие: Для высоконагруженных или чувствительных к задержкам рабочих нагрузок. Подходит для чата и сценариев без программирования, где приоритетом является более быстрое время отклика.
    • Высокое усилие: Для задач, требующих максимального интеллекта от Sonnet 4.6.
    • Максимальное усилие: Для задач, требующих абсолютно наивысших возможностей без ограничений на расход токенов.

    Базовое использование

    Когда следует изменять параметр effort

    • Используйте максимальное усилие, когда вам нужны абсолютно наивысшие возможности без ограничений: наиболее тщательное рассуждение и глубокий анализ. Доступно на Claude Mythos Preview, Claude Opus 4.6 и Claude Sonnet 4.6.
    • Используйте высокое усилие (по умолчанию), когда вам нужна лучшая работа Claude: сложные рассуждения, тонкий анализ, трудные задачи по программированию или любые задачи, где качество является главным приоритетом.
    • Используйте среднее усилие как сбалансированный вариант, когда вы хотите хорошей производительности без полного расхода токенов при высоком усилии.
    • Используйте низкое усилие, когда вы оптимизируете скорость (потому что Claude отвечает меньшим количеством токенов) или стоимость. Например, простые задачи классификации, быстрые поиски или высоконагруженные сценарии использования, где незначительные улучшения качества не оправдывают дополнительную задержку или расходы.

    Усилие при использовании инструментов

    При использовании инструментов параметр effort влияет как на пояснения вокруг вызовов инструментов, так и на сами вызовы инструментов. Более низкие уровни усилия, как правило:

    • Объединяют несколько операций в меньшее количество вызовов инструментов
    • Делают меньше вызовов инструментов
    • Переходят непосредственно к действию без предисловий
    • Используют краткие подтверждающие сообщения после завершения

    Более высокие уровни усилия могут:

    • Делать больше вызовов инструментов
    • Объяснять план перед выполнением действия
    • Предоставлять подробные сводки изменений
    • Включать более полные комментарии к коду

    Усилие с расширенным мышлением

    Параметр effort работает совместно с расширенным мышлением. Его поведение зависит от модели:

    • Claude Mythos Preview использует адаптивное мышление по умолчанию (конфигурация thinking не требуется). thinking: {type: "disabled"} отклоняется. Усилие управляет глубиной мышления так же, как и в Opus 4.6.
    • Claude Opus 4.6 использует адаптивное мышление (thinking: {type: "adaptive"}), где усилие является рекомендуемым способом управления глубиной мышления. Хотя budget_tokens по-прежнему принимается в Opus 4.6, он устарел и будет удалён в будущем выпуске. При усилии high и max Claude почти всегда думает глубоко. При более низких уровнях он может пропускать мышление для более простых задач.
    • Claude Sonnet 4.6 использует адаптивное мышление (где усилие управляет глубиной мышления). Ручное мышление с чередующимся режимом (thinking: {type: "enabled", budget_tokens: N}) по-прежнему работает, но устарело.
    • Claude Opus 4.5 и другие модели Claude 4 используют ручное мышление (), где усилие работает совместно с бюджетом токенов мышления. Установите уровень усилия для вашей задачи, затем установите бюджет токенов мышления в зависимости от сложности задачи.

    Параметр effort можно использовать как с включённым расширенным мышлением, так и без него. При использовании без мышления он по-прежнему управляет общим расходом токенов для текстовых ответов и вызовов инструментов.

    Лучшие практики

    1. Явно задавайте усилие: API по умолчанию использует high, но правильная отправная точка зависит от вашей модели и рабочей нагрузки.
    2. Используйте низкое усилие для чувствительных к скорости или простых задач: Когда важна задержка или задачи просты, низкое усилие может значительно сократить время отклика и затраты.
    3. Тестируйте свой сценарий использования: Влияние уровней усилия варьируется в зависимости от типа задачи. Оцените производительность на ваших конкретных сценариях использования перед развёртыванием.
    4. Рассмотрите динамическое усилие: Регулируйте усилие в зависимости от сложности задачи. Простые запросы могут потребовать низкого усилия, тогда как агентное программирование и сложные рассуждения выигрывают от высокого усилия.
    curl https://api.anthropic.com/v1/messages \
        --header "x-api-key: $ANTHROPIC_API_KEY" \
        --header "anthropic-version: 2023-06-01" \
        --header "content-type: application/json" \
        --data '{
            "model": "claude-opus-4-6",
            "max_tokens": 4096,
            "messages": [{
                "role": "user",
                "content": "Analyze the trade-offs between microservices and monolithic architectures"
            }],
            "output_config": {
                "effort": "medium"
            }
        }'
    thinking: {type: "enabled", budget_tokens: N}