Loading...
  • Разработка
  • Администрирование
  • Модели и цены
  • Клиентские SDK
  • Справочник API
Search...
⌘K
Log in
Усилие
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Разработка/Возможности модели

Усилие

Контролируйте, сколько токенов использует Claude при ответе с помощью параметра effort, балансируя между полнотой ответа и эффективностью использования токенов.

Was this page helpful?

  • Как работает effort
  • Уровни усилия
  • Рекомендуемые уровни усилия для Sonnet 4.6
  • Рекомендуемые уровни усилия для Claude Opus 4.7
  • Базовое использование
  • Когда нужно корректировать параметр effort
  • Effort с использованием инструментов
  • Effort с расширенным мышлением
  • Лучшие практики

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

Параметр effort позволяет вам контролировать, насколько охотно Claude тратит токены при ответе на запросы. Это дает вам возможность балансировать между полнотой ответа и эффективностью использования токенов, используя одну модель. Параметр effort доступен на всех поддерживаемых моделях без необходимости использования бета-заголовка.

Параметр effort поддерживается Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6 и Claude Opus 4.5.

Для Claude Opus 4.6 и Sonnet 4.6 effort заменяет budget_tokens как рекомендуемый способ контроля глубины мышления. Комбинируйте effort с адаптивным мышлением (thinking: {type: "adaptive"}) для лучшего опыта. Хотя budget_tokens по-прежнему принимается на Opus 4.6 и Sonnet 4.6, он устарел и будет удален в будущем выпуске модели. При high (по умолчанию) и max effort Claude почти всегда будет думать. При более низких уровнях усилия он может пропустить мышление для более простых задач.

Как работает effort

По умолчанию Claude использует высокое усилие, тратя столько токенов, сколько необходимо для отличных результатов. Вы можете повысить уровень усилия до max для абсолютно наивысшей производительности или понизить его, чтобы быть более консервативным в использовании токенов, оптимизируя скорость и стоимость при принятии некоторого снижения производительности.

Установка effort на "high" дает ровно такое же поведение, как если бы параметр effort был полностью опущен.

Параметр effort влияет на все токены в ответе, включая:

  • Текстовые ответы и объяснения
  • Вызовы инструментов и аргументы функций
  • Расширенное мышление (если включено)

Этот подход имеет два основных преимущества:

  1. Он не требует включения мышления для его использования.
  2. Он может влиять на все расходы токенов, включая вызовы инструментов. Например, более низкое усилие означает, что Claude делает меньше вызовов инструментов. Это дает гораздо больший контроль над эффективностью.

Уровни усилия

УровеньОписаниеТипичный случай использования
maxАбсолютная максимальная производительность без ограничений на расходы токенов. Доступно на Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6 и Claude Sonnet 4.6.Задачи, требующие самого глубокого возможного рассуждения и наиболее тщательного анализа
xhighРасширенная производительность для долгосрочной работы. Доступно на Claude Opus 4.7.Долгосрочные агентские и кодовые задачи (более 30 минут) с бюджетами токенов в миллионах
highВысокая производительность. Эквивалентно отсутствию установки параметра.Сложное рассуждение, сложные задачи кодирования, агентские задачи
mediumСбалансированный подход с умеренной экономией токенов.Агентские задачи, требующие баланса скорости, стоимости и производительности
lowНаиболее эффективный. Значительная экономия токенов с некоторым снижением производительности.

Effort — это поведенческий сигнал, а не строгий бюджет токенов. При более низких уровнях усилия Claude все еще будет думать над достаточно сложными задачами, но будет думать меньше, чем при более высоких уровнях усилия для той же задачи.

Рекомендуемые уровни усилия для Sonnet 4.6

Sonnet 4.6 по умолчанию использует high effort. Явно установите effort при использовании Sonnet 4.6, чтобы избежать неожиданной задержки:

  • Среднее усилие (рекомендуемое по умолчанию): Лучший баланс скорости, стоимости и производительности для большинства приложений. Подходит для агентского кодирования, рабочих процессов с большим количеством инструментов и генерации кода.
  • Низкое усилие: Для высокообъемных или чувствительных к задержкам рабочих нагрузок. Подходит для чата и некодовых случаев использования, где приоритет — более быстрое выполнение.
  • Высокое усилие: Для задач, требующих максимального интеллекта от Sonnet 4.6.
  • Максимальное усилие: Для задач, требующих абсолютно наивысшей производительности без ограничений на расходы токенов.

Рекомендуемые уровни усилия для Claude Opus 4.7

Начните с xhigh для кодирования и агентских случаев использования, и используйте high как минимум для большинства рабочих нагрузок, чувствительных к интеллекту. Снизьте до medium для рабочих нагрузок, чувствительных к стоимости, или повысьте до max только когда ваши оценки показывают измеримый запас на xhigh.

API по умолчанию использует high. Чтобы использовать xhigh, явно установите effort; значение, которое вы передаете, переопределяет значение по умолчанию.

УсилиеРекомендации для Claude Opus 4.7
lowЭффективный, но лучше всего для коротких, ограниченных задач. Комбинируйте low с явными контрольными списками, если ваша задача имеет несколько разделов.
mediumЗамена для среднего рабочего процесса, где вы хотите хорошие результаты при снижении затрат.
highПродвинутые случаи использования, которые по-прежнему требуют баланса интеллекта и потребления токенов. Это часто оптимальная точка, балансирующая качество и эффективность использования токенов.
xhighРекомендуемая начальная точка для кодирования и агентской работы, а также для исследовательских задач, таких как повторные вызовы инструментов, детальный веб-поиск и поиск по базе знаний. Ожидайте значительно более высокого использования токенов, чем high.
maxЗарезервируйте для действительно граничных проблем. На большинстве рабочих нагрузок max добавляет значительные затраты для относительно небольших улучшений качества, и на некоторых задачах со структурированным выводом или менее чувствительных к интеллекту это может привести к чрезмерному размышлению.

Claude Opus 4.7 также более строго соблюдает уровни усилия, чем Claude Opus 4.6, особенно при low и medium. При более низких уровнях усилия модель ограничивает свою работу тем, что было запрошено, а не выходит за рамки. Если вы наблюдаете поверхностное рассуждение по сложным задачам с Claude Opus 4.7, повысьте усилие вместо того, чтобы обходить это в подсказке. Если вы должны сохранить низкое усилие для задержки, добавьте целевое руководство, такое как "Эта задача включает многошаговое рассуждение. Тщательно подумайте перед ответом."

При запуске Claude Opus 4.7 с xhigh или max effort установите большой max_tokens, чтобы модель имела место для размышления и действия в подагентах и вызовах инструментов. Начало с 64k токенов и настройка оттуда — это разумное значение по умолчанию.

Базовое использование

Когда нужно корректировать параметр effort

  • Используйте максимальное усилие, когда вам нужна абсолютно наивысшая производительность без ограничений: наиболее тщательное рассуждение и глубочайший анализ. Доступно на Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6 и Claude Sonnet 4.6.
  • Используйте очень высокое усилие для продвинутого кодирования и сложной агентской работы, требующей расширенного исследования, такой как повторные вызовы инструментов и детальный поиск. Доступно на Claude Opus 4.7.
  • Используйте высокое усилие (по умолчанию), когда вам нужна лучшая работа Claude: сложное рассуждение, тонкий анализ, сложные задачи кодирования или любая задача, где качество — главный приоритет.
  • Используйте среднее усилие как сбалансированный вариант, когда вы хотите хорошую производительность без полных расходов токенов высокого усилия.
  • Используйте низкое усилие, когда вы оптимизируете скорость (потому что Claude отвечает с меньшим количеством токенов) или стоимость. Например, простые задачи классификации, быстрые поиски или высокообъемные случаи использования, где незначительные улучшения качества не оправдывают дополнительную задержку или расходы.

Effort с использованием инструментов

При использовании инструментов параметр effort влияет как на объяснения вокруг вызовов инструментов, так и на сами вызовы инструментов. Более низкие уровни усилия, как правило:

  • Объединяют несколько операций в меньшее количество вызовов инструментов
  • Делают меньше вызовов инструментов
  • Переходят непосредственно к действию без преамбулы
  • Используют лаконичные сообщения подтверждения после завершения

Более высокие уровни усилия могут:

  • Делать больше вызовов инструментов
  • Объяснять план перед принятием мер
  • Предоставлять подробные резюме изменений
  • Включать более подробные комментарии к коду

Effort с расширенным мышлением

Параметр effort работает вместе с расширенным мышлением. Его поведение зависит от модели:

  • Claude Mythos Preview использует адаптивное мышление по умолчанию (конфигурация thinking не требуется). thinking: {type: "disabled"} отклоняется. Effort контролирует глубину мышления так же, как на Opus 4.7 и Opus 4.6.
  • Claude Opus 4.7 использует адаптивное мышление (thinking: {type: "adaptive"}), где effort — рекомендуемый контроль для глубины мышления. Ручное расширенное мышление (thinking: {type: "enabled", budget_tokens: N}) больше не поддерживается на Opus 4.7; вместо этого используйте адаптивное мышление с effort. При high, xhigh и max effort Claude почти всегда думает глубоко. При более низких уровнях он может пропустить мышление для более простых задач.
  • Claude Opus 4.6 использует адаптивное мышление (thinking: {type: "adaptive"}), где effort — рекомендуемый контроль для глубины мышления. Хотя budget_tokens по-прежнему принимается на Opus 4.6, он устарел и будет удален в будущем выпуске. При high и effort Claude почти всегда думает глубоко. При более низких уровнях он может пропустить мышление для более простых задач.

Параметр effort можно использовать с расширенным мышлением или без него. При использовании без мышления он по-прежнему контролирует общие расходы токенов для текстовых ответов и вызовов инструментов.

Лучшие практики

  1. Явно установите effort: API по умолчанию использует high, но правильная начальная точка зависит от вашей модели и рабочей нагрузки.
  2. Используйте low для задач, чувствительных к скорости или простых: Когда задержка имеет значение или задачи простые, низкое усилие может значительно сократить время ответа и затраты.
  3. Протестируйте ваш случай использования: Влияние уровней усилия варьируется в зависимости от типа задачи. Оцените производительность на ваших конкретных случаях использования перед развертыванием.
  4. Рассмотрите динамическое усилие: Корректируйте усилие на основе сложности задачи. Простые запросы могут требовать низкого усилия, в то время как агентское кодирование и сложное рассуждение выигрывают от высокого усилия.
Более простые задачи, требующие лучшей скорости и наименьших затрат, такие как подагенты
client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures",
        }
    ],
    output_config={"effort": "medium"},
)

print(response.content[0].text)
max
  • Claude Sonnet 4.6 использует адаптивное мышление (где effort контролирует глубину мышления). Ручное мышление с чередующимся режимом (thinking: {type: "enabled", budget_tokens: N}) по-прежнему функционально, но устарело.
  • Claude Opus 4.5 и другие модели Claude 4 используют ручное мышление (thinking: {type: "enabled", budget_tokens: N}), где effort работает вместе с бюджетом токенов мышления. Установите уровень усилия для вашей задачи, затем установите бюджет токенов мышления на основе сложности задачи.