Was this page helpful?
This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
Параметр effort позволяет управлять тем, насколько активно Claude расходует токены при ответе на запросы. Это даёт возможность балансировать между полнотой ответа и эффективностью использования токенов — всё в рамках одной модели. Параметр effort доступен на всех поддерживаемых моделях без необходимости использования бета-заголовка.
Параметр effort поддерживается Claude Mythos Preview, Claude Opus 4.6, Claude Sonnet 4.6 и Claude Opus 4.5.
Для Claude Opus 4.6 и Sonnet 4.6 параметр effort заменяет budget_tokens как рекомендуемый способ управления глубиной мышления. Сочетайте effort с адаптивным мышлением (thinking: {type: "adaptive"}) для наилучшего результата. Хотя budget_tokens по-прежнему принимается в Opus 4.6 и Sonnet 4.6, он устарел и будет удалён в будущем выпуске модели. При high (по умолчанию) и max усилии Claude почти всегда будет думать. При более низких уровнях усилия он может пропускать мышление для более простых задач.
По умолчанию Claude использует высокое усилие, расходуя столько токенов, сколько необходимо для отличных результатов. Вы можете повысить уровень усилия до max для достижения максимальной производительности или снизить его, чтобы быть более экономным с токенами, оптимизируя скорость и стоимость при некотором снижении возможностей.
Установка effort в значение "high" даёт точно такое же поведение, как и полное отсутствие параметра effort.
Параметр effort влияет на все токены в ответе, включая:
Этот подход имеет два основных преимущества:
| Уровень | Описание | Типичный сценарий использования |
|---|---|---|
max | Абсолютный максимум возможностей без ограничений на расход токенов. Доступно на Claude Mythos Preview, Claude Opus 4.6 и Claude Sonnet 4.6. | Задачи, требующие максимально глубокого рассуждения и наиболее тщательного анализа |
high | Высокие возможности. Эквивалентно отсутствию параметра. | Сложные рассуждения, трудные задачи по программированию, агентные задачи |
medium | Сбалансированный подход с умеренной экономией токенов. | Агентные задачи, требующие баланса скорости, стоимости и производительности |
low | Максимальная эффективность. Значительная экономия токенов при некотором снижении возможностей. | Более простые задачи, требующие наилучшей скорости и минимальных затрат, например субагенты |
Усилие — это поведенческий сигнал, а не строгий бюджет токенов. При более низких уровнях усилия Claude всё равно будет думать над достаточно сложными задачами, но будет думать меньше, чем при более высоких уровнях усилия для той же задачи.
Sonnet 4.6 по умолчанию использует усилие high. Явно задавайте усилие при использовании Sonnet 4.6, чтобы избежать неожиданных задержек:
При использовании инструментов параметр effort влияет как на пояснения вокруг вызовов инструментов, так и на сами вызовы инструментов. Более низкие уровни усилия, как правило:
Более высокие уровни усилия могут:
Параметр effort работает совместно с расширенным мышлением. Его поведение зависит от модели:
thinking не требуется). thinking: {type: "disabled"} отклоняется. Усилие управляет глубиной мышления так же, как и в Opus 4.6.thinking: {type: "adaptive"}), где усилие является рекомендуемым способом управления глубиной мышления. Хотя budget_tokens по-прежнему принимается в Opus 4.6, он устарел и будет удалён в будущем выпуске. При усилии high и max Claude почти всегда думает глубоко. При более низких уровнях он может пропускать мышление для более простых задач.thinking: {type: "enabled", budget_tokens: N}) по-прежнему работает, но устарело.Параметр effort можно использовать как с включённым расширенным мышлением, так и без него. При использовании без мышления он по-прежнему управляет общим расходом токенов для текстовых ответов и вызовов инструментов.
high, но правильная отправная точка зависит от вашей модели и рабочей нагрузки.curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-opus-4-6",
"max_tokens": 4096,
"messages": [{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
"output_config": {
"effort": "medium"
}
}'thinking: {type: "enabled", budget_tokens: N}