Was this page helpful?
This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
Параметр effort позволяет вам контролировать, насколько охотно Claude тратит токены при ответе на запросы. Это дает вам возможность балансировать между полнотой ответа и эффективностью использования токенов, используя одну модель. Параметр effort доступен на всех поддерживаемых моделях без необходимости использования бета-заголовка.
Параметр effort поддерживается Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6 и Claude Opus 4.5.
Для Claude Opus 4.6 и Sonnet 4.6 effort заменяет budget_tokens как рекомендуемый способ контроля глубины мышления. Комбинируйте effort с адаптивным мышлением (thinking: {type: "adaptive"}) для лучшего опыта. Хотя budget_tokens по-прежнему принимается на Opus 4.6 и Sonnet 4.6, он устарел и будет удален в будущем выпуске модели. При high (по умолчанию) и max effort Claude почти всегда будет думать. При более низких уровнях усилия он может пропустить мышление для более простых задач.
По умолчанию Claude использует высокое усилие, тратя столько токенов, сколько необходимо для отличных результатов. Вы можете повысить уровень усилия до max для абсолютно наивысшей производительности или понизить его, чтобы быть более консервативным в использовании токенов, оптимизируя скорость и стоимость при принятии некоторого снижения производительности.
Установка effort на "high" дает ровно такое же поведение, как если бы параметр effort был полностью опущен.
Параметр effort влияет на все токены в ответе, включая:
Этот подход имеет два основных преимущества:
| Уровень | Описание | Типичный случай использования |
|---|---|---|
max | Абсолютная максимальная производительность без ограничений на расходы токенов. Доступно на Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6 и Claude Sonnet 4.6. | Задачи, требующие самого глубокого возможного рассуждения и наиболее тщательного анализа |
xhigh | Расширенная производительность для долгосрочной работы. Доступно на Claude Opus 4.7. | Долгосрочные агентские и кодовые задачи (более 30 минут) с бюджетами токенов в миллионах |
high | Высокая производительность. Эквивалентно отсутствию установки параметра. | Сложное рассуждение, сложные задачи кодирования, агентские задачи |
medium | Сбалансированный подход с умеренной экономией токенов. | Агентские задачи, требующие баланса скорости, стоимости и производительности |
low | Наиболее эффективный. Значительная экономия токенов с некоторым снижением производительности. |
Effort — это поведенческий сигнал, а не строгий бюджет токенов. При более низких уровнях усилия Claude все еще будет думать над достаточно сложными задачами, но будет думать меньше, чем при более высоких уровнях усилия для той же задачи.
Sonnet 4.6 по умолчанию использует high effort. Явно установите effort при использовании Sonnet 4.6, чтобы избежать неожиданной задержки:
Начните с xhigh для кодирования и агентских случаев использования, и используйте high как минимум для большинства рабочих нагрузок, чувствительных к интеллекту. Снизьте до medium для рабочих нагрузок, чувствительных к стоимости, или повысьте до max только когда ваши оценки показывают измеримый запас на xhigh.
API по умолчанию использует high. Чтобы использовать xhigh, явно установите effort; значение, которое вы передаете, переопределяет значение по умолчанию.
| Усилие | Рекомендации для Claude Opus 4.7 |
|---|---|
low | Эффективный, но лучше всего для коротких, ограниченных задач. Комбинируйте low с явными контрольными списками, если ваша задача имеет несколько разделов. |
medium | Замена для среднего рабочего процесса, где вы хотите хорошие результаты при снижении затрат. |
high | Продвинутые случаи использования, которые по-прежнему требуют баланса интеллекта и потребления токенов. Это часто оптимальная точка, балансирующая качество и эффективность использования токенов. |
xhigh | Рекомендуемая начальная точка для кодирования и агентской работы, а также для исследовательских задач, таких как повторные вызовы инструментов, детальный веб-поиск и поиск по базе знаний. Ожидайте значительно более высокого использования токенов, чем high. |
max | Зарезервируйте для действительно граничных проблем. На большинстве рабочих нагрузок max добавляет значительные затраты для относительно небольших улучшений качества, и на некоторых задачах со структурированным выводом или менее чувствительных к интеллекту это может привести к чрезмерному размышлению. |
Claude Opus 4.7 также более строго соблюдает уровни усилия, чем Claude Opus 4.6, особенно при low и medium. При более низких уровнях усилия модель ограничивает свою работу тем, что было запрошено, а не выходит за рамки. Если вы наблюдаете поверхностное рассуждение по сложным задачам с Claude Opus 4.7, повысьте усилие вместо того, чтобы обходить это в подсказке. Если вы должны сохранить низкое усилие для задержки, добавьте целевое руководство, такое как "Эта задача включает многошаговое рассуждение. Тщательно подумайте перед ответом."
При запуске Claude Opus 4.7 с xhigh или max effort установите большой max_tokens, чтобы модель имела место для размышления и действия в подагентах и вызовах инструментов. Начало с 64k токенов и настройка оттуда — это разумное значение по умолчанию.
При использовании инструментов параметр effort влияет как на объяснения вокруг вызовов инструментов, так и на сами вызовы инструментов. Более низкие уровни усилия, как правило:
Более высокие уровни усилия могут:
Параметр effort работает вместе с расширенным мышлением. Его поведение зависит от модели:
thinking не требуется). thinking: {type: "disabled"} отклоняется. Effort контролирует глубину мышления так же, как на Opus 4.7 и Opus 4.6.thinking: {type: "adaptive"}), где effort — рекомендуемый контроль для глубины мышления. Ручное расширенное мышление (thinking: {type: "enabled", budget_tokens: N}) больше не поддерживается на Opus 4.7; вместо этого используйте адаптивное мышление с effort. При high, xhigh и max effort Claude почти всегда думает глубоко. При более низких уровнях он может пропустить мышление для более простых задач.thinking: {type: "adaptive"}), где effort — рекомендуемый контроль для глубины мышления. Хотя budget_tokens по-прежнему принимается на Opus 4.6, он устарел и будет удален в будущем выпуске. При high и effort Claude почти всегда думает глубоко. При более низких уровнях он может пропустить мышление для более простых задач.Параметр effort можно использовать с расширенным мышлением или без него. При использовании без мышления он по-прежнему контролирует общие расходы токенов для текстовых ответов и вызовов инструментов.
high, но правильная начальная точка зависит от вашей модели и рабочей нагрузки.| Более простые задачи, требующие лучшей скорости и наименьших затрат, такие как подагенты |
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=4096,
messages=[
{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures",
}
],
output_config={"effort": "medium"},
)
print(response.content[0].text)maxthinking: {type: "enabled", budget_tokens: N}) по-прежнему функционально, но устарело.thinking: {type: "enabled", budget_tokens: N}), где effort работает вместе с бюджетом токенов мышления. Установите уровень усилия для вашей задачи, затем установите бюджет токенов мышления на основе сложности задачи.