Параметр effort позволяет вам контролировать, насколько охотно Claude тратит токены при ответе на запросы. Это дает вам возможность балансировать между полнотой ответа и эффективностью использования токенов, используя одну модель.
Параметр effort в настоящее время находится в бета-версии и поддерживается только Claude Opus 4.5.
При использовании этой функции необходимо включить заголовок бета-версии effort-2025-11-24.
По умолчанию Claude использует максимальное усилие — тратит столько токенов, сколько необходимо для предоставления тщательных ответов. Снижая уровень усилия, вы можете указать Claude быть более консервативным в использовании токенов, рассматривая токены как более дорогой ресурс.
Установка effort на "high" дает ровно такое же поведение, как если бы параметр effort вообще не был указан.
Параметр effort влияет на все токены в ответе, включая:
| Уровень | Описание | Типичный случай использования |
|---|---|---|
high | Максимальная тщательность — Claude использует столько токенов, сколько необходимо. Эквивалентно отсутствию параметра. | Сложный анализ, подробные объяснения, образовательный контент |
medium | Сбалансированный подход с умеренной экономией токенов. | Большинство производственных случаев использования, приложения, ориентированные на экономию затрат |
low | Наиболее эффективные по токенам ответы. | Высокообъемная автоматизация, простые запросы, когда ответы обрабатываются программно |
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)Параметр effort в первую очередь контролирует многословность вывода и глубину объяснений, а не правильность ответа. Claude выполняет аналогичное внутреннее рассуждение независимо от уровня усилия, но корректирует, сколько этого рассуждения появляется в выводе.
При использовании инструментов параметр effort влияет как на объяснения вокруг вызовов инструментов, так и на сами вызовы инструментов. Более низкие уровни усилия, как правило:
Более высокие уровни усилия могут:
Параметр effort работает вместе с бюджетом токенов мышления, когда включено расширенное мышление. Эти два элемента управления служат разным целям:
Параметр effort можно использовать с расширенным мышлением или без него. Когда оба настроены:
Для лучшей производительности при сложных задачах рассуждения используйте высокое усилие (по умолчанию) с высоким бюджетом токенов мышления. Это позволяет Claude тщательно обдумать и предоставить полные ответы.
Начните со среднего: Для большинства приложений среднее усилие обеспечивает хороший баланс качества и эффективности.
Используйте низкое для автоматизации: Когда ответы потребляются кодом, а не людьми, низкое усилие может значительно снизить затраты без влияния на правильность.
Протестируйте ваш случай использования: Влияние уровней усилия варьируется в зависимости от типа задачи. Оцените производительность на ваших конкретных случаях использования перед развертыванием.
Контролируйте качество: Хотя правильность в целом сохраняется на всех уровнях усилия, качество объяснений варьируется. Убедитесь, что выбранный вами уровень соответствует потребностям ваших пользователей.
Рассмотрите динамическое усилие: Корректируйте усилие на основе сложности задачи или предпочтений пользователя. Простые запросы могут требовать низкого усилия, в то время как сложный анализ выигрывает от высокого усилия.