Усилие
Параметр effort позволяет вам контролировать, насколько охотно Claude тратит токены при ответе на запросы. Это дает вам возможность балансировать между полнотой ответа и эффективностью использования токенов, используя одну модель.
Параметр effort в настоящее время находится в бета-версии и поддерживается только Claude Opus 4.5.
При использовании этой функции необходимо включить заголовок бета-версии effort-2025-11-24.
Как работает effort
По умолчанию Claude использует максимальное усилие — тратит столько токенов, сколько необходимо для предоставления тщательных ответов. Снижая уровень усилия, вы можете указать Claude быть более консервативным в использовании токенов, рассматривая токены как более дорогой ресурс.
Установка effort на "high" дает ровно такое же поведение, как если бы параметр effort вообще не был указан.
Параметр effort влияет на все токены в ответе, включая:
- Текстовые ответы и объяснения
- Вызовы инструментов и аргументы функций
- Расширенное мышление (когда включено)
Уровни усилия
| Уровень | Описание | Типичный случай использования |
|---|---|---|
high | Максимальная тщательность — Claude использует столько токенов, сколько необходимо. Эквивалентно отсутствию параметра. | Сложный анализ, подробные объяснения, образовательный контент |
medium | Сбалансированный подход с умеренной экономией токенов. | Большинство производственных случаев использования, приложения, ориентированные на экономию затрат |
low | Наиболее эффективные по токенам ответы. | Высокообъемная автоматизация, простые запросы, когда ответы обрабатываются программно |
Базовое использование
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)Поведение по уровням усилия
Параметр effort в первую очередь контролирует многословность вывода и глубину объяснений, а не правильность ответа. Claude выполняет аналогичное внутреннее рассуждение независимо от уровня усилия, но корректирует, сколько этого рассуждения появляется в выводе.
Ответы с низким усилием
- Ответ указан прямо с минимальным объяснением
- Краткие, эффективные ответы (1-2 предложения контекста)
- Формулы показаны, но не выведены
- Предполагается, что читатель может проверить ответ
- Лаконичные подтверждения для использования инструментов ("Готово.", "Исправлено.")
Ответы со средним усилием
- Краткий контекст перед ответом
- Краткое обоснование с ключевыми промежуточными шагами
- Может включать один рабочий пример
- По-прежнему сосредоточен на эффективности
Ответы с высоким усилием
- Структурированы с заголовками разделов
- Постановка задачи и определение переменных
- Пошаговый процесс решения
- Проверка и проверка здравого смысла
- Богатое форматирование markdown
Случаи использования
Когда использовать низкое усилие
- Оптимизация скорости: Меньшее количество токенов означает более быстрое время ответа, что полезно для приложений, чувствительных к задержкам
- Автоматизированные конвейеры: Когда ответы обрабатываются кодом, а не читаются людьми
- Высокообъемные приложения: Снижение затрат на рутинные, простые запросы
- Опытные пользователи: Когда пользователям не нужны подробные объяснения
- Быстрые подтверждения: Простые ответы да/нет или ответы о статусе
Когда использовать среднее усилие
- Production API: Баланс ясности и экономической эффективности
- Приложения, ориентированные на пользователя: Достаточно контекста без чрезмерной многословности
- Развертывания, ориентированные на экономию затрат: Значительная экономия с минимальным влиянием на качество
Когда использовать высокое усилие (или без параметра effort)
- Сложный анализ: Когда тщательность критична
- Образовательный контент: Когда пользователям нужно понять рассуждение
- Документация: Когда ответы служат справочным материалом
- Отладка: Когда подробные объяснения помогают выявить проблемы
Усилие при использовании инструментов
При использовании инструментов параметр effort влияет как на объяснения вокруг вызовов инструментов, так и на сами вызовы инструментов. Более низкие уровни усилия, как правило:
- Объединяют несколько операций в меньшее количество вызовов инструментов
- Переходят непосредственно к действию без предисловия
- Используют лаконичные сообщения подтверждения после завершения
Более высокие уровни усилия могут:
- Объяснить план перед принятием мер
- Предоставить подробные сводки изменений
- Включить более полные комментарии кода
Усилие с расширенным мышлением
Параметр effort работает вместе с бюджетом токенов мышления, когда включено расширенное мышление. Эти два элемента управления служат разным целям:
- Параметр effort: Контролирует, как Claude тратит все токены — включая токены мышления, текстовые ответы и вызовы инструментов
- Бюджет токенов мышления: Устанавливает максимальный лимит на токены мышления специально
Параметр effort можно использовать с расширенным мышлением или без него. Когда оба настроены:
- Сначала определите уровень усилия, подходящий для вашей задачи
- Затем установите бюджет токенов мышления на основе сложности задачи
Для лучшей производительности при сложных задачах рассуждения используйте высокое усилие (по умолчанию) с высоким бюджетом токенов мышления. Это позволяет Claude тщательно обдумать и предоставить полные ответы.
Лучшие практики
-
Начните со среднего: Для большинства приложений среднее усилие обеспечивает хороший баланс качества и эффективности.
-
Используйте низкое для автоматизации: Когда ответы потребляются кодом, а не людьми, низкое усилие может значительно снизить затраты без влияния на правильность.
-
Протестируйте ваш случай использования: Влияние уровней усилия варьируется в зависимости от типа задачи. Оцените производительность на ваших конкретных случаях использования перед развертыванием.
-
Контролируйте качество: Хотя правильность в целом сохраняется на всех уровнях усилия, качество объяснений варьируется. Убедитесь, что выбранный вами уровень соответствует потребностям ваших пользователей.
-
Рассмотрите динамическое усилие: Корректируйте усилие на основе сложности задачи или предпочтений пользователя. Простые запросы могут требовать низкого усилия, в то время как сложный анализ выигрывает от высокого усилия.