Параметр effort позволяет вам контролировать, насколько охотно Claude тратит токены при ответе на запросы. Это дает вам возможность балансировать между полнотой ответа и эффективностью использования токенов, используя одну модель. Параметр effort доступен на всех поддерживаемых моделях без необходимости использования бета-заголовка.
Параметр effort поддерживается Claude Opus 4.6 и Claude Opus 4.5.
Для Claude Opus 4.6 effort заменяет budget_tokens как рекомендуемый способ контроля глубины мышления. Комбинируйте effort с адаптивным мышлением (thinking: {type: "adaptive"}) для лучшего опыта. Хотя budget_tokens по-прежнему принимается на Opus 4.6, он устарел и будет удален в будущем выпуске модели. При high (по умолчанию) и max effort Claude почти всегда будет думать. При более низких уровнях effort он может пропустить мышление для более простых задач.
По умолчанию Claude использует высокий effort — тратит столько токенов, сколько необходимо для отличных результатов. Вы можете повысить уровень effort до max для абсолютно максимальной производительности или понизить его, чтобы быть более консервативным в использовании токенов, оптимизируя скорость и стоимость при принятии некоторого снижения производительности.
Установка effort на "high" дает ровно такое же поведение, как если бы параметр effort вообще не был указан.
Параметр effort влияет на все токены в ответе, включая:
Этот подход имеет два основных преимущества:
| Уровень | Описание | Типичный случай использования |
|---|---|---|
max | Абсолютная максимальная производительность без ограничений на расходование токенов. Только Opus 4.6 — запросы с использованием max на других моделях вернут ошибку. | Задачи, требующие самого глубокого возможного рассуждения и наиболее тщательного анализа |
high | Высокая производительность. Эквивалентно отсутствию установки параметра. | Сложное рассуждение, сложные задачи кодирования, агентские задачи |
medium | Сбалансированный подход с умеренной экономией токенов. | Агентские задачи, требующие баланса скорости, стоимости и производительности |
low | Наиболее эффективный. Значительная экономия токенов с некоторым снижением производительности. | Более простые задачи, требующие лучшей скорости и наименьших затрат, такие как подагенты |
Effort — это поведенческий сигнал, а не строгий бюджет токенов. При более низких уровнях effort Claude все еще будет думать над достаточно сложными задачами — он просто будет думать меньше, чем при более высоких уровнях effort для той же задачи.
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)max на других моделях вернут ошибку.При использовании инструментов параметр effort влияет как на объяснения вокруг вызовов инструментов, так и на сами вызовы инструментов. Более низкие уровни effort, как правило:
Более высокие уровни effort могут:
Параметр effort работает вместе с расширенным мышлением. Его поведение зависит от модели:
thinking: {type: "adaptive"}), где effort является рекомендуемым управлением глубиной мышления. Хотя budget_tokens по-прежнему принимается на Opus 4.6, он устарел и будет удален в будущем выпуске. При high и max effort Claude почти всегда глубоко думает. При более низких уровнях он может пропустить мышление для более простых задач.thinking: {type: "enabled", budget_tokens: N}), где effort работает вместе с бюджетом токенов мышления. Установите уровень effort для вашей задачи, затем установите бюджет токенов мышления на основе сложности задачи.Параметр effort можно использовать с расширенным мышлением или без него. При использовании без мышления он по-прежнему контролирует общее расходование токенов для текстовых ответов и вызовов инструментов.
Was this page helpful?