Возможности модели

Effort

Контролируйте, сколько токенов использует Claude при ответе с помощью параметра effort, балансируя между полнотой ответа и эффективностью использования токенов.

Параметр effort позволяет вам контролировать, насколько охотно Claude тратит токены при ответе на запросы. Это дает вам возможность балансировать между полнотой ответа и эффективностью использования токенов, используя одну модель. Параметр effort доступен на всех поддерживаемых моделях без необходимости использования бета-заголовка.

Параметр effort поддерживается Claude Opus 4.6 и Claude Opus 4.5.

Для Claude Opus 4.6 effort заменяет budget_tokens как рекомендуемый способ контроля глубины мышления. Комбинируйте effort с адаптивным мышлением (thinking: {type: "adaptive"}) для лучшего опыта. Хотя budget_tokens по-прежнему принимается на Opus 4.6, он устарел и будет удален в будущем выпуске модели. При high (по умолчанию) и max effort Claude почти всегда будет думать. При более низких уровнях effort он может пропустить мышление для более простых задач.

Как работает effort

По умолчанию Claude использует высокий effort — тратит столько токенов, сколько необходимо для отличных результатов. Вы можете повысить уровень effort до max для абсолютно максимальной производительности или понизить его, чтобы быть более консервативным в использовании токенов, оптимизируя скорость и стоимость при принятии некоторого снижения производительности.

Установка effort на "high" дает ровно такое же поведение, как если бы параметр effort вообще не был указан.

Параметр effort влияет на все токены в ответе, включая:

Текстовые ответы и объяснения
Вызовы инструментов и аргументы функций
Расширенное мышление (если включено)

Этот подход имеет два основных преимущества:

Он не требует включения мышления для его использования.
Он может влиять на все расходы токенов, включая вызовы инструментов. Например, более низкий effort означает, что Claude будет делать меньше вызовов инструментов. Это дает гораздо больший контроль над эффективностью.

Уровни effort

Уровень	Описание	Типичный случай использования
`max`	Абсолютная максимальная производительность без ограничений на расходование токенов. Только Opus 4.6 — запросы с использованием `max` на других моделях вернут ошибку.	Задачи, требующие самого глубокого возможного рассуждения и наиболее тщательного анализа
`high`	Высокая производительность. Эквивалентно отсутствию установки параметра.	Сложное рассуждение, сложные задачи кодирования, агентские задачи
`medium`	Сбалансированный подход с умеренной экономией токенов.	Агентские задачи, требующие баланса скорости, стоимости и производительности
`low`	Наиболее эффективный. Значительная экономия токенов с некоторым снижением производительности.	Более простые задачи, требующие лучшей скорости и наименьших затрат, такие как подагенты

Effort — это поведенческий сигнал, а не строгий бюджет токенов. При более низких уровнях effort Claude все еще будет думать над достаточно сложными задачами — он просто будет думать меньше, чем при более высоких уровнях effort для той же задачи.

Базовое использование

import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=4096,
    messages=[{
        "role": "user",
        "content": "Analyze the trade-offs between microservices and monolithic architectures"
    }],
    output_config={
        "effort": "medium"
    }
)

print(response.content[0].text)

Когда следует корректировать параметр effort?

Используйте max effort, когда вам нужна абсолютно максимальная производительность без ограничений — самое тщательное рассуждение и самый глубокий анализ. Доступно только на Opus 4.6; запросы с использованием max на других моделях вернут ошибку.
Используйте high effort (по умолчанию), когда вам нужна лучшая работа Claude — сложное рассуждение, тонкий анализ, сложные задачи кодирования или любая задача, где качество является главным приоритетом.
Используйте medium effort как сбалансированный вариант, когда вы хотите хорошую производительность без полного расходования токенов high effort.
Используйте low effort, когда вы оптимизируете скорость (потому что Claude отвечает с меньшим количеством токенов) или стоимость — например, простые задачи классификации, быстрые поиски или высокообъемные случаи использования, где незначительные улучшения качества не оправдывают дополнительную задержку или расходы.

Effort с использованием инструментов

При использовании инструментов параметр effort влияет как на объяснения вокруг вызовов инструментов, так и на сами вызовы инструментов. Более низкие уровни effort, как правило:

Объединяют несколько операций в меньшее количество вызовов инструментов
Делают меньше вызовов инструментов
Переходят непосредственно к действию без предисловия
Используют лаконичные сообщения подтверждения после завершения

Более высокие уровни effort могут:

Делать больше вызовов инструментов
Объяснять план перед принятием мер
Предоставлять подробные сводки изменений
Включать более полные комментарии к коду

Effort с расширенным мышлением

Параметр effort работает вместе с расширенным мышлением. Его поведение зависит от модели:

Claude Opus 4.6 использует адаптивное мышление (thinking: {type: "adaptive"}), где effort является рекомендуемым управлением глубиной мышления. Хотя budget_tokens по-прежнему принимается на Opus 4.6, он устарел и будет удален в будущем выпуске. При high и max effort Claude почти всегда глубоко думает. При более низких уровнях он может пропустить мышление для более простых задач.
Claude Opus 4.5 использует ручное мышление (thinking: {type: "enabled", budget_tokens: N}), где effort работает вместе с бюджетом токенов мышления. Установите уровень effort для вашей задачи, затем установите бюджет токенов мышления на основе сложности задачи.

Параметр effort можно использовать с расширенным мышлением или без него. При использовании без мышления он по-прежнему контролирует общее расходование токенов для текстовых ответов и вызовов инструментов.

Лучшие практики

Начните с high: Используйте более низкие уровни effort для обмена производительностью на эффективность использования токенов.
Используйте low для задач, чувствительных к скорости или простых задач: Когда задержка имеет значение или задачи простые, low effort может значительно сократить время ответа и затраты.
Протестируйте ваш случай использования: Влияние уровней effort варьируется в зависимости от типа задачи. Оцените производительность на ваших конкретных случаях использования перед развертыванием.
Рассмотрите динамический effort: Корректируйте effort на основе сложности задачи. Простые запросы могут требовать low effort, в то время как агентское кодирование и сложное рассуждение выигрывают от high effort.

Was this page helpful?

Возможности модели

Effort

Параметр effort поддерживается Claude Opus 4.6 и Claude Opus 4.5.

Как работает effort

Установка effort на "high" дает ровно такое же поведение, как если бы параметр effort вообще не был указан.

Параметр effort влияет на все токены в ответе, включая:

Текстовые ответы и объяснения
Вызовы инструментов и аргументы функций
Расширенное мышление (если включено)

Этот подход имеет два основных преимущества:

Он не требует включения мышления для его использования.
Он может влиять на все расходы токенов, включая вызовы инструментов. Например, более низкий effort означает, что Claude будет делать меньше вызовов инструментов. Это дает гораздо больший контроль над эффективностью.

Уровни effort

Уровень	Описание	Типичный случай использования
`max`	Абсолютная максимальная производительность без ограничений на расходование токенов. Только Opus 4.6 — запросы с использованием `max` на других моделях вернут ошибку.	Задачи, требующие самого глубокого возможного рассуждения и наиболее тщательного анализа
`high`	Высокая производительность. Эквивалентно отсутствию установки параметра.	Сложное рассуждение, сложные задачи кодирования, агентские задачи
`medium`	Сбалансированный подход с умеренной экономией токенов.	Агентские задачи, требующие баланса скорости, стоимости и производительности
`low`	Наиболее эффективный. Значительная экономия токенов с некоторым снижением производительности.	Более простые задачи, требующие лучшей скорости и наименьших затрат, такие как подагенты

Базовое использование

import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=4096,
    messages=[{
        "role": "user",
        "content": "Analyze the trade-offs between microservices and monolithic architectures"
    }],
    output_config={
        "effort": "medium"
    }
)

print(response.content[0].text)

Когда следует корректировать параметр effort?

Используйте max effort, когда вам нужна абсолютно максимальная производительность без ограничений — самое тщательное рассуждение и самый глубокий анализ. Доступно только на Opus 4.6; запросы с использованием max на других моделях вернут ошибку.
Используйте high effort (по умолчанию), когда вам нужна лучшая работа Claude — сложное рассуждение, тонкий анализ, сложные задачи кодирования или любая задача, где качество является главным приоритетом.
Используйте medium effort как сбалансированный вариант, когда вы хотите хорошую производительность без полного расходования токенов high effort.
Используйте low effort, когда вы оптимизируете скорость (потому что Claude отвечает с меньшим количеством токенов) или стоимость — например, простые задачи классификации, быстрые поиски или высокообъемные случаи использования, где незначительные улучшения качества не оправдывают дополнительную задержку или расходы.

Effort с использованием инструментов

Объединяют несколько операций в меньшее количество вызовов инструментов
Делают меньше вызовов инструментов
Переходят непосредственно к действию без предисловия
Используют лаконичные сообщения подтверждения после завершения

Более высокие уровни effort могут:

Делать больше вызовов инструментов
Объяснять план перед принятием мер
Предоставлять подробные сводки изменений
Включать более полные комментарии к коду

Effort с расширенным мышлением

Параметр effort работает вместе с расширенным мышлением. Его поведение зависит от модели:

Claude Opus 4.6 использует адаптивное мышление (thinking: {type: "adaptive"}), где effort является рекомендуемым управлением глубиной мышления. Хотя budget_tokens по-прежнему принимается на Opus 4.6, он устарел и будет удален в будущем выпуске. При high и max effort Claude почти всегда глубоко думает. При более низких уровнях он может пропустить мышление для более простых задач.
Claude Opus 4.5 использует ручное мышление (thinking: {type: "enabled", budget_tokens: N}), где effort работает вместе с бюджетом токенов мышления. Установите уровень effort для вашей задачи, затем установите бюджет токенов мышления на основе сложности задачи.

Лучшие практики

Начните с high: Используйте более низкие уровни effort для обмена производительностью на эффективность использования токенов.
Используйте low для задач, чувствительных к скорости или простых задач: Когда задержка имеет значение или задачи простые, low effort может значительно сократить время ответа и затраты.
Протестируйте ваш случай использования: Влияние уровней effort варьируется в зависимости от типа задачи. Оцените производительность на ваших конкретных случаях использования перед развертыванием.
Рассмотрите динамический effort: Корректируйте effort на основе сложности задачи. Простые запросы могут требовать low effort, в то время как агентское кодирование и сложное рассуждение выигрывают от high effort.

Was this page helpful?