Loading...
    • Руководство разработчика
    • Справочник API
    • MCP
    • Ресурсы
    • Примечания к выпуску
    Search...
    ⌘K
    Первые шаги
    Введение в ClaudeБыстрый старт
    Модели и цены
    Обзор моделейВыбор моделиЧто нового в Claude 4.6Руководство миграцииУстаревшие моделиЦены
    Разработка с Claude
    Обзор функцийИспользование Messages APIОбработка причин остановкиЛучшие практики промптирования
    Возможности модели
    Extended thinkingAdaptive thinkingУсилиеБыстрый режим (preview)Структурированные выходные данныеЦитированияПотоковая передача сообщенийПакетная обработкаПоддержка PDFРезультаты поискаМногоязычная поддержкаEmbeddingsЗрение
    Инструменты
    ОбзорКак реализовать использование инструментовИнструмент веб-поискаИнструмент веб-загрузкиИнструмент выполнения кодаИнструмент памятиИнструмент BashИнструмент управления компьютеромИнструмент текстового редактора
    Инфраструктура инструментов
    Поиск инструментовПрограммный вызов инструментовПотоковая передача инструментов с детализацией
    Управление контекстом
    Контекстные окнаСжатиеРедактирование контекстаКэширование промптовПодсчет токенов
    Файлы и ресурсы
    Files API
    Agent Skills
    ОбзорБыстрый стартЛучшие практикиSkills для предприятийИспользование Skills с API
    Agent SDK
    ОбзорБыстрый стартTypeScript SDKTypeScript V2 (preview)Python SDKРуководство миграции
    MCP в API
    MCP коннекторУдаленные MCP серверы
    Claude на платформах третьих сторон
    Amazon BedrockMicrosoft FoundryVertex AI
    Инженерия промптов
    ОбзорГенератор промптовИспользование шаблонов промптовУлучшитель промптовБудьте ясны и прямолинейныИспользуйте примеры (многошаговое промптирование)Дайте Claude думать (CoT)Используйте XML тегиДайте Claude роль (системные промпты)Цепочка сложных промптовСоветы для длинного контекстаСоветы для Extended thinking
    Тестирование и оценка
    Определение критериев успехаРазработка тестовых случаевИспользование инструмента оценкиСнижение задержки
    Укрепление защиты
    Снижение галлюцинацийУвеличение согласованности выходных данныхСмягчение jailbreaksПотоковая передача отказовСнижение утечки промптаДержите Claude в образе
    Администрирование и мониторинг
    Обзор Admin APIРезидентность данныхРабочие пространстваUsage and Cost APIClaude Code Analytics APIZero Data Retention
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Возможности модели

    Effort

    Контролируйте, сколько токенов использует Claude при ответе с помощью параметра effort, балансируя между полнотой ответа и эффективностью использования токенов.

    Параметр effort позволяет вам контролировать, насколько охотно Claude тратит токены при ответе на запросы. Это дает вам возможность балансировать между полнотой ответа и эффективностью использования токенов, используя одну модель. Параметр effort доступен на всех поддерживаемых моделях без необходимости использования бета-заголовка.

    Параметр effort поддерживается Claude Opus 4.6 и Claude Opus 4.5.

    Для Claude Opus 4.6 effort заменяет budget_tokens как рекомендуемый способ контроля глубины мышления. Комбинируйте effort с адаптивным мышлением (thinking: {type: "adaptive"}) для лучшего опыта. Хотя budget_tokens по-прежнему принимается на Opus 4.6, он устарел и будет удален в будущем выпуске модели. При high (по умолчанию) и max effort Claude почти всегда будет думать. При более низких уровнях effort он может пропустить мышление для более простых задач.

    Как работает effort

    По умолчанию Claude использует высокий effort — тратит столько токенов, сколько необходимо для отличных результатов. Вы можете повысить уровень effort до max для абсолютно максимальной производительности или понизить его, чтобы быть более консервативным в использовании токенов, оптимизируя скорость и стоимость при принятии некоторого снижения производительности.

    Установка effort на "high" дает ровно такое же поведение, как если бы параметр effort вообще не был указан.

    Параметр effort влияет на все токены в ответе, включая:

    • Текстовые ответы и объяснения
    • Вызовы инструментов и аргументы функций
    • Расширенное мышление (если включено)

    Этот подход имеет два основных преимущества:

    1. Он не требует включения мышления для его использования.
    2. Он может влиять на все расходы токенов, включая вызовы инструментов. Например, более низкий effort означает, что Claude будет делать меньше вызовов инструментов. Это дает гораздо больший контроль над эффективностью.

    Уровни effort

    УровеньОписаниеТипичный случай использования
    maxАбсолютная максимальная производительность без ограничений на расходование токенов. Только Opus 4.6 — запросы с использованием max на других моделях вернут ошибку.Задачи, требующие самого глубокого возможного рассуждения и наиболее тщательного анализа
    highВысокая производительность. Эквивалентно отсутствию установки параметра.Сложное рассуждение, сложные задачи кодирования, агентские задачи
    mediumСбалансированный подход с умеренной экономией токенов.Агентские задачи, требующие баланса скорости, стоимости и производительности
    lowНаиболее эффективный. Значительная экономия токенов с некоторым снижением производительности.Более простые задачи, требующие лучшей скорости и наименьших затрат, такие как подагенты

    Effort — это поведенческий сигнал, а не строгий бюджет токенов. При более низких уровнях effort Claude все еще будет думать над достаточно сложными задачами — он просто будет думать меньше, чем при более высоких уровнях effort для той же задачи.

    Базовое использование

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=4096,
        messages=[{
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures"
        }],
        output_config={
            "effort": "medium"
        }
    )
    
    print(response.content[0].text)

    Когда следует корректировать параметр effort?

    • Используйте max effort, когда вам нужна абсолютно максимальная производительность без ограничений — самое тщательное рассуждение и самый глубокий анализ. Доступно только на Opus 4.6; запросы с использованием max на других моделях вернут ошибку.
    • Используйте high effort (по умолчанию), когда вам нужна лучшая работа Claude — сложное рассуждение, тонкий анализ, сложные задачи кодирования или любая задача, где качество является главным приоритетом.
    • Используйте medium effort как сбалансированный вариант, когда вы хотите хорошую производительность без полного расходования токенов high effort.
    • Используйте low effort, когда вы оптимизируете скорость (потому что Claude отвечает с меньшим количеством токенов) или стоимость — например, простые задачи классификации, быстрые поиски или высокообъемные случаи использования, где незначительные улучшения качества не оправдывают дополнительную задержку или расходы.

    Effort с использованием инструментов

    При использовании инструментов параметр effort влияет как на объяснения вокруг вызовов инструментов, так и на сами вызовы инструментов. Более низкие уровни effort, как правило:

    • Объединяют несколько операций в меньшее количество вызовов инструментов
    • Делают меньше вызовов инструментов
    • Переходят непосредственно к действию без предисловия
    • Используют лаконичные сообщения подтверждения после завершения

    Более высокие уровни effort могут:

    • Делать больше вызовов инструментов
    • Объяснять план перед принятием мер
    • Предоставлять подробные сводки изменений
    • Включать более полные комментарии к коду

    Effort с расширенным мышлением

    Параметр effort работает вместе с расширенным мышлением. Его поведение зависит от модели:

    • Claude Opus 4.6 использует адаптивное мышление (thinking: {type: "adaptive"}), где effort является рекомендуемым управлением глубиной мышления. Хотя budget_tokens по-прежнему принимается на Opus 4.6, он устарел и будет удален в будущем выпуске. При high и max effort Claude почти всегда глубоко думает. При более низких уровнях он может пропустить мышление для более простых задач.
    • Claude Opus 4.5 использует ручное мышление (thinking: {type: "enabled", budget_tokens: N}), где effort работает вместе с бюджетом токенов мышления. Установите уровень effort для вашей задачи, затем установите бюджет токенов мышления на основе сложности задачи.

    Параметр effort можно использовать с расширенным мышлением или без него. При использовании без мышления он по-прежнему контролирует общее расходование токенов для текстовых ответов и вызовов инструментов.

    Лучшие практики

    1. Начните с high: Используйте более низкие уровни effort для обмена производительностью на эффективность использования токенов.
    2. Используйте low для задач, чувствительных к скорости или простых задач: Когда задержка имеет значение или задачи простые, low effort может значительно сократить время ответа и затраты.
    3. Протестируйте ваш случай использования: Влияние уровней effort варьируется в зависимости от типа задачи. Оцените производительность на ваших конкретных случаях использования перед развертыванием.
    4. Рассмотрите динамический effort: Корректируйте effort на основе сложности задачи. Простые запросы могут требовать low effort, в то время как агентское кодирование и сложное рассуждение выигрывают от high effort.

    Was this page helpful?

    • Как работает effort
    • Уровни effort
    • Базовое использование
    • Когда следует корректировать параметр effort?
    • Effort с использованием инструментов
    • Effort с расширенным мышлением
    • Лучшие практики