Loading...
    • Руководство разработчика
    • Справочник API
    • MCP
    • Ресурсы
    • Примечания к выпуску
    Search...
    ⌘K
    Первые шаги
    Введение в ClaudeБыстрый старт
    Модели и цены
    Обзор моделейВыбор моделиЧто нового в Claude 4.5Миграция на Claude 4.5Устаревшие моделиЦены
    Разработка с Claude
    Обзор функцийИспользование Messages APIКонтекстные окнаЛучшие практики промптирования
    Возможности
    Кэширование промптовРедактирование контекстаРасширенное мышлениеУсилиеПотоковая передача сообщенийПакетная обработкаЦитированияМногоязычная поддержкаПодсчет токеновEmbeddingsЗрениеПоддержка PDFFiles APIРезультаты поискаСтруктурированные выходные данные
    Инструменты
    ОбзорКак реализовать использование инструментовПотоковая передача инструментов с детализациейИнструмент BashИнструмент выполнения кодаПрограммное вызывание инструментовИнструмент управления компьютеромИнструмент текстового редактораИнструмент веб-выборкиИнструмент веб-поискаИнструмент памятиИнструмент поиска инструментов
    Agent Skills
    ОбзорБыстрый стартЛучшие практикиИспользование Skills с API
    Agent SDK
    ОбзорБыстрый стартTypeScript SDKTypeScript V2 (preview)Python SDKРуководство по миграции
    MCP в API
    MCP коннекторУдаленные MCP серверы
    Claude на сторонних платформах
    Amazon BedrockMicrosoft FoundryVertex AI
    Инженерия промптов
    ОбзорГенератор промптовИспользование шаблонов промптовУлучшитель промптовБудьте ясны и прямолинейныИспользуйте примеры (многошаговое промптирование)Дайте Claude подумать (CoT)Используйте XML-тегиДайте Claude роль (системные промпты)Предзаполните ответ ClaudeЦепочка сложных промптовСоветы по длинному контекстуСоветы по расширенному мышлению
    Тестирование и оценка
    Определение критериев успехаРазработка тестовых случаевИспользование инструмента оценкиСнижение задержки
    Усиление защиты
    Снижение галлюцинацийПовышение согласованности выходных данныхСмягчение взломовПотоковые отказыСнижение утечки промптовДержите Claude в образе
    Администрирование и мониторинг
    Обзор Admin APIAPI использования и затратClaude Code Analytics API
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Возможности

    Effort

    Контролируйте, сколько токенов использует Claude при ответе с помощью параметра effort, балансируя между полнотой ответа и эффективностью использования токенов.

    Параметр effort позволяет вам контролировать, насколько охотно Claude тратит токены при ответе на запросы. Это дает вам возможность балансировать между полнотой ответа и эффективностью использования токенов, используя одну модель.

    Параметр effort в настоящее время находится в бета-версии и поддерживается только Claude Opus 4.5.

    Вы должны включить бета-заголовок effort-2025-11-24 при использовании этой функции.

    Как работает effort

    По умолчанию Claude использует максимальный effort — тратит столько токенов, сколько необходимо для достижения наилучшего результата. Снижая уровень effort, вы можете указать Claude быть более консервативным в использовании токенов, оптимизируя скорость и стоимость, при этом принимая некоторое снижение возможностей.

    Установка effort на "high" дает ровно такое же поведение, как если бы параметр effort вообще не был указан.

    Параметр effort влияет на все токены в ответе, включая:

    • Текстовые ответы и объяснения
    • Вызовы инструментов и аргументы функций
    • Расширенное мышление (если включено)

    Этот подход имеет два основных преимущества:

    1. Он не требует включения мышления для его использования.
    2. Он может влиять на все расходы токенов, включая вызовы инструментов. Например, более низкий effort означает, что Claude делает меньше вызовов инструментов. Это дает гораздо больший контроль над эффективностью.

    Уровни effort

    УровеньОписаниеТипичный случай использования
    highМаксимальные возможности. Claude использует столько токенов, сколько необходимо для достижения наилучшего результата. Эквивалентно отсутствию параметра.Сложные рассуждения, сложные задачи кодирования, агентские задачи
    mediumСбалансированный подход с умеренной экономией токенов.Агентские задачи, требующие баланса скорости, стоимости и производительности
    lowНаиболее эффективный. Значительная экономия токенов с некоторым снижением возможностей.Более простые задачи, требующие лучшей скорости и наименьших затрат, такие как подагенты

    Базовое использование

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.beta.messages.create(
        model="claude-opus-4-5-20251101",
        betas=["effort-2025-11-24"],
        max_tokens=4096,
        messages=[{
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures"
        }],
        output_config={
            "effort": "medium"
        }
    )
    
    print(response.content[0].text)

    Когда следует регулировать параметр effort?

    • Используйте high effort (по умолчанию), когда вам нужна лучшая работа Claude — сложные рассуждения, тонкий анализ, сложные задачи кодирования или любая задача, где качество является главным приоритетом.
    • Используйте medium effort как сбалансированный вариант, когда вы хотите хорошую производительность без полного расхода токенов high effort.
    • Используйте low effort, когда вы оптимизируете скорость (потому что Claude отвечает с меньшим количеством токенов) или стоимость — например, простые задачи классификации, быстрые поиски или высокообъемные случаи использования, где незначительные улучшения качества не оправдывают дополнительную задержку или расходы.

    Effort с использованием инструментов

    При использовании инструментов параметр effort влияет как на объяснения вокруг вызовов инструментов, так и на сами вызовы инструментов. Более низкие уровни effort, как правило:

    • Объединяют несколько операций в меньшее количество вызовов инструментов
    • Делают меньше вызовов инструментов
    • Переходят непосредственно к действию без предисловия
    • Используют лаконичные сообщения подтверждения после завершения

    Более высокие уровни effort могут:

    • Делать больше вызовов инструментов
    • Объяснять план перед принятием мер
    • Предоставлять подробные резюме изменений
    • Включать более полные комментарии кода

    Effort с расширенным мышлением

    Параметр effort работает вместе с бюджетом токенов мышления, когда включено расширенное мышление. Эти два элемента управления служат разным целям:

    • Параметр effort: Контролирует, как Claude тратит все токены — включая токены мышления, текстовые ответы и вызовы инструментов
    • Бюджет токенов мышления: Устанавливает максимальный лимит на токены мышления конкретно

    Параметр effort можно использовать с включенным или отключенным расширенным мышлением. Когда оба настроены:

    1. Сначала определите уровень effort, подходящий для вашей задачи
    2. Затем установите бюджет токенов мышления на основе сложности задачи

    Для лучшей производительности при сложных задачах рассуждения используйте high effort (по умолчанию) с высоким бюджетом токенов мышления. Это позволяет Claude тщательно обдумать и предоставить полные ответы.

    Лучшие практики

    1. Начните с high: Используйте более низкие уровни effort для обмена производительностью на эффективность использования токенов.
    2. Используйте low для задач, чувствительных к скорости или простых задач: Когда задержка имеет значение или задачи простые, low effort может значительно сократить время ответа и затраты.
    3. Протестируйте ваш случай использования: Влияние уровней effort варьируется в зависимости от типа задачи. Оцените производительность на ваших конкретных случаях использования перед развертыванием.
    4. Рассмотрите динамический effort: Регулируйте effort в зависимости от сложности задачи. Простые запросы могут требовать low effort, в то время как агентское кодирование и сложные рассуждения выигрывают от high effort.
    • Как работает effort
    • Уровни effort
    • Базовое использование
    • Когда следует регулировать параметр effort?
    • Effort с использованием инструментов
    • Effort с расширенным мышлением
    • Лучшие практики