Loading...
    0
    • Руководство разработчика
    • Справочник API
    • MCP
    • Ресурсы
    • Примечания к выпуску
    Search...
    ⌘K
    Первые шаги
    Введение в ClaudeБыстрый старт
    Модели и цены
    Обзор моделейВыбор моделиЧто нового в Claude 4.5Миграция на Claude 4.5Устаревшие моделиЦены
    Разработка с Claude
    Обзор функцийИспользование Messages APIКонтекстные окнаЛучшие практики промптирования
    Возможности
    Кэширование промптовРедактирование контекстаРасширенное мышлениеУсилиеПотоковая передача сообщенийПакетная обработкаЦитированияМногоязычная поддержкаПодсчет токеновВстраиванияЗрениеПоддержка PDFFiles APIРезультаты поискаСтруктурированные выходные данныеДополнение Google Sheets
    Инструменты
    ОбзорКак реализовать использование инструментовЭкономное использование токенов инструментамиПотоковая передача инструментов с высокой детализациейИнструмент BashИнструмент выполнения кодаПрограммное вызывание инструментовИнструмент управления компьютеромИнструмент текстового редактораИнструмент веб-выборкиИнструмент веб-поискаИнструмент памятиИнструмент поиска инструментов
    Навыки агента
    ОбзорБыстрый стартЛучшие практикиИспользование навыков с API
    Agent SDK
    ОбзорTypeScript SDKPython SDKРуководство по миграции
    Руководства
    Потоковый вводОбработка разрешенийУправление сеансомСтруктурированные выходные данные в SDKРазмещение Agent SDKИзменение системных промптовMCP в SDKПользовательские инструментыПодагенты в SDKКосые команды в SDKНавыки агента в SDKОтслеживание затрат и использованияСписки задачПлагины в SDK
    MCP в API
    Соединитель MCPУдаленные серверы MCP
    Claude на платформах третьих сторон
    Amazon BedrockMicrosoft FoundryVertex AI
    Инженерия промптов
    ОбзорГенератор промптовИспользование шаблонов промптовУлучшитель промптовБудьте ясны и прямолинейныИспользуйте примеры (многошаговое промптирование)Дайте Claude подумать (CoT)Используйте XML тегиДайте Claude роль (системные промпты)Предзаполните ответ ClaudeЦепочка сложных промптовСоветы по длинному контекстуСоветы по расширенному мышлению
    Тестирование и оценка
    Определите критерии успехаРазработайте тестовые случаиИспользование инструмента оценкиСнижение задержки
    Усиление защиты
    Снижение галлюцинацийПовышение согласованности выходных данныхСмягчение взломовПотоковые отказыСнижение утечки промптовДержите Claude в образе
    Администрирование и мониторинг
    Обзор Admin APIAPI использования и затратClaude Code Analytics API
    Console
    Возможности

    Усилие

    Контролируйте, сколько токенов использует Claude при ответе с помощью параметра effort, балансируя между полнотой ответа и эффективностью использования токенов.

    Параметр effort позволяет вам контролировать, насколько охотно Claude тратит токены при ответе на запросы. Это дает вам возможность балансировать между полнотой ответа и эффективностью использования токенов, используя одну модель.

    Параметр effort в настоящее время находится в бета-версии и поддерживается только Claude Opus 4.5.

    При использовании этой функции необходимо включить заголовок бета-версии effort-2025-11-24.

    Как работает effort

    По умолчанию Claude использует максимальное усилие — тратит столько токенов, сколько необходимо для предоставления тщательных ответов. Снижая уровень усилия, вы можете указать Claude быть более консервативным в использовании токенов, рассматривая токены как более дорогой ресурс.

    Установка effort на "high" дает ровно такое же поведение, как если бы параметр effort вообще не был указан.

    Параметр effort влияет на все токены в ответе, включая:

    • Текстовые ответы и объяснения
    • Вызовы инструментов и аргументы функций
    • Расширенное мышление (когда включено)

    Уровни усилия

    УровеньОписаниеТипичный случай использования
    highМаксимальная тщательность — Claude использует столько токенов, сколько необходимо. Эквивалентно отсутствию параметра.Сложный анализ, подробные объяснения, образовательный контент
    mediumСбалансированный подход с умеренной экономией токенов.Большинство производственных случаев использования, приложения, ориентированные на экономию затрат
    lowНаиболее эффективные по токенам ответы.Высокообъемная автоматизация, простые запросы, когда ответы обрабатываются программно

    Базовое использование

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.beta.messages.create(
        model="claude-opus-4-5-20251101",
        betas=["effort-2025-11-24"],
        max_tokens=4096,
        messages=[{
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures"
        }],
        output_config={
            "effort": "medium"
        }
    )
    
    print(response.content[0].text)

    Поведение по уровням усилия

    Параметр effort в первую очередь контролирует многословность вывода и глубину объяснений, а не правильность ответа. Claude выполняет аналогичное внутреннее рассуждение независимо от уровня усилия, но корректирует, сколько этого рассуждения появляется в выводе.

    Ответы с низким усилием

    • Ответ указан прямо с минимальным объяснением
    • Краткие, эффективные ответы (1-2 предложения контекста)
    • Формулы показаны, но не выведены
    • Предполагается, что читатель может проверить ответ
    • Лаконичные подтверждения для использования инструментов ("Готово.", "Исправлено.")

    Ответы со средним усилием

    • Краткий контекст перед ответом
    • Краткое обоснование с ключевыми промежуточными шагами
    • Может включать один рабочий пример
    • По-прежнему сосредоточен на эффективности

    Ответы с высоким усилием

    • Структурированы с заголовками разделов
    • Постановка задачи и определение переменных
    • Пошаговый процесс решения
    • Проверка и проверка здравого смысла
    • Богатое форматирование markdown

    Случаи использования

    Когда использовать низкое усилие

    • Оптимизация скорости: Меньшее количество токенов означает более быстрое время ответа, что полезно для приложений, чувствительных к задержкам
    • Автоматизированные конвейеры: Когда ответы обрабатываются кодом, а не читаются людьми
    • Высокообъемные приложения: Снижение затрат на рутинные, простые запросы
    • Опытные пользователи: Когда пользователям не нужны подробные объяснения
    • Быстрые подтверждения: Простые ответы да/нет или ответы о статусе

    Когда использовать среднее усилие

    • Production API: Баланс ясности и экономической эффективности
    • Приложения, ориентированные на пользователя: Достаточно контекста без чрезмерной многословности
    • Развертывания, ориентированные на экономию затрат: Значительная экономия с минимальным влиянием на качество

    Когда использовать высокое усилие (или без параметра effort)

    • Сложный анализ: Когда тщательность критична
    • Образовательный контент: Когда пользователям нужно понять рассуждение
    • Документация: Когда ответы служат справочным материалом
    • Отладка: Когда подробные объяснения помогают выявить проблемы

    Усилие при использовании инструментов

    При использовании инструментов параметр effort влияет как на объяснения вокруг вызовов инструментов, так и на сами вызовы инструментов. Более низкие уровни усилия, как правило:

    • Объединяют несколько операций в меньшее количество вызовов инструментов
    • Переходят непосредственно к действию без предисловия
    • Используют лаконичные сообщения подтверждения после завершения

    Более высокие уровни усилия могут:

    • Объяснить план перед принятием мер
    • Предоставить подробные сводки изменений
    • Включить более полные комментарии кода

    Усилие с расширенным мышлением

    Параметр effort работает вместе с бюджетом токенов мышления, когда включено расширенное мышление. Эти два элемента управления служат разным целям:

    • Параметр effort: Контролирует, как Claude тратит все токены — включая токены мышления, текстовые ответы и вызовы инструментов
    • Бюджет токенов мышления: Устанавливает максимальный лимит на токены мышления специально

    Параметр effort можно использовать с расширенным мышлением или без него. Когда оба настроены:

    1. Сначала определите уровень усилия, подходящий для вашей задачи
    2. Затем установите бюджет токенов мышления на основе сложности задачи

    Для лучшей производительности при сложных задачах рассуждения используйте высокое усилие (по умолчанию) с высоким бюджетом токенов мышления. Это позволяет Claude тщательно обдумать и предоставить полные ответы.

    Лучшие практики

    1. Начните со среднего: Для большинства приложений среднее усилие обеспечивает хороший баланс качества и эффективности.

    2. Используйте низкое для автоматизации: Когда ответы потребляются кодом, а не людьми, низкое усилие может значительно снизить затраты без влияния на правильность.

    3. Протестируйте ваш случай использования: Влияние уровней усилия варьируется в зависимости от типа задачи. Оцените производительность на ваших конкретных случаях использования перед развертыванием.

    4. Контролируйте качество: Хотя правильность в целом сохраняется на всех уровнях усилия, качество объяснений варьируется. Убедитесь, что выбранный вами уровень соответствует потребностям ваших пользователей.

    5. Рассмотрите динамическое усилие: Корректируйте усилие на основе сложности задачи или предпочтений пользователя. Простые запросы могут требовать низкого усилия, в то время как сложный анализ выигрывает от высокого усилия.

    • Как работает effort
    • Уровни усилия
    • Базовое использование
    • Поведение по уровням усилия
    • Ответы с низким усилием
    • Ответы со средним усилием
    • Ответы с высоким усилием
    • Случаи использования
    • Когда использовать низкое усилие
    • Когда использовать среднее усилие
    • Когда использовать высокое усилие (или без параметра effort)
    • Усилие при использовании инструментов
    • Усилие с расширенным мышлением
    • Лучшие практики

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy