Loading...
    • Руководство разработчика
    • Справочник API
    • MCP
    • Ресурсы
    • Примечания к выпуску
    Search...
    ⌘K
    Первые шаги
    Введение в ClaudeБыстрый старт
    Модели и цены
    Обзор моделейВыбор моделиЧто нового в Claude 4.5Миграция на Claude 4.5Устаревшие моделиЦены
    Разработка с Claude
    Обзор функцийИспользование Messages APIКонтекстные окнаЛучшие практики промптирования
    Возможности
    Кэширование промптовРедактирование контекстаРасширенное мышлениеУсилиеПотоковая передача сообщенийПакетная обработкаЦитированияМногоязычная поддержкаПодсчет токеновEmbeddingsЗрениеПоддержка PDFFiles APIРезультаты поискаСтруктурированные выходные данные
    Инструменты
    ОбзорКак реализовать использование инструментовПотоковая передача инструментов с детализациейИнструмент BashИнструмент выполнения кодаПрограммное вызывание инструментовИнструмент управления компьютеромИнструмент текстового редактораИнструмент веб-выборкиИнструмент веб-поискаИнструмент памятиИнструмент поиска инструментов
    Agent Skills
    ОбзорБыстрый стартЛучшие практикиИспользование Skills с API
    Agent SDK
    ОбзорБыстрый стартTypeScript SDKTypeScript V2 (preview)Python SDKРуководство по миграции
    MCP в API
    MCP коннекторУдаленные MCP серверы
    Claude на сторонних платформах
    Amazon BedrockMicrosoft FoundryVertex AI
    Инженерия промптов
    ОбзорГенератор промптовИспользование шаблонов промптовУлучшитель промптовБудьте ясны и прямолинейныИспользуйте примеры (многошаговое промптирование)Дайте Claude подумать (CoT)Используйте XML-тегиДайте Claude роль (системные промпты)Предзаполните ответ ClaudeЦепочка сложных промптовСоветы по длинному контекстуСоветы по расширенному мышлению
    Тестирование и оценка
    Определение критериев успехаРазработка тестовых случаевИспользование инструмента оценкиСнижение задержки
    Усиление защиты
    Снижение галлюцинацийПовышение согласованности выходных данныхСмягчение взломовПотоковые отказыСнижение утечки промптовДержите Claude в образе
    Администрирование и мониторинг
    Обзор Admin APIAPI использования и затратClaude Code Analytics API
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Возможности

    Создание с расширенным мышлением

    Расширенное мышление дает Claude улучшенные возможности рассуждения для сложных задач, обеспечивая различные уровни прозрачности его пошагового процесса мышления перед тем, как он предоставит окончательный ответ.
    • Поддерживаемые модели
    • Как работает расширенное мышление
    • Как использовать расширенное мышление
    • Суммированное мышление
    • Потоковое мышление
    • Расширенное мышление с использованием инструментов
    • Переключение режимов мышления в разговорах
    • Сохранение блоков мышления
    • Перемежающееся мышление
    • Расширенное мышление с кешированием подсказок
    • Понимание поведения кеширования блока мышления
    • Максимальное количество токенов и размер контекстного окна с расширенным мышлением
    • Контекстное окно с расширенным мышлением
    • Контекстное окно с расширенным мышлением и использованием инструментов
    • Управление токенами с расширенным мышлением
    • Шифрование мышления
    • Редактирование мышления
    • Различия в мышлении между версиями моделей
    • Сохранение блока мышления в Claude Opus 4.5
    • Цены
    • Лучшие практики и соображения для расширенного мышления
    • Работа с бюджетами мышления
    • Соображения производительности
    • Совместимость функций
    • Рекомендации по использованию
    • Следующие шаги

    Расширенное мышление дает Claude улучшенные возможности рассуждения для сложных задач, обеспечивая различные уровни прозрачности его пошагового процесса мышления перед тем, как он предоставит окончательный ответ.

    Поддерживаемые модели

    Расширенное мышление поддерживается в следующих моделях:

    • Claude Sonnet 4.5 (claude-sonnet-4-5-20250929)
    • Claude Sonnet 4 (claude-sonnet-4-20250514)
    • Claude Sonnet 3.7 (claude-3-7-sonnet-20250219) (устарела)
    • Claude Haiku 4.5 (claude-haiku-4-5-20251001)
    • Claude Opus 4.5 (claude-opus-4-5-20251101)
    • Claude Opus 4.1 (claude-opus-4-1-20250805)
    • Claude Opus 4 (claude-opus-4-20250514)

    Поведение API отличается между моделями Claude Sonnet 3.7 и Claude 4, но формы API остаются абсолютно одинаковыми.

    Для получения дополнительной информации см. Различия в мышлении между версиями моделей.

    Как работает расширенное мышление

    Когда расширенное мышление включено, Claude создает блоки содержимого thinking, где выводит свои внутренние рассуждения. Claude использует идеи из этих рассуждений перед тем, как создать окончательный ответ.

    Ответ API будет включать блоки содержимого thinking, за которыми следуют блоки содержимого text.

    Вот пример формата ответа по умолчанию:

    {
      "content": [
        {
          "type": "thinking",
          "thinking": "Let me analyze this step by step...",
          "signature": "WaUjzkypQ2mUEVM36O2TxuC06KN8xyfbJwyem2dw3URve/op91XWHOEBLLqIOMfFG/UvLEczmEsUjavL...."
        },
        {
          "type": "text",
          "text": "Based on my analysis..."
        }
      ]
    }

    Для получения дополнительной информации о формате ответа расширенного мышления см. Справочник API Messages.

    Как использовать расширенное мышление

    Вот пример использования расширенного мышления в Messages API:

    Чтобы включить расширенное мышление, добавьте объект thinking с параметром type, установленным на enabled, и budget_tokens на указанный бюджет токенов для расширенного мышления.

    Параметр budget_tokens определяет максимальное количество токенов, которые Claude может использовать для своего внутреннего процесса рассуждения. В моделях Claude 4 это ограничение применяется к полным токенам мышления, а не к суммированному выводу. Большие бюджеты могут улучшить качество ответа, позволяя более тщательный анализ сложных проблем, хотя Claude может не использовать весь выделенный бюджет, особенно при значениях выше 32k.

    budget_tokens должен быть установлен на значение меньше, чем max_tokens. Однако при использовании чередующегося мышления с инструментами, вы можете превысить это ограничение, так как лимит токенов становится вашим всем контекстным окном (200k токенов).

    Суммированное мышление

    С включенным расширенным мышлением Messages API для моделей Claude 4 возвращает сводку полного процесса мышления Claude. Суммированное мышление обеспечивает полные преимущества интеллекта расширенного мышления, предотвращая неправомерное использование.

    Вот некоторые важные соображения для суммированного мышления:

    • Вам выставляется счет за полные токены мышления, созданные исходным запросом, а не за токены сводки.
    • Количество выставленных токенов вывода не совпадет с количеством токенов, которые вы видите в ответе.
    • Первые несколько строк вывода мышления более подробны, предоставляя детальные рассуждения, которые особенно полезны для целей инженерии подсказок.
    • По мере того как Anthropic стремится улучшить функцию расширенного мышления, поведение суммирования может измениться.
    • Суммирование сохраняет ключевые идеи процесса мышления Claude с минимальной добавленной задержкой, обеспечивая потоковый пользовательский опыт и легкую миграцию с Claude Sonnet 3.7 на модели Claude 4.
    • Суммирование обрабатывается другой моделью, чем та, которую вы указываете в своих запросах. Модель мышления не видит суммированный вывод.

    Claude Sonnet 3.7 продолжает возвращать полный вывод мышления.

    В редких случаях, когда вам нужен доступ к полному выводу мышления для моделей Claude 4, свяжитесь с нашей командой продаж.

    Потоковое мышление

    Вы можете передавать ответы расширенного мышления, используя события, отправляемые сервером (SSE).

    Когда потоковая передача включена для расширенного мышления, вы получаете содержимое мышления через события thinking_delta.

    Для получения дополнительной документации по потоковой передаче через Messages API см. Потоковые сообщения.

    Вот как обрабатывать потоковую передачу с мышлением:

    Попробуйте в консоли

    Пример вывода потоковой передачи:

    event: message_start
    data: {"type": "message_start", "message": {"id": "msg_01...", "type": "message", "role": "assistant", "content": [], "model": "claude-sonnet-4-5", "stop_reason": null, "stop_sequence": null}}
    
    event: content_block_start
    data: {"type": "content_block_start", "index": 0, "content_block": {"type": "thinking", "thinking": ""}}
    
    event: content_block_delta
    data: {"type": "content_block_delta", "index": 0, "delta": {"type": "thinking_delta", "thinking": "Let me solve this step by step:\n\n1. First break down 27 * 453"}}
    
    event: content_block_delta
    data: {"type": "content_block_delta", "index": 0, "delta": {"type": "thinking_delta", "thinking": "\n2. 453 = 400 + 50 + 3"}}
    
    // Additional thinking deltas...
    
    event: content_block_delta
    data: {"type": "content_block_delta", "index": 0, "delta": {"type": "signature_delta", "signature": "EqQBCgIYAhIM1gbcDa9GJwZA2b3hGgxBdjrkzLoky3dl1pkiMOYds..."}}
    
    event: content_block_stop
    data: {"type": "content_block_stop", "index": 0}
    
    event: content_block_start
    data: {"type": "content_block_start", "index": 1, "content_block": {"type": "text", "text": ""}}
    
    event: content_block_delta
    data: {"type": "content_block_delta", "index": 1, "delta": {"type": "text_delta", "text": "27 * 453 = 12,231"}}
    
    // Additional text deltas...
    
    event: content_block_stop
    data: {"type": "content_block_stop", "index": 1}
    
    event: message_delta
    data: {"type": "message_delta", "delta": {"stop_reason": "end_turn", "stop_sequence": null}}
    
    event: message_stop
    data: {"type": "message_stop"}

    При использовании потоковой передачи с включенным мышлением вы можете заметить, что текст иногда поступает в больших блоках, чередуясь с меньшей доставкой токен за токеном. Это ожидаемое поведение, особенно для содержимого мышления.

    Система потоковой передачи должна обрабатывать содержимое партиями для оптимальной производительности, что может привести к этому "прерывистому" шаблону доставки с возможными задержками между событиями потоковой передачи. Мы постоянно работаем над улучшением этого опыта, с будущими обновлениями, сосредоточенными на более плавной потоковой передаче содержимого мышления.

    Расширенное мышление с использованием инструментов

    Расширенное мышление можно использовать наряду с использованием инструментов, позволяя Claude рассуждать о выборе инструментов и обработке результатов.

    При использовании расширенного мышления с использованием инструментов помните о следующих ограничениях:

    1. Ограничение выбора инструмента: Использование инструментов с мышлением поддерживает только tool_choice: {"type": "auto"} (по умолчанию) или tool_choice: {"type": "none"}. Использование tool_choice: {"type": "any"} или tool_choice: {"type": "tool", "name": "..."} приведет к ошибке, потому что эти опции принуждают использование инструментов, что несовместимо с расширенным мышлением.

    2. Сохранение блоков мышления: Во время использования инструментов вы должны передать блоки thinking обратно в API для последнего сообщения ассистента. Включите полный неизмененный блок обратно в API для поддержания непрерывности рассуждений.

    Переключение режимов мышления в разговорах

    Вы не можете переключать мышление в середине хода ассистента, включая во время циклов использования инструментов. Весь ход ассистента должен работать в одном режиме мышления:

    • Если мышление включено, финальный ход ассистента должен начинаться с блока мышления.
    • Если мышление отключено, финальный ход ассистента не должен содержать никаких блоков мышления

    С точки зрения модели, циклы использования инструментов являются частью хода ассистента. Ход ассистента не завершается, пока Claude не завершит свой полный ответ, который может включать несколько вызовов инструментов и результатов.

    Например, эта последовательность является частью одного хода ассистента:

    User: "What's the weather in Paris?"
    Assistant: [thinking] + [tool_use: get_weather]
    User: [tool_result: "20°C, sunny"]
    Assistant: [text: "The weather in Paris is 20°C and sunny"]

    Хотя есть несколько сообщений API, цикл использования инструментов концептуально является частью одного непрерывного ответа ассистента.

    Распространенные сценарии ошибок

    Вы можете столкнуться с этой ошибкой:

    Expected `thinking` or `redacted_thinking`, but found `tool_use`.
    When `thinking` is enabled, a final `assistant` message must start
    with a thinking block (preceding the lastmost set of `tool_use` and
    `tool_result` blocks).

    Это обычно происходит, когда:

    1. У вас было мышление отключено во время последовательности использования инструментов
    2. Вы хотите включить мышление снова
    3. Ваше последнее сообщение ассистента содержит блоки использования инструментов, но нет блока мышления

    Практическое руководство

    ✗ Недействительно: Переключение мышления сразу после использования инструмента

    User: "What's the weather?"
    Assistant: [tool_use] (thinking disabled)
    User: [tool_result]
    // Cannot enable thinking here - still in the same assistant turn

    ✓ Действительно: Завершите ход ассистента сначала

    User: "What's the weather?"
    Assistant: [tool_use] (thinking disabled)
    User: [tool_result]
    Assistant: [text: "It's sunny"] 
    User: "What about tomorrow?" (thinking disabled)
    Assistant: [thinking] + [text: "..."] (thinking enabled - new turn)

    Лучшая практика: Спланируйте вашу стратегию мышления в начале каждого хода, а не пытайтесь переключаться в середине хода.

    Переключение режимов мышления также делает недействительным кэширование подсказок для истории сообщений. Для получения дополнительной информации см. раздел Расширенное мышление с кэшированием подсказок.

    Сохранение блоков мышления

    Во время использования инструментов вы должны передать блоки thinking обратно в API, и вы должны включить полный неизмененный блок обратно в API. Это критично для поддержания потока рассуждений модели и целостности разговора.

    Хотя вы можете опустить блоки thinking из предыдущих ходов роли assistant, мы предлагаем всегда передавать все блоки мышления обратно в API для любого многоходового разговора. API будет:

    • Автоматически фильтровать предоставленные блоки мышления
    • Использовать релевантные блоки мышления, необходимые для сохранения рассуждений модели
    • Выставлять счет только за входные токены для блоков, показанных Claude

    При переключении режимов мышления во время разговора помните, что весь ход ассистента (включая циклы использования инструментов) должен работать в одном режиме мышления. Для получения дополнительной информации см. Переключение режимов мышления в разговорах.

    Когда Claude вызывает инструменты, он приостанавливает построение ответа, чтобы ожидать внешней информации. Когда возвращаются результаты инструментов, Claude продолжит построение этого существующего ответа. Это требует сохранения блоков мышления во время использования инструментов по нескольким причинам:

    1. Непрерывность рассуждений: Блоки мышления захватывают пошаговые рассуждения Claude, которые привели к запросам инструментов. Когда вы отправляете результаты инструментов, включение исходного мышления гарантирует, что Claude может продолжить свои рассуждения с того момента, где он остановился.

    2. Поддержание контекста: Хотя результаты инструментов отображаются как пользовательские сообщения в структуре API, они являются частью непрерывного потока рассуждений. Сохранение блоков мышления поддерживает этот концептуальный поток через несколько вызовов API. Для получения дополнительной информации об управлении контекстом см. наше руководство по контекстным окнам.

    Важно: При предоставлении блоков thinking, вся последовательность последовательных блоков thinking должна соответствовать выходам, созданным моделью во время исходного запроса; вы не можете переставлять или изменять последовательность этих блоков.

    Перемежающееся мышление

    Расширенное мышление с использованием инструментов в моделях Claude 4 поддерживает перемежающееся мышление, которое позволяет Claude думать между вызовами инструментов и проводить более сложные рассуждения после получения результатов инструментов.

    С перемежающимся мышлением Claude может:

    • Рассуждать о результатах вызова инструмента перед тем, как решить, что делать дальше
    • Связывать несколько вызовов инструментов с этапами рассуждения между ними
    • Принимать более тонкие решения на основе промежуточных результатов

    Чтобы включить перемежающееся мышление, добавьте заголовок бета-версии interleaved-thinking-2025-05-14 в ваш запрос API.

    Вот некоторые важные соображения для перемежающегося мышления:

    • С перемежающимся мышлением budget_tokens может превышать параметр max_tokens, так как он представляет общий бюджет для всех блоков мышления в одном ходу помощника.
    • Перемежающееся мышление поддерживается только для инструментов, используемых через Messages API.
    • Перемежающееся мышление поддерживается только для моделей Claude 4 с заголовком бета-версии interleaved-thinking-2025-05-14.
    • Прямые вызовы API Claude позволяют вам передавать interleaved-thinking-2025-05-14 в запросах к любой модели без каких-либо эффектов.
    • На платформах третьих сторон (например, Amazon Bedrock и Vertex AI), если вы передаете interleaved-thinking-2025-05-14 к любой модели, кроме Claude Opus 4.5, Claude Opus 4.1, Opus 4 или Sonnet 4, ваш запрос будет отклонен.

    Расширенное мышление с кешированием подсказок

    Кеширование подсказок с мышлением имеет несколько важных соображений:

    Задачи расширенного мышления часто занимают более 5 минут. Рассмотрите возможность использования длительности кеша в 1 час для сохранения попаданий кеша во время длительных сеансов мышления и многоэтапных рабочих процессов.

    Удаление контекста блока мышления

    • Блоки мышления из предыдущих ходов удаляются из контекста, что может повлиять на точки разрыва кеша
    • При продолжении разговоров с использованием инструментов блоки мышления кешируются и учитываются как входные токены при чтении из кеша
    • Это создает компромисс: хотя блоки мышления не потребляют пространство контекстного окна визуально, они все еще учитываются в использовании входных токенов при кешировании
    • Если мышление отключено, запросы будут отклонены, если вы передаете содержимое мышления в текущем ходе использования инструмента. В других контекстах содержимое мышления, переданное в API, просто игнорируется

    Шаблоны инвалидации кеша

    • Изменения параметров мышления (включено/отключено или распределение бюджета) инвалидируют точки разрыва кеша сообщений
    • Перемежающееся мышление усиливает инвалидацию кеша, так как блоки мышления могут возникать между несколькими вызовами инструментов
    • Системные подсказки и инструменты остаются кешированными несмотря на изменения параметров мышления или удаление блоков

    Хотя блоки мышления удаляются для кеширования и расчетов контекста, они должны быть сохранены при продолжении разговоров с использованием инструментов, особенно с перемежающимся мышлением.

    Понимание поведения кеширования блока мышления

    При использовании расширенного мышления с использованием инструментов блоки мышления демонстрируют специфическое поведение кеширования, которое влияет на подсчет токенов:

    Как это работает:

    1. Кеширование происходит только при выполнении последующего запроса, который включает результаты инструментов
    2. Когда выполняется последующий запрос, предыдущая история разговора (включая блоки мышления) может быть кеширована
    3. Эти кешированные блоки мышления учитываются как входные токены в ваших метриках использования при чтении из кеша
    4. Когда включен блок результата, не связанный с инструментом, все предыдущие блоки мышления игнорируются и удаляются из контекста

    Подробный пример потока:

    Запрос 1:

    User: "What's the weather in Paris?"

    Ответ 1:

    [thinking_block_1] + [tool_use block 1]

    Запрос 2:

    User: ["What's the weather in Paris?"], 
    Assistant: [thinking_block_1] + [tool_use block 1], 
    User: [tool_result_1, cache=True]

    Ответ 2:

    [thinking_block_2] + [text block 2]

    Запрос 2 записывает кеш содержимого запроса (не ответа). Кеш включает исходное сообщение пользователя, первый блок мышления, блок использования инструмента и результат инструмента.

    Запрос 3:

    User: ["What's the weather in Paris?"],
    Assistant: [thinking_block_1] + [tool_use block 1],
    User: [tool_result_1, cache=True],
    Assistant: [thinking_block_2] + [text block 2],
    User: [Text response, cache=True]

    Для Claude Opus 4.5 и более поздних версий все предыдущие блоки мышления сохраняются по умолчанию. Для более старых моделей, поскольку был включен блок результата, не связанный с инструментом, все предыдущие блоки мышления игнорируются. Этот запрос будет обработан так же, как:

    User: ["What's the weather in Paris?"],
    Assistant: [tool_use block 1],
    User: [tool_result_1, cache=True],
    Assistant: [text block 2],
    User: [Text response, cache=True]

    Ключевые моменты:

    • Это поведение кеширования происходит автоматически, даже без явных маркеров cache_control
    • Это поведение согласуется независимо от использования обычного мышления или перемежающегося мышления

    Максимальное количество токенов и размер контекстного окна с расширенным мышлением

    В более старых моделях Claude (до Claude Sonnet 3.7), если сумма токенов подсказки и max_tokens превышала контекстное окно модели, система автоматически корректировала max_tokens для соответствия лимиту контекста. Это означало, что вы могли установить большое значение max_tokens, и система молча уменьшала бы его по мере необходимости.

    С моделями Claude 3.7 и 4, max_tokens (который включает ваш бюджет мышления при включенном мышлении) применяется как строгий лимит. Система теперь вернет ошибку валидации, если токены подсказки + max_tokens превышает размер контекстного окна.

    Вы можете прочитать наше руководство по контекстным окнам для более глубокого погружения.

    Контекстное окно с расширенным мышлением

    При расчете использования контекстного окна с включенным мышлением необходимо учитывать некоторые моменты:

    • Блоки мышления из предыдущих ходов удаляются и не учитываются в вашем контекстном окне
    • Мышление текущего хода учитывается в вашем лимите max_tokens для этого хода

    Диаграмма ниже демонстрирует специализированное управление токенами при включенном расширенном мышлении:

    Context window diagram with extended thinking

    Эффективное контекстное окно рассчитывается как:

    context window =
      (current input tokens - previous thinking tokens) +
      (thinking tokens + encrypted thinking tokens + text output tokens)

    Мы рекомендуем использовать API подсчета токенов для получения точных подсчетов токенов для вашего конкретного случая использования, особенно при работе с многоходовыми разговорами, которые включают мышление.

    Контекстное окно с расширенным мышлением и использованием инструментов

    При использовании расширенного мышления с использованием инструментов блоки мышления должны быть явно сохранены и возвращены с результатами инструментов.

    Расчет эффективного контекстного окна для расширенного мышления с использованием инструментов становится:

    context window =
      (current input tokens + previous thinking tokens + tool use tokens) +
      (thinking tokens + encrypted thinking tokens + text output tokens)

    Диаграмма ниже иллюстрирует управление токенами для расширенного мышления с использованием инструментов:

    Context window diagram with extended thinking and tool use

    Управление токенами с расширенным мышлением

    Учитывая поведение контекстного окна и max_tokens с расширенным мышлением в моделях Claude 3.7 и 4, вам может потребоваться:

    • Более активно отслеживать и управлять использованием токенов
    • Корректировать значения max_tokens по мере изменения длины подсказки
    • Потенциально использовать конечные точки подсчета токенов более часто
    • Помнить, что предыдущие блоки мышления не накапливаются в вашем контекстном окне

    Это изменение было сделано для обеспечения более предсказуемого и прозрачного поведения, особенно поскольку максимальные лимиты токенов значительно увеличились.

    Шифрование мышления

    Полное содержимое мышления зашифровано и возвращается в поле signature. Это поле используется для проверки того, что блоки мышления были созданы Claude при передаче обратно в API.

    Строго необходимо отправлять обратно блоки мышления только при использовании инструментов с расширенным мышлением. В противном случае вы можете опустить блоки мышления из предыдущих ходов или позволить API удалить их, если вы передадите их обратно.

    Если вы отправляете обратно блоки мышления, мы рекомендуем передавать все обратно так, как вы это получили, для согласованности и избежания потенциальных проблем.

    Вот некоторые важные соображения по шифрованию мышления:

    • При потоковой передаче ответов подпись добавляется через signature_delta внутри события content_block_delta непосредственно перед событием content_block_stop.
    • Значения signature значительно длиннее в моделях Claude 4, чем в предыдущих моделях.
    • Поле signature является непрозрачным полем и не должно интерпретироваться или анализироваться - оно существует исключительно в целях проверки.
    • Значения signature совместимы между платформами (Claude API, Amazon Bedrock и Vertex AI). Значения, созданные на одной платформе, будут совместимы с другой.

    Редактирование мышления

    Иногда внутреннее рассуждение Claude будет отмечено нашими системами безопасности. Когда это происходит, мы шифруем часть или весь блок thinking и возвращаем его вам как блок redacted_thinking. Блоки redacted_thinking расшифровываются при передаче обратно в API, позволяя Claude продолжить свой ответ без потери контекста.

    При создании приложений, ориентированных на пользователей, которые используют расширенное мышление:

    • Помните, что блоки redacted thinking содержат зашифрованный контент, который не является читаемым для человека
    • Рассмотрите возможность предоставления простого объяснения, например: "Часть внутреннего рассуждения Claude была автоматически зашифрована в целях безопасности. Это не влияет на качество ответов."
    • Если вы показываете блоки мышления пользователям, вы можете отфильтровать редактируемые блоки, сохраняя при этом обычные блоки мышления
    • Будьте прозрачны в том, что использование функций расширенного мышления может иногда привести к шифрованию некоторого рассуждения
    • Реализуйте надлежащую обработку ошибок для корректного управления редактируемым мышлением без нарушения вашего пользовательского интерфейса

    Вот пример, показывающий как обычные, так и редактируемые блоки мышления:

    {
      "content": [
        {
          "type": "thinking",
          "thinking": "Let me analyze this step by step...",
          "signature": "WaUjzkypQ2mUEVM36O2TxuC06KN8xyfbJwyem2dw3URve/op91XWHOEBLLqIOMfFG/UvLEczmEsUjavL...."
        },
        {
          "type": "redacted_thinking",
          "data": "EmwKAhgBEgy3va3pzix/LafPsn4aDFIT2Xlxh0L5L8rLVyIwxtE3rAFBa8cr3qpPkNRj2YfWXGmKDxH4mPnZ5sQ7vB9URj2pLmN3kF8/dW5hR7xJ0aP1oLs9yTcMnKVf2wRpEGjH9XZaBt4UvDcPrQ..."
        },
        {
          "type": "text",
          "text": "Based on my analysis..."
        }
      ]
    }

    Появление редактируемых блоков мышления в вашем выводе — это ожидаемое поведение. Модель все еще может использовать это редактируемое рассуждение для информирования своих ответов, сохраняя при этом защиту безопасности.

    Если вам нужно протестировать обработку редактируемого мышления в вашем приложении, вы можете использовать эту специальную тестовую строку в качестве подсказки: ANTHROPIC_MAGIC_STRING_TRIGGER_REDACTED_THINKING_46C9A13E193C177646C7398A98432ECCCE4C1253D5E2D82641AC0E52CC2876CB

    При передаче блоков thinking и redacted_thinking обратно в API в многоходовом разговоре вы должны включить полный неизменённый блок обратно в API для последнего хода ассистента. Это критически важно для сохранения потока рассуждений модели. Мы рекомендуем всегда передавать все блоки мышления в API. Для получения дополнительной информации см. раздел Сохранение блоков мышления выше.

    Различия в мышлении между версиями моделей

    Messages API обрабатывает мышление по-разному в моделях Claude Sonnet 3.7 и Claude 4, в основном в поведении редактирования и суммирования.

    См. таблицу ниже для сокращённого сравнения:

    ФункцияClaude Sonnet 3.7Claude 4 Models (pre-Opus 4.5)Claude Opus 4.5 и позже
    Вывод мышленияВозвращает полный вывод мышленияВозвращает суммированное мышлениеВозвращает суммированное мышление
    Чередующееся мышлениеНе поддерживаетсяПоддерживается с заголовком бета-версии interleaved-thinking-2025-05-14Поддерживается с заголовком бета-версии interleaved-thinking-2025-05-14
    Сохранение блока мышленияНе сохраняется между ходамиНе сохраняется между ходамиСохраняется по умолчанию (включает оптимизацию кэша, экономию токенов)

    Сохранение блока мышления в Claude Opus 4.5

    Claude Opus 4.5 вводит новое поведение по умолчанию: блоки мышления из предыдущих ходов ассистента сохраняются в контексте модели по умолчанию. Это отличается от более ранних моделей, которые удаляют блоки мышления из предыдущих ходов.

    Преимущества сохранения блока мышления:

    • Оптимизация кэша: При использовании инструментов сохранённые блоки мышления позволяют попадать в кэш, так как они передаются обратно с результатами инструментов и кэшируются постепенно на протяжении хода ассистента, что приводит к экономии токенов в многошаговых рабочих процессах
    • Без влияния на интеллект: Сохранение блоков мышления не оказывает отрицательного влияния на производительность модели

    Важные соображения:

    • Использование контекста: Длинные разговоры будут потреблять больше пространства контекста, так как блоки мышления сохраняются в контексте
    • Автоматическое поведение: Это поведение по умолчанию для Claude Opus 4.5 — не требуются изменения кода или заголовки бета-версии
    • Обратная совместимость: Чтобы использовать эту функцию, продолжайте передавать полные неизменённые блоки мышления обратно в API, как вы делали бы для использования инструментов

    Для более ранних моделей (Claude Sonnet 4.5, Opus 4.1 и т. д.) блоки мышления из предыдущих ходов продолжают удаляться из контекста. Существующее поведение, описанное в разделе Расширенное мышление с кэшированием подсказок, применяется к этим моделям.

    Цены

    Для получения полной информации о ценах, включая базовые ставки, записи в кэш, попадания в кэш и выходные токены, см. страницу цен.

    Процесс мышления влечёт за собой расходы на:

    • Токены, используемые во время мышления (выходные токены)
    • Блоки мышления из последнего хода ассистента, включённые в последующие запросы (входные токены)
    • Стандартные токены текстового вывода

    Когда расширенное мышление включено, специализированная системная подсказка автоматически включается для поддержки этой функции.

    При использовании суммированного мышления:

    • Входные токены: Токены в вашем исходном запросе (исключает токены мышления из предыдущих ходов)
    • Выходные токены (выставлены счётом): Исходные токены мышления, которые Claude сгенерировал внутри
    • Выходные токены (видимые): Суммированные токены мышления, которые вы видите в ответе
    • Без платежа: Токены, используемые для создания резюме

    Количество выходных токенов, выставленных счётом, не будет совпадать с видимым количеством токенов в ответе. Вам выставляется счёт за полный процесс мышления, а не за резюме, которое вы видите.

    Лучшие практики и соображения для расширенного мышления

    Работа с бюджетами мышления

    • Оптимизация бюджета: Минимальный бюджет составляет 1024 токена. Мы рекомендуем начать с минимума и постепенно увеличивать бюджет мышления, чтобы найти оптимальный диапазон для вашего варианта использования. Более высокие количества токенов позволяют более комплексное рассуждение, но с убывающей отдачей в зависимости от задачи. Увеличение бюджета может улучшить качество ответа в обмен на увеличенную задержку. Для критических задач протестируйте различные параметры, чтобы найти оптимальный баланс. Обратите внимание, что бюджет мышления является целевым показателем, а не строгим ограничением — фактическое использование токенов может варьироваться в зависимости от задачи.
    • Начальные точки: Начните с больших бюджетов мышления (16k+ токенов) для сложных задач и отрегулируйте в зависимости от ваших потребностей.
    • Большие бюджеты: Для бюджетов мышления выше 32k мы рекомендуем использовать пакетную обработку во избежание проблем с сетью. Запросы, которые заставляют модель думать выше 32k токенов, вызывают долгоживущие запросы, которые могут столкнуться с истечением времени ожидания системы и ограничениями открытых соединений.
    • Отслеживание использования токенов: Отслеживайте использование токенов мышления для оптимизации затрат и производительности.

    Соображения производительности

    • Время ответа: Будьте готовы к потенциально более длительному времени ответа из-за дополнительной обработки, необходимой для процесса рассуждения. Учитывайте, что создание блоков мышления может увеличить общее время ответа.
    • Требования потоковой передачи: Потоковая передача требуется, когда max_tokens больше 21 333. При потоковой передаче будьте готовы обрабатывать как блоки мышления, так и текстовые блоки контента по мере их поступления.

    Совместимость функций

    • Мышление несовместимо с модификациями temperature или top_k, а также с принудительным использованием инструментов.
    • Когда мышление включено, вы можете установить top_p на значения между 1 и 0,95.
    • Вы не можете предварительно заполнить ответы, когда мышление включено.
    • Изменения в бюджете мышления делают недействительными кэшированные префиксы подсказок, которые включают сообщения. Однако кэшированные системные подсказки и определения инструментов продолжат работать при изменении параметров мышления.

    Рекомендации по использованию

    • Выбор задачи: Используйте расширенное мышление для особенно сложных задач, которые выигрывают от пошагового рассуждения, таких как математика, кодирование и анализ.
    • Обработка контекста: Вам не нужно самостоятельно удалять предыдущие блоки мышления. API Claude автоматически игнорирует блоки мышления из предыдущих ходов, и они не включаются при расчёте использования контекста.
    • Инженерия подсказок: Ознакомьтесь с нашими советами по инженерии подсказок расширенного мышления, если вы хотите максимизировать возможности мышления Claude.

    Следующие шаги

    Попробуйте кулинарную книгу расширенного мышления
    curl https://api.anthropic.com/v1/messages \
         --header "x-api-key: $ANTHROPIC_API_KEY" \
         --header "anthropic-version: 2023-06-01" \
         --header "content-type: application/json" \
         --data \
    '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 16000,
        "thinking": {
            "type": "enabled",
            "budget_tokens": 10000
        },
        "messages": [
            {
                "role": "user",
                "content": "Are there an infinite number of prime numbers such that n mod 4 == 3?"
            }
        ]
    }'
    curl https://api.anthropic.com/v1/messages \
         --header "x-api-key: $ANTHROPIC_API_KEY" \
         --header "anthropic-version: 2023-06-01" \
         --header "content-type: application/json" \
         --data \
    '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 16000,
        "stream": true,
        "thinking": {
            "type": "enabled",
            "budget_tokens": 10000
        },
        "messages": [
            {
                "role": "user",
                "content": "What is 27 * 453?"
            }
        ]
    }'

    Изучите практические примеры мышления в нашей кулинарной книге.

    Советы по инженерии подсказок расширенного мышления

    Изучите лучшие практики инженерии подсказок для расширенного мышления.