Создание с расширенным мышлением

{
  "content": [
    {
      "type": "thinking",
      "thinking": "Let me analyze this step by step...",
      "signature": "WaUjzkypQ2mUEVM36O2TxuC06KN8xyfbJwyem2dw3URve/op91XWHOEBLLqIOMfFG/UvLEczmEsUjavL...."
    },
    {
      "type": "text",
      "text": "Based on my analysis..."
    }
  ]
}

curl https://api.anthropic.com/v1/messages \
     --header "x-api-key: $ANTHROPIC_API_KEY" \
     --header "anthropic-version: 2023-06-01" \
     --header "content-type: application/json" \
     --data \
'{
    "model": "claude-sonnet-4-6",
    "max_tokens": 16000,
    "thinking": {
        "type": "enabled",
        "budget_tokens": 10000
    },
    "messages": [
        {
            "role": "user",
            "content": "Are there an infinite number of prime numbers such that n mod 4 == 3?"
        }
    ]
}'

curl https://api.anthropic.com/v1/messages \
     --header "x-api-key: $ANTHROPIC_API_KEY" \
     --header "anthropic-version: 2023-06-01" \
     --header "content-type: application/json" \
     --data \
'{
    "model": "claude-sonnet-4-6",
    "max_tokens": 16000,
    "stream": true,
    "thinking": {
        "type": "enabled",
        "budget_tokens": 10000
    },
    "messages": [
        {
            "role": "user",
            "content": "What is the greatest common divisor of 1071 and 462?"
        }
    ]
}'

event: message_start
data: {"type": "message_start", "message": {"id": "msg_01...", "type": "message", "role": "assistant", "content": [], "model": "claude-sonnet-4-6", "stop_reason": null, "stop_sequence": null}}

event: content_block_start
data: {"type": "content_block_start", "index": 0, "content_block": {"type": "thinking", "thinking": ""}}

event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "thinking_delta", "thinking": "I need to find the GCD of 1071 and 462 using the Euclidean algorithm.\n\n1071 = 2 × 462 + 147"}}

event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "thinking_delta", "thinking": "\n462 = 3 × 147 + 21\n147 = 7 × 21 + 0\n\nSo GCD(1071, 462) = 21"}}

// Additional thinking deltas...

event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "signature_delta", "signature": "EqQBCgIYAhIM1gbcDa9GJwZA2b3hGgxBdjrkzLoky3dl1pkiMOYds..."}}

event: content_block_stop
data: {"type": "content_block_stop", "index": 0}

event: content_block_start
data: {"type": "content_block_start", "index": 1, "content_block": {"type": "text", "text": ""}}

event: content_block_delta
data: {"type": "content_block_delta", "index": 1, "delta": {"type": "text_delta", "text": "The greatest common divisor of 1071 and 462 is **21**."}}

// Additional text deltas...

event: content_block_stop
data: {"type": "content_block_stop", "index": 1}

event: message_delta
data: {"type": "message_delta", "delta": {"stop_reason": "end_turn", "stop_sequence": null}}

event: message_stop
data: {"type": "message_stop"}

User: "What's the weather?"
Assistant: [tool_use] (thinking disabled)
User: [tool_result]
Assistant: [text: "It's sunny"]
User: "What about tomorrow?"
Assistant: [thinking] + [text: "..."] (thinking enabled - new turn)

User: ["What's the weather in Paris?"],
Assistant: [thinking_block_1] + [tool_use block 1],
User: [tool_result_1, cache=True],
Assistant: [thinking_block_2] + [text block 2],
User: [Text response, cache=True]

Функция	Claude Sonnet 3.7	Claude 4 Models (pre-Opus 4.5)	Claude Opus 4.5	Claude Sonnet 4.6	Claude Opus 4.6 (адаптивное мышление)
Вывод мышления	Возвращает полный вывод мышления	Возвращает суммированное мышление	Возвращает суммированное мышление	Возвращает суммированное мышление	Возвращает суммированное мышление
Чередующееся мышление	Не поддерживается	Поддерживается с заголовком бета `interleaved-thinking-2025-05-14`	Поддерживается с заголовком бета `interleaved-thinking-2025-05-14`	Поддерживается с заголовком бета `interleaved-thinking-2025-05-14` или автоматически с адаптивным мышлением	Автоматически с адаптивным мышлением (заголовок бета не поддерживается)
Сохранение блока мышления	Не сохраняется между ходами	Не сохраняется между ходами	Сохраняется по умолчанию	Сохраняется по умолчанию	Сохраняется по умолчанию

Оптимизация бюджета: Минимальный бюджет составляет 1024 токена. Мы предлагаем начать с минимума и постепенно увеличивать бюджет мышления, чтобы найти оптимальный диапазон для вашего случая использования. Более высокие количества токенов позволяют более комплексное рассуждение, но с убывающей отдачей в зависимости от задачи. Увеличение бюджета может улучшить качество ответа за счет увеличения задержки. Для критических задач протестируйте различные настройки, чтобы найти оптимальный баланс. Обратите внимание, что бюджет мышления является целевым, а не строгим лимитом — фактическое использование токенов может варьироваться в зависимости от задачи.
Начальные точки: Начните с больших бюджетов мышления (16k+ токенов) для сложных задач и корректируйте в зависимости от ваших потребностей.
Большие бюджеты: Для бюджетов мышления выше 32k мы рекомендуем использовать пакетную обработку для избежания проблем с сетью. Запросы, которые заставляют модель думать выше 32k токенов, вызывают долгоживущие запросы, которые могут столкнуться с тайм-аутами системы и лимитами открытых соединений.
Отслеживание использования токенов: Отслеживайте использование токенов мышления для оптимизации затрат и производительности.

Создание с расширенным мышлением

Поддерживаемые модели

Создание с расширенным мышлением

Поддерживаемые модели

Как работает расширенное мышление

Как использовать расширенное мышление

Суммированное мышление

Потоковое мышление

Расширенное мышление с использованием инструментов

Переключение режимов мышления в разговорах

Плавная деградация мышления

Практическое руководство

Сохранение блоков мышления

Чередующееся мышление

Расширенное мышление с кэшированием подсказок

Понимание поведения кеширования блоков мышления

Максимальное количество токенов и размер контекстного окна с расширенным мышлением

Контекстное окно с расширенным мышлением

Контекстное окно с расширенным мышлением и использованием инструментов

Управление токенами с расширенным мышлением

Шифрование мышления

Различия в мышлении между версиями моделей

Сохранение блока мышления в Claude Opus 4.5 и более поздних версиях

Цены

Лучшие практики и соображения для расширенного мышления

Работа с бюджетами мышления

Соображения производительности

Совместимость функций

Рекомендации по использованию

Следующие шаги

Поддерживаемые модели

Поддерживаемые модели

Как работает расширенное мышление

Как использовать расширенное мышление

Суммированное мышление

Потоковое мышление

Расширенное мышление с использованием инструментов

Переключение режимов мышления в разговорах

Плавная деградация мышления

Практическое руководство

Пример: Передача блоков мышления с результатами инструментов

Сохранение блоков мышления

Чередующееся мышление

Использование инструментов без чередующегося мышления

Использование инструментов с чередующимся мышлением

Расширенное мышление с кэшированием подсказок

Понимание поведения кеширования блоков мышления

Кеширование системного приглашения (сохраняется при изменении мышления)

Кеширование сообщений (инвалидируется при изменении мышления)

Максимальное количество токенов и размер контекстного окна с расширенным мышлением

Контекстное окно с расширенным мышлением

Контекстное окно с расширенным мышлением и использованием инструментов

Управление токенами с расширенным мышлением

Шифрование мышления

Различия в мышлении между версиями моделей

Сохранение блока мышления в Claude Opus 4.5 и более поздних версиях

Цены

Лучшие практики и соображения для расширенного мышления

Работа с бюджетами мышления

Соображения производительности

Совместимость функций

Рекомендации по использованию

Следующие шаги