Loading...
  • Разработка
  • Администрирование
  • Модели и цены
  • Клиентские SDK
  • Справочник API
Search...
⌘K
Log in
Адаптивное мышление
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Разработка/Возможности модели

Адаптивное мышление

Позвольте Claude динамически определять, когда и в какой степени использовать расширенное мышление с режимом адаптивного мышления.

Was this page helpful?

  • Поддерживаемые модели
  • Как работает адаптивное мышление
  • Как использовать адаптивное мышление
  • Адаптивное мышление с параметром усилия
  • Потоковая передача с адаптивным мышлением
  • Адаптивное против ручного против отключенного мышления
  • Важные соображения
  • Изменения валидации
  • Кэширование подсказок
  • Настройка поведения мышления
  • Контроль затрат
  • Работа с блоками мышления
  • Суммированное мышление
  • Управление отображением мышления
  • Шифрование мышления
  • Цены
  • Дополнительные темы
  • Следующие шаги

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

Адаптивное мышление — это рекомендуемый способ использования расширенного мышления с Claude Opus 4.7, Claude Opus 4.6 и Claude Sonnet 4.6, и это режим по умолчанию на Claude Mythos Preview (где он автоматически применяется, когда thinking не установлен). Вместо того чтобы вручную устанавливать бюджет токенов мышления, адаптивное мышление позволяет Claude динамически определять, когда и в какой степени использовать расширенное мышление на основе сложности каждого запроса. На Claude Opus 4.7 адаптивное мышление — это единственный поддерживаемый режим мышления; ручное thinking: {type: "enabled", budget_tokens: N} больше не принимается.

Адаптивное мышление может обеспечить лучшую производительность, чем расширенное мышление с фиксированным budget_tokens для многих рабочих нагрузок, особенно для бимодальных задач и долгосрочных агентских рабочих процессов. Заголовок бета-версии не требуется.

Если ваша рабочая нагрузка требует предсказуемой задержки или точного контроля над затратами на мышление, расширенное мышление с budget_tokens по-прежнему функционально на Claude Opus 4.6 и Claude Sonnet 4.6, но является устаревшим и больше не рекомендуется. См. предупреждение ниже.

Поддерживаемые модели

Адаптивное мышление поддерживается на следующих моделях:

  • Claude Mythos Preview (claude-mythos-preview), адаптивное мышление является режимом по умолчанию; thinking: {type: "disabled"} не поддерживается
  • Claude Opus 4.7 (claude-opus-4-7), адаптивное мышление — единственный поддерживаемый режим мышления. Мышление отключено, если вы явно не установите thinking: {type: "adaptive"} в вашем запросе; ручное thinking: {type: "enabled"} отклоняется с ошибкой 400.
  • Claude Opus 4.6 (claude-opus-4-6)
  • Claude Sonnet 4.6 (claude-sonnet-4-6)

thinking.type: "enabled" и budget_tokens устарели на Opus 4.6 и Sonnet 4.6 и будут удалены в будущем выпуске модели. Используйте thinking.type: "adaptive" с параметром effort вместо этого. Существующие конфигурации budget_tokens по-прежнему функциональны, но больше не рекомендуются; планируйте миграцию.

Более старые модели (Sonnet 4.5, Opus 4.5 и т. д.) не поддерживают адаптивное мышление и требуют thinking.type: "enabled" с budget_tokens.

Как работает адаптивное мышление

В адаптивном режиме мышление является необязательным для модели. Claude оценивает сложность каждого запроса и определяет, использовать ли расширенное мышление и в какой степени. На уровне усилий по умолчанию (high), Claude почти всегда думает. На более низких уровнях усилий Claude может пропустить мышление для более простых задач.

Адаптивное мышление также автоматически включает чередующееся мышление. Это означает, что Claude может думать между вызовами инструментов, что делает его особенно эффективным для агентских рабочих процессов.

Как использовать адаптивное мышление

Установите thinking.type на "adaptive" в вашем запросе API:

Адаптивное мышление с параметром усилия

Вы можете комбинировать адаптивное мышление с параметром усилия для управления тем, сколько мышления использует Claude. Уровень усилия действует как мягкое руководство для распределения мышления Claude:

Уровень усилияПоведение мышления
maxClaude всегда думает без ограничений на глубину мышления. Доступно на Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6 и Claude Sonnet 4.6.
xhighClaude всегда глубоко думает с расширенным исследованием. Доступно на Claude Opus 4.7.
high (по умолчанию)Claude всегда думает. Обеспечивает глубокое рассуждение по сложным задачам.
mediumClaude использует умеренное мышление. Может пропустить мышление для очень простых запросов.
lowClaude минимизирует мышление. Пропускает мышление для простых задач, где скорость имеет наибольшее значение.

Потоковая передача с адаптивным мышлением

Адаптивное мышление работает безупречно с потоковой передачей. Блоки мышления передаются через события thinking_delta так же, как в режиме ручного мышления:

Адаптивное против ручного против отключенного мышления

РежимКонфигурацияДоступностьКогда использовать
Адаптивноеthinking: {type: "adaptive"}Claude Mythos Preview (по умолчанию), Opus 4.7 (единственный режим), Opus 4.6, Sonnet 4.6Claude определяет, когда и в какой степени использовать расширенное мышление. Используйте effort для руководства.
Ручноеthinking: {type: "enabled", budget_tokens: N}Все модели, кроме Claude Opus 4.7 (отклоняется). Устарело на Opus 4.6 и Sonnet 4.6 (рассмотрите адаптивный режим вместо этого).Когда вам нужен точный контроль над расходом токенов мышления.
ОтключенноеОпустите параметр thinking или передайте {type: "disabled"}Все модели, кроме Claude Mythos PreviewКогда вам не нужно расширенное мышление и вы хотите минимальную задержку.

Адаптивное мышление доступно на Claude Mythos Preview, Claude Opus 4.7, Opus 4.6 и Sonnet 4.6. На Mythos Preview адаптивное мышление является режимом по умолчанию и применяется автоматически, когда thinking не установлен. На Claude Opus 4.7 адаптивное мышление — единственный поддерживаемый режим, и type: "enabled" с budget_tokens отклоняется. Более старые модели поддерживают только type: "enabled" с budget_tokens. На Opus 4.6 и Sonnet 4.6 type: "enabled" с budget_tokens по-прежнему функционален, но устарел.

Доступность чередующегося мышления по режимам:

  • Адаптивный режим: Чередующееся мышление автоматически включено на Claude Mythos Preview, Claude Opus 4.7, Opus 4.6 и Sonnet 4.6. На Mythos Preview и Opus 4.7 межинструментальное рассуждение всегда находится внутри блоков мышления.
  • Ручной режим на Sonnet 4.6: Чередующееся мышление работает через заголовок бета-версии interleaved-thinking-2025-05-14.
  • Ручной режим на Opus 4.6: Чередующееся мышление недоступно. Если ваш агентский рабочий процесс требует мышления между вызовами инструментов на Opus 4.6, используйте адаптивный режим.

Важные соображения

Изменения валидации

При использовании адаптивного мышления предыдущие ходы помощника не должны начинаться с блоков мышления. Это более гибко, чем ручной режим, где API требует, чтобы ходы с включенным мышлением начинались с блока мышления.

Кэширование подсказок

Последовательные запросы с использованием адаптивного мышления сохраняют точки разрыва кэша подсказок. Однако переключение между режимами адаптивного и включенного/отключенного мышления нарушает точки разрыва кэша для сообщений. Системные подсказки и определения инструментов остаются кэшированными независимо от изменений режима.

Настройка поведения мышления

Поведение срабатывания адаптивного мышления можно настраивать через подсказку. Если Claude думает чаще или реже, чем вам хотелось бы, вы можете добавить руководство в вашу системную подсказку:

Extended thinking adds latency and should only be used when it
will meaningfully improve answer quality — typically for problems
that require multi-step reasoning. When in doubt, respond directly.

Направление Claude на менее частое мышление может снизить качество на задачах, которые выигрывают от рассуждения. Измерьте влияние на ваши конкретные рабочие нагрузки перед развертыванием настройки на основе подсказок в производство. Рассмотрите сначала тестирование с более низкими уровнями усилия.

Контроль затрат

Используйте max_tokens как жесткий лимит на общий результат (мышление + текст ответа). Параметр effort обеспечивает дополнительное мягкое руководство по тому, сколько мышления выделяет Claude. Вместе они дают вам эффективный контроль над затратами.

На уровнях усилия high и max Claude может думать более обширно и с большей вероятностью исчерпать бюджет max_tokens. Если вы наблюдаете stop_reason: "max_tokens" в ответах, рассмотрите увеличение max_tokens, чтобы дать модели больше места, или снизьте уровень усилия.

Работа с блоками мышления

Следующие концепции применяются ко всем моделям, поддерживающим расширенное мышление, независимо от того, используете ли вы адаптивный или ручной режим.

Суммированное мышление

With extended thinking enabled, the Messages API for Claude 4 models returns a summary of Claude's full thinking process. Summarized thinking provides the full intelligence benefits of extended thinking, while preventing misuse. This is the default behavior on Claude 4 models when the display field on the thinking configuration is unset or set to "summarized". On Claude Opus 4.7 and Claude Mythos Preview, display defaults to "omitted" instead, so you must set display: "summarized" explicitly to receive summarized thinking.

Here are some important considerations for summarized thinking:

  • You're charged for the full thinking tokens generated by the original request, not the summary tokens.
  • The billed output token count will not match the count of tokens you see in the response.
  • On Claude 4 models, the first few lines of thinking output are more verbose, providing detailed reasoning that's particularly helpful for prompt engineering purposes. Claude Mythos Preview summarizes from the first token, so its thinking blocks do not show this verbose preamble.
  • As Anthropic seeks to improve the extended thinking feature, summarization behavior is subject to change.
  • Summarization preserves the key ideas of Claude's thinking process with minimal added latency, enabling a streamable user experience.
  • Summarization is processed by a different model than the one you target in your requests. The thinking model does not see the summarized output.

In rare cases where you need access to full thinking output for Claude 4 models, contact Anthropic sales.

Управление отображением мышления

The display field on the thinking configuration controls how thinking content is returned in API responses. It accepts two values:

  • "summarized": Thinking blocks contain summarized thinking text. See Summarized thinking for details. This is the default on Claude Opus 4.6, Claude Sonnet 4.6, and earlier Claude 4 models.
  • "omitted": Thinking blocks are returned with an empty thinking field. The signature field still carries the encrypted full thinking for multi-turn continuity (see Thinking encryption). This is the default on Claude Opus 4.7 and Claude Mythos Preview.

Setting display: "omitted" is useful when your application doesn't surface thinking content to users. The primary benefit is faster time-to-first-text-token when streaming: The server skips streaming thinking tokens entirely and delivers only the signature, so the final text response begins streaming sooner.

Here are some important considerations for omitted thinking:

  • You're still charged for the full thinking tokens. Omitting reduces latency, not cost.
  • If you pass thinking blocks back in multi-turn conversations, pass them unchanged. The server decrypts the signature to reconstruct the original thinking for prompt construction (see Preserving thinking blocks). Any text you place in the thinking field of a round-tripped omitted block is ignored.
  • display is invalid with thinking.type: "disabled" (there is nothing to display).
  • When using thinking.type: "adaptive" and the model skips thinking for a simple request, no thinking block is produced regardless of display.

The signature field is identical whether display is "summarized" or "omitted". Switching display values between turns in a conversation is supported.

На Claude Opus 4.7 thinking.display по умолчанию имеет значение "omitted". Блоки мышления по-прежнему появляются в потоке ответов, но их поле thinking пусто, если вы явно не согласитесь. Это молчаливое изменение от Claude Opus 4.6, где значение по умолчанию было "summarized". Чтобы восстановить суммированный текст мышления на Claude Opus 4.7, явно установите thinking.display на "summarized":

thinking = {
    "type": "adaptive",
    "display": "summarized",
}

Для примеров кода и поведения потоковой передачи с display: "omitted", см. Управление отображением мышления на странице расширенного мышления. Примеры там используют type: "enabled"; с адаптивным мышлением используйте:

thinking = {"type": "adaptive", "display": "omitted"}

Шифрование мышления

Full thinking content is encrypted and returned in the signature field. This field is used to verify that thinking blocks were generated by Claude when passed back to the API.

It is only strictly necessary to send back thinking blocks when using tools with extended thinking. Otherwise you can omit thinking blocks from previous turns. If you pass them back, whether the API keeps or strips them depends on the model: Opus 4.5+ and Sonnet 4.6+ keep them in context by default; earlier Opus/Sonnet models and all Haiku models strip them. See context editing to configure this.

If sending back thinking blocks, pass everything back as you received it for consistency and to avoid potential issues.

Here are some important considerations on thinking encryption:

  • When streaming responses, the signature is added via a signature_delta inside a content_block_delta event just before the content_block_stop event.
  • signature values are significantly longer in Claude 4 models than in previous models.
  • The signature field is an opaque field and should not be interpreted or parsed.
  • signature values are compatible across platforms (Claude APIs, Amazon Bedrock, and Vertex AI). Values generated on one platform will be compatible with another.

Цены

For complete pricing information including base rates, cache writes, cache hits, and output tokens, see the pricing page.

The thinking process incurs charges for:

  • Tokens used during thinking (output tokens)
  • Thinking blocks from prior assistant turns kept in context: only the last turn on earlier Opus/Sonnet models and all Haiku models; all turns by default on Opus 4.5+ and Sonnet 4.6+ (input tokens)
  • Standard text output tokens

When extended thinking is enabled, a specialized system prompt is automatically included to support this feature.

When using summarized thinking:

  • Input tokens: Tokens in your original request (excludes thinking tokens from previous turns)
  • Output tokens (billed): The original thinking tokens that Claude generated internally
  • Output tokens (visible): The summarized thinking tokens you see in the response
  • No charge: Tokens used to generate the summary

When using display: "omitted":

  • Input tokens: Tokens in your original request (same as summarized)
  • Output tokens (billed): The original thinking tokens that Claude generated internally (same as summarized)
  • Output tokens (visible): Zero thinking tokens (the thinking field is empty)

The billed output token count will not match the visible token count in the response. You are billed for the full thinking process, not the thinking content visible in the response.

Дополнительные темы

Страница расширенного мышления охватывает несколько тем более подробно с примерами кода, специфичными для режима:

  • Использование инструментов с мышлением: Те же правила применяются для адаптивного мышления: сохраняйте блоки мышления между вызовами инструментов и помните об ограничениях tool_choice при активном мышлении.
  • Кэширование подсказок: С адаптивным мышлением последовательные запросы, использующие один и тот же режим мышления, сохраняют точки разрыва кэша. Переключение между режимами адаптивного и включенного/отключенного мышления нарушает точки разрыва кэша для сообщений (системные подсказки и определения инструментов остаются кэшированными).
  • Контекстные окна: Как токены мышления взаимодействуют с max_tokens и ограничениями размера контекстного окна.

Следующие шаги

Extended thinking
client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[
        {
            "role": "user",
            "content": "Explain why the sum of two even numbers is always even.",
        }
    ],
)

for block in response.content:
    if block.type == "thinking":
        print(f"\nThinking: {block.thinking}")
    elif block.type == "text":
        print(f"\nResponse: {block.text}")
client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},
    messages=[{"role": "user", "content": "What is the capital of France?"}],
)

print(response.content[0].text)
client = anthropic.Anthropic()

with client.messages.stream(
    model="claude-opus-4-7",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[
        {
            "role": "user",
            "content": "What is the greatest common divisor of 1071 and 462?",
        }
    ],
) as stream:
    for event in stream:
        if event.type == "content_block_start":
            print(f"\nStarting {event.content_block.type} block...")
        elif event.type == "content_block_delta":
            if event.delta.type == "thinking_delta":
                print(event.delta.thinking, end="", flush=True)
            elif event.delta.type == "text_delta":
                print(event.delta.text, end="", flush=True)

Узнайте больше о расширенном мышлении, включая ручной режим, использование инструментов и кэширование подсказок.

Effort parameter

Контролируйте, насколько тщательно Claude отвечает, с помощью параметра усилия.