Модели и цены

Что нового в Claude 4.6

Обзор новых функций и возможностей в Claude Opus 4.6.

Claude 4.6 представляет собой следующее поколение моделей Claude, обеспечивающее значительные новые возможности и улучшения API. На этой странице приведены все новые функции, доступные при запуске.

Новые модели

Модель	API model ID	Описание
Claude Opus 4.6	`claude-opus-4-6`	Наша самая интеллектуальная модель для создания агентов и кодирования

Claude Opus 4.6 поддерживает контекстное окно объемом 200K (с контекстным окном 1M токенов, доступным в бета-версии), максимум 128K выходных токенов, расширенное мышление и все существующие функции Claude API.

Полную информацию о ценах и спецификациях см. в обзоре моделей.

Новые функции

Режим адаптивного мышления

Адаптивное мышление (thinking: {type: "adaptive"}) — это рекомендуемый режим мышления для Opus 4.6. Claude динамически решает, когда и сколько думать. На уровне усилий по умолчанию (high), Claude почти всегда будет думать. На более низких уровнях усилий он может пропустить мышление для более простых задач.

thinking: {type: "enabled"} и budget_tokens устарели на Opus 4.6. Они остаются функциональными, но будут удалены в будущем выпуске модели. Используйте адаптивное мышление и параметр усилий для управления глубиной мышления. Адаптивное мышление также автоматически включает чередующееся мышление.

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[{"role": "user", "content": "Solve this complex problem..."}]
)

Параметр усилий GA

Параметр усилий теперь общедоступен (заголовок бета-версии не требуется). Новый уровень усилий max обеспечивает абсолютно наивысшую производительность на Opus 4.6. Комбинируйте усилия с адаптивным мышлением для оптимального соотношения затрат и качества.

Compaction API (бета)

Compaction обеспечивает автоматическое суммирование контекста на стороне сервера, позволяя эффективно бесконечные разговоры. Когда контекст приближается к пределу окна, API автоматически суммирует более ранние части разговора.

Потоковая передача инструментов с точной настройкой (GA)

Потоковая передача инструментов с точной настройкой теперь общедоступна на всех моделях и платформах. Заголовок бета-версии не требуется.

128K выходных токенов

Opus 4.6 поддерживает до 128K выходных токенов, удвоив предыдущий лимит 64K. Это позволяет увеличить бюджеты мышления и получить более полные ответы. SDK требуют потоковой передачи для запросов с большими значениями max_tokens, чтобы избежать тайм-аутов HTTP. Если вам не нужно обрабатывать события пошагово, используйте .stream() с .get_final_message() для получения полного ответа — см. Потоковая передача сообщений для получения подробной информации.

Элементы управления местоположением данных

Элементы управления местоположением данных позволяют указать, где выполняется вывод модели, используя параметр inference_geo. Вы можете выбрать маршрутизацию "global" (по умолчанию) или "us" для каждого запроса. Вывод только для США оценивается в 1,1x на Claude Opus 4.6 и более новых моделях.

Устаревшие функции

`type: "enabled"` и `budget_tokens`

thinking: {type: "enabled", budget_tokens: N} устарел на Opus 4.6. Он остается функциональным, но будет удален в будущем выпуске модели. Перейдите на thinking: {type: "adaptive"} с параметром усилий.

Заголовок бета-версии `interleaved-thinking-2025-05-14`

Заголовок бета-версии interleaved-thinking-2025-05-14 устарел на Opus 4.6. Он безопасно игнорируется при включении, но больше не требуется. Адаптивное мышление автоматически включает чередующееся мышление. Удалите betas=["interleaved-thinking-2025-05-14"] из ваших запросов при использовании Opus 4.6.

`output_format`

Параметр output_format для структурированных выходов был перемещен в output_config.format. Старый параметр остается функциональным, но устарел и будет удален в будущем выпуске модели.

# Before
response = client.messages.create(
    output_format={"type": "json_schema", "schema": {...}},
    ...
)

# After
response = client.messages.create(
    output_config={"format": {"type": "json_schema", "schema": {...}}},
    ...
)

Критические изменения

Удаление предварительного заполнения

Предварительное заполнение сообщений помощника (предварительное заполнение последнего хода помощника) не поддерживается на Opus 4.6. Запросы с предварительно заполненными сообщениями помощника возвращают ошибку 400.

Альтернативы:

Структурированные выходы для управления форматом ответа
Инструкции системного приглашения для руководства стилем ответа
output_config.format для вывода JSON

Кавычки параметров инструмента

Opus 4.6 может создавать немного другое экранирование строк JSON в аргументах вызова инструмента (например, различное обращение с экранированием Unicode или экранированием косой черты). Стандартные парсеры JSON автоматически обрабатывают эти различия. Если вы анализируете input вызова инструмента как необработанную строку вместо использования json.loads() или JSON.parse(), проверьте, что ваша логика анализа все еще работает.

Руководство по миграции

Пошаговые инструкции по миграции см. в разделе Миграция на Claude 4.6.

Следующие шаги

Адаптивное мышление

Узнайте, как использовать режим адаптивного мышления.

Обзор моделей

Сравните все модели Claude.

Compaction

Изучите сжатие контекста на стороне сервера.

Руководство по миграции

Пошаговые инструкции по миграции.

Was this page helpful?

Модели и цены

Что нового в Claude 4.6

Обзор новых функций и возможностей в Claude Opus 4.6.

Новые модели

Модель	API model ID	Описание
Claude Opus 4.6	`claude-opus-4-6`	Наша самая интеллектуальная модель для создания агентов и кодирования

Полную информацию о ценах и спецификациях см. в обзоре моделей.

Новые функции

Режим адаптивного мышления

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[{"role": "user", "content": "Solve this complex problem..."}]
)

Параметр усилий GA

Compaction API (бета)

Потоковая передача инструментов с точной настройкой (GA)

128K выходных токенов

Элементы управления местоположением данных

Устаревшие функции

`type: "enabled"` и `budget_tokens`

Заголовок бета-версии `interleaved-thinking-2025-05-14`

`output_format`

# Before
response = client.messages.create(
    output_format={"type": "json_schema", "schema": {...}},
    ...
)

# After
response = client.messages.create(
    output_config={"format": {"type": "json_schema", "schema": {...}}},
    ...
)

Критические изменения

Удаление предварительного заполнения

Альтернативы:

Структурированные выходы для управления форматом ответа
Инструкции системного приглашения для руководства стилем ответа
output_config.format для вывода JSON

Кавычки параметров инструмента

Руководство по миграции

Пошаговые инструкции по миграции см. в разделе Миграция на Claude 4.6.

Следующие шаги

Адаптивное мышление

Узнайте, как использовать режим адаптивного мышления.

Обзор моделей

Сравните все модели Claude.

Compaction

Изучите сжатие контекста на стороне сервера.

Руководство по миграции

Пошаговые инструкции по миграции.

Was this page helpful?

Новые модели

Новые функции

Режим адаптивного мышления

Параметр усилий GA

Compaction API (бета)

Потоковая передача инструментов с точной настройкой (GA)

128K выходных токенов

Элементы управления местоположением данных

Устаревшие функции

type: "enabled" и budget_tokens

Заголовок бета-версии interleaved-thinking-2025-05-14

output_format

Критические изменения

Удаление предварительного заполнения

Кавычки параметров инструмента

Руководство по миграции

Следующие шаги

Новые модели

Новые функции

Режим адаптивного мышления

Параметр усилий GA

Compaction API (бета)

Потоковая передача инструментов с точной настройкой (GA)

128K выходных токенов

Элементы управления местоположением данных

Устаревшие функции

type: "enabled" и budget_tokens

Заголовок бета-версии interleaved-thinking-2025-05-14

output_format

Критические изменения

Удаление предварительного заполнения

Кавычки параметров инструмента

Руководство по миграции

Следующие шаги

`type: "enabled"` и `budget_tokens`

Заголовок бета-версии `interleaved-thinking-2025-05-14`

`output_format`

`type: "enabled"` и `budget_tokens`

Заголовок бета-версии `interleaved-thinking-2025-05-14`

`output_format`