Модели и ценыМодели

Что нового в Claude Opus 4.8

Обзор новых функций и изменений в поведении Claude Opus 4.8.

Claude Opus 4.8 — самая мощная модель уровня Opus от Anthropic. Она развивает возможности Claude Opus 4.7. На этой странице собрано всё новое на момент запуска, включая быстрый режим (исследовательская предварительная версия в Claude API) и сниженную до 1 024 токенов минимальную длину кэшируемой подсказки.

Новая модель

Модель	Идентификатор модели в API	Описание
Claude Opus 4.8	claude-opus-4-8	Самая мощная модель уровня Opus от Anthropic для сложных рассуждений, долгосрочного агентного программирования и работы с высокой степенью автономности

Claude Opus 4.8 поддерживает контекстное окно в 1 млн токенов по умолчанию в Claude API, Amazon Bedrock и Vertex AI (200 тыс. в Microsoft Foundry), максимум 128 тыс. выходных токенов, адаптивное мышление, а также тот же набор инструментов и функций платформы, что и Claude Opus 4.7.

Полную информацию о ценах и характеристиках см. в обзоре моделей.

Новые функции

Системные сообщения в середине разговора

Claude Opus 4.8 принимает сообщения с role: "system" сразу после хода пользователя в массиве messages (с учётом правил размещения). Это позволяет добавлять обновлённые инструкции на более поздних этапах длительного разговора без повторения полной системной подсказки, что сохраняет попадания в кэш подсказок для предыдущих ходов и снижает стоимость входных данных в агентных циклах. Бета-заголовок не требуется. Подробности использования см. в разделе Системные сообщения в середине разговора.

Детали остановки при отказе

Объект stop_details в ответах с отказом (доступный начиная с Claude Opus 4.7) теперь публично задокументирован. Когда Claude отказывается выполнить запрос, этот объект описывает категорию отказа в дополнение к существующей причине остановки refusal, что упрощает для вашего приложения различение разных классов отклонённых запросов и направление пользователя к правильному следующему шагу. Бета-заголовок не требуется. Список категорий и рекомендации по обработке см. в разделе Обработка причин остановки.

Значения effort по умолчанию

Значение по умолчанию для параметра effort в Claude Opus 4.8 — high на всех платформах, включая Claude API и Claude Code. Если вы уже задаёте effort явно, ваша настройка не изменится. Рекомендации по каждому уровню см. в разделе Effort.

Быстрый режим

Быстрый режим теперь доступен для Claude Opus 4.8 в виде исследовательской предварительной версии в Claude API. Установите speed: "fast", чтобы получить до 2,5 раз больше выходных токенов в секунду от той же модели по премиальной цене. Информацию о доступе, поддерживаемых моделях и ценах см. в разделе Быстрый режим.

Сниженный минимум для кэширования подсказок

Минимальная длина кэшируемой подсказки в Claude Opus 4.8 составляет 1 024 токена — меньше, чем в Claude Opus 4.7. Подсказки, которые были слишком короткими для кэширования в Claude Opus 4.7, теперь могут создавать записи в кэше без изменений в коде. Минимальные значения для каждой модели см. в разделе Кэширование подсказок.

Ограничения API, унаследованные от Claude Opus 4.7

Эти ограничения не изменились по сравнению с Claude Opus 4.7, поэтому код, который уже работает с Claude Opus 4.7, не требует изменений. Они применяются только к Messages API; Claude Managed Agents не затрагиваются.

Параметры сэмплирования не поддерживаются

Установка temperature, top_p или top_k в значение, отличное от значения по умолчанию, возвращает ошибку 400 в Claude Opus 4.8, как и в Claude Opus 4.7. Опустите эти параметры и используйте подсказки для управления поведением модели.

Адаптивное мышление — единственный режим мышления

Как и Claude Opus 4.7, Claude Opus 4.8 не поддерживает бюджеты расширенного мышления. Установка thinking: {"type": "enabled", "budget_tokens": N} возвращает ошибку 400. Используйте адаптивное мышление и параметр effort для управления глубиной мышления.

Python

# До (Opus 4.6 или более ранние версии)
thinking = {"type": "enabled", "budget_tokens": 32000}

# После (Opus 4.7 и более поздние версии)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}

Улучшения возможностей

Области улучшений

По сравнению с Claude Opus 4.7, Claude Opus 4.8 нацелена на поведенческие улучшения в следующих областях:

Долгосрочное агентное программирование, включая улучшенную работу с длинным контекстом, меньшее количество уплотнений и лучшее восстановление после уплотнения.
Калибровка усилий при рассуждении, с более надёжным поведением на каждом уровне effort в различных предметных областях.
Запуск инструментов, с меньшим числом случаев пропуска вызова инструмента, который требовался для задачи.

Адаптивное мышление

При включённом адаптивном мышлении Claude Opus 4.8 запускает рассуждение только тогда, когда считает, что данный ход этого требует. При простых запросах на поиск и коротких агентных шагах модель отвечает напрямую; при сложных многошаговых задачах она рассуждает перед ответом. Это сокращает количество напрасно потраченных токенов мышления при бимодальных нагрузках по сравнению с Claude Opus 4.7 на том же уровне effort. Как и в Claude Opus 4.7, мышление отключено, если вы явно не установите thinking: {type: "adaptive"} в своём запросе.

Изменения в поведении

Это не критические изменения API, но они могут потребовать обновления подсказок. Полные рекомендации см. в разделе Миграция на Claude Opus 4.8.

Меньше напрасно потраченных токенов мышления на том же уровне effort при включённом адаптивном мышлении, поскольку модель решает на каждом ходу, нужно ли ей думать.
Улучшенный запуск инструментов. Модель реже пропускает вызов инструмента, который требовался для задачи, — проблема, о которой сообщали некоторые пользователи Claude Opus 4.7.
Улучшенная обработка уплотнения и качество работы с длинным контекстом. Длинные агентные трассы остаются в рамках задачи с меньшим числом отклонений после уплотнения.

Руководство по миграции

Пошаговые инструкции по миграции и полный контрольный список миграции см. в разделе Миграция на Claude Opus 4.8. Если вы используете Claude Code или Agent SDK, навык Claude API может автоматически применить эти шаги миграции к вашей кодовой базе.

Дальнейшие шаги

Руководство по миграции

Пошаговые инструкции по обновлению с Claude Opus 4.7.

Effort

Рекомендации по каждому уровню effort, включая новые значения по умолчанию.

Адаптивное мышление

Единственный поддерживаемый режим включённого мышления в Claude Opus 4.8.

Кэширование подсказок

Как системные сообщения в середине разговора сохраняют попадания в кэш.

Обработка причин остановки

Детали остановки при отказе и способы их обработки.

Быстрый режим

Более высокая скорость вывода по премиальной цене.

Was this page helpful?

Модели и ценыМодели

Что нового в Claude Opus 4.8

Обзор новых функций и изменений в поведении Claude Opus 4.8.

Новая модель

Модель	Идентификатор модели в API	Описание
Claude Opus 4.8	claude-opus-4-8	Самая мощная модель уровня Opus от Anthropic для сложных рассуждений, долгосрочного агентного программирования и работы с высокой степенью автономности

Полную информацию о ценах и характеристиках см. в обзоре моделей.

Новые функции

Системные сообщения в середине разговора

Детали остановки при отказе

Значения effort по умолчанию

Быстрый режим

Сниженный минимум для кэширования подсказок

Ограничения API, унаследованные от Claude Opus 4.7

Параметры сэмплирования не поддерживаются

Адаптивное мышление — единственный режим мышления

Python

# До (Opus 4.6 или более ранние версии)
thinking = {"type": "enabled", "budget_tokens": 32000}

# После (Opus 4.7 и более поздние версии)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}

Улучшения возможностей

Области улучшений

По сравнению с Claude Opus 4.7, Claude Opus 4.8 нацелена на поведенческие улучшения в следующих областях:

Долгосрочное агентное программирование, включая улучшенную работу с длинным контекстом, меньшее количество уплотнений и лучшее восстановление после уплотнения.
Калибровка усилий при рассуждении, с более надёжным поведением на каждом уровне effort в различных предметных областях.
Запуск инструментов, с меньшим числом случаев пропуска вызова инструмента, который требовался для задачи.

Адаптивное мышление

Изменения в поведении

Меньше напрасно потраченных токенов мышления на том же уровне effort при включённом адаптивном мышлении, поскольку модель решает на каждом ходу, нужно ли ей думать.
Улучшенный запуск инструментов. Модель реже пропускает вызов инструмента, который требовался для задачи, — проблема, о которой сообщали некоторые пользователи Claude Opus 4.7.
Улучшенная обработка уплотнения и качество работы с длинным контекстом. Длинные агентные трассы остаются в рамках задачи с меньшим числом отклонений после уплотнения.

Руководство по миграции

Дальнейшие шаги

Руководство по миграции

Пошаговые инструкции по обновлению с Claude Opus 4.7.

Effort

Рекомендации по каждому уровню effort, включая новые значения по умолчанию.

Адаптивное мышление

Единственный поддерживаемый режим включённого мышления в Claude Opus 4.8.

Кэширование подсказок

Как системные сообщения в середине разговора сохраняют попадания в кэш.

Обработка причин остановки

Детали остановки при отказе и способы их обработки.

Быстрый режим

Более высокая скорость вывода по премиальной цене.

Was this page helpful?

Новая модель

Новые функции

Системные сообщения в середине разговора

Детали остановки при отказе

Значения effort по умолчанию

Быстрый режим

Сниженный минимум для кэширования подсказок

Ограничения API, унаследованные от Claude Opus 4.7

Параметры сэмплирования не поддерживаются

Адаптивное мышление — единственный режим мышления

Улучшения возможностей

Области улучшений

Адаптивное мышление

Изменения в поведении

Руководство по миграции

Дальнейшие шаги

Новая модель

Новые функции

Системные сообщения в середине разговора

Детали остановки при отказе

Значения effort по умолчанию

Быстрый режим

Сниженный минимум для кэширования подсказок

Ограничения API, унаследованные от Claude Opus 4.7

Параметры сэмплирования не поддерживаются

Адаптивное мышление — единственный режим мышления

Улучшения возможностей

Области улучшений

Адаптивное мышление

Изменения в поведении

Руководство по миграции

Дальнейшие шаги

Новая модель

Новые функции

Системные сообщения в середине разговора

Детали остановки при отказе

Значения effort по умолчанию

Быстрый режим

Сниженный минимум для кэширования подсказок

Ограничения API, унаследованные от Claude Opus 4.7

Параметры сэмплирования не поддерживаются

Адаптивное мышление — единственный режим мышления

Улучшения возможностей

Области улучшений

Адаптивное мышление

Изменения в поведении

Руководство по миграции

Дальнейшие шаги

Новая модель

Новые функции

Системные сообщения в середине разговора

Детали остановки при отказе

Значения effort по умолчанию

Быстрый режим

Сниженный минимум для кэширования подсказок

Ограничения API, унаследованные от Claude Opus 4.7

Параметры сэмплирования не поддерживаются

Адаптивное мышление — единственный режим мышления

Улучшения возможностей

Области улучшений

Адаптивное мышление

Изменения в поведении

Руководство по миграции

Дальнейшие шаги