Claude Opus 4.8 — самая мощная модель уровня Opus от Anthropic. Она развивает возможности Claude Opus 4.7. На этой странице собрано всё новое на момент запуска, включая быстрый режим (исследовательская предварительная версия в Claude API) и сниженную до 1 024 токенов минимальную длину кэшируемой подсказки.
| Модель | Идентификатор модели в API | Описание |
|---|---|---|
| Claude Opus 4.8 | claude-opus-4-8 | Самая мощная модель уровня Opus от Anthropic для сложных рассуждений, долгосрочного агентного программирования и работы с высокой степенью автономности |
Claude Opus 4.8 поддерживает контекстное окно в 1 млн токенов по умолчанию в Claude API, Amazon Bedrock и Vertex AI (200 тыс. в Microsoft Foundry), максимум 128 тыс. выходных токенов, адаптивное мышление, а также тот же набор инструментов и функций платформы, что и Claude Opus 4.7.
Полную информацию о ценах и характеристиках см. в обзоре моделей.
Claude Opus 4.8 принимает сообщения с role: "system" сразу после хода пользователя в массиве messages (с учётом правил размещения). Это позволяет добавлять обновлённые инструкции на более поздних этапах длительного разговора без повторения полной системной подсказки, что сохраняет попадания в кэш подсказок для предыдущих ходов и снижает стоимость входных данных в агентных циклах. Бета-заголовок не требуется. Подробности использования см. в разделе Системные сообщения в середине разговора.
Объект stop_details в ответах с отказом (доступный начиная с Claude Opus 4.7) теперь публично задокументирован. Когда Claude отказывается выполнить запрос, этот объект описывает категорию отказа в дополнение к существующей причине остановки refusal, что упрощает для вашего приложения различение разных классов отклонённых запросов и направление пользователя к правильному следующему шагу. Бета-заголовок не требуется. Список категорий и рекомендации по обработке см. в разделе Обработка причин остановки.
Значение по умолчанию для параметра effort в Claude Opus 4.8 — high на всех платформах, включая Claude API и Claude Code. Если вы уже задаёте effort явно, ваша настройка не изменится. Рекомендации по каждому уровню см. в разделе Effort.
Быстрый режим теперь доступен для Claude Opus 4.8 в виде исследовательской предварительной версии в Claude API. Установите speed: "fast", чтобы получить до 2,5 раз больше выходных токенов в секунду от той же модели по премиальной цене. Информацию о доступе, поддерживаемых моделях и ценах см. в разделе Быстрый режим.
Минимальная длина кэшируемой подсказки в Claude Opus 4.8 составляет 1 024 токена — меньше, чем в Claude Opus 4.7. Подсказки, которые были слишком короткими для кэширования в Claude Opus 4.7, теперь могут создавать записи в кэше без изменений в коде. Минимальные значения для каждой модели см. в разделе Кэширование подсказок.
Эти ограничения не изменились по сравнению с Claude Opus 4.7, поэтому код, который уже работает с Claude Opus 4.7, не требует изменений. Они применяются только к Messages API; Claude Managed Agents не затрагиваются.
Установка temperature, top_p или top_k в значение, отличное от значения по умолчанию, возвращает ошибку 400 в Claude Opus 4.8, как и в Claude Opus 4.7. Опустите эти параметры и используйте подсказки для управления поведением модели.
Как и Claude Opus 4.7, Claude Opus 4.8 не поддерживает бюджеты расширенного мышления. Установка thinking: {"type": "enabled", "budget_tokens": N} возвращает ошибку 400. Используйте адаптивное мышление и параметр effort для управления глубиной мышления.
# До (Opus 4.6 или более ранние версии)
thinking = {"type": "enabled", "budget_tokens": 32000}
# После (Opus 4.7 и более поздние версии)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}По сравнению с Claude Opus 4.7, Claude Opus 4.8 нацелена на поведенческие улучшения в следующих областях:
При включённом адаптивном мышлении Claude Opus 4.8 запускает рассуждение только тогда, когда считает, что данный ход этого требует. При простых запросах на поиск и коротких агентных шагах модель отвечает напрямую; при сложных многошаговых задачах она рассуждает перед ответом. Это сокращает количество напрасно потраченных токенов мышления при бимодальных нагрузках по сравнению с Claude Opus 4.7 на том же уровне effort. Как и в Claude Opus 4.7, мышление отключено, если вы явно не установите thinking: {type: "adaptive"} в своём запросе.
Это не критические изменения API, но они могут потребовать обновления подсказок. Полные рекомендации см. в разделе Миграция на Claude Opus 4.8.
Пошаговые инструкции по миграции и полный контрольный список миграции см. в разделе Миграция на Claude Opus 4.8. Если вы используете Claude Code или Agent SDK, навык Claude API может автоматически применить эти шаги миграции к вашей кодовой базе.
Пошаговые инструкции по обновлению с Claude Opus 4.7.
Рекомендации по каждому уровню effort, включая новые значения по умолчанию.
Единственный поддерживаемый режим включённого мышления в Claude Opus 4.8.
Как системные сообщения в середине разговора сохраняют попадания в кэш.
Детали остановки при отказе и способы их обработки.
Более высокая скорость вывода по премиальной цене.
Was this page helpful?