• Сообщения
  • Управляемые агенты
  • Администрирование

Search...
⌘K
Модели
Обзор моделейИдентификаторы и версии моделейВыбор моделиПредставляем Claude Fable 5 и Claude Mythos 5Что нового в Claude Opus 4.8Обновление между версиями моделейУстаревшие моделиКарточки моделейСистемные подсказкиЦены

Log in
Обновление между версиями моделей
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Модели и цены/Модели

Руководство по миграции

Руководство по миграции на новейшие модели Claude с предыдущих версий Claude


Это руководство описывает миграцию кода, использующего Messages API. Если вы используете Claude Managed Agents, никаких изменений, кроме обновления имени модели, не требуется.



Автоматизируйте миграцию с помощью навыка Claude API. В Claude Code выполните /claude-api migrate, чтобы вызвать встроенный навык Claude API. Он работает для любой целевой модели на этой странице:

/claude-api migrate this project to claude-opus-4-8

Навык выполняет замену идентификатора модели и, при необходимости, вносит критические изменения параметров, заменяет префилл и калибрует уровень усилий для вашей целевой модели по всей кодовой базе, а затем формирует контрольный список пунктов для ручной проверки. Перед редактированием каких-либо файлов он просит вас подтвердить область миграции (весь рабочий каталог, подкаталог или конкретный список файлов). Навык также распознаёт клиенты Amazon Bedrock, Vertex AI, Claude Platform on AWS и Microsoft Foundry и корректирует форматы идентификаторов моделей и изменения функций для каждой платформы.

Миграция с Claude Mythos Preview на Claude Mythos 5

Claude Mythos 5 — это преемник с ограниченным доступом для Claude Mythos Preview, исследовательской предварительной версии, доступной только по приглашениям. Для общедоступной версии см. Claude Fable 5. Миграция в основном не требует изменений: Claude Mythos 5 использует тот же Messages API и те же паттерны использования инструментов, что и Claude Mythos Preview. Ключевые изменения — это функции, которые больше недоступны (перечислены в следующем разделе), и вывод мышления. Количество токенов практически не изменилось: Claude Mythos 5 использует тот же токенизатор, что и Claude Mythos Preview. График вывода Claude Mythos Preview из эксплуатации см. в разделе Устаревание моделей.

Обновите имя модели

model = "claude-mythos-preview"  # Before
model = "claude-mythos-5"  # After

Функции, недоступные в Claude Mythos 5

  1. Расширенное мышление и бюджеты токенов мышления: Ручное расширенное мышление (thinking: {type: "enabled", budget_tokens: N}) не поддерживается в claude-mythos-5 и возвращает ошибку 400. Адаптивное мышление всегда включено: модель сама определяет, когда и сколько думать при каждом запросе, и конфигурация thinking не требуется. thinking: {type: "disabled"} возвращает ошибку. Для budget_tokens прямой замены нет: мышление адаптивно, а параметр effort — это отдельный элемент управления на уровне вывода, а не бюджет мышления.

    До (Claude Mythos Preview):

    client.messages.create(
        model="claude-mythos-preview",
        max_tokens=16000,
        thinking={"type": "enabled", "budget_tokens": 10000},
        messages=[{"role": "user", "content": "..."}],
    )

Подсчёт токенов и тарификация

claude-mythos-5 использует тот же токенизатор, что и claude-mythos-preview (токенизатор, представленный в Claude Opus 4.7). Количество токенов практически не изменяется при миграции с claude-mythos-preview. Один и тот же контент может токенизироваться примерно в 30% больше токенов по сравнению с моделями до Claude Opus 4.7, в зависимости от содержимого и характера рабочей нагрузки.

/v1/messages/count_tokens возвращает практически неизменные значения для claude-mythos-5 по сравнению с claude-mythos-preview. Заново определите базовые показатели стоимости и задержки на ваших собственных рабочих нагрузках.

Контрольный список миграции

  • Обновите имя модели с claude-mythos-preview на claude-mythos-5.
  • Удалите конфигурацию ручного расширенного мышления (thinking: {type: "enabled", budget_tokens: N}). Адаптивное мышление всегда включено, и поле thinking не требуется.
  • Удалите любую конфигурацию thinking: {type: "disabled"}. Отключение мышления возвращает ошибку в claude-mythos-5.
  • Удалите budget_tokens. Прямой замены нет: мышление адаптивно, а параметр effort — это отдельный элемент управления на уровне вывода, а не бюджет мышления.
  • Убедитесь, что любой код, разбирающий поле thinking, обрабатывает его только как отображаемый текст и передаёт блоки мышления обратно без изменений при продолжении на той же модели. thinking.display по умолчанию имеет значение в , так же как и в Claude Mythos Preview; установите , чтобы получать читаемые сводки. См. .

Миграция с Claude Opus 4.8 на Claude Fable 5

Claude Fable 5 — самая мощная широко выпущенная модель Anthropic, общедоступная в Claude API, Claude Platform on AWS, Amazon Bedrock, Vertex AI и Microsoft Foundry.

Миграция в основном не требует изменений: Claude Fable 5 использует тот же Messages API и те же паттерны использования инструментов, что и Claude Opus 4.8, и поддерживает то же контекстное окно в 1 млн токенов по умолчанию и 128 тыс. максимальных выходных токенов. Ключевые изменения — это всегда включённое адаптивное мышление, вывод мышления, отказы классификатора безопасности и ценообразование. Количество токенов практически не изменилось: Claude Fable 5 использует тот же токенизатор, что и Claude Opus 4.8.



Claude Fable 5 стоит $10 за миллион входных токенов и $50 за миллион выходных токенов, по сравнению с $5 и $25 для Claude Opus 4.8. Подробности см. в разделе Цены на Claude.



Если ваш код работает на Claude Opus 4.7 или более ранней версии, сначала примените Миграцию с Claude Opus 4.7 на Claude Opus 4.8 и, для моделей более ранних, чем Claude Opus 4.7, шаги миграции на Claude Opus 4.7. Эти разделы описывают критические изменения (отклонение параметров сэмплирования, отклонение ручного расширенного мышления, удаление префилла, новый токенизатор), которые данный раздел не повторяет.

Обновите имя модели

model = "claude-opus-4-8"  # Before
model = "claude-fable-5"  # After

Что изменилось

Пункты в этом разделе описывают различия в API и поведении, которые стоит проверить после замены идентификатора модели.

  1. Адаптивное мышление всегда включено: Адаптивное мышление — единственный режим мышления в claude-fable-5: модель сама определяет, когда и сколько думать при каждом запросе, и конфигурация thinking не требуется. thinking: {type: "disabled"} возвращает ошибку. В Claude Opus 4.8 запросы без поля thinking выполняются без мышления; в claude-fable-5 такие запросы выполняются с адаптивным мышлением. max_tokens остаётся жёстким ограничением на общий вывод — мышление плюс текст ответа, — поэтому пересмотрите его для рабочих нагрузок, которые выполнялись без мышления в Claude Opus 4.8. См. Контроль затрат. Используйте параметр effort для управления глубиной мышления.

    До (Claude Opus 4.8):

    client.messages.create(
        model="claude-opus-4-8",
        max_tokens=16000,
        thinking={"type": "adaptive"},
        output_config={"effort": "high"},
        messages=[{"role": "user", "content": "..."}],
    )

Контрольный список миграции

  • Обновите имя модели с claude-opus-4-8 на claude-fable-5.
  • Удалите любую конфигурацию thinking: {type: "disabled"}. Отключение мышления возвращает ошибку в claude-fable-5, а запросы без поля thinking выполняются с адаптивным мышлением.
  • Если вы удалили ручное расширенное мышление и префиллы ассистента во время предыдущих миграций, никаких действий не требуется: оба остаются неподдерживаемыми в claude-fable-5.
  • Убедитесь, что любой код, разбирающий поле thinking, обрабатывает его только как отображаемый текст и передаёт блоки мышления обратно без изменений при продолжении на той же модели. thinking.display по умолчанию имеет значение "omitted" в claude-fable-5, так же как и в Claude Opus 4.8; установите display: "summarized", чтобы получать читаемые сводки. См. .

Миграция с Claude Opus 4.7 на Claude Opus 4.8

Claude Opus 4.8 — самая мощная модель уровня Opus от Anthropic. Она построена на основе Claude Opus 4.7.

Claude Opus 4.8 должна демонстрировать высокую производительность «из коробки» на существующих подсказках и оценках Claude Opus 4.7. Критических изменений API для кода, уже работающего на Claude Opus 4.7, нет. Она поддерживает тот же набор функций, что и Claude Opus 4.7, включая контекстное окно в 1 млн токенов, 128 тыс. максимальных выходных токенов, адаптивное мышление, кэширование подсказок, пакетную обработку, Files API, поддержку PDF, зрение и полный набор серверных и клиентских инструментов. Она также добавляет системные сообщения в середине разговора и публично документирует детали остановки при отказе.



Если ваш код работает на Claude Opus 4.6 или более ранней версии, также примените шаги миграции на Claude Opus 4.7 ниже перед обновлением до Claude Opus 4.8. Эти шаги включают критические изменения (отклонение параметров сэмплирования, отклонение ручного расширенного мышления, новый токенизатор), которые само по себе обновление до 4.8 не охватывает.



В Microsoft Foundry Claude Opus 4.8 имеет контекстное окно в 200 тыс. токенов на момент запуска. Контекстное окно в 1 млн применяется в Claude API, Amazon Bedrock и Vertex AI. См. Claude в Microsoft Foundry.

Обновите имя модели

# Миграция Opus
model = "claude-opus-4-7"  # Before
model = "claude-opus-4-8"  # After

Что изменилось

Это не критические изменения. Код, работающий на Claude Opus 4.7, продолжает работать без изменений на Claude Opus 4.8. Пункты ниже описывают различия в поведении, которые стоит проверить после замены идентификатора модели.

  1. Параметры сэмплирования (без изменений): Установка temperature, top_p или top_k в значение, отличное от значения по умолчанию, возвращает ошибку 400 в Claude Opus 4.8, так же как и в Claude Opus 4.7. Типы запросов SDK по-прежнему определяют эти поля для совместимости с более ранними моделями, поэтому код, который их устанавливает, проходит проверку типов, но API отклоняет запрос на стороне сервера. Если вы удалили эти параметры при миграции на Opus 4.7, дальнейших изменений не требуется.

  2. Значение effort по умолчанию — high: Значение по умолчанию для параметра effort в Claude Opus 4.8 — high на всех поверхностях, включая Claude Code и Messages API. Если вы уже устанавливаете effort явно, ваша настройка не изменяется. Для кодирования и высокоавтономной работы устанавливайте xhigh явно. Пересмотрите вашу настройку effort с учётом вашего бюджета задержки и стоимости.

  3. Контекстное окно в 1 млн — по умолчанию: Claude Opus 4.8 предоставляет полное контекстное окно в 1 млн токенов по умолчанию без бета-заголовка и без надбавки за длинный контекст. Если ваш клиент передаёт бета-заголовок контекстного окна для совместимости со старыми моделями, вы можете удалить его в Claude Opus 4.8.

Контрольный список миграции

  • Обновите имя модели с claude-opus-4-7 на claude-opus-4-8 (или обновите псевдонимы).
  • Если вы удалили параметры сэмплирования во время миграции на Opus 4.7, никаких действий не требуется. Если вы добавили их обратно с путём повтора при ошибке 400, удалите этот путь повтора.
  • Пересмотрите вашу настройку effort. Значение по умолчанию — high на всех поверхностях; для кодирования и высокоавтономной работы устанавливайте xhigh явно.
  • Удалите любой бета-заголовок контекстного окна. Контекстное окно в 1 млн — значение по умолчанию в Claude API, Amazon Bedrock и Vertex AI (200 тыс. в Microsoft Foundry).
  • Если вы перестраиваете историю разговора для обновления инструкций, рассмотрите переход на системное сообщение в середине разговора, чтобы сохранить попадания в кэш подсказок.
  • Убедитесь, что ваша обработка причин остановки считывает stop_details при отказах (доступно начиная с Claude Opus 4.7; теперь публично задокументировано).

Миграция на Claude Opus 4.7

Claude Opus 4.7 обладает высокой автономностью и исключительно хорошо справляется с долгосрочной агентной работой, работой со знаниями, задачами зрения и задачами памяти.

Claude Opus 4.7 должна демонстрировать высокую производительность «из коробки» на существующих подсказках и оценках Claude Opus 4.6 при той же цене $5 / $25 за миллион токенов, но есть несколько изменений в поведении и API, о которых стоит знать при миграции. Она поддерживает тот же набор функций, что и Claude Opus 4.6, включая:

  • Контекстное окно в 1 млн токенов по стандартной цене API без надбавки за длинный контекст
  • 128 тыс. максимальных выходных токенов
  • Адаптивное мышление
  • Кэширование подсказок
  • Пакетная обработка
  • Files API
  • Поддержка PDF
  • Зрение
  • Полный набор серверных и клиентских инструментов (bash, выполнение кода, использование компьютера, , , , , )

Обновите имя модели

# Миграция Opus
model = "claude-opus-4-6"  # Before
model = "claude-opus-4-7"  # After

Критические изменения

  1. Расширенное мышление удалено: thinking: {type: "enabled", budget_tokens: N} больше не поддерживается в Claude Opus 4.7 и более поздних моделях и возвращает ошибку 400. Переключитесь на адаптивное мышление (thinking: {type: "adaptive"}) и используйте параметр effort для управления глубиной мышления. Адаптивное мышление выключено по умолчанию в Claude Opus 4.7: запросы без поля thinking выполняются без мышления, что соответствует поведению Opus 4.6. Установите thinking: {type: "adaptive"} явно, чтобы включить его.

    До (Claude Opus 4.6):

    client.messages.create(
        model="claude-opus-4-6",
        max_tokens=16000,
        thinking={"type": "enabled", "budget_tokens": 10000},
        messages=[{"role": "user", "content": "..."}],
    )

Выбор уровня усилий

Параметр effort позволяет вам настраивать соотношение интеллекта Claude и расхода токенов, обменивая возможности на более высокую скорость и более низкие затраты. Начните с нового уровня усилий xhigh для сценариев кодирования и агентных сценариев и используйте минимум high для большинства сценариев, чувствительных к интеллекту. Экспериментируйте с другими уровнями усилий для дальнейшей настройки использования токенов и интеллекта:

  • max: Максимальный уровень усилий может обеспечить прирост производительности в некоторых сценариях, но может демонстрировать убывающую отдачу от увеличенного использования токенов. Эта настройка также иногда может быть склонна к избыточному мышлению. Тестируйте максимальный уровень усилий для задач, требующих высокого интеллекта.
  • xhigh (новый): Очень высокий уровень усилий — лучшая настройка для большинства сценариев кодирования и агентных сценариев.
  • high: Эта настройка балансирует использование токенов и интеллект. Для большинства сценариев, чувствительных к интеллекту, используйте минимум high.
  • medium: Подходит для сценариев, чувствительных к затратам, которым нужно сократить использование токенов, жертвуя интеллектом.
  • low: Резервируйте для коротких, ограниченных задач и рабочих нагрузок, чувствительных к задержке, которые не чувствительны к интеллекту.

Уровень усилий важнее для этой модели, чем для любой предыдущей Opus. Активно экспериментируйте с ним при обновлении.

Изменения в поведении

Claude Opus 4.7 имеет несколько поведенческих отличий от Claude Opus 4.6, которые не являются критическими изменениями API, но могут потребовать обновления подсказок или удаления вспомогательной обвязки.

  1. Длина ответа варьируется в зависимости от сценария: Claude Opus 4.7 калибрует длину ответа в зависимости от того, насколько сложной она считает задачу, а не использует фиксированную многословность по умолчанию. Обычно это означает более короткие ответы на простые запросы и гораздо более длинные — на открытый анализ.

    Если ваш продукт зависит от определённого стиля или многословности вывода, вам может потребоваться настроить ваши подсказки. Например, чтобы уменьшить многословность, добавьте: «Предоставляй краткие, сфокусированные ответы. Пропускай несущественный контекст и сводите примеры к минимуму». Если вы видите конкретные виды избыточных объяснений, добавьте целевые инструкции в вашу подсказку, чтобы предотвратить их.

    Положительные примеры, показывающие, как Claude может общаться с надлежащим уровнем краткости, как правило, более эффективны, чем отрицательные примеры или инструкции, которые говорят модели, чего не делать.

  2. Более буквальное следование инструкциям: Claude Opus 4.7 интерпретирует подсказки более буквально и явно, чем Claude Opus 4.6, особенно на более низких уровнях усилий. Она не будет молча обобщать инструкцию с одного элемента на другой и не будет выводить запросы, которые вы не делали. Преимущество этой буквальности — точность и меньше метаний. Она, как правило, работает лучше для сценариев API с тщательно настроенными подсказками, структурированным извлечением и конвейерами, где вам нужно предсказуемое поведение. Пересмотр подсказок и обвязки может быть особенно полезен для миграции на Claude Opus 4.7.

  3. Более прямой тон: Как и с любой новой моделью, стиль прозы в длинных текстах может измениться. Claude Opus 4.7 более прямая и категоричная, с меньшим количеством одобрительных формулировок и меньшим количеством эмодзи, чем более тёплый стиль Claude Opus 4.6. Если ваш продукт полагается на определённый голос, пересмотрите стилевые подсказки относительно новой базовой линии.

Рекомендуемые изменения

Эти изменения не являются обязательными, но улучшат ваш опыт работы:

  1. Пересмотрите max_tokens: Поскольку один и тот же текст даёт более высокое количество токенов в Claude Opus 4.7, обновите параметры max_tokens, чтобы обеспечить дополнительный запас, включая триггеры компактизации. Вмешательства на уровне подсказок, task_budget и effort помогут контролировать затраты и обеспечить надлежащее использование токенов.

  2. Проверьте ожидания по количеству токенов: Любой путь кода, который оценивает токены на стороне клиента или предполагает фиксированное соотношение токенов к символам, следует повторно протестировать с Claude Opus 4.7. Используйте эндпоинт подсчёта токенов для проверки.

  3. Внедрите бюджеты задач (бета): Claude Opus 4.7 вводит бюджеты задач. Эти бюджеты позволяют сообщить Claude, сколько токенов у него есть на полный агентный цикл, включая мышление, вызовы инструментов, результаты инструментов и финальный вывод. Модель видит текущий обратный отсчёт и использует его для приоритизации работы и корректного завершения задачи по мере расходования бюджета. Для использования установите бета-заголовок task-budgets-2026-03-13 и добавьте следующее в конфигурацию вывода:

    output_config = {
        "effort": "high",
        "task_budget": {"type": "tokens", "total": 128000},
    }

Контрольный список миграции

  • Обновите имя модели с claude-opus-4-6 на claude-opus-4-7 (или обновите псевдонимы).
  • Удалите temperature, top_p и top_k из полезной нагрузки запросов.
  • Замените thinking: {type: "enabled", budget_tokens: N} на thinking: {type: "adaptive"} плюс параметр effort.
  • Удалите все предзаполнения сообщений ассистента.
  • Если ваш интерфейс отображает содержимое мышления, явно включите суммаризацию мышления.
  • Повторно измерьте сквозную стоимость и задержку с учётом обновлённой токенизации.
  • Перенастройте с учётом обновлённой токенизации.

Миграция на Claude Opus 4.7 с Opus 4.5 или более ранних версий

Если вы мигрируете с Claude Opus 4.5, Opus 4.1 (устаревшая) или более ранней модели напрямую на Claude Opus 4.7, примените все изменения Opus 4.7, описанные выше, плюс накопительные изменения из этого раздела, вступившие в силу между Opus 4.5 и Opus 4.7. Если вы мигрируете с Opus 4.6, вам нужен только раздел Opus 4.7 выше.

Обновите имя модели

# Миграция Opus
model = "claude-opus-4-5"  # Before
model = "claude-opus-4-7"  # After

Критические изменения

  1. Удаление предзаполнения описано в разделе критических изменений Opus 4.7 выше.

  2. Экранирование параметров инструментов: Claude Opus 4.6 и более поздние модели могут выдавать немного отличающееся экранирование строк JSON в аргументах вызовов инструментов (например, иная обработка Unicode-экранирования или экранирования прямой косой черты). Если вы разбираете input вызова инструмента как необработанную строку, а не используете JSON-парсер, проверьте логику разбора. Стандартные JSON-парсеры (такие как json.loads() или JSON.parse()) обрабатывают эти различия автоматически.

Рекомендуемые изменения

Эти изменения улучшат ваш опыт работы с Opus 4.7. Пункты, помеченные (обязательно для Opus 4.7), были необязательными рекомендациями при запуске Opus 4.6, но теперь являются обязательными; остальные остаются рекомендуемыми.

  1. Перейдите на адаптивное мышление (обязательно для Opus 4.7): thinking: {type: "enabled", budget_tokens: N} возвращает ошибку 400 в Claude Opus 4.7. Переключитесь на thinking: {type: "adaptive"} и используйте параметр effort для управления глубиной мышления. См. Адаптивное мышление.

Миграция с Claude 4.1 или более ранних версий

Если вы мигрируете с Opus 4.1 (устаревшая), Sonnet 4 (устаревшая) или более ранних моделей напрямую на Claude Opus 4.7, примените изменения Claude Opus 4.7 в начале этого руководства и накопительные изменения выше, плюс дополнительные изменения из этого раздела.

# Из Opus 4.1
model = "claude-opus-4-1-20250805"  # Before
model = "claude-opus-4-7"  # After

# Из Sonnet 4
model = "claude-sonnet-4-20250514"  # Before
model = "claude-opus-4-7"  # After

# Из Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Before
model = "claude-opus-4-7"  # After

Дополнительные критические изменения

  1. Удалите параметры сэмплирования

    

    Это критическое изменение при миграции с моделей Claude 3.x.

    Начиная с Claude Opus 4.7, установка temperature, top_p или top_k в любое значение, отличное от значения по умолчанию, вернёт ошибку 400. Самый безопасный путь миграции — полностью исключить эти параметры из запросов и использовать подсказки для управления поведением модели. Если вы использовали temperature = 0 для детерминизма, учтите, что это никогда не гарантировало идентичных выводов.

    Python
    # До — это вызовет ошибку в моделях Claude 4+
    response = client.messages.create(
        model="claude-3-7-sonnet-20250219",
        temperature=0.7,
        top_p=0.9,  # Non-default sampling params return 400 on Opus 4.7
        # ...
    )
    
    # После
    response = client.messages.create(
        model="claude-opus-4-7",
        # ...
    )

Дополнительные рекомендуемые изменения

  • Удалите устаревшие бета-заголовки: Удалите token-efficient-tools-2025-02-19 и output-128k-2025-02-19. Все модели Claude 4+ имеют встроенное токен-эффективное использование инструментов, и эти заголовки не имеют эффекта.

Контрольный список миграции (с Opus 4.5 или более ранних версий)

  • Обновите идентификатор модели на claude-opus-4-7
  • Примените все критические изменения Opus 4.7 (расширенное мышление удалено, параметры сэмплирования удалены, отображение мышления по умолчанию опущено, обновлённая токенизация)
  • КРИТИЧЕСКОЕ: Удалите предзаполнения сообщений ассистента (возвращает ошибку 400); используйте структурированные выводы или output_config.format вместо этого
  • КРИТИЧЕСКОЕ для Opus 4.7: Замените thinking: {type: "enabled", budget_tokens: N} на thinking: {type: "adaptive"} плюс параметр effort (возвращает 400 в Opus 4.7)
  • Убедитесь, что разбор JSON вызовов инструментов использует стандартный JSON-парсер
  • Удалите бета-заголовок effort-2025-11-24 (effort теперь общедоступен)
  • Удалите бета-заголовок

Миграция на Claude Sonnet 4.6

Claude Sonnet 4.6 сочетает высокий интеллект с быстрой производительностью, обладает улучшенными возможностями агентного поиска и бесплатным выполнением кода при использовании с веб-поиском или веб-загрузкой. Идеально подходит для повседневных задач программирования, анализа и создания контента.

Полный обзор возможностей см. в обзоре моделей.



Стоимость Sonnet 4.6 составляет 3 $ за миллион входных токенов, 15 $ за миллион выходных токенов. Подробности см. в разделе Цены на Claude.

Обновите имя модели:

# От Sonnet 4.5
model = "claude-sonnet-4-5"  # Before
model = "claude-sonnet-4-6"  # After

# От Sonnet 4
model = "claude-sonnet-4-20250514"  # Before
model = "claude-sonnet-4-6"  # After

Критические изменения

При миграции с Sonnet 4.5

  1. Предзаполнение сообщений ассистента больше не поддерживается

    

    Это критическое изменение при миграции с Sonnet 4.5 или более ранних версий.

    Предзаполнение сообщений ассистента возвращает ошибку 400 в Sonnet 4.6. Используйте структурированные выводы, инструкции в системной подсказке или output_config.format вместо этого.

    Распространённые сценарии использования предзаполнения и способы миграции:

    • Управление форматированием вывода (принудительный вывод JSON/YAML): Используйте структурированные выводы или инструменты с полями enum для задач классификации.

    • Устранение преамбул (удаление фраз «Вот...»): Добавьте прямые инструкции в системную подсказку: «Отвечай напрямую без преамбулы. Не начинай с фраз типа "Вот...", "На основе..." и т. д.»

    • Избежание некорректных отказов: Claude теперь гораздо лучше справляется с уместными отказами. Чёткой подсказки в сообщении пользователя без предзаполнения должно быть достаточно.

При миграции с Claude 3.x

  1. Обновите параметры сэмплирования

    

    Это критическое изменение при миграции с моделей Claude 3.x.

    Используйте только temperature ИЛИ top_p, но не оба.

  2. Обновите версии инструментов

    

    Это критическое изменение при миграции с моделей Claude 3.x.

    Обновитесь до последних версий инструментов (text_editor_20250728, code_execution_20250825). Удалите любой код, использующий команду undo_edit.

  3. Обрабатывайте причину остановки refusal

    Обновите ваше приложение для обработки причин остановки refusal.

Рекомендуемые изменения

  1. Удалите бета-заголовок fine-grained-tool-streaming-2025-05-14: Детальная потоковая передача инструментов теперь общедоступна (GA) в Sonnet 4.6 и больше не требует бета-заголовка.
  2. Перейдите с output_format на output_config.format: Параметр output_format устарел. Используйте output_config.format вместо него.

Миграция с Sonnet 4.5

Рассмотрите миграцию с Sonnet 4.5 на Sonnet 4.6, который обеспечивает больший интеллект по той же цене.



Sonnet 4.6 по умолчанию использует уровень усилий high, в отличие от Sonnet 4.5, у которого не было параметра effort. Рассмотрите возможность настройки параметра effort при миграции с Sonnet 4.5 на Sonnet 4.6. Если он не установлен явно, вы можете столкнуться с более высокой задержкой при уровне усилий по умолчанию.

Если вы не используете расширенное мышление

Если вы не используете расширенное мышление в Sonnet 4.5, вы можете продолжать без него в Sonnet 4.6. Вам следует явно установить effort на уровень, подходящий для вашего сценария использования. При уровне усилий low с отключённым мышлением вы можете ожидать аналогичную или лучшую производительность по сравнению с Sonnet 4.5 без расширенного мышления.

Если вы используете расширенное мышление

Если вы используете расширенное мышление с budget_tokens в Sonnet 4.5, оно всё ещё функционально в Sonnet 4.6, но устарело. Перейдите на адаптивное мышление с параметром effort.

Миграция на адаптивное мышление

Адаптивное мышление — это рекомендуемая замена budget_tokens в Sonnet 4.6. Оно особенно хорошо подходит для следующих типов рабочих нагрузок:

  • Автономные многошаговые агенты: агенты программирования, превращающие требования в работающее программное обеспечение, конвейеры анализа данных и поиск ошибок, где модель работает независимо на протяжении многих шагов. Адаптивное мышление позволяет модели калибровать рассуждения на каждом шаге, оставаясь на правильном пути на более длинных траекториях. Для таких рабочих нагрузок начните с уровня усилий high. Если задержка или использование токенов вызывают беспокойство, снизьте до medium.
  • Агенты использования компьютера: Sonnet 4.6 достиг лучшей в своём классе точности на оценках использования компьютера с использованием адаптивного режима.
  • Бимодальные рабочие нагрузки: смесь простых и сложных задач, где адаптивное мышление пропускает мышление на простых запросах и глубоко рассуждает на сложных.

При использовании адаптивного мышления оцените уровни усилий medium и high на ваших задачах. Правильный уровень зависит от компромисса вашей рабочей нагрузки между качеством, задержкой и использованием токенов.



Если вы наблюдаете непоследовательное поведение или регрессии качества с адаптивным мышлением, попробуйте сначала снизить настройку effort или использовать max_tokens как жёсткий лимит. Расширенное мышление с budget_tokens всё ещё функционально в Sonnet 4.6, но устарело и больше не рекомендуется.

Сохранение budget_tokens во время миграции

Если вам нужно временно сохранить budget_tokens во время миграции, бюджет около 16 тыс. токенов обеспечивает запас для более сложных задач без риска неконтролируемого использования токенов. Эта конфигурация устарела и будет удалена в будущем выпуске модели.

Сценарии программирования и агентные сценарии

Для агентного программирования, фронтенд-дизайна, рабочих процессов с интенсивным использованием инструментов и сложных корпоративных рабочих процессов начните с уровня усилий medium. Если задержка слишком высока, рассмотрите снижение усилий до low. Если вам нужен более высокий интеллект, рассмотрите увеличение усилий до high или миграцию на Opus 4.7.

Чат и сценарии, не связанные с программированием

Для чата, генерации контента, поиска, классификации и других задач, не связанных с программированием, начните с уровня усилий low с расширенным мышлением. Если вам нужна большая глубина, увеличьте усилия до medium.

Контрольный список миграции на Sonnet 4.6

  • Обновите идентификатор модели на claude-sonnet-4-6
  • КРИТИЧЕСКОЕ: Удалите предзаполнение сообщений ассистента; используйте структурированные выводы или output_config.format вместо этого
  • КРИТИЧЕСКОЕ: Убедитесь, что разбор JSON параметров инструментов обрабатывает различия в экранировании
  • КРИТИЧЕСКОЕ: Обновите версии инструментов до последних (text_editor_20250728, code_execution_20250825); устаревшие версии не поддерживаются (при миграции с 3.x)
  • КРИТИЧЕСКОЕ: Удалите любой код, использующий команду undo_edit (если применимо)
  • КРИТИЧЕСКОЕ: Обновите параметры сэмплирования, чтобы использовать только temperature ИЛИ top_p, но не оба (при миграции с 3.x)

Миграция на Claude Sonnet 4.5

Claude Sonnet 4.5 сочетает высокий интеллект с быстрой производительностью, что делает его идеальным для повседневных задач программирования, анализа и создания контента.

Полный обзор возможностей см. в обзоре моделей.



Стоимость Sonnet 4.5 составляет 3 $ за миллион входных токенов, 15 $ за миллион выходных токенов. Подробности см. в разделе Цены на Claude.

Обновите имя модели:

# Из Sonnet 4
model = "claude-sonnet-4-20250514"  # Before
model = "claude-sonnet-4-5-20250929"  # After

# Из Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Before
model = "claude-sonnet-4-5-20250929"  # After

Критические изменения

Эти критические изменения применяются при миграции с моделей Claude 3.x Sonnet.

  1. Обновите параметры сэмплирования

    

    Это критическое изменение при миграции с моделей Claude 3.x.

    Используйте только temperature ИЛИ top_p, но не оба.

  2. Обновите версии инструментов

    

    Это критическое изменение при миграции с моделей Claude 3.x.

    Обновитесь до последних версий инструментов (text_editor_20250728, code_execution_20250825). Удалите любой код, использующий команду undo_edit.

  3. Обрабатывайте причину остановки refusal

    Обновите ваше приложение для обработки причин остановки refusal.

Контрольный список миграции на Sonnet 4.5

  • Обновите идентификатор модели на claude-sonnet-4-5-20250929
  • КРИТИЧЕСКОЕ: Обновите версии инструментов до последних (text_editor_20250728, code_execution_20250825); устаревшие версии не поддерживаются (при миграции с 3.x)
  • КРИТИЧЕСКОЕ: Удалите любой код, использующий команду undo_edit (если применимо)
  • КРИТИЧЕСКОЕ: Обновите параметры сэмплирования, чтобы использовать только temperature ИЛИ top_p, но не оба (при миграции с 3.x)
  • Обрабатывайте новую причину остановки refusal в вашем приложении
  • Проверьте и обновите подсказки в соответствии с лучшими практиками составления подсказок

Миграция на Claude Haiku 4.5

Claude Haiku 4.5 — самая быстрая и интеллектуальная модель Haiku с производительностью, близкой к передовой, обеспечивающая качество премиальной модели для интерактивных приложений и высоконагруженной обработки.

Полный обзор возможностей см. в обзоре моделей.



Стоимость Haiku 4.5 составляет 1 $ за миллион входных токенов, 5 $ за миллион выходных токенов. Подробности см. в разделе Цены на Claude.

Обновите имя модели:

# От Haiku 3.5
model = "claude-3-5-haiku-20241022"  # Before
model = "claude-haiku-4-5-20251001"  # After

Ознакомьтесь с новыми ограничениями скорости: Haiku 4.5 имеет отдельные ограничения скорости от Haiku 3.5. Подробности см. в документации по ограничениям скорости.



Для значительного улучшения производительности в задачах программирования и рассуждения рассмотрите включение расширенного мышления с thinking: {type: "enabled", budget_tokens: N}.



Расширенное мышление влияет на эффективность кэширования подсказок.

Расширенное мышление устарело в моделях Claude 4.6 и удалено в Claude Opus 4.7. При использовании более новых моделей используйте адаптивное мышление вместо него.

Изучите новые возможности: См. обзор моделей для получения подробной информации об осведомлённости о контексте, увеличенной ёмкости вывода (64 тыс. токенов), более высоком интеллекте и улучшенной скорости.

Критические изменения

Эти критические изменения применяются при миграции с моделей Claude 3.x Haiku.

  1. Обновите параметры сэмплирования

    

    Это критическое изменение при миграции с моделей Claude 3.x.

    Используйте только temperature ИЛИ top_p, но не оба.

  2. Обновите версии инструментов

    

    Это критическое изменение при миграции с моделей Claude 3.x.

    Обновитесь до последних версий инструментов (text_editor_20250728, code_execution_20250825). Удалите любой код, использующий команду undo_edit.

  3. Обрабатывайте причину остановки refusal

    Обновите ваше приложение для обработки причин остановки refusal.

Контрольный список миграции на Haiku 4.5

  • Обновите идентификатор модели на claude-haiku-4-5-20251001
  • КРИТИЧЕСКОЕ: Обновите версии инструментов до последних (text_editor_20250728, code_execution_20250825); устаревшие версии не поддерживаются
  • КРИТИЧЕСКОЕ: Удалите любой код, использующий команду undo_edit (если применимо)
  • КРИТИЧЕСКОЕ: Обновите параметры сэмплирования, чтобы использовать только temperature ИЛИ top_p, но не оба
  • Обрабатывайте новую причину остановки refusal в вашем приложении
  • Ознакомьтесь с новыми ограничениями скорости и адаптируйтесь к ним (отдельные от Haiku 3.5)
  • Проверьте и обновите подсказки в соответствии с

Получить помощь

  • Ознакомьтесь с документацией API для получения подробных спецификаций
  • Ознакомьтесь с возможностями моделей для сравнения производительности
  • Ознакомьтесь с примечаниями к выпуску API для получения обновлений API
  • Обратитесь в службу поддержки, если столкнётесь с какими-либо проблемами во время миграции

Was this page helpful?

  • Миграция с Claude Mythos Preview на Claude Mythos 5
  • Обновите имя модели
  • Функции, недоступные в Claude Mythos 5
  • Подсчёт токенов и тарификация
  • Контрольный список миграции
  • Миграция с Claude Opus 4.8 на Claude Fable 5
  • Обновите имя модели
  • Что изменилось
  • Контрольный список миграции
  • Миграция с Claude Opus 4.7 на Claude Opus 4.8
  • Обновите имя модели
  • Что изменилось
  • Контрольный список миграции
  • Миграция на Claude Opus 4.7
  • Обновите имя модели
  • Критические изменения
  • Выбор уровня усилий
  • Изменения в поведении
  • Рекомендуемые изменения
  • Контрольный список миграции
  • Миграция на Claude Opus 4.7 с Opus 4.5 или более ранних версий
  • Обновите имя модели
  • Критические изменения
  • Рекомендуемые изменения
  • Миграция с Claude 4.1 или более ранних версий
  • Контрольный список миграции (с Opus 4.5 или более ранних версий)
  • Миграция на Claude Sonnet 4.6
  • Критические изменения
  • Рекомендуемые изменения
  • Миграция с Sonnet 4.5
  • Контрольный список миграции на Sonnet 4.6
  • Миграция на Claude Sonnet 4.5
  • Критические изменения
  • Контрольный список миграции на Sonnet 4.5
  • Миграция на Claude Haiku 4.5
  • Критические изменения
  • Контрольный список миграции на Haiku 4.5
  • Получить помощь

После (Claude Mythos 5):

client.messages.create(
    model="claude-mythos-5",
    max_tokens=16000,
    messages=[{"role": "user", "content": "..."}],
)
  • Префилл ассистента: Предварительное заполнение сообщения ассистента не поддерживается в claude-mythos-5 и возвращает ошибку 400, так же как и в Claude Mythos Preview. Вместо этого используйте инструкции в системной подсказке.

  • Вывод мышления: В claude-mythos-5 необработанная цепочка рассуждений никогда не возвращается, но блоки мышления по-прежнему содержат читаемый обобщённый текст, когда thinking.display установлен в summarized. Передавайте блоки мышления обратно без изменений при продолжении разговора на той же модели. См. Вывод мышления в Claude Fable 5 и Claude Mythos 5.

  • "omitted"
    claude-mythos-5
    display: "summarized"
    Вывод мышления в Claude Fable 5 и Claude Mythos 5
  • Если вы воспроизводите историю разговора на другой модели, сначала удалите блоки thinking и redacted_thinking из предыдущих ходов ассистента. Блоки мышления из claude-mythos-5 привязаны к модели, которая их создала; модели, отличные от Claude Fable 5 и Claude Mythos 5, молча игнорируют их; удаление делает кросс-модельные запросы минимальными и единообразными.
  • Заново определите базовые показатели количества токенов и затрат на ваших собственных рабочих нагрузках. Количество токенов практически не изменяется при миграции с claude-mythos-preview.
  • После (Claude Fable 5):

    client.messages.create(
        model="claude-fable-5",
        max_tokens=16000,
        output_config={"effort": "high"},
        messages=[{"role": "user", "content": "..."}],
    )
  • Расширенное мышление и бюджеты мышления (без изменений): Ручное расширенное мышление (thinking: {type: "enabled", budget_tokens: N}) не поддерживается в claude-fable-5 и возвращает ошибку 400, так же как и в Claude Opus 4.8. Для budget_tokens прямой замены нет: мышление адаптивно, а параметр effort — это отдельный элемент управления на уровне вывода, а не бюджет мышления.

  • Префилл ассистента (без изменений): Предварительное заполнение сообщения ассистента не поддерживается в claude-fable-5 и возвращает ошибку 400, так же как и в Claude Opus 4.8. Вместо этого используйте инструкции в системной подсказке.

  • Вывод мышления: В claude-fable-5 необработанная цепочка рассуждений никогда не возвращается, но блоки мышления по-прежнему содержат читаемый обобщённый текст, когда thinking.display установлен в summarized. Передавайте блоки мышления обратно без изменений при продолжении разговора на той же модели. См. Вывод мышления в Claude Fable 5 и Claude Mythos 5.

  • Классификаторы безопасности и причина остановки refusal: claude-fable-5 запускает классификаторы безопасности для запросов и во время генерации ответа. Когда классификатор отклоняет запрос, Messages API возвращает stop_reason: "refusal", а поле stop_details.category сообщает, какой классификатор сработал ("cyber", "bio", "reasoning_extraction" или null, когда отказ не соответствует ни одной именованной категории). Отклонённый ответ — это успешный HTTP-ответ 200, а не ошибка, и вам не выставляется счёт за входные токены запроса, отклонённого до генерации какого-либо вывода. Когда классификатор срабатывает в середине потока, входные и уже переданные выходные токены тарифицируются; отбросьте частичный вывод. Чтобы автоматически повторно выполнять отклонённые запросы на другой модели, передайте опциональный параметр fallbacks (в бета-версии в Claude API и Claude Platform on AWS; недоступен в Message Batches API, а также в Amazon Bedrock, Vertex AI и Microsoft Foundry; на этих трёх платформах выполняйте повтор на стороне клиента или используйте промежуточное ПО SDK для резервного переключения при отказе). См. Обработка причин остановки.

  • Начинайте с уровня усилий high: Значение по умолчанию для параметра effort остаётся high. В Claude Opus 4.8 для кодирования и высокоавтономной работы рекомендуется явно устанавливать xhigh. В claude-fable-5 используйте high по умолчанию для большинства задач и резервируйте xhigh для наиболее требовательных к возможностям рабочих нагрузок: более низкие настройки усилий в claude-fable-5 по-прежнему работают хорошо и часто превосходят производительность xhigh на предыдущих моделях. Снижайте уровень усилий, если задача выполняется, но занимает больше времени, чем необходимо. См. Подсказки для Claude Fable 5.

  • Более низкий минимум для кэширования подсказок: Минимальная длина кэшируемой подсказки в claude-fable-5 составляет 512 токенов, что ниже 1 024 токенов в Claude Opus 4.8. Подсказки, которые были слишком короткими для кэширования в Claude Opus 4.8, теперь могут создавать записи кэша без изменений в коде. В Amazon Bedrock минимум для claude-fable-5 составляет 1 024 токена. См. Кэширование подсказок для минимумов по моделям.

  • Вывод мышления в Claude Fable 5 и Claude Mythos 5
  • Если вы воспроизводите историю разговора на другой модели, сначала удалите блоки thinking и redacted_thinking из предыдущих ходов ассистента. Блоки мышления из claude-fable-5 привязаны к модели, которая их создала; модели, отличные от Claude Fable 5 и Claude Mythos 5, молча игнорируют их; удаление делает кросс-модельные запросы минимальными и единообразными. Исключение — погашение резервного кредита, которое требует тела запроса, воспроизведённого по точным правилам этой функции.
  • Обрабатывайте stop_reason: "refusal" и считывайте поле stop_details.category. Чтобы автоматически повторно выполнять отклонённые запросы на другой модели, рассмотрите опциональный параметр fallbacks (бета). См. Обработка причин остановки.
  • Пересмотрите вашу настройку effort. Начинайте с high для большинства задач, включая рабочие нагрузки, которые выполнялись на xhigh в Claude Opus 4.8.
  • Заново определите базовые показатели стоимости и задержки на ваших собственных рабочих нагрузках. Количество токенов практически не изменяется при миграции с claude-opus-4-8; цена за токен отличается.
  • Системные сообщения в середине разговора: Claude Opus 4.8 принимает сообщения с role: "system" сразу после хода пользователя в массиве messages (с учётом правил размещения). Используйте поле верхнего уровня system для инструкций, которые применяются с самого начала. Более ранние модели, включая Claude Opus 4.7, отклоняют role: "system" в messages с ошибкой 400. Если вы поддерживаете пути кода, которые перестраивают полную историю сообщений для обновления инструкций, вы можете упростить их и сохранить попадания в кэш подсказок для более ранних ходов.

  • Детали остановки при отказе: Объект stop_details в ответах с отказом (доступный начиная с Claude Opus 4.7) теперь публично задокументирован. Когда модель отклоняет запрос, она идентифицирует категорию отказа в дополнение к существующей причине остановки refusal. Бета-заголовок не требуется, и отказаться от этого нельзя. См. Обработка причин остановки.

  • Более низкий минимум для кэширования подсказок: Минимальная длина кэшируемой подсказки в Claude Opus 4.8 составляет 1 024 токена, что ниже, чем в Claude Opus 4.7. Подсказки, которые были слишком короткими для кэширования в Claude Opus 4.7, теперь могут создавать записи кэша без изменений в коде. См. Кэширование подсказок для минимумов по моделям.

  • Перекалиброванные уровни усилий: Распределение токенов за каждым уровнем усилий изменяется в Claude Opus 4.8 по сравнению с Claude Opus 4.7: medium допускает несколько больше мышления, high — несколько меньше, а xhigh — существенно больше. Если вы настраивали уровень усилий под стоимость или задержку Claude Opus 4.7, заново определите базовые показатели на том же уровне, прежде чем корректировать его. См. Effort.

  • Заново определите базовые показатели стоимости и задержки на выбранном вами уровне усилий.
  • текстовый редактор
    веб-поиск
    веб-загрузка
    коннектор MCP
    память

    После (Claude Opus 4.7):

    client.messages.create(
        model="claude-opus-4-7",
        max_tokens=16000,
        thinking={"type": "adaptive"},
        output_config={"effort": "high"},  # or "max", "xhigh", "medium", "low"
        messages=[{"role": "user", "content": "..."}],
    )

    Адаптивное мышление управляется через подсказки. Рекомендации по настройке, когда модель думает слишком много или слишком мало, см. в разделе Калибровка усилий и глубины мышления.

  • Параметры сэмплирования удалены: Установка temperature, top_p или top_k в любое значение, отличное от значения по умолчанию, в Claude Opus 4.7 возвращает ошибку 400. Самый безопасный путь миграции — полностью исключить эти параметры из полезной нагрузки запроса. Подсказки — рекомендуемый способ управления поведением модели в Claude Opus 4.7. Если вы использовали temperature = 0 для детерминизма, обратите внимание, что это никогда не гарантировало идентичных выходных данных на предыдущих моделях.

  • Содержимое мышления по умолчанию опускается: Блоки мышления по-прежнему появляются в потоке ответа в Claude Opus 4.7, но их поле thinking пусто, если вы явно не включите его. Это тихое изменение по сравнению с Claude Opus 4.6, где по умолчанию возвращался обобщённый текст мышления. Чтобы восстановить обобщённое содержимое мышления в Claude Opus 4.7, установите thinking.display в "summarized":

    thinking = {
        "type": "adaptive",
        "display": "summarized",
    }

    Значение по умолчанию — "omitted" в Claude Opus 4.7. Если ваш продукт передаёт рассуждения пользователям в потоковом режиме, новое значение по умолчанию выглядит как длинная пауза перед началом вывода; установите display: "summarized", чтобы восстановить видимый прогресс во время мышления. Подробности см. в разделе Расширенное мышление.

  • Обновлённый подсчёт токенов: Claude Opus 4.7 использует новый токенизатор, что способствует улучшению производительности в широком спектре задач. Новый токенизатор может использовать примерно от 1x до 1,35x больше токенов при обработке текста по сравнению с предыдущими моделями (до ~35% больше, в зависимости от содержимого).

    /v1/messages/count_tokens будет возвращать другое количество токенов для Claude Opus 4.7, чем для Claude Opus 4.6. Эффективность токенов может варьироваться в зависимости от характера рабочей нагрузки.

    Вмешательства через подсказки, task_budget и effort могут помочь контролировать затраты и обеспечить надлежащее использование токенов. Эти элементы управления могут снижать интеллект модели. Обновите ваши параметры max_tokens, чтобы обеспечить дополнительный запас, включая триггеры сжатия. Claude Opus 4.7 предоставляет контекстное окно в 1 млн по стандартной цене API без надбавки за длинный контекст.

  • Удаление префилла (перенесено из Opus 4.6): Предварительное заполнение сообщений ассистента возвращает ошибку 400 в Claude Opus 4.7. Вместо этого используйте структурированные выходные данные, инструкции в системной подсказке или output_config.format.

  • Встроенные обновления прогресса в агентных трассировках: Claude Opus 4.7 предоставляет более регулярные, более качественные обновления пользователю на протяжении длинных агентных трассировок. Если вы добавили обвязку для принудительных промежуточных сообщений о статусе («После каждых 3 вызовов инструментов суммируй прогресс»), попробуйте удалить её. Если вы обнаружите, что длина или содержимое обновлений Claude Opus 4.7 для пользователя плохо откалиброваны для вашего сценария, явно опишите, как должны выглядеть эти обновления, в подсказке и приведите примеры.

  • Меньше субагентов порождается по умолчанию: Claude Opus 4.7 склонна порождать меньше субагентов по умолчанию. Однако это поведение управляется через подсказки; дайте Claude Opus 4.7 явные указания о том, когда субагенты желательны.

  • Более строгая калибровка усилий: Существенно отличаясь от Claude Opus 4.6, Claude Opus 4.7 строго соблюдает уровни усилий, особенно на нижнем конце. На low и medium модель ограничивает свою работу тем, что было запрошено, а не делает больше, чем нужно.

    Это хорошо для задержки и стоимости, но на умеренно сложных задачах, выполняемых на уровне low, есть некоторый риск недостаточного мышления. Если вы наблюдаете поверхностные рассуждения на сложных проблемах, повысьте уровень усилий до high или xhigh, а не обходите это через подсказки.

    Если вам нужно сохранить уровень усилий на low ради задержки, добавьте целевые указания: «Эта задача включает многошаговые рассуждения. Тщательно обдумай проблему перед ответом». См. Рекомендуемые уровни усилий для Claude Opus 4.7.

  • Меньше вызовов инструментов по умолчанию: Claude Opus 4.7 склонна использовать инструменты реже, чем Claude Opus 4.6, и больше использовать рассуждения. В большинстве случаев это даёт лучшие результаты.

    Чтобы увеличить использование инструментов, повысьте настройку усилий. Настройки усилий high или xhigh демонстрируют существенно большее использование инструментов в агентном поиске и кодировании. Вы также можете скорректировать вашу подсказку, чтобы явно проинструктировать модель о том, когда и как правильно использовать её инструменты.

  • Защитные меры кибербезопасности в реальном времени: Впервые добавленные в Claude Opus 4.7, запросы, затрагивающие запрещённые или высокорисковые темы, могут приводить к отказам. Для легитимной работы в области безопасности, такой как тестирование на проникновение, исследование уязвимостей или red-teaming, подайте заявку в Cyber Verification Program, чтобы запросить снижение ограничений. Справочную информацию см. в разделе Защитные меры, предупреждения и апелляции.

  • Поддержка изображений высокого разрешения: Claude Opus 4.7 — первая модель Claude с поддержкой изображений высокого разрешения. Максимальное разрешение изображения составляет 2576 пикселей по длинной стороне, по сравнению с 1568 пикселями на предыдущих моделях. Это открывает преимущества для рабочих нагрузок с интенсивным использованием зрения и особенно ценно для использования компьютера, понимания скриншотов и анализа документов.

    Поддержка высокого разрешения автоматическая и не требует бета-заголовка или включения на стороне клиента. Два момента, которые стоит учесть:

    • Изображения в полном разрешении могут использовать примерно до 3x больше токенов изображений, чем на предыдущих моделях (до 4 784 токенов на изображение, по сравнению с предыдущим пределом примерно в 1 600 токенов на изображение). Пересмотрите бюджет max_tokens и ожидания по стоимости для рабочих нагрузок с большим количеством изображений или уменьшите разрешение перед отправкой, если вам не нужна дополнительная точность.
    • Координаты указания и ограничивающих рамок, возвращаемые моделью, соответствуют 1:1 фактическим пикселям изображения в Claude Opus 4.7, поэтому преобразование масштабного коэффициента не требуется.

    Подробности см. в разделе Поддержка изображений высокого разрешения в Claude Opus 4.7.

  • Возможно, вам потребуется поэкспериментировать с разными бюджетами задач для вашего сценария использования. Если модели задан слишком ограничительный бюджет задачи, она может выполнить задачу менее тщательно, ссылаясь на свой бюджет как на ограничение.

    Для открытых агентных задач, где качество важнее скорости, не устанавливайте бюджет задачи. Используйте бюджеты задач для рабочих нагрузок, где вам нужно, чтобы модель ограничивала объём своей работы выделенным количеством токенов. Минимальное значение бюджета задачи — 20 тыс. токенов.

    Бюджет задачи — это не жёсткий лимит, а рекомендация, о которой модель осведомлена. Он отличается от max_tokens:

    • task_budget: рекомендательный лимит на весь агентный цикл. Модель видит его и использует для регулирования темпа работы.
    • max_tokens: жёсткий потолок на количество сгенерированных токенов в рамках одного запроса. Он не передаётся модели, поэтому модель о нём не знает.

    Используйте task_budget, когда хотите, чтобы модель саморегулировалась, и max_tokens как жёсткий потолок для ограничения использования.

  • Установите большое значение max_tokens при уровне усилий max или xhigh: Если вы запускаете Claude Opus 4.7 с уровнем усилий max или xhigh, установите большой бюджет выходных токенов, чтобы у модели было пространство для мышления и действий через субагентов и вызовы инструментов. Начните с 64 тыс. токенов и настраивайте дальше.

  • Уменьшайте разрешение изображений, если высокое разрешение не требуется: Claude Opus 4.7 поддерживает изображения до 2576 пикселей / 3,75 МП. Изображения высокого разрешения используют больше токенов. Если дополнительная детализация изображения не нужна, уменьшите разрешение изображений перед отправкой в Claude, чтобы избежать увеличения использования токенов. См. Изображения и зрение.

  • max_tokens
  • Повторно протестируйте любые клиентские оценки количества токенов.
  • Если ваше приложение отправляет изображения, пересчитайте бюджет с учётом поддержки изображений высокого разрешения (примерно до 3 раз больше токенов изображения на одно изображение в полном разрешении). Уменьшите разрешение перед отправкой, если дополнительная детализация не нужна.
  • Если вы используете координаты точек или ограничивающих рамок от модели, удалите любое преобразование масштабного коэффициента; координаты соответствуют фактическим пикселям изображения 1:1 в Claude Opus 4.7.
  • Проверьте подсказки на предмет описанных выше изменений поведения (длина ответа, буквализм, тон, обновления прогресса, субагенты, калибровка усилий, срабатывание инструментов, защитные меры в области кибербезопасности, обработка изображений высокого разрешения).
  • Заново определите базовую длину ответа, удалив существующие подсказки контроля длины, затем настройте явно.
  • При использовании уровня усилий xhigh или max увеличьте max_tokens как минимум до 64 тыс. в качестве отправной точки.
  • Рассмотрите внедрение бюджетов задач (бета) для агентных рабочих процессов.
  • Если ваш продукт выполняет легитимную работу в области безопасности, подайте заявку в Cyber Verification Program для получения доступа к сниженным ограничениям на контент, связанный с кибербезопасностью.
  • response = client.beta.messages.create(
        model="claude-opus-4-5",
        max_tokens=16000,
        thinking={"type": "enabled", "budget_tokens": 32000},
        betas=["interleaved-thinking-2025-05-14"],
        messages=[{"role": "user", "content": "Your prompt here"}],
    )

    Обратите внимание, что миграция также переходит с client.beta.messages.create на client.messages.create. Адаптивное мышление и effort — это общедоступные (GA) функции, которые не требуют бета-пространства имён SDK или каких-либо бета-заголовков.

  • Удалите бета-заголовок effort: Параметр effort теперь общедоступен (GA). Удалите betas=["effort-2025-11-24"] из ваших запросов.

  • Удалите бета-заголовок детальной потоковой передачи инструментов: Детальная потоковая передача инструментов теперь общедоступна (GA). Удалите betas=["fine-grained-tool-streaming-2025-05-14"] из ваших запросов.

  • Удалите бета-заголовок чередующегося мышления: Адаптивное мышление автоматически включает чередующееся мышление в Claude Opus 4.7, Opus 4.6 и Sonnet 4.6. Удалите betas=["interleaved-thinking-2025-05-14"] из ваших запросов. Заголовок всё ещё функционален в Sonnet 4.6 с ручным расширенным мышлением, но ручной режим устарел.

  • Перейдите на output_config.format: Если вы используете структурированные выводы, обновите output_format={...} на output_config={"format": {...}}. Старый параметр остаётся функциональным, но устарел и будет удалён в будущем выпуске модели.

  • Обновите версии инструментов

    

    Это критическое изменение при миграции с моделей Claude 3.x.

    Обновитесь до последних версий инструментов. Удалите любой код, использующий команду undo_edit.

    # До
    tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
    
    # После
    tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]
    • Текстовый редактор: Используйте text_editor_20250728 и str_replace_based_edit_tool. Подробности см. в документации по инструменту текстового редактора.
    • Выполнение кода: Обновитесь до code_execution_20250825. Инструкции по миграции см. в документации по инструменту выполнения кода.
  • Обрабатывайте причину остановки refusal

    Обновите ваше приложение для обработки причин остановки refusal:

    Python
    response = client.messages.create(...)
    
    if response.stop_reason == "refusal":
        # Обработайте отказ соответствующим образом
        pass
  • Обрабатывайте причину остановки model_context_window_exceeded

    Модели Claude 4.5+ возвращают причину остановки model_context_window_exceeded, когда генерация останавливается из-за достижения лимита контекстного окна, а не запрошенного лимита max_tokens. Обновите ваше приложение для обработки этой новой причины остановки:

    Python
    response = client.messages.create(...)
    
    if response.stop_reason == "model_context_window_exceeded":
        # Обработайте ограничение контекстного окна соответствующим образом
        pass
  • Проверьте обработку параметров инструментов (завершающие переводы строк)

    Модели Claude 4.5+ сохраняют завершающие переводы строк в строковых параметрах вызовов инструментов, которые ранее удалялись. Если ваши инструменты полагаются на точное сопоставление строк с параметрами вызовов инструментов, убедитесь, что ваша логика корректно обрабатывает завершающие переводы строк.

  • Обновите подсказки с учётом изменений поведения

    Модели Claude 4+ имеют более лаконичный, прямой стиль общения и требуют явных указаний. Ознакомьтесь с лучшими практиками составления подсказок для рекомендаций по оптимизации.

  • fine-grained-tool-streaming-2025-05-14
  • Удалите бета-заголовок interleaved-thinking-2025-05-14 (адаптивное мышление включает чередующееся мышление автоматически)
  • Перейдите с output_format на output_config.format (если применимо)
  • При миграции с Claude 4.1 или более ранних версий: удалите temperature, top_p и top_k (значения, отличные от значений по умолчанию, возвращают 400 в Opus 4.7)
  • При миграции с Claude 4.1 или более ранних версий: обновите версии инструментов (text_editor_20250728, code_execution_20250825)
  • При миграции с Claude 4.1 или более ранних версий: обрабатывайте причину остановки refusal
  • При миграции с Claude 4.1 или более ранних версий: обрабатывайте причину остановки model_context_window_exceeded
  • При миграции с Claude 4.1 или более ранних версий: проверьте обработку строковых параметров инструментов на предмет завершающих переводов строк
  • При миграции с Claude 4.1 или более ранних версий: удалите устаревшие бета-заголовки (token-efficient-tools-2025-02-19, output-128k-2025-02-19)
  • Проверьте и обновите подсказки в соответствии с лучшими практиками составления подсказок
  • Протестируйте в среде разработки перед развёртыванием в продакшене
  • Продолжения (возобновление прерванных ответов): Переместите продолжение в сообщение пользователя: «Твой предыдущий ответ был прерван и закончился на [previous_response]. Продолжи с того места, где остановился.»

  • Гидратация контекста / согласованность роли (обновление контекста в длинных разговорах): Вставляйте то, что ранее было предзаполненными напоминаниями ассистента, в ход пользователя вместо этого.

  • Экранирование JSON в параметрах инструментов может отличаться

    

    Это критическое изменение при миграции с Sonnet 4.5 или более ранних версий.

    Экранирование строк JSON в параметрах инструментов может отличаться от предыдущих моделей. Стандартные JSON-парсеры обрабатывают это автоматически, но пользовательский разбор на основе строк может потребовать обновления.

  • Обновите подсказки с учётом изменений поведения

    Модели Claude 4 имеют более лаконичный, прямой стиль общения. Ознакомьтесь с лучшими практиками составления подсказок для рекомендаций по оптимизации.

    response = client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=8192,
        output_config={"effort": "low"},
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
    response = client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=64000,
        thinking={"type": "adaptive"},
        output_config={"effort": "medium"},
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
    response = client.beta.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=16384,
        thinking={"type": "enabled", "budget_tokens": 16384},
        output_config={"effort": "medium"},
        betas=["interleaved-thinking-2025-05-14"],
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
    response = client.beta.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=8192,
        thinking={"type": "enabled", "budget_tokens": 16384},
        output_config={"effort": "low"},
        betas=["interleaved-thinking-2025-05-14"],
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
  • Обрабатывайте новую причину остановки refusal в вашем приложении
  • Удалите бета-заголовок fine-grained-tool-streaming-2025-05-14 (теперь общедоступен)
  • Перейдите с output_format на output_config.format
  • Проверьте и обновите подсказки в соответствии с лучшими практиками составления подсказок
  • Рекомендуется: Перейдите с thinking: {type: "enabled", budget_tokens: N} на thinking: {type: "adaptive"} с параметром effort (budget_tokens устарел и будет удалён в будущем выпуске)
  • Протестируйте в среде разработки перед развёртыванием в продакшене
  • Обновите подсказки с учётом изменений поведения

    Модели Claude 4 имеют более лаконичный, прямой стиль общения. Ознакомьтесь с лучшими практиками составления подсказок для рекомендаций по оптимизации.

  • Рассмотрите включение расширенного мышления для сложных задач рассуждения
  • Протестируйте в среде разработки перед развёртыванием в продакшене
  • Обновите подсказки с учётом изменений поведения

    Модели Claude 4 имеют более лаконичный, прямой стиль общения. Ознакомьтесь с лучшими практиками составления подсказок для рекомендаций по оптимизации.

    лучшими практиками составления подсказок
  • Рассмотрите включение расширенного мышления для сложных задач рассуждения
  • Протестируйте в среде разработки перед развёртыванием в продакшене