Loading...
  • Разработка
  • Администрирование
  • Модели и цены
  • Клиентские SDK
  • Справочник API
Search...
⌘K
Модели
Обзор моделейВыбор моделиЧто нового в Claude Opus 4.7Руководство по миграцииУстаревание моделейКарточки моделейСистемные промпты
Цены
Цены
Log in
Руководство по миграции
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Модели и цены/Модели

Руководство по миграции

Руководство по миграции на модели Claude Opus 4.7 и Claude 4.6 с предыдущих версий Claude

Was this page helpful?

  • Миграция на Claude Opus 4.7
  • Обновите имя вашей модели
  • Критические изменения
  • Выбор уровня усилий
  • Изменения поведения
  • Рекомендуемые изменения
  • Контрольный список миграции
  • Миграция на Claude Opus 4.7 с Opus 4.5 или более ранней версии
  • Обновите имя вашей модели
  • Критические изменения
  • Рекомендуемые изменения
  • Миграция с Claude 4.1 или более ранней версии
  • Контрольный список миграции (с Opus 4.5 или более ранней версии)
  • Миграция на Claude Sonnet 4.6
  • Критические изменения
  • Рекомендуемые изменения
  • Миграция с Sonnet 4.5
  • Контрольный список миграции Sonnet 4.6
  • Миграция на Claude Sonnet 4.5
  • Критические изменения
  • Контрольный список миграции Sonnet 4.5
  • Миграция на Claude Haiku 4.5
  • Критические изменения
  • Контрольный список миграции Haiku 4.5
  • Получить помощь

Это руководство охватывает миграцию кода Messages API. Если вы используете Claude Managed Agents, никаких изменений, кроме обновления имени модели, не требуется.

Миграция на Claude Opus 4.7

Claude Opus 4.7 — это наша самая мощная доступная модель на сегодняшний день. Она обладает высокой автономностью и исключительно хорошо работает с долгосрочными агентскими задачами, работой со знаниями, задачами зрения и задачами памяти. Claude Opus 4.7 должна показывать сильную производительность из коробки на существующих подсказках и оценках Claude Opus 4.6 при той же цене $5 / $25 за MTok, но есть несколько поведенческих и API изменений, о которых стоит знать при миграции. Она поддерживает тот же набор функций, что и Claude Opus 4.6, включая окно контекста в 1M токенов при стандартном ценообразовании API без премии за длинный контекст, максимум 128k выходных токенов, адаптивное мышление, кэширование подсказок, пакетную обработку, Files API, поддержку PDF, зрение и полный набор инструментов на стороне сервера и клиента (bash, выполнение кода, компьютерное использование, текстовый редактор, веб-поиск, веб-выборка, MCP коннектор, память).

Автоматизируйте эту миграцию с помощью Claude API skill. В Claude Code запустите /claude-api migrate для вызова встроенного Claude API skill:

/claude-api migrate this project to claude-opus-4-7

Skill применяет замену ID модели, изменения критических параметров, замену prefill и калибровку усилий, описанные ниже, по всей вашей кодовой базе, а затем создает контрольный список элементов для проверки вручную. Он просит вас подтвердить область миграции (весь рабочий каталог, подкаталог или определенный список файлов) перед редактированием любых файлов.

Обновите имя вашей модели

# Миграция Opus
model = "claude-opus-4-6"  # До
model = "claude-opus-4-7"  # После

Критические изменения

  1. Расширенное мышление удалено: thinking: {type: "enabled", budget_tokens: N} больше не поддерживается на Claude Opus 4.7 или более поздних моделях и возвращает ошибку 400. Переключитесь на адаптивное мышление (thinking: {type: "adaptive"}) и используйте параметр effort для управления глубиной мышления. Адаптивное мышление отключено по умолчанию на Claude Opus 4.7: запросы без поля thinking выполняются без мышления, что соответствует поведению Opus 4.6. Установите thinking: {type: "adaptive"} явно, чтобы включить его.

    До (Claude Opus 4.6):

    client.messages.create(
        model="claude-opus-4-6",
        max_tokens=64000,
        thinking={"type": "enabled", "budget_tokens": 32000},
        messages=[{"role": "user", "content": "..."}],
    )

Выбор уровня усилий

Параметр effort позволяет вам настроить интеллект Claude в сравнении с расходом токенов, компромиссно обменивая возможность на более быструю скорость и более низкие затраты. Начните с нового уровня усилий xhigh для кодирования и агентских вариантов использования и используйте минимум high усилий для большинства случаев использования, чувствительных к интеллекту. Экспериментируйте с другими уровнями усилий, чтобы дополнительно настроить использование токенов и интеллект:

  • max: Максимальные усилия могут обеспечить прирост производительности в некоторых случаях использования, но могут показать убывающую отдачу от увеличенного использования токенов. Этот параметр также иногда может быть подвержен переусложнению. Мы рекомендуем тестировать максимальные усилия для задач, требующих высокого интеллекта.
  • xhigh (новое): Очень высокие усилия — это лучший параметр для большинства случаев кодирования и агентского использования.
  • high: Этот параметр балансирует использование токенов и интеллект. Для большинства случаев использования, чувствительных к интеллекту, мы рекомендуем минимум high усилий.
  • medium: Хорошо для случаев использования, чувствительных к затратам, которым необходимо снизить использование токенов, компромиссно обменивая интеллект.
  • low: Зарезервируйте для коротких, ограниченных задач и рабочих нагрузок, чувствительных к задержкам, которые не требуют высокого интеллекта.

Мы ожидаем, что усилия будут более важны для этой модели, чем для любого предыдущего Opus, и рекомендуем активно экспериментировать с ними при обновлении.

Изменения поведения

Claude Opus 4.7 имеет несколько поведенческих отличий от Claude Opus 4.6, которые не являются критическими изменениями API, но могут потребовать обновления подсказок или удаления строительных лесов.

  1. Длина ответа варьируется в зависимости от варианта использования: Claude Opus 4.7 калибрует длину ответа в зависимости от того, насколько сложной она судит задачу, а не по умолчанию на фиксированную многословность. Это обычно означает более короткие ответы на простые поиски и намного более длинные на открытый анализ. Если ваш продукт зависит от определенного стиля или многословности вывода, вам может потребоваться настроить ваши подсказки. Например, чтобы уменьшить многословность, вы можете добавить: "Предоставляйте краткие, сосредоточенные ответы. Пропускайте несущественный контекст и держите примеры минимальными." Если вы видите конкретные примеры видов многословности (т.е. чрезмерное объяснение), вы можете добавить дополнительные инструкции в вашу подсказку, чтобы их предотвратить. Положительные примеры, показывающие, как Claude может общаться с надлежащим уровнем краткости, обычно более эффективны, чем отрицательные примеры или инструкции, которые говорят модели, что не делать.

  2. Более буквальное следование инструкциям: Claude Opus 4.7 интерпретирует подсказки более буквально и явно, чем Claude Opus 4.6, особенно на более низких уровнях усилий. Она не будет молча обобщать инструкцию с одного элемента на другой и не будет делать выводы о запросах, которые вы не делали. Положительная сторона этого буквализма — точность и меньше суеты. Она обычно работает лучше для случаев использования API с тщательно настроенными подсказками, структурированной экстракцией и конвейерами, где вы хотите предсказуемое поведение. Обзор подсказки и привязки может быть особенно полезен для миграции на Claude Opus 4.7.

  3. Более прямой тон: Как и в случае с любой новой моделью, стиль прозы при длинной письменной работе может измениться. Claude Opus 4.7 более прямолинейна и категорична, с меньшей ориентацией на валидацию и меньшим количеством эмодзи, чем более теплый стиль Claude Opus 4.6. Если ваш продукт полагается на определенный голос, переоцените стиль подсказок в сравнении с новой базовой линией.

Рекомендуемые изменения

Они не требуются, но улучшат ваш опыт:

  1. Переоцените max_tokens: Поскольку один и тот же текст производит более высокий подсчет токенов на Claude Opus 4.7, мы предлагаем обновить ваши параметры max_tokens, чтобы дать дополнительное пространство, включая триггеры сжатия. Вмешательства в подсказки, task_budget и effort могут помочь контролировать затраты и обеспечить надлежащее использование токенов.

  2. Проверьте ожидания подсчета токенов: Любой путь кода, который оценивает токены на стороне клиента или предполагает фиксированное соотношение токен-символ, должен быть повторно протестирован на Claude Opus 4.7. Используйте конечную точку подсчета токенов для проверки.

  3. Примите бюджеты задач (бета): Claude Opus 4.7 вводит бюджеты задач. Эти бюджеты позволяют вам информировать Claude о том, сколько токенов у него есть для полного агентского цикла, включая мышление, вызовы инструментов, результаты инструментов и окончательный вывод. Модель видит обратный отсчет и использует его для приоритизации работы и корректного завершения задачи по мере расходования бюджета. Чтобы использовать, установите бета-заголовок task-budgets-2026-03-13 и добавьте следующее в вашу конфигурацию вывода:

Контрольный список миграции

  • Обновите имя модели с claude-opus-4-6 на claude-opus-4-7 (или обновите псевдонимы).
  • Удалите temperature, top_p и top_k из полезных нагрузок запроса.
  • Замените thinking: {type: "enabled", budget_tokens: N} на thinking: {type: "adaptive"} плюс параметр effort.
  • Удалите любые prefill сообщений помощника.
  • Если ваш UI отображает содержимое мышления, явно согласитесь на обобщение мышления.
  • Переоцените сквозную стоимость и задержку при обновленной токенизации.
  • Переустановите для учета обновленной токенизации.

Миграция на Claude Opus 4.7 с Opus 4.5 или более ранней версии

Если вы мигрируете с Claude Opus 4.5, Opus 4.1 или более ранней модели непосредственно на Claude Opus 4.7, примените все изменения Opus 4.7 выше плюс кумулятивные изменения в этом разделе, которые вступили в силу между Opus 4.5 и Opus 4.7. Если вы мигрируете с Opus 4.6, вам нужен только раздел Opus 4.7 выше.

Обновите имя вашей модели

# Миграция Opus
model = "claude-opus-4-5"  # До
model = "claude-opus-4-7"  # После

Критические изменения

  1. Удаление prefill рассматривается в критических изменениях Opus 4.7 выше.

  2. Цитирование параметров инструмента: Claude Opus 4.6 и более поздние модели могут производить немного другое экранирование строк JSON в аргументах вызова инструмента (например, различная обработка экранирования Unicode или экранирования прямой косой черты). Если вы анализируете input вызова инструмента как необработанную строку, а не используете парсер JSON, проверьте вашу логику анализа. Стандартные парсеры JSON (такие как json.loads() или JSON.parse()) автоматически обрабатывают эти различия.

Рекомендуемые изменения

Эти изменения улучшают ваш опыт на Opus 4.7. Элементы, отмеченные (требуется на Opus 4.7), были дополнительными рекомендациями при запуске Opus 4.6, но теперь являются обязательными; остальные остаются рекомендуемыми.

  1. Мигрируйте на адаптивное мышление (требуется на Opus 4.7): thinking: {type: "enabled", budget_tokens: N} возвращает ошибку 400 на Claude Opus 4.7. Переключитесь на thinking: {type: "adaptive"} и используйте параметр effort для управления глубиной мышления. Подробнее см. в разделе Адаптивное мышление.

Миграция с Claude 4.1 или более ранней версии

Если вы мигрируете с Opus 4.1, Sonnet 4 (устарел) или более ранних моделей непосредственно на Claude Opus 4.7, примените изменения Claude Opus 4.7 в верхней части этого руководства и кумулятивные изменения выше плюс дополнительные изменения в этом разделе.

# С Opus 4.1
model = "claude-opus-4-1-20250805"  # До
model = "claude-opus-4-7"  # После

# С Sonnet 4
model = "claude-sonnet-4-20250514"  # До
model = "claude-opus-4-7"  # После

# С Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # До
model = "claude-opus-4-7"  # После

Дополнительные критические изменения

  1. Удалите параметры выборки

    Это критическое изменение при миграции с моделей Claude 3.x.

    Начиная с Claude Opus 4.7, установка temperature, top_p или top_k на любое значение, отличное от значения по умолчанию, вернет ошибку 400. Самый безопасный путь миграции — полностью опустить эти параметры из запросов и использовать подсказки для направления поведения модели. Если вы использовали temperature = 0 для детерминизма, имейте в виду, что это никогда не гарантировало идентичные выходные данные.

    Python
    # До - Это вызовет ошибку в моделях Claude 4+
    response = client.messages.create(
        model="claude-3-7-sonnet-20250219",
        temperature=0.7,
        top_p=0.9,  # Параметры выборки, отличные от значения по умолчанию, возвращают 400 на Opus 4.7
        # ...
    )
    
    # После
    response = client.messages.create(
        model="claude-opus-4-7",
        # ...
    )

Дополнительные рекомендуемые изменения

  • Удалите устаревшие бета-заголовки: Удалите token-efficient-tools-2025-02-19 и output-128k-2025-02-19. Все модели Claude 4+ имеют встроенное эффективное использование инструментов по токенам, и эти заголовки не имеют никакого эффекта.

Контрольный список миграции (с Opus 4.5 или более ранней версии)

  • Обновите ID модели на claude-opus-4-7
  • Примените все критические изменения Opus 4.7 (расширенное мышление удалено, параметры выборки удалены, отображение мышления опущено по умолчанию, обновленная токенизация)
  • КРИТИЧЕСКОЕ: Удалите prefill сообщений помощника (возвращает ошибку 400); используйте вместо этого структурированные выходные данные или output_config.format
  • КРИТИЧЕСКОЕ на Opus 4.7: Замените thinking: {type: "enabled", budget_tokens: N} на thinking: {type: "adaptive"} плюс параметр effort (возвращает ошибку 400 на Opus 4.7)
  • Проверьте, что анализ JSON вызова инструмента использует стандартный парсер JSON
  • Удалите бета-заголовок effort-2025-11-24 (усилие теперь GA)
  • Удалите бета-заголовок

Миграция на Claude Sonnet 4.6

Claude Sonnet 4.6 сочетает сильный интеллект с быстрой производительностью, отличаясь улучшенными возможностями агентского поиска и бесплатным выполнением кода при использовании с веб-поиском или веб-выборкой. Это идеально подходит для повседневного кодирования, анализа и задач создания контента.

Полный обзор возможностей см. в обзоре моделей.

Цена Sonnet 4.6 составляет $3 за миллион входных токенов, $15 за миллион выходных токенов. Подробнее см. в ценообразовании Claude.

Обновите имя вашей модели:

# С Sonnet 4.5
model = "claude-sonnet-4-5"  # До
model = "claude-sonnet-4-6"  # После

# С Sonnet 4
model = "claude-sonnet-4-20250514"  # До
model = "claude-sonnet-4-6"  # После

Критические изменения

При миграции с Sonnet 4.5

  1. Предзаполнение сообщений ассистента больше не поддерживается

    Это критическое изменение при миграции с Sonnet 4.5 или более ранней версии.

    Предзаполнение сообщений ассистента возвращает ошибку 400 на Sonnet 4.6. Используйте структурированные выходные данные, инструкции системного промпта или output_config.format вместо этого.

    Распространённые случаи использования предзаполнения и миграции:

    • Управление форматированием выходных данных (принудительный вывод JSON/YAML): Используйте структурированные выходные данные или инструменты с полями enum для задач классификации.

    • Исключение преамбул (удаление фраз типа "Вот..."): Добавьте прямые инструкции в системный промпт: "Отвечайте напрямую без преамбулы. Не начинайте с фраз типа 'Вот...', 'На основе...', и т.д."

    • Избежание неправильных отказов: Claude теперь намного лучше справляется с надлежащими отказами. Чёткое формулирование в сообщении пользователя без предзаполнения должно быть достаточным.

При миграции с Claude 3.x

  1. Обновите параметры выборки

    Это критическое изменение при миграции с моделей Claude 3.x.

    Используйте только temperature ИЛИ top_p, но не оба одновременно.

  2. Обновите версии инструментов

    Это критическое изменение при миграции с моделей Claude 3.x.

    Обновитесь до последних версий инструментов (text_editor_20250728, code_execution_20250825). Удалите любой код, использующий команду undo_edit.

  3. Обработайте причину остановки refusal

    Обновите своё приложение, чтобы обработать причины остановки refusal.

Рекомендуемые изменения

  1. Удалите заголовок бета-версии fine-grained-tool-streaming-2025-05-14: Потоковая передача инструментов с точной настройкой теперь GA на Sonnet 4.6 и больше не требует заголовка бета-версии.
  2. Перенесите output_format на output_config.format: Параметр output_format устарел. Используйте output_config.format вместо этого.

Миграция с Sonnet 4.5

Рассмотрите возможность миграции с Sonnet 4.5 на Sonnet 4.6, который обеспечивает большую интеллектуальность по той же цене.

Sonnet 4.6 по умолчанию устанавливает уровень усилий на high, в отличие от Sonnet 4.5, который не имел параметра усилий. Рассмотрите возможность корректировки параметра усилий при миграции с Sonnet 4.5 на Sonnet 4.6. Если не установлено явно, вы можете испытать более высокую задержку с уровнем усилий по умолчанию.

Если вы не используете расширенное мышление

Если вы не используете расширенное мышление на Sonnet 4.5, вы можете продолжить без него на Sonnet 4.6. Вы должны явно установить усилие на уровень, подходящий для вашего случая использования. При low усилии с отключённым мышлением вы можете ожидать аналогичной или лучшей производительности по сравнению с Sonnet 4.5 без расширенного мышления.

Если вы используете расширенное мышление

Если вы используете расширенное мышление с budget_tokens на Sonnet 4.5, оно всё ещё функционально на Sonnet 4.6, но устарело. Перенесите на адаптивное мышление с параметром усилий.

Миграция на адаптивное мышление

Адаптивное мышление — это рекомендуемая замена budget_tokens на Sonnet 4.6. Оно особенно хорошо подходит для следующих паттернов рабочей нагрузки:

  • Автономные многошаговые агенты: агенты кодирования, которые превращают требования в рабочее программное обеспечение, конвейеры анализа данных и поиск ошибок, где модель работает независимо на протяжении многих шагов. Адаптивное мышление позволяет модели калибровать своё рассуждение на каждом шаге, оставаясь на пути на более длительных траекториях. Для этих рабочих нагрузок начните с high усилия. Если задержка или использование токенов вызывает беспокойство, уменьшите до medium.
  • Агенты компьютерного использования: Sonnet 4.6 достиг лучшей в своём классе точности на оценках компьютерного использования, используя адаптивный режим.
  • Бимодальные рабочие нагрузки: смесь простых и сложных задач, где адаптивное мышление пропускает размышления на простых запросах и глубоко рассуждает на сложных.

При использовании адаптивного мышления оцените medium и high усилие на ваших задачах. Правильный уровень зависит от компромисса вашей рабочей нагрузки между качеством, задержкой и использованием токенов.

Если вы видите непоследовательное поведение или регрессию качества с адаптивным мышлением, попробуйте снизить параметр усилий или сначала использовать max_tokens как жёсткий лимит. Расширенное мышление с budget_tokens всё ещё функционально на Sonnet 4.6, но устарело и больше не рекомендуется.

Сохранение budget_tokens во время миграции

Если вам нужно временно сохранить budget_tokens во время миграции, бюджет около 16k токенов обеспечивает место для более сложных проблем без риска неконтролируемого использования токенов. Эта конфигурация устарела и будет удалена в будущем выпуске модели.

Случаи использования кодирования и агентов

Для агентского кодирования, дизайна фронтенда, рабочих процессов с большим количеством инструментов и сложных корпоративных рабочих процессов начните с medium усилия. Если вы обнаружите, что задержка слишком высока, рассмотрите возможность снижения усилия до low. Если вам нужна более высокая интеллектуальность, рассмотрите возможность увеличения усилия до high или миграции на Opus 4.7.

Случаи использования чата и некодирования

Для чата, создания контента, поиска, классификации и других задач, не связанных с кодированием, начните с low усилия с расширенным мышлением. Если вам нужна большая глубина, увеличьте усилие до medium.

Контрольный список миграции Sonnet 4.6

  • Обновите ID модели на claude-sonnet-4-6
  • КРИТИЧЕСКОЕ: Удалите предзаполнение сообщений ассистента; используйте структурированные выходные данные или output_config.format вместо этого
  • КРИТИЧЕСКОЕ: Проверьте, что парсинг JSON параметров инструмента обрабатывает различия в экранировании
  • КРИТИЧЕСКОЕ: Обновите версии инструментов до последних (text_editor_20250728, code_execution_20250825); устаревшие версии не поддерживаются (если миграция с 3.x)
  • КРИТИЧЕСКОЕ: Удалите любой код, использующий команду undo_edit (если применимо)
  • КРИТИЧЕСКОЕ: Обновите параметры выборки, чтобы использовать только temperature ИЛИ top_p, но не оба (если миграция с 3.x)

Миграция на Claude Sonnet 4.5

Claude Sonnet 4.5 сочетает сильный интеллект с быстрой производительностью, что делает его идеальным для повседневного кодирования, анализа и задач создания контента.

Полный обзор возможностей см. в обзоре моделей.

Цены Sonnet 4.5 составляют $3 за миллион входных токенов, $15 за миллион выходных токенов. Подробности см. в ценах Claude.

Обновите имя модели:

# С Sonnet 4
model = "claude-sonnet-4-20250514"  # До
model = "claude-sonnet-4-5-20250929"  # После

# С Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # До
model = "claude-sonnet-4-5-20250929"  # После

Критические изменения

Эти критические изменения применяются при миграции с моделей Claude 3.x Sonnet.

  1. Обновите параметры выборки

    Это критическое изменение при миграции с моделей Claude 3.x.

    Используйте только temperature ИЛИ top_p, но не оба одновременно.

  2. Обновите версии инструментов

    Это критическое изменение при миграции с моделей Claude 3.x.

    Обновитесь до последних версий инструментов (text_editor_20250728, code_execution_20250825). Удалите любой код, использующий команду undo_edit.

  3. Обработайте причину остановки refusal

    Обновите своё приложение, чтобы обработать причины остановки refusal.

Контрольный список миграции Sonnet 4.5

  • Обновите ID модели на claude-sonnet-4-5-20250929
  • КРИТИЧЕСКОЕ: Обновите версии инструментов до последних (text_editor_20250728, code_execution_20250825); устаревшие версии не поддерживаются (если миграция с 3.x)
  • КРИТИЧЕСКОЕ: Удалите любой код, использующий команду undo_edit (если применимо)
  • КРИТИЧЕСКОЕ: Обновите параметры выборки, чтобы использовать только temperature ИЛИ top_p, но не оба (если миграция с 3.x)
  • Обработайте новую причину остановки refusal в вашем приложении
  • Просмотрите и обновите промпты, следуя лучшим практикам промптинга

Миграция на Claude Haiku 4.5

Claude Haiku 4.5 — это самый быстрый и самый интеллектуальный модель Haiku с производительностью, близкой к границе, обеспечивающий качество премиум-модели для интерактивных приложений и высокообъёмной обработки.

Полный обзор возможностей см. в обзоре моделей.

Цены Haiku 4.5 составляют $1 за миллион входных токенов, $5 за миллион выходных токенов. Подробности см. в ценах Claude.

Обновите имя модели:

# С Haiku 3.5
model = "claude-3-5-haiku-20241022"  # До
model = "claude-haiku-4-5-20251001"  # После

# С Haiku 3
model = "claude-3-haiku-20240307"  # До
model = "claude-haiku-4-5-20251001"  # После

Просмотрите новые ограничения скорости: Haiku 4.5 имеет отдельные ограничения скорости от Haiku 3.5 и Haiku 3. Подробности см. в документации по ограничениям скорости.

Для значительного улучшения производительности при задачах кодирования и рассуждения рассмотрите возможность включения расширенного мышления с thinking: {type: "enabled", budget_tokens: N}.

Расширенное мышление влияет на эффективность кэширования промпта.

Расширенное мышление устарело в Claude 4.6 или более новых моделях. Если вы используете более новые модели, используйте адаптивное мышление вместо этого.

Изучите новые возможности: Подробности см. в обзоре моделей о контекстной осведомлённости, увеличенной ёмкости выходных данных (64k токенов), более высокой интеллектуальности и улучшенной скорости.

Критические изменения

Эти критические изменения применяются при миграции с моделей Claude 3.x Haiku.

  1. Обновите параметры выборки

    Это критическое изменение при миграции с моделей Claude 3.x.

    Используйте только temperature ИЛИ top_p, но не оба одновременно.

  2. Обновите версии инструментов

    Это критическое изменение при миграции с моделей Claude 3.x.

    Обновитесь до последних версий инструментов (text_editor_20250728, code_execution_20250825). Удалите любой код, использующий команду undo_edit.

  3. Обработайте причину остановки refusal

    Обновите своё приложение, чтобы обработать причины остановки refusal.

Контрольный список миграции Haiku 4.5

  • Обновите ID модели на claude-haiku-4-5-20251001
  • КРИТИЧЕСКОЕ: Обновите версии инструментов до последних (text_editor_20250728, code_execution_20250825); устаревшие версии не поддерживаются
  • КРИТИЧЕСКОЕ: Удалите любой код, использующий команду undo_edit (если применимо)
  • КРИТИЧЕСКОЕ: Обновите параметры выборки, чтобы использовать только temperature ИЛИ top_p, но не оба
  • Обработайте новую причину остановки refusal в вашем приложении
  • Просмотрите и отрегулируйте для новых ограничений скорости (отдельно от Haiku 3.5)
  • Просмотрите и обновите промпты, следуя

Получить помощь

  • Проверьте документацию API для подробных спецификаций
  • Просмотрите возможности моделей для сравнения производительности
  • Просмотрите примечания к выпуску API для обновлений API
  • Свяжитесь с поддержкой, если вы столкнулись с какими-либо проблемами во время миграции

После (Claude Opus 4.7):

client.messages.create(
    model="claude-opus-4-7",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "high"},  # или "max", "xhigh", "medium", "low"
    messages=[{"role": "user", "content": "..."}],
)

Адаптивное мышление можно управлять через подсказки. Для рекомендаций по настройке, когда модель переусложняет или недостаточно думает, см. Калибровка усилий и глубины мышления.

  • Параметры выборки удалены: Установка temperature, top_p или top_k на любое значение, отличное от значения по умолчанию, на Claude Opus 4.7 возвращает ошибку 400. Самый безопасный путь миграции — полностью опустить эти параметры из полезных нагрузок запроса. Подсказка — это рекомендуемый способ направить поведение модели на Claude Opus 4.7. Если вы использовали temperature = 0 для детерминизма, имейте в виду, что это никогда не гарантировало идентичные выходные данные на предыдущих моделях.

  • Содержимое мышления опущено по умолчанию: Блоки мышления по-прежнему появляются в потоке ответов на Claude Opus 4.7, но их поле thinking пусто, если вы явно не согласитесь. Это молчаливое изменение от Claude Opus 4.6, где по умолчанию возвращался обобщенный текст мышления. Чтобы восстановить обобщенное содержимое мышления на Claude Opus 4.7, установите thinking.display на "summarized":

    thinking = {
        "type": "adaptive",
        "display": "summarized",
    }

    По умолчанию используется "omitted" на Claude Opus 4.7. Если ваш продукт транслирует рассуждения пользователям, новое значение по умолчанию выглядит как длительная пауза перед началом вывода; установите display: "summarized", чтобы восстановить видимый прогресс во время мышления. Подробнее см. в разделе Расширенное мышление.

  • Обновленный подсчет токенов: Claude Opus 4.7 использует новый токенизатор, способствующий его улучшенной производительности на широком спектре задач. Этот новый токенизатор может использовать примерно в 1x до 1.35x больше токенов при обработке текста по сравнению с предыдущими моделями (до ~35% больше, в зависимости от содержимого), и /v1/messages/count_tokens вернет другое количество токенов для Claude Opus 4.7, чем для Claude Opus 4.6. Эффективность токенов Claude Opus 4.7 может варьироваться в зависимости от формы рабочей нагрузки. Вмешательства в подсказки, task_budget и effort могут помочь контролировать затраты и обеспечить надлежащее использование токенов. Имейте в виду, что эти элементы управления могут компромиссно влиять на интеллект модели. Мы предлагаем обновить ваши параметры max_tokens, чтобы дать дополнительное пространство, включая триггеры сжатия. Claude Opus 4.7 предоставляет окно контекста в 1M при стандартном ценообразовании API без премии за длинный контекст.

  • Удаление prefill (перенесено из Opus 4.6): Предварительное заполнение сообщений помощника возвращает ошибку 400 на Claude Opus 4.7. Используйте вместо этого структурированные выходные данные, инструкции системной подсказки или output_config.format.

  • Встроенные обновления прогресса в агентских трассах: Claude Opus 4.7 предоставляет более регулярные, высокого качества обновления пользователю на протяжении длинных агентских трасс. Если вы добавили строительные леса для принудительных промежуточных сообщений о статусе ("После каждых 3 вызовов инструмента суммируйте прогресс"), попробуйте их удалить. Если вы обнаружите, что длина или содержание обновлений Claude Opus 4.7, обращенных к пользователю, не хорошо откалиброваны для вашего варианта использования, явно опишите, как должны выглядеть эти обновления в подсказке, и предоставьте примеры.

  • Меньше подагентов порождается по умолчанию: Claude Opus 4.7 имеет тенденцию порождать меньше подагентов по умолчанию. Однако это поведение можно управлять через подсказки; дайте Claude Opus 4.7 явное руководство о том, когда подагенты желательны.

  • Более строгая калибровка усилий: Значительно отличаясь от Claude Opus 4.6, Claude Opus 4.7 строго соблюдает уровни усилий, особенно на нижнем конце. При low и medium модель ограничивает свою работу тем, что было запрошено, а не выходит за рамки. Это хорошо для задержки и затрат, но на умеренно сложных задачах, работающих с low усилиями, есть некоторый риск недостаточного мышления. Если вы наблюдаете поверхностное рассуждение на сложных проблемах, повысьте усилия до high или xhigh, а не обходите это через подсказки. Если вам нужно держать усилия на low для задержки, добавьте целевое руководство: "Эта задача включает многошаговое рассуждение. Тщательно подумайте о проблеме перед ответом." См. Рекомендуемые уровни усилий для Claude Opus 4.7.

  • Меньше вызовов инструментов по умолчанию: Claude Opus 4.7 имеет тенденцию использовать инструменты реже, чем Claude Opus 4.6, и использовать рассуждения больше. Это дает лучшие результаты в большинстве случаев. Однако увеличение параметра усилий — это полезный рычаг для увеличения уровня использования инструментов, особенно в работе со знаниями. Параметры усилий high или xhigh показывают значительно больше использования инструментов в агентском поиске и кодировании. Для сценариев, где вы хотите больше использования инструментов, вы также можете отрегулировать вашу подсказку, чтобы явно инструктировать модель о том, когда и как правильно использовать свои инструменты.

  • Кибербезопасность в реальном времени: Вновь добавленные в Claude Opus 4.7, запросы, которые включают запрещенные или высокорисковые темы, могут привести к отказам. Для законной работы в области безопасности, такой как тестирование на проникновение, исследование уязвимостей или красное командование, подайте заявку на Программу кибер-верификации, чтобы запросить сниженные ограничения. Подробнее см. в разделе Защита, предупреждения и апелляции.

  • Поддержка изображений высокого разрешения: Claude Opus 4.7 — первая модель Claude с поддержкой изображений высокого разрешения, с максимальным разрешением изображения 2576 пикселей на длинном краю (вверх с 1568 пикселей на предыдущих моделях). Это разблокирует прибыль на рабочих нагрузках, интенсивных по зрению, и особенно ценно для компьютерного использования, понимания скриншотов и анализа документов. Поддержка высокого разрешения автоматическая и не требует бета-заголовка или согласия на стороне клиента. Полнораспределительные изображения могут использовать до примерно 3x больше токенов изображения, чем на предыдущих моделях (до 4,784 токенов на изображение, по сравнению с предыдущей крышкой примерно 1,600 токенов на изображение), поэтому переустановите max_tokens и ожидания затрат для рабочих нагрузок, интенсивных по изображениям, или уменьшите выборку перед отправкой, если вам не нужна дополнительная точность. Координаты указания и ограничивающего прямоугольника, возвращаемые моделью, находятся в соотношении 1

    с фактическими пикселями изображения на Claude Opus 4.7, поэтому преобразование масштабного коэффициента не требуется. Подробнее см. в разделе Поддержка изображений высокого разрешения на Claude Opus 4.7.

  • output_config = {
        "effort": "high",
        "task_budget": {"type": "tokens", "total": 128000},
    }

    Вам может потребоваться экспериментировать с различными бюджетами задач для вашего варианта использования. Если модели дан бюджет задачи, который слишком ограничен для данной задачи, она может выполнить задачу менее тщательно, ссылаясь на свой бюджет как на ограничение. Для открытых агентских задач, где качество важнее скорости, не устанавливайте бюджет задачи; зарезервируйте бюджеты задач для рабочих нагрузок, где вам нужна модель для ограничения своей работы допуском токенов. Минимальное значение для бюджета задачи — 20k токенов.

    Это не жесткая крышка; это предложение, о котором модель знает. Это отличается от max_tokens, который является жесткой крышкой на запрос для сгенерированных токенов (max_tokens не передается модели, и модель о нем не знает), в то время как task_budget — это рекомендуемая крышка по всему агентскому циклу. Используйте task_budget, когда вы хотите, чтобы модель саморегулировалась, и max_tokens как жесткий потолок на запрос для ограничения использования.

  • Установите большой max_tokens при max или xhigh усилиях: Если вы запускаете Claude Opus 4.7 при max или xhigh усилиях, установите большой бюджет максимальных выходных токенов, чтобы модель имела место для мышления и действия по своим подагентам и вызовам инструментов. Мы рекомендуем начать с 64k токенов и настроить оттуда.

  • Уменьшите выборку изображений, если высокое разрешение не требуется: Claude Opus 4.7 поддерживает изображения до 2576px / 3.75MP. Изображения высокого разрешения используют больше токенов. Если дополнительная точность изображения не требуется, уменьшите выборку изображений перед отправкой в Claude, чтобы избежать увеличения использования токенов. Подробнее см. в разделе Изображения и зрение.

  • max_tokens
  • Повторно протестируйте любые оценки подсчета токенов на стороне клиента.
  • Если ваше приложение отправляет изображения, переустановите бюджет для поддержки изображений высокого разрешения (до примерно 3x больше токенов изображения на полнораспределительное изображение). Уменьшите выборку перед отправкой, если вам не нужна дополнительная точность. Если вы потребляете координаты указания или ограничивающего прямоугольника из модели, удалите любое преобразование масштабного коэффициента; координаты находятся в соотношении 1
    с фактическими пикселями изображения на Claude Opus 4.7.
  • Проверьте подсказки на предмет изменений поведения выше (длина ответа, буквализм, тон, обновления прогресса, подагенты, калибровка усилий, запуск инструментов, кибербезопасность, обработка изображений высокого разрешения).
  • Переустановите длину ответа с удаленными существующими подсказками управления длиной, затем настройте явно.
  • Если используется xhigh или max усилия, повысьте max_tokens до минимум 64k в качестве начальной точки.
  • Рассмотрите возможность принятия бюджетов задач (бета) для агентских рабочих процессов.
  • Если ваш продукт выполняет законную работу в области безопасности, подайте заявку на Программу кибер-верификации для доступа к более низким ограничениям на кибер-контент.
  • response = client.beta.messages.create(
        model="claude-opus-4-5",
        max_tokens=16000,
        thinking={"type": "enabled", "budget_tokens": 32000},
        betas=["interleaved-thinking-2025-05-14"],
        messages=[...],
    )

    Обратите внимание, что миграция также переходит с client.beta.messages.create на client.messages.create. Адаптивное мышление и усилия — это функции GA и не требуют бета-пространства имен SDK или каких-либо бета-заголовков.

  • Удалите бета-заголовок усилий: Параметр усилий теперь GA. Удалите betas=["effort-2025-11-24"] из ваших запросов.

  • Удалите бета-заголовок потоковой передачи инструментов с точной детализацией: Потоковая передача инструментов с точной детализацией теперь GA. Удалите betas=["fine-grained-tool-streaming-2025-05-14"] из ваших запросов.

  • Удалите бета-заголовок чередующегося мышления: Адаптивное мышление автоматически включает чередующееся мышление на Claude Opus 4.7, Opus 4.6 и Sonnet 4.6. Удалите betas=["interleaved-thinking-2025-05-14"] из ваших запросов. Заголовок по-прежнему функционален на Sonnet 4.6 с ручным расширенным мышлением, но ручной режим устарел.

  • Мигрируйте на output_config.format: Если используются структурированные выходные данные, обновите output_format={...} на output_config={"format": {...}}. Старый параметр остается функциональным, но устарел и будет удален в будущем выпуске модели.

  • Обновите версии инструментов

    Это критическое изменение при миграции с моделей Claude 3.x.

    Обновите до последних версий инструментов. Удалите любой код, использующий команду undo_edit.

    # До
    tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
    
    # После
    tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]
    • Текстовый редактор: Используйте text_editor_20250728 и str_replace_based_edit_tool. Подробнее см. в документации инструмента текстового редактора.
    • Выполнение кода: Обновите до code_execution_20250825. Подробнее см. в документации инструмента выполнения кода для инструкций по миграции.
  • Обработайте причину остановки refusal

    Обновите ваше приложение для обработки причин остановки refusal:

    Python
    response = client.messages.create(...)
    
    if response.stop_reason == "refusal":
        # Обработайте отказ надлежащим образом
        pass
  • Обработайте причину остановки model_context_window_exceeded

    Модели Claude 4.5+ возвращают причину остановки model_context_window_exceeded, когда генерация останавливается из-за достижения предела окна контекста, а не запрошенного предела max_tokens. Обновите ваше приложение для обработки этой новой причины остановки:

    Python
    response = client.messages.create(...)
    
    if response.stop_reason == "model_context_window_exceeded":
        # Обработайте предел окна контекста надлежащим образом
        pass
  • Проверьте обработку параметров инструмента (конечные новые строки)

    Модели Claude 4.5+ сохраняют конечные новые строки в параметрах строк вызова инструмента, которые ранее были удалены. Если ваши инструменты полагаются на точное совпадение строк с параметрами вызова инструмента, проверьте вашу логику для правильной обработки конечных новых строк.

  • Обновите ваши подсказки для изменений поведения

    Модели Claude 4+ имеют более краткий, прямой стиль общения и требуют явного направления. Подробнее см. в лучших практиках подсказок для рекомендаций по оптимизации.

  • fine-grained-tool-streaming-2025-05-14
  • Удалите бета-заголовок interleaved-thinking-2025-05-14 (адаптивное мышление автоматически включает чередующееся мышление)
  • Мигрируйте output_format на output_config.format (если применимо)
  • Если мигрируете с Claude 4.1 или более ранней версии: удалите temperature, top_p и top_k (значения, отличные от значения по умолчанию, возвращают ошибку 400 на Opus 4.7)
  • Если мигрируете с Claude 4.1 или более ранней версии: обновите версии инструментов (text_editor_20250728, code_execution_20250825)
  • Если мигрируете с Claude 4.1 или более ранней версии: обработайте причину остановки refusal
  • Если мигрируете с Claude 4.1 или более ранней версии: обработайте причину остановки model_context_window_exceeded
  • Если мигрируете с Claude 4.1 или более ранней версии: проверьте обработку параметров строк инструмента на конечные новые строки
  • Если мигрируете с Claude 4.1 или более ранней версии: удалите устаревшие бета-заголовки (token-efficient-tools-2025-02-19, output-128k-2025-02-19)
  • Проверьте и обновите подсказки, следуя лучшим практикам подсказок
  • Протестируйте в среде разработки перед развертыванием в производство
  • Продолжения (возобновление прерванных ответов): Переместите продолжение в сообщение пользователя: "Ваш предыдущий ответ был прерван и закончился на [previous_response]. Продолжайте с того места, где вы остановились."

  • Гидратация контекста / согласованность роли (обновление контекста в длительных разговорах): Вместо этого внедрите то, что ранее было напоминаниями о предзаполненном ассистенте, в ход пользователя.

  • Экранирование JSON параметров инструмента может отличаться

    Это критическое изменение при миграции с Sonnet 4.5 или более ранней версии.

    Экранирование строк JSON в параметрах инструмента может отличаться от предыдущих моделей. Стандартные парсеры JSON обрабатывают это автоматически, но пользовательский парсинг на основе строк может потребовать обновлений.

  • Обновите ваши промпты для изменений поведения

    Модели Claude 4 имеют более лаконичный, прямой стиль общения. Ознакомьтесь с лучшими практиками промптинга для руководства по оптимизации.

    response = client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=8192,
        output_config={"effort": "low"},
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
    response = client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=64000,
        thinking={"type": "adaptive"},
        output_config={"effort": "medium"},
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
    response = client.beta.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=16384,
        thinking={"type": "enabled", "budget_tokens": 16384},
        output_config={"effort": "medium"},
        betas=["interleaved-thinking-2025-05-14"],
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
    response = client.beta.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=8192,
        thinking={"type": "enabled", "budget_tokens": 16384},
        output_config={"effort": "low"},
        betas=["interleaved-thinking-2025-05-14"],
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
  • Обработайте новую причину остановки refusal в вашем приложении
  • Удалите заголовок бета-версии fine-grained-tool-streaming-2025-05-14 (теперь GA)
  • Перенесите output_format на output_config.format
  • Просмотрите и обновите промпты, следуя лучшим практикам промптинга
  • Рекомендуется: Перенесите с thinking: {type: "enabled", budget_tokens: N} на thinking: {type: "adaptive"} с параметром усилий (budget_tokens устарел и будет удалён в будущем выпуске)
  • Протестируйте в среде разработки перед развёртыванием в производство
  • Обновите ваши промпты для изменений поведения

    Модели Claude 4 имеют более лаконичный, прямой стиль общения. Ознакомьтесь с лучшими практиками промптинга для руководства по оптимизации.

  • Рассмотрите возможность включения расширенного мышления для задач сложного рассуждения
  • Протестируйте в среде разработки перед развёртыванием в производство
  • Обновите ваши промпты для изменений поведения

    Модели Claude 4 имеют более лаконичный, прямой стиль общения. Ознакомьтесь с лучшими практиками промптинга для руководства по оптимизации.

    лучшим практикам промптинга
  • Рассмотрите возможность включения расширенного мышления для задач сложного рассуждения
  • Протестируйте в среде разработки перед развёртыванием в производство