Was this page helpful?
Это руководство охватывает миграцию кода Messages API. Если вы используете Claude Managed Agents, никаких изменений, кроме обновления имени модели, не требуется.
Claude Opus 4.7 — это наша самая мощная доступная модель на сегодняшний день. Она обладает высокой автономностью и исключительно хорошо работает с долгосрочными агентскими задачами, работой со знаниями, задачами зрения и задачами памяти. Claude Opus 4.7 должна показывать сильную производительность из коробки на существующих подсказках и оценках Claude Opus 4.6 при той же цене $5 / $25 за MTok, но есть несколько поведенческих и API изменений, о которых стоит знать при миграции. Она поддерживает тот же набор функций, что и Claude Opus 4.6, включая окно контекста в 1M токенов при стандартном ценообразовании API без премии за длинный контекст, максимум 128k выходных токенов, адаптивное мышление, кэширование подсказок, пакетную обработку, Files API, поддержку PDF, зрение и полный набор инструментов на стороне сервера и клиента (bash, выполнение кода, компьютерное использование, текстовый редактор, веб-поиск, веб-выборка, MCP коннектор, память).
Автоматизируйте эту миграцию с помощью Claude API skill. В Claude Code запустите /claude-api migrate для вызова встроенного Claude API skill:
/claude-api migrate this project to claude-opus-4-7Skill применяет замену ID модели, изменения критических параметров, замену prefill и калибровку усилий, описанные ниже, по всей вашей кодовой базе, а затем создает контрольный список элементов для проверки вручную. Он просит вас подтвердить область миграции (весь рабочий каталог, подкаталог или определенный список файлов) перед редактированием любых файлов.
# Миграция Opus
model = "claude-opus-4-6" # До
model = "claude-opus-4-7" # ПослеРасширенное мышление удалено: thinking: {type: "enabled", budget_tokens: N} больше не поддерживается на Claude Opus 4.7 или более поздних моделях и возвращает ошибку 400. Переключитесь на адаптивное мышление (thinking: {type: "adaptive"}) и используйте параметр effort для управления глубиной мышления. Адаптивное мышление отключено по умолчанию на Claude Opus 4.7: запросы без поля thinking выполняются без мышления, что соответствует поведению Opus 4.6. Установите thinking: {type: "adaptive"} явно, чтобы включить его.
До (Claude Opus 4.6):
client.messages.create(
model="claude-opus-4-6",
max_tokens=64000,
thinking={"type": "enabled", "budget_tokens": 32000},
messages=[{"role": "user", "content": "..."}],
)Параметр effort позволяет вам настроить интеллект Claude в сравнении с расходом токенов, компромиссно обменивая возможность на более быструю скорость и более низкие затраты. Начните с нового уровня усилий xhigh для кодирования и агентских вариантов использования и используйте минимум high усилий для большинства случаев использования, чувствительных к интеллекту. Экспериментируйте с другими уровнями усилий, чтобы дополнительно настроить использование токенов и интеллект:
max: Максимальные усилия могут обеспечить прирост производительности в некоторых случаях использования, но могут показать убывающую отдачу от увеличенного использования токенов. Этот параметр также иногда может быть подвержен переусложнению. Мы рекомендуем тестировать максимальные усилия для задач, требующих высокого интеллекта.xhigh (новое): Очень высокие усилия — это лучший параметр для большинства случаев кодирования и агентского использования.high: Этот параметр балансирует использование токенов и интеллект. Для большинства случаев использования, чувствительных к интеллекту, мы рекомендуем минимум high усилий.medium: Хорошо для случаев использования, чувствительных к затратам, которым необходимо снизить использование токенов, компромиссно обменивая интеллект.low: Зарезервируйте для коротких, ограниченных задач и рабочих нагрузок, чувствительных к задержкам, которые не требуют высокого интеллекта.Мы ожидаем, что усилия будут более важны для этой модели, чем для любого предыдущего Opus, и рекомендуем активно экспериментировать с ними при обновлении.
Claude Opus 4.7 имеет несколько поведенческих отличий от Claude Opus 4.6, которые не являются критическими изменениями API, но могут потребовать обновления подсказок или удаления строительных лесов.
Длина ответа варьируется в зависимости от варианта использования: Claude Opus 4.7 калибрует длину ответа в зависимости от того, насколько сложной она судит задачу, а не по умолчанию на фиксированную многословность. Это обычно означает более короткие ответы на простые поиски и намного более длинные на открытый анализ. Если ваш продукт зависит от определенного стиля или многословности вывода, вам может потребоваться настроить ваши подсказки. Например, чтобы уменьшить многословность, вы можете добавить: "Предоставляйте краткие, сосредоточенные ответы. Пропускайте несущественный контекст и держите примеры минимальными." Если вы видите конкретные примеры видов многословности (т.е. чрезмерное объяснение), вы можете добавить дополнительные инструкции в вашу подсказку, чтобы их предотвратить. Положительные примеры, показывающие, как Claude может общаться с надлежащим уровнем краткости, обычно более эффективны, чем отрицательные примеры или инструкции, которые говорят модели, что не делать.
Более буквальное следование инструкциям: Claude Opus 4.7 интерпретирует подсказки более буквально и явно, чем Claude Opus 4.6, особенно на более низких уровнях усилий. Она не будет молча обобщать инструкцию с одного элемента на другой и не будет делать выводы о запросах, которые вы не делали. Положительная сторона этого буквализма — точность и меньше суеты. Она обычно работает лучше для случаев использования API с тщательно настроенными подсказками, структурированной экстракцией и конвейерами, где вы хотите предсказуемое поведение. Обзор подсказки и привязки может быть особенно полезен для миграции на Claude Opus 4.7.
Более прямой тон: Как и в случае с любой новой моделью, стиль прозы при длинной письменной работе может измениться. Claude Opus 4.7 более прямолинейна и категорична, с меньшей ориентацией на валидацию и меньшим количеством эмодзи, чем более теплый стиль Claude Opus 4.6. Если ваш продукт полагается на определенный голос, переоцените стиль подсказок в сравнении с новой базовой линией.
Они не требуются, но улучшат ваш опыт:
Переоцените max_tokens: Поскольку один и тот же текст производит более высокий подсчет токенов на Claude Opus 4.7, мы предлагаем обновить ваши параметры max_tokens, чтобы дать дополнительное пространство, включая триггеры сжатия. Вмешательства в подсказки, task_budget и effort могут помочь контролировать затраты и обеспечить надлежащее использование токенов.
Проверьте ожидания подсчета токенов: Любой путь кода, который оценивает токены на стороне клиента или предполагает фиксированное соотношение токен-символ, должен быть повторно протестирован на Claude Opus 4.7. Используйте конечную точку подсчета токенов для проверки.
Примите бюджеты задач (бета): Claude Opus 4.7 вводит бюджеты задач. Эти бюджеты позволяют вам информировать Claude о том, сколько токенов у него есть для полного агентского цикла, включая мышление, вызовы инструментов, результаты инструментов и окончательный вывод. Модель видит обратный отсчет и использует его для приоритизации работы и корректного завершения задачи по мере расходования бюджета. Чтобы использовать, установите бета-заголовок task-budgets-2026-03-13 и добавьте следующее в вашу конфигурацию вывода:
claude-opus-4-6 на claude-opus-4-7 (или обновите псевдонимы).temperature, top_p и top_k из полезных нагрузок запроса.thinking: {type: "enabled", budget_tokens: N} на thinking: {type: "adaptive"} плюс параметр effort.Если вы мигрируете с Claude Opus 4.5, Opus 4.1 или более ранней модели непосредственно на Claude Opus 4.7, примените все изменения Opus 4.7 выше плюс кумулятивные изменения в этом разделе, которые вступили в силу между Opus 4.5 и Opus 4.7. Если вы мигрируете с Opus 4.6, вам нужен только раздел Opus 4.7 выше.
# Миграция Opus
model = "claude-opus-4-5" # До
model = "claude-opus-4-7" # ПослеУдаление prefill рассматривается в критических изменениях Opus 4.7 выше.
Цитирование параметров инструмента: Claude Opus 4.6 и более поздние модели могут производить немного другое экранирование строк JSON в аргументах вызова инструмента (например, различная обработка экранирования Unicode или экранирования прямой косой черты). Если вы анализируете input вызова инструмента как необработанную строку, а не используете парсер JSON, проверьте вашу логику анализа. Стандартные парсеры JSON (такие как json.loads() или JSON.parse()) автоматически обрабатывают эти различия.
Эти изменения улучшают ваш опыт на Opus 4.7. Элементы, отмеченные (требуется на Opus 4.7), были дополнительными рекомендациями при запуске Opus 4.6, но теперь являются обязательными; остальные остаются рекомендуемыми.
Мигрируйте на адаптивное мышление (требуется на Opus 4.7): thinking: {type: "enabled", budget_tokens: N} возвращает ошибку 400 на Claude Opus 4.7. Переключитесь на thinking: {type: "adaptive"} и используйте параметр effort для управления глубиной мышления. Подробнее см. в разделе Адаптивное мышление.
Если вы мигрируете с Opus 4.1, Sonnet 4 (устарел) или более ранних моделей непосредственно на Claude Opus 4.7, примените изменения Claude Opus 4.7 в верхней части этого руководства и кумулятивные изменения выше плюс дополнительные изменения в этом разделе.
# С Opus 4.1
model = "claude-opus-4-1-20250805" # До
model = "claude-opus-4-7" # После
# С Sonnet 4
model = "claude-sonnet-4-20250514" # До
model = "claude-opus-4-7" # После
# С Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # До
model = "claude-opus-4-7" # ПослеУдалите параметры выборки
Это критическое изменение при миграции с моделей Claude 3.x.
Начиная с Claude Opus 4.7, установка temperature, top_p или top_k на любое значение, отличное от значения по умолчанию, вернет ошибку 400. Самый безопасный путь миграции — полностью опустить эти параметры из запросов и использовать подсказки для направления поведения модели. Если вы использовали temperature = 0 для детерминизма, имейте в виду, что это никогда не гарантировало идентичные выходные данные.
# До - Это вызовет ошибку в моделях Claude 4+
response = client.messages.create(
model="claude-3-7-sonnet-20250219",
temperature=0.7,
top_p=0.9, # Параметры выборки, отличные от значения по умолчанию, возвращают 400 на Opus 4.7
# ...
)
# После
response = client.messages.create(
model="claude-opus-4-7",
# ...
)token-efficient-tools-2025-02-19 и output-128k-2025-02-19. Все модели Claude 4+ имеют встроенное эффективное использование инструментов по токенам, и эти заголовки не имеют никакого эффекта.claude-opus-4-7output_config.formatthinking: {type: "enabled", budget_tokens: N} на thinking: {type: "adaptive"} плюс параметр effort (возвращает ошибку 400 на Opus 4.7)effort-2025-11-24 (усилие теперь GA)Claude Sonnet 4.6 сочетает сильный интеллект с быстрой производительностью, отличаясь улучшенными возможностями агентского поиска и бесплатным выполнением кода при использовании с веб-поиском или веб-выборкой. Это идеально подходит для повседневного кодирования, анализа и задач создания контента.
Полный обзор возможностей см. в обзоре моделей.
Цена Sonnet 4.6 составляет $3 за миллион входных токенов, $15 за миллион выходных токенов. Подробнее см. в ценообразовании Claude.
Обновите имя вашей модели:
# С Sonnet 4.5
model = "claude-sonnet-4-5" # До
model = "claude-sonnet-4-6" # После
# С Sonnet 4
model = "claude-sonnet-4-20250514" # До
model = "claude-sonnet-4-6" # ПослеПредзаполнение сообщений ассистента больше не поддерживается
Это критическое изменение при миграции с Sonnet 4.5 или более ранней версии.
Предзаполнение сообщений ассистента возвращает ошибку 400 на Sonnet 4.6. Используйте структурированные выходные данные, инструкции системного промпта или output_config.format вместо этого.
Распространённые случаи использования предзаполнения и миграции:
Управление форматированием выходных данных (принудительный вывод JSON/YAML): Используйте структурированные выходные данные или инструменты с полями enum для задач классификации.
Исключение преамбул (удаление фраз типа "Вот..."): Добавьте прямые инструкции в системный промпт: "Отвечайте напрямую без преамбулы. Не начинайте с фраз типа 'Вот...', 'На основе...', и т.д."
Избежание неправильных отказов: Claude теперь намного лучше справляется с надлежащими отказами. Чёткое формулирование в сообщении пользователя без предзаполнения должно быть достаточным.
Обновите параметры выборки
Это критическое изменение при миграции с моделей Claude 3.x.
Используйте только temperature ИЛИ top_p, но не оба одновременно.
Обновите версии инструментов
Это критическое изменение при миграции с моделей Claude 3.x.
Обновитесь до последних версий инструментов (text_editor_20250728, code_execution_20250825). Удалите любой код, использующий команду undo_edit.
Обработайте причину остановки refusal
Обновите своё приложение, чтобы обработать причины остановки refusal.
fine-grained-tool-streaming-2025-05-14: Потоковая передача инструментов с точной настройкой теперь GA на Sonnet 4.6 и больше не требует заголовка бета-версии.output_format на output_config.format: Параметр output_format устарел. Используйте output_config.format вместо этого.Рассмотрите возможность миграции с Sonnet 4.5 на Sonnet 4.6, который обеспечивает большую интеллектуальность по той же цене.
Sonnet 4.6 по умолчанию устанавливает уровень усилий на high, в отличие от Sonnet 4.5, который не имел параметра усилий. Рассмотрите возможность корректировки параметра усилий при миграции с Sonnet 4.5 на Sonnet 4.6. Если не установлено явно, вы можете испытать более высокую задержку с уровнем усилий по умолчанию.
Если вы не используете расширенное мышление на Sonnet 4.5, вы можете продолжить без него на Sonnet 4.6. Вы должны явно установить усилие на уровень, подходящий для вашего случая использования. При low усилии с отключённым мышлением вы можете ожидать аналогичной или лучшей производительности по сравнению с Sonnet 4.5 без расширенного мышления.
Если вы используете расширенное мышление с budget_tokens на Sonnet 4.5, оно всё ещё функционально на Sonnet 4.6, но устарело. Перенесите на адаптивное мышление с параметром усилий.
Адаптивное мышление — это рекомендуемая замена budget_tokens на Sonnet 4.6. Оно особенно хорошо подходит для следующих паттернов рабочей нагрузки:
high усилия. Если задержка или использование токенов вызывает беспокойство, уменьшите до medium.При использовании адаптивного мышления оцените medium и high усилие на ваших задачах. Правильный уровень зависит от компромисса вашей рабочей нагрузки между качеством, задержкой и использованием токенов.
Если вы видите непоследовательное поведение или регрессию качества с адаптивным мышлением, попробуйте снизить параметр усилий или сначала использовать max_tokens как жёсткий лимит. Расширенное мышление с budget_tokens всё ещё функционально на Sonnet 4.6, но устарело и больше не рекомендуется.
Если вам нужно временно сохранить budget_tokens во время миграции, бюджет около 16k токенов обеспечивает место для более сложных проблем без риска неконтролируемого использования токенов. Эта конфигурация устарела и будет удалена в будущем выпуске модели.
Для агентского кодирования, дизайна фронтенда, рабочих процессов с большим количеством инструментов и сложных корпоративных рабочих процессов начните с medium усилия. Если вы обнаружите, что задержка слишком высока, рассмотрите возможность снижения усилия до low. Если вам нужна более высокая интеллектуальность, рассмотрите возможность увеличения усилия до high или миграции на Opus 4.7.
Для чата, создания контента, поиска, классификации и других задач, не связанных с кодированием, начните с low усилия с расширенным мышлением. Если вам нужна большая глубина, увеличьте усилие до medium.
claude-sonnet-4-6output_config.format вместо этогоtext_editor_20250728, code_execution_20250825); устаревшие версии не поддерживаются (если миграция с 3.x)undo_edit (если применимо)temperature ИЛИ top_p, но не оба (если миграция с 3.x)Claude Sonnet 4.5 сочетает сильный интеллект с быстрой производительностью, что делает его идеальным для повседневного кодирования, анализа и задач создания контента.
Полный обзор возможностей см. в обзоре моделей.
Цены Sonnet 4.5 составляют $3 за миллион входных токенов, $15 за миллион выходных токенов. Подробности см. в ценах Claude.
Обновите имя модели:
# С Sonnet 4
model = "claude-sonnet-4-20250514" # До
model = "claude-sonnet-4-5-20250929" # После
# С Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # До
model = "claude-sonnet-4-5-20250929" # ПослеЭти критические изменения применяются при миграции с моделей Claude 3.x Sonnet.
Обновите параметры выборки
Это критическое изменение при миграции с моделей Claude 3.x.
Используйте только temperature ИЛИ top_p, но не оба одновременно.
Обновите версии инструментов
Это критическое изменение при миграции с моделей Claude 3.x.
Обновитесь до последних версий инструментов (text_editor_20250728, code_execution_20250825). Удалите любой код, использующий команду undo_edit.
Обработайте причину остановки refusal
Обновите своё приложение, чтобы обработать причины остановки refusal.
claude-sonnet-4-5-20250929text_editor_20250728, code_execution_20250825); устаревшие версии не поддерживаются (если миграция с 3.x)undo_edit (если применимо)temperature ИЛИ top_p, но не оба (если миграция с 3.x)refusal в вашем приложенииClaude Haiku 4.5 — это самый быстрый и самый интеллектуальный модель Haiku с производительностью, близкой к границе, обеспечивающий качество премиум-модели для интерактивных приложений и высокообъёмной обработки.
Полный обзор возможностей см. в обзоре моделей.
Цены Haiku 4.5 составляют $1 за миллион входных токенов, $5 за миллион выходных токенов. Подробности см. в ценах Claude.
Обновите имя модели:
# С Haiku 3.5
model = "claude-3-5-haiku-20241022" # До
model = "claude-haiku-4-5-20251001" # После
# С Haiku 3
model = "claude-3-haiku-20240307" # До
model = "claude-haiku-4-5-20251001" # ПослеПросмотрите новые ограничения скорости: Haiku 4.5 имеет отдельные ограничения скорости от Haiku 3.5 и Haiku 3. Подробности см. в документации по ограничениям скорости.
Для значительного улучшения производительности при задачах кодирования и рассуждения рассмотрите возможность включения расширенного мышления с thinking: {type: "enabled", budget_tokens: N}.
Расширенное мышление влияет на эффективность кэширования промпта.
Расширенное мышление устарело в Claude 4.6 или более новых моделях. Если вы используете более новые модели, используйте адаптивное мышление вместо этого.
Изучите новые возможности: Подробности см. в обзоре моделей о контекстной осведомлённости, увеличенной ёмкости выходных данных (64k токенов), более высокой интеллектуальности и улучшенной скорости.
Эти критические изменения применяются при миграции с моделей Claude 3.x Haiku.
Обновите параметры выборки
Это критическое изменение при миграции с моделей Claude 3.x.
Используйте только temperature ИЛИ top_p, но не оба одновременно.
Обновите версии инструментов
Это критическое изменение при миграции с моделей Claude 3.x.
Обновитесь до последних версий инструментов (text_editor_20250728, code_execution_20250825). Удалите любой код, использующий команду undo_edit.
Обработайте причину остановки refusal
Обновите своё приложение, чтобы обработать причины остановки refusal.
claude-haiku-4-5-20251001text_editor_20250728, code_execution_20250825); устаревшие версии не поддерживаютсяundo_edit (если применимо)temperature ИЛИ top_p, но не обаrefusal в вашем приложенииПосле (Claude Opus 4.7):
client.messages.create(
model="claude-opus-4-7",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "high"}, # или "max", "xhigh", "medium", "low"
messages=[{"role": "user", "content": "..."}],
)Адаптивное мышление можно управлять через подсказки. Для рекомендаций по настройке, когда модель переусложняет или недостаточно думает, см. Калибровка усилий и глубины мышления.
Параметры выборки удалены: Установка temperature, top_p или top_k на любое значение, отличное от значения по умолчанию, на Claude Opus 4.7 возвращает ошибку 400. Самый безопасный путь миграции — полностью опустить эти параметры из полезных нагрузок запроса. Подсказка — это рекомендуемый способ направить поведение модели на Claude Opus 4.7. Если вы использовали temperature = 0 для детерминизма, имейте в виду, что это никогда не гарантировало идентичные выходные данные на предыдущих моделях.
Содержимое мышления опущено по умолчанию: Блоки мышления по-прежнему появляются в потоке ответов на Claude Opus 4.7, но их поле thinking пусто, если вы явно не согласитесь. Это молчаливое изменение от Claude Opus 4.6, где по умолчанию возвращался обобщенный текст мышления. Чтобы восстановить обобщенное содержимое мышления на Claude Opus 4.7, установите thinking.display на "summarized":
thinking = {
"type": "adaptive",
"display": "summarized",
}По умолчанию используется "omitted" на Claude Opus 4.7. Если ваш продукт транслирует рассуждения пользователям, новое значение по умолчанию выглядит как длительная пауза перед началом вывода; установите display: "summarized", чтобы восстановить видимый прогресс во время мышления. Подробнее см. в разделе Расширенное мышление.
Обновленный подсчет токенов: Claude Opus 4.7 использует новый токенизатор, способствующий его улучшенной производительности на широком спектре задач. Этот новый токенизатор может использовать примерно в 1x до 1.35x больше токенов при обработке текста по сравнению с предыдущими моделями (до ~35% больше, в зависимости от содержимого), и /v1/messages/count_tokens вернет другое количество токенов для Claude Opus 4.7, чем для Claude Opus 4.6. Эффективность токенов Claude Opus 4.7 может варьироваться в зависимости от формы рабочей нагрузки. Вмешательства в подсказки, task_budget и effort могут помочь контролировать затраты и обеспечить надлежащее использование токенов. Имейте в виду, что эти элементы управления могут компромиссно влиять на интеллект модели. Мы предлагаем обновить ваши параметры max_tokens, чтобы дать дополнительное пространство, включая триггеры сжатия. Claude Opus 4.7 предоставляет окно контекста в 1M при стандартном ценообразовании API без премии за длинный контекст.
Удаление prefill (перенесено из Opus 4.6): Предварительное заполнение сообщений помощника возвращает ошибку 400 на Claude Opus 4.7. Используйте вместо этого структурированные выходные данные, инструкции системной подсказки или output_config.format.
Встроенные обновления прогресса в агентских трассах: Claude Opus 4.7 предоставляет более регулярные, высокого качества обновления пользователю на протяжении длинных агентских трасс. Если вы добавили строительные леса для принудительных промежуточных сообщений о статусе ("После каждых 3 вызовов инструмента суммируйте прогресс"), попробуйте их удалить. Если вы обнаружите, что длина или содержание обновлений Claude Opus 4.7, обращенных к пользователю, не хорошо откалиброваны для вашего варианта использования, явно опишите, как должны выглядеть эти обновления в подсказке, и предоставьте примеры.
Меньше подагентов порождается по умолчанию: Claude Opus 4.7 имеет тенденцию порождать меньше подагентов по умолчанию. Однако это поведение можно управлять через подсказки; дайте Claude Opus 4.7 явное руководство о том, когда подагенты желательны.
Более строгая калибровка усилий: Значительно отличаясь от Claude Opus 4.6, Claude Opus 4.7 строго соблюдает уровни усилий, особенно на нижнем конце. При low и medium модель ограничивает свою работу тем, что было запрошено, а не выходит за рамки. Это хорошо для задержки и затрат, но на умеренно сложных задачах, работающих с low усилиями, есть некоторый риск недостаточного мышления. Если вы наблюдаете поверхностное рассуждение на сложных проблемах, повысьте усилия до high или xhigh, а не обходите это через подсказки. Если вам нужно держать усилия на low для задержки, добавьте целевое руководство: "Эта задача включает многошаговое рассуждение. Тщательно подумайте о проблеме перед ответом." См. Рекомендуемые уровни усилий для Claude Opus 4.7.
Меньше вызовов инструментов по умолчанию: Claude Opus 4.7 имеет тенденцию использовать инструменты реже, чем Claude Opus 4.6, и использовать рассуждения больше. Это дает лучшие результаты в большинстве случаев. Однако увеличение параметра усилий — это полезный рычаг для увеличения уровня использования инструментов, особенно в работе со знаниями. Параметры усилий high или xhigh показывают значительно больше использования инструментов в агентском поиске и кодировании. Для сценариев, где вы хотите больше использования инструментов, вы также можете отрегулировать вашу подсказку, чтобы явно инструктировать модель о том, когда и как правильно использовать свои инструменты.
Кибербезопасность в реальном времени: Вновь добавленные в Claude Opus 4.7, запросы, которые включают запрещенные или высокорисковые темы, могут привести к отказам. Для законной работы в области безопасности, такой как тестирование на проникновение, исследование уязвимостей или красное командование, подайте заявку на Программу кибер-верификации, чтобы запросить сниженные ограничения. Подробнее см. в разделе Защита, предупреждения и апелляции.
Поддержка изображений высокого разрешения: Claude Opus 4.7 — первая модель Claude с поддержкой изображений высокого разрешения, с максимальным разрешением изображения 2576 пикселей на длинном краю (вверх с 1568 пикселей на предыдущих моделях). Это разблокирует прибыль на рабочих нагрузках, интенсивных по зрению, и особенно ценно для компьютерного использования, понимания скриншотов и анализа документов. Поддержка высокого разрешения автоматическая и не требует бета-заголовка или согласия на стороне клиента. Полнораспределительные изображения могут использовать до примерно 3x больше токенов изображения, чем на предыдущих моделях (до 4,784 токенов на изображение, по сравнению с предыдущей крышкой примерно 1,600 токенов на изображение), поэтому переустановите max_tokens и ожидания затрат для рабочих нагрузок, интенсивных по изображениям, или уменьшите выборку перед отправкой, если вам не нужна дополнительная точность. Координаты указания и ограничивающего прямоугольника, возвращаемые моделью, находятся в соотношении 1
output_config = {
"effort": "high",
"task_budget": {"type": "tokens", "total": 128000},
}Вам может потребоваться экспериментировать с различными бюджетами задач для вашего варианта использования. Если модели дан бюджет задачи, который слишком ограничен для данной задачи, она может выполнить задачу менее тщательно, ссылаясь на свой бюджет как на ограничение. Для открытых агентских задач, где качество важнее скорости, не устанавливайте бюджет задачи; зарезервируйте бюджеты задач для рабочих нагрузок, где вам нужна модель для ограничения своей работы допуском токенов. Минимальное значение для бюджета задачи — 20k токенов.
Это не жесткая крышка; это предложение, о котором модель знает. Это отличается от max_tokens, который является жесткой крышкой на запрос для сгенерированных токенов (max_tokens не передается модели, и модель о нем не знает), в то время как task_budget — это рекомендуемая крышка по всему агентскому циклу. Используйте task_budget, когда вы хотите, чтобы модель саморегулировалась, и max_tokens как жесткий потолок на запрос для ограничения использования.
Установите большой max_tokens при max или xhigh усилиях: Если вы запускаете Claude Opus 4.7 при max или xhigh усилиях, установите большой бюджет максимальных выходных токенов, чтобы модель имела место для мышления и действия по своим подагентам и вызовам инструментов. Мы рекомендуем начать с 64k токенов и настроить оттуда.
Уменьшите выборку изображений, если высокое разрешение не требуется: Claude Opus 4.7 поддерживает изображения до 2576px / 3.75MP. Изображения высокого разрешения используют больше токенов. Если дополнительная точность изображения не требуется, уменьшите выборку изображений перед отправкой в Claude, чтобы избежать увеличения использования токенов. Подробнее см. в разделе Изображения и зрение.
max_tokensxhigh или max усилия, повысьте max_tokens до минимум 64k в качестве начальной точки.response = client.beta.messages.create(
model="claude-opus-4-5",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 32000},
betas=["interleaved-thinking-2025-05-14"],
messages=[...],
)Обратите внимание, что миграция также переходит с client.beta.messages.create на client.messages.create. Адаптивное мышление и усилия — это функции GA и не требуют бета-пространства имен SDK или каких-либо бета-заголовков.
Удалите бета-заголовок усилий: Параметр усилий теперь GA. Удалите betas=["effort-2025-11-24"] из ваших запросов.
Удалите бета-заголовок потоковой передачи инструментов с точной детализацией: Потоковая передача инструментов с точной детализацией теперь GA. Удалите betas=["fine-grained-tool-streaming-2025-05-14"] из ваших запросов.
Удалите бета-заголовок чередующегося мышления: Адаптивное мышление автоматически включает чередующееся мышление на Claude Opus 4.7, Opus 4.6 и Sonnet 4.6. Удалите betas=["interleaved-thinking-2025-05-14"] из ваших запросов. Заголовок по-прежнему функционален на Sonnet 4.6 с ручным расширенным мышлением, но ручной режим устарел.
Мигрируйте на output_config.format: Если используются структурированные выходные данные, обновите output_format={...} на output_config={"format": {...}}. Старый параметр остается функциональным, но устарел и будет удален в будущем выпуске модели.
Обновите версии инструментов
Это критическое изменение при миграции с моделей Claude 3.x.
Обновите до последних версий инструментов. Удалите любой код, использующий команду undo_edit.
# До
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
# После
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]text_editor_20250728 и str_replace_based_edit_tool. Подробнее см. в документации инструмента текстового редактора.code_execution_20250825. Подробнее см. в документации инструмента выполнения кода для инструкций по миграции.Обработайте причину остановки refusal
Обновите ваше приложение для обработки причин остановки refusal:
response = client.messages.create(...)
if response.stop_reason == "refusal":
# Обработайте отказ надлежащим образом
passОбработайте причину остановки model_context_window_exceeded
Модели Claude 4.5+ возвращают причину остановки model_context_window_exceeded, когда генерация останавливается из-за достижения предела окна контекста, а не запрошенного предела max_tokens. Обновите ваше приложение для обработки этой новой причины остановки:
response = client.messages.create(...)
if response.stop_reason == "model_context_window_exceeded":
# Обработайте предел окна контекста надлежащим образом
passПроверьте обработку параметров инструмента (конечные новые строки)
Модели Claude 4.5+ сохраняют конечные новые строки в параметрах строк вызова инструмента, которые ранее были удалены. Если ваши инструменты полагаются на точное совпадение строк с параметрами вызова инструмента, проверьте вашу логику для правильной обработки конечных новых строк.
Обновите ваши подсказки для изменений поведения
Модели Claude 4+ имеют более краткий, прямой стиль общения и требуют явного направления. Подробнее см. в лучших практиках подсказок для рекомендаций по оптимизации.
fine-grained-tool-streaming-2025-05-14interleaved-thinking-2025-05-14 (адаптивное мышление автоматически включает чередующееся мышление)output_format на output_config.format (если применимо)temperature, top_p и top_k (значения, отличные от значения по умолчанию, возвращают ошибку 400 на Opus 4.7)text_editor_20250728, code_execution_20250825)refusalmodel_context_window_exceededtoken-efficient-tools-2025-02-19, output-128k-2025-02-19)Продолжения (возобновление прерванных ответов): Переместите продолжение в сообщение пользователя: "Ваш предыдущий ответ был прерван и закончился на [previous_response]. Продолжайте с того места, где вы остановились."
Гидратация контекста / согласованность роли (обновление контекста в длительных разговорах): Вместо этого внедрите то, что ранее было напоминаниями о предзаполненном ассистенте, в ход пользователя.
Экранирование JSON параметров инструмента может отличаться
Это критическое изменение при миграции с Sonnet 4.5 или более ранней версии.
Экранирование строк JSON в параметрах инструмента может отличаться от предыдущих моделей. Стандартные парсеры JSON обрабатывают это автоматически, но пользовательский парсинг на основе строк может потребовать обновлений.
Обновите ваши промпты для изменений поведения
Модели Claude 4 имеют более лаконичный, прямой стиль общения. Ознакомьтесь с лучшими практиками промптинга для руководства по оптимизации.
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
output_config={"effort": "low"},
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"},
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=16384,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "medium"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "low"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)refusal в вашем приложенииfine-grained-tool-streaming-2025-05-14 (теперь GA)output_format на output_config.formatthinking: {type: "enabled", budget_tokens: N} на thinking: {type: "adaptive"} с параметром усилий (budget_tokens устарел и будет удалён в будущем выпуске)Обновите ваши промпты для изменений поведения
Модели Claude 4 имеют более лаконичный, прямой стиль общения. Ознакомьтесь с лучшими практиками промптинга для руководства по оптимизации.
Обновите ваши промпты для изменений поведения
Модели Claude 4 имеют более лаконичный, прямой стиль общения. Ознакомьтесь с лучшими практиками промптинга для руководства по оптимизации.