Claude 4.6 представляет собой следующее поколение моделей Claude, обеспечивающее значительные новые возможности и улучшения API. На этой странице приведены все новые функции, доступные при запуске.
| Модель | API model ID | Описание |
|---|---|---|
| Claude Opus 4.6 | claude-opus-4-6 | Наша самая интеллектуальная модель для создания агентов и кодирования |
Claude Opus 4.6 поддерживает контекстное окно объемом 200K (с контекстным окном 1M токенов, доступным в бета-версии), максимум 128K выходных токенов, расширенное мышление и все существующие функции Claude API.
Полную информацию о ценах и спецификациях см. в обзоре моделей.
Адаптивное мышление (thinking: {type: "adaptive"}) — это рекомендуемый режим мышления для Opus 4.6. Claude динамически решает, когда и сколько думать. На уровне усилий по умолчанию (high), Claude почти всегда будет думать. На более низких уровнях усилий он может пропустить мышление для более простых задач.
thinking: {type: "enabled"} и budget_tokens устарели на Opus 4.6. Они остаются функциональными, но будут удалены в будущем выпуске модели. Используйте адаптивное мышление и параметр усилий для управления глубиной мышления. Адаптивное мышление также автоматически включает чередующееся мышление.
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
messages=[{"role": "user", "content": "Solve this complex problem..."}]
)Параметр усилий теперь общедоступен (заголовок бета-версии не требуется). Новый уровень усилий max обеспечивает абсолютно наивысшую производительность на Opus 4.6. Комбинируйте усилия с адаптивным мышлением для оптимального соотношения затрат и качества.
Compaction обеспечивает автоматическое суммирование контекста на стороне сервера, позволяя эффективно бесконечные разговоры. Когда контекст приближается к пределу окна, API автоматически суммирует более ранние части разговора.
Потоковая передача инструментов с точной настройкой теперь общедоступна на всех моделях и платформах. Заголовок бета-версии не требуется.
Opus 4.6 поддерживает до 128K выходных токенов, удвоив предыдущий лимит 64K. Это позволяет увеличить бюджеты мышления и получить более полные ответы. SDK требуют потоковой передачи для запросов с большими значениями max_tokens, чтобы избежать тайм-аутов HTTP. Если вам не нужно обрабатывать события пошагово, используйте .stream() с .get_final_message() для получения полного ответа — см. Потоковая передача сообщений для получения подробной информации.
Элементы управления местоположением данных позволяют указать, где выполняется вывод модели, используя параметр inference_geo. Вы можете выбрать маршрутизацию "global" (по умолчанию) или "us" для каждого запроса. Вывод только для США оценивается в 1,1x на Claude Opus 4.6 и более новых моделях.
type: "enabled" и budget_tokensthinking: {type: "enabled", budget_tokens: N} устарел на Opus 4.6. Он остается функциональным, но будет удален в будущем выпуске модели. Перейдите на thinking: {type: "adaptive"} с параметром усилий.
interleaved-thinking-2025-05-14Заголовок бета-версии interleaved-thinking-2025-05-14 устарел на Opus 4.6. Он безопасно игнорируется при включении, но больше не требуется. Адаптивное мышление автоматически включает чередующееся мышление. Удалите betas=["interleaved-thinking-2025-05-14"] из ваших запросов при использовании Opus 4.6.
output_formatПараметр output_format для структурированных выходов был перемещен в output_config.format. Старый параметр остается функциональным, но устарел и будет удален в будущем выпуске модели.
# Before
response = client.messages.create(
output_format={"type": "json_schema", "schema": {...}},
...
)
# After
response = client.messages.create(
output_config={"format": {"type": "json_schema", "schema": {...}}},
...
)Предварительное заполнение сообщений помощника (предварительное заполнение последнего хода помощника) не поддерживается на Opus 4.6. Запросы с предварительно заполненными сообщениями помощника возвращают ошибку 400.
Альтернативы:
output_config.format для вывода JSONOpus 4.6 может создавать немного другое экранирование строк JSON в аргументах вызова инструмента (например, различное обращение с экранированием Unicode или экранированием косой черты). Стандартные парсеры JSON автоматически обрабатывают эти различия. Если вы анализируете input вызова инструмента как необработанную строку вместо использования json.loads() или JSON.parse(), проверьте, что ваша логика анализа все еще работает.
Пошаговые инструкции по миграции см. в разделе Миграция на Claude 4.6.
Узнайте, как использовать режим адаптивного мышления.
Сравните все модели Claude.
Изучите сжатие контекста на стороне сервера.
Пошаговые инструкции по миграции.
Was this page helpful?