Claude на Vertex AI
API Vertex для доступа к Claude почти идентичен Messages API и поддерживает все те же параметры с двумя ключевыми отличиями:
- В Vertex
modelне передается в теле запроса. Вместо этого он указывается в URL конечной точки Google Cloud. - В Vertex
anthropic_versionпередается в теле запроса (а не в качестве заголовка) и должен быть установлен на значениеvertex-2023-10-16.
Vertex также поддерживается официальными SDK клиентов Anthropic. Это руководство проведет вас через процесс создания запроса к Claude на Vertex AI на Python или TypeScript.
Обратите внимание, что это руководство предполагает, что у вас уже есть проект GCP, который может использовать Vertex AI. Дополнительную информацию о требуемой настройке и полное пошаговое руководство см. в разделе использование моделей Claude 3 от Anthropic.
Установите SDK для доступа к Vertex AI
Сначала установите SDK клиента Anthropic для выбранного вами языка.
pip install -U google-cloud-aiplatform "anthropic[vertex]"npm install @anthropic-ai/vertex-sdkДоступ к Vertex AI
Доступность моделей
Обратите внимание, что доступность моделей Anthropic варьируется в зависимости от региона. Найдите "Claude" в Vertex AI Model Garden или перейдите на Use Claude 3 для получения последней информации.
Идентификаторы моделей API
| Модель | Идентификатор модели Vertex AI API |
|---|---|
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 | claude-3-7-sonnet@20250219 |
| Claude Opus 4.1 | claude-opus-4-1@20250805 |
| Claude Opus 4 | claude-opus-4@20250514 |
| Claude Opus 3 | claude-3-opus@20240229 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
| Claude Haiku 3.5 | claude-3-5-haiku@20241022 |
| Claude Haiku 3 | claude-3-haiku@20240307 |
Создание запросов
Перед выполнением запросов вам может потребоваться запустить gcloud auth application-default login для аутентификации с GCP.
Следующие примеры показывают, как генерировать текст из Claude на Vertex AI:
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-sonnet-4-5@20250929",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Дополнительные сведения см. в наших SDK клиентов и официальной документации Vertex AI.
Логирование активности
Vertex предоставляет сервис логирования запросов и ответов, который позволяет клиентам регистрировать подсказки и завершения, связанные с вашим использованием.
Anthropic рекомендует регистрировать вашу активность по крайней мере на основе 30-дневного скользящего окна, чтобы понять вашу активность и исследовать любой потенциальный неправомерный доступ.
Включение этого сервиса не дает Google или Anthropic никакого доступа к вашему контенту.
Поддержка функций
Все функции, которые в настоящее время поддерживаются на Vertex, можно найти здесь.
Глобальные и региональные конечные точки
Начиная с Claude Sonnet 4.5 и всех будущих моделей, Google Vertex AI предлагает два типа конечных точек:
- Глобальные конечные точки: Динамическая маршрутизация для максимальной доступности
- Региональные конечные точки: Гарантированная маршрутизация данных через определенные географические регионы
Региональные конечные точки включают надбавку в размере 10% к цене по сравнению с глобальными конечными точками.
Это применяется только к Claude Sonnet 4.5 и будущим моделям. Старые модели (Claude Sonnet 4, Opus 4 и более ранние) сохраняют свои существующие структуры ценообразования.
Когда использовать каждый вариант
Глобальные конечные точки (рекомендуется):
- Обеспечивают максимальную доступность и время безотказной работы
- Динамически маршрутизируют запросы в регионы с доступной емкостью
- Без надбавки к цене
- Лучше всего подходят для приложений, где местоположение данных гибко
- Поддерживают только трафик с оплатой по мере использования (пропускная способность по требованию требует региональных конечных точек)
Региональные конечные точки:
- Маршрутизируют трафик через определенные географические регионы
- Требуются для требований к местоположению данных и соответствию нормативным требованиям
- Поддерживают как трафик с оплатой по мере использования, так и пропускную способность по требованию
- Надбавка в размере 10% к цене отражает затраты на инфраструктуру для выделенной региональной емкости
Реализация
Использование глобальных конечных точек (рекомендуется):
Установите параметр region на "global" при инициализации клиента:
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-sonnet-4-5@20250929",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Использование региональных конечных точек:
Укажите конкретный регион, например "us-east1" или "europe-west1":
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us-east1" # Specify a specific region
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-sonnet-4-5@20250929",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Дополнительные ресурсы
- Ценообразование Google Vertex AI: cloud.google.com/vertex-ai/generative-ai/pricing
- Документация моделей Claude: Claude на Vertex AI
- Пост в блоге Google: Глобальная конечная точка для моделей Claude
- Детали ценообразования Anthropic: Документация по ценообразованию