API Vertex для доступа к Claude почти идентичен Messages API и поддерживает все те же опции с двумя ключевыми отличиями:
model не передается в теле запроса. Вместо этого он указывается в URL-адресе конечной точки Google Cloud.anthropic_version передается в теле запроса (а не в виде заголовка) и должен быть установлен на значение vertex-2023-10-16.Vertex также поддерживается официальными SDK клиентов Anthropic. Это руководство проведет вас через создание запроса к Claude на Vertex AI с использованием одного из SDK клиентов Anthropic.
Обратите внимание, что это руководство предполагает, что у вас уже есть проект GCP, который может использовать Vertex AI. Дополнительную информацию о требуемой настройке и полное пошаговое руководство см. в разделе использование моделей Claude 3 от Anthropic.
Сначала установите SDK клиента Anthropic для выбранного вами языка программирования.
Обратите внимание, что доступность моделей Anthropic варьируется в зависимости от региона. Найдите "Claude" в Vertex AI Model Garden или перейдите на Use Claude 3 для получения последней информации.
| Модель | Идентификатор модели Vertex AI |
|---|---|
| Claude Opus 4.7 | claude-opus-4-7 |
| Claude Opus 4.6 | claude-opus-4-6 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 |
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 ⚠️ | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 ⚠️ | claude-3-7-sonnet@20250219 |
| Claude Opus 4.5 | claude-opus-4-5@20251101 |
| Claude Opus 4.1 | claude-opus-4-1@20250805 |
| Claude Opus 4 ⚠️ | claude-opus-4@20250514 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
| Claude Haiku 3.5 ⚠️ | claude-3-5-haiku@20241022 |
| Claude Haiku 3 ⚠️ | claude-3-haiku@20240307 |
Перед выполнением запросов может потребоваться запустить gcloud auth application-default login для аутентификации с помощью GCP.
Следующие примеры показывают, как генерировать текст из Claude на Vertex AI:
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Дополнительные сведения см. в разделе SDK клиентов и официальной документации Vertex AI.
Claude также доступен через Amazon Bedrock и Microsoft Foundry.
Vertex предоставляет сервис логирования запросов и ответов, который позволяет клиентам регистрировать подсказки и завершения, связанные с вашим использованием.
Anthropic рекомендует регистрировать вашу активность по крайней мере на основе 30-дневного скользящего окна, чтобы понять вашу активность и исследовать любой потенциальный неправомерный использование.
Включение этого сервиса не дает Google или Anthropic никакого доступа к вашему контенту.
Для всех поддерживаемых в настоящее время функций на Vertex AI см. обзор функций API.
Claude Opus 4.7, Claude Opus 4.6 и Claude Sonnet 4.6 имеют контекстное окно в 1 млн токенов на Vertex AI. Другие модели Claude, включая Sonnet 4.5 и Sonnet 4 (устарела), имеют контекстное окно в 200 тыс. токенов.
Vertex AI ограничивает полезную нагрузку запроса до 30 МБ. При отправке больших документов или множества изображений вы можете достичь этого ограничения раньше, чем ограничение по токенам.
Google Vertex AI предлагает три типа конечных точек:
Региональные и многорегиональные конечные точки включают надбавку в размере 10% к цене по сравнению с глобальными конечными точками.
Это применяется только к Claude Sonnet 4.5 и будущим моделям. Старые модели (Claude Sonnet 4 (устарела), Opus 4 (устарела) и более ранние) сохраняют свои существующие структуры ценообразования.
Глобальные конечные точки (рекомендуется):
Многорегиональные конечные точки:
us и eu)Региональные конечные точки:
Использование глобальных конечных точек (рекомендуется):
Установите параметр region на "global" при инициализации клиента:
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Использование многорегиональных конечных точек:
Установите параметр region на многорегиональный идентификатор: "us" для Соединенных Штатов или "eu" для Европейского союза. SDK маршрутизирует запросы на соответствующую многорегиональную конечную точку (https://aiplatform.us.rep.googleapis.com или https://aiplatform.eu.rep.googleapis.com), которая динамически балансирует трафик в регионах в пределах этой географии.
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us" # Multi-region identifier: "us" or "eu"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Использование региональных конечных точек:
Укажите конкретный регион, например "us-east1" или "europe-west1":
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us-east1" # Specify a specific region
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Claude Mythos Preview — это исследовательский предпросмотр, доступный приглашенным клиентам на Google Vertex AI. Дополнительную информацию см. в разделе Project Glasswing.
Was this page helpful?