Was this page helpful?
用于访问 Claude 的 Vertex API 与 Messages API 几乎相同,支持所有相同的选项,但有两个关键区别:
model 不在请求体中传递。相反,它在 Google Cloud 端点 URL 中指定。anthropic_version 在请求体中传递(而不是作为标头),并且必须设置为值 vertex-2023-10-16。Vertex 也受 Anthropic 官方 client SDKs 支持。本指南将引导您使用 Anthropic 的 client SDK 之一向 Vertex AI 上的 Claude 发出请求。
请注意,本指南假设您已经有一个能够使用 Vertex AI 的 GCP 项目。有关所需的设置以及完整的演练,请参阅 从 Anthropic 使用 Claude 3 模型。
首先,为您选择的语言安装 Anthropic 的 client SDK。
请注意,Anthropic 模型的可用性因地区而异。在 Vertex AI Model Garden 中搜索"Claude"或访问 使用 Claude 3 以获取最新信息。
| 模型 | Vertex AI API 模型 ID |
|---|---|
| Claude Opus 4.7 | claude-opus-4-7 |
| Claude Opus 4.6 | claude-opus-4-6 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 |
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 ⚠️ | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 ⚠️ | claude-3-7-sonnet@20250219 |
| Claude Opus 4.5 | claude-opus-4-5@20251101 |
| Claude Opus 4.1 | claude-opus-4-1@20250805 |
| Claude Opus 4 ⚠️ | claude-opus-4@20250514 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
| Claude Haiku 3.5 |
在运行请求之前,您可能需要运行 gcloud auth application-default login 以使用 GCP 进行身份验证。
以下示例展示了如何从 Vertex AI 上的 Claude 生成文本:
有关更多详情,请参阅 client SDKs 和官方 Vertex AI 文档。
Claude 也可通过 Amazon Bedrock 和 Microsoft Foundry 获得。
Vertex 提供了一个 请求-响应日志服务,允许客户记录与您的使用相关的提示和完成。
Anthropic 建议您至少在 30 天滚动基础上记录您的活动,以便了解您的活动并调查任何潜在的滥用。
启用此服务不会给 Google 或 Anthropic 任何访问您内容的权限。
有关 Vertex AI 上当前支持的所有功能,请参阅 API 功能概述。
Claude Opus 4.7、Claude Opus 4.6 和 Claude Sonnet 4.6 在 Vertex AI 上有 100 万令牌上下文窗口。其他 Claude 模型,包括 Sonnet 4.5 和 Sonnet 4(已弃用),有 20 万令牌上下文窗口。
Vertex AI 将请求有效负载限制为 30 MB。发送大型文档或多个图像时,您可能会在达到令牌限制之前达到此限制。
Google Vertex AI 提供三种端点类型:
区域和多区域端点包括相对于全局端点的 10% 定价溢价。
这仅适用于 Claude Sonnet 4.5 和未来的模型。较旧的模型(Claude Sonnet 4(已弃用)、Opus 4(已弃用)及更早版本)保持其现有的定价结构。
全局端点(推荐):
多区域端点:
us 和 eu)跨区域动态路由请求区域端点:
使用全局端点(推荐):
初始化客户端时将 region 参数设置为 "global":
使用多区域端点:
将 region 参数设置为多区域标识符:"us" 表示美国或 "eu" 表示欧盟。SDK 将请求路由到相应的多区域端点(https://aiplatform.us.rep.googleapis.com 或 https://aiplatform.eu.rep.googleapis.com),该端点在该地理范围内的区域之间动态平衡流量。
使用区域端点:
指定特定区域,如 "us-east1" 或 "europe-west1":
Claude Mythos Preview 是一个研究预览版,可供 Google Vertex AI 上的受邀客户使用。有关更多信息,请参阅 Project Glasswing。
| claude-3-5-haiku@20241022 |
| Claude Haiku 3 ⚠️ | claude-3-haiku@20240307 |
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us" # 多区域标识符:"us" 或 "eu"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us-east1" # 指定特定区域
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)