Was this page helpful?
用于访问 Claude 的 Vertex API 与 Messages API 几乎完全相同,但在请求格式上有两个关键区别:
model 不在请求正文中传递,而是在 Google Cloud 端点 URL 中指定。anthropic_version 在请求正文中传递(而不是作为请求头),并且必须设置为值 vertex-2023-10-16。Anthropic 的官方客户端 SDK 也支持 Vertex。本指南将引导您使用 Anthropic 的客户端 SDK 之一向 Vertex AI 上的 Claude 发出请求。
请注意,本指南假设您已经拥有一个能够使用 Vertex AI 的 GCP 项目。有关所需设置和完整演练的更多信息,请参阅 Vertex AI 上的 Anthropic Claude 模型。
首先,安装您所选语言的 Anthropic 客户端 SDK。
请注意,Anthropic 模型的可用性因区域而异。在 Vertex AI Model Garden 中搜索"Claude",或访问 Anthropic Claude 模型以获取最新信息。
生命周期术语(已弃用、已停用)在模型弃用中定义。合作伙伴运营平台上的生命周期日期由合作伙伴设定,可能与 Claude API 的时间表不同。有关 Vertex AI 上任何模型的当前停用日期,请参阅 Google Cloud 关于 Vertex AI 上 Claude 模型的文档。
| 模型 | Vertex AI API 模型 ID |
|---|---|
| Claude Fable 5 | claude-fable-5 |
| Claude Opus 4.8 | claude-opus-4-8 |
| Claude Opus 4.7 | claude-opus-4-7 |
| Claude Opus 4.6 | claude-opus-4-6 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 |
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 已弃用。 | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 已停用。 | claude-3-7-sonnet@20250219 |
| Claude Opus 4.5 | claude-opus-4-5@20251101 |
| Claude Opus 4.1 已弃用。 | claude-opus-4-1@20250805 |
| Claude Opus 4 已弃用。 |
正在升级到更新的 Claude 模型?在 Claude Code 中运行 /claude-api migrate,即可在整个代码库中应用模型 ID 替换和破坏性参数变更。该技能会检测您的代码所针对的云平台,并针对该平台调整模型 ID 格式和功能变更。请参阅迁移到更新的 Claude 模型。
在运行请求之前,您可能需要运行 gcloud auth application-default login 以通过 GCP 进行身份验证。
以下示例展示了如何在 Vertex AI 上使用 Claude 生成文本:
有关更多详细信息,请参阅客户端 SDK 和官方 Vertex AI 文档。
Claude 也可通过 Amazon Bedrock、AWS 上的 Claude Platform 和 Microsoft Foundry 使用。
此服务的数据处理由 Google Cloud Vertex AI 管理。有关详细信息,请参阅 Vertex AI 与零数据保留。
Vertex 提供了请求-响应日志记录服务,允许客户记录与您的使用相关的提示和补全内容。
Anthropic 建议您至少以 30 天滚动周期记录您的活动,以便了解您的活动并调查任何潜在的滥用行为。
开启此服务不会让 Google 或 Anthropic 访问您的内容。
有关 Vertex AI 可用性的完整功能列表,请参阅功能概览。
fallbacks 参数;请改用客户端回退模式)Claude Fable 5、Claude Opus 4.8、Claude Opus 4.7、Claude Opus 4.6 和 Claude Sonnet 4.6 在 Vertex AI 上拥有 100 万令牌的上下文窗口。其他 Claude 模型,包括 Sonnet 4.5 和 Sonnet 4(已弃用),拥有 20 万令牌的上下文窗口。
Vertex AI 将请求负载限制为 30 MB。当发送大型文档或大量图像时,您可能会在达到令牌限制之前先达到此限制。
Vertex AI 提供三种端点类型:
区域端点和多区域端点的定价比全球端点高 10%。
这仅适用于 Claude Sonnet 4.5 及未来的模型。较早的模型(Claude Sonnet 4(已弃用)、Opus 4(已弃用)及更早版本)保持其现有的定价结构。
全球端点(推荐):
多区域端点:
us 和 eu)跨区域动态路由请求区域端点:
使用全球端点(推荐):
在初始化客户端时将 region 参数设置为 "global":
使用多区域端点:
将 region 参数设置为多区域标识符:"us" 表示美国,"eu" 表示欧盟。SDK 会将请求路由到相应的多区域端点(https://aiplatform.us.rep.googleapis.com 或 https://aiplatform.eu.rep.googleapis.com),该端点会在该地理范围内的各区域之间动态平衡流量。
使用区域端点:
指定特定区域,如 "us-east1" 或 "europe-west1":
Claude Mythos Preview 是一个研究预览版,仅面向 Vertex AI 上受邀的客户提供。有关更多信息,请参阅 Project Glasswing。
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
| Claude Haiku 3.5 已弃用。 | claude-3-5-haiku@20241022 |
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us" # Multi-region identifier: "us" or "eu"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us-east1" # Specify a specific region
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)