Loading...
  • 构建
  • 管理
  • 模型与定价
  • 客户端 SDK
  • API 参考
Search...
⌘K
Log in
Vertex AI
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
管理/第三方平台

Vertex AI 上的 Claude

Anthropic 的 Claude 模型现已通过 Vertex AI 正式推出。

Was this page helpful?

  • 安装用于访问 Vertex AI 的 SDK
  • 访问 Vertex AI

用于访问 Claude 的 Vertex API 与 Messages API 几乎相同,支持所有相同的选项,但有两个关键区别:

  • 在 Vertex 中,model 不在请求体中传递。相反,它在 Google Cloud 端点 URL 中指定。
  • 在 Vertex 中,anthropic_version 在请求体中传递(而不是作为标头),并且必须设置为值 vertex-2023-10-16。

Vertex 也受 Anthropic 官方 client SDKs 支持。本指南将引导您使用 Anthropic 的 client SDK 之一向 Vertex AI 上的 Claude 发出请求。

请注意,本指南假设您已经有一个能够使用 Vertex AI 的 GCP 项目。有关所需的设置以及完整的演练,请参阅 从 Anthropic 使用 Claude 3 模型。

安装用于访问 Vertex AI 的 SDK

首先,为您选择的语言安装 Anthropic 的 client SDK。

访问 Vertex AI

模型可用性

请注意,Anthropic 模型的可用性因地区而异。在 Vertex AI Model Garden 中搜索"Claude"或访问 使用 Claude 3 以获取最新信息。

API 模型 ID

模型Vertex AI API 模型 ID
Claude Opus 4.7claude-opus-4-7
Claude Opus 4.6claude-opus-4-6
Claude Sonnet 4.6claude-sonnet-4-6
Claude Sonnet 4.5claude-sonnet-4-5@20250929
Claude Sonnet 4 ⚠️claude-sonnet-4@20250514
Claude Sonnet 3.7 ⚠️claude-3-7-sonnet@20250219
Claude Opus 4.5claude-opus-4-5@20251101
Claude Opus 4.1claude-opus-4-1@20250805
Claude Opus 4 ⚠️claude-opus-4@20250514
Claude Haiku 4.5claude-haiku-4-5@20251001
Claude Haiku 3.5

发出请求

在运行请求之前,您可能需要运行 gcloud auth application-default login 以使用 GCP 进行身份验证。

以下示例展示了如何从 Vertex AI 上的 Claude 生成文本:

有关更多详情,请参阅 client SDKs 和官方 Vertex AI 文档。

Claude 也可通过 Amazon Bedrock 和 Microsoft Foundry 获得。

活动日志

Vertex 提供了一个 请求-响应日志服务,允许客户记录与您的使用相关的提示和完成。

Anthropic 建议您至少在 30 天滚动基础上记录您的活动,以便了解您的活动并调查任何潜在的滥用。

启用此服务不会给 Google 或 Anthropic 任何访问您内容的权限。

功能支持

有关 Vertex AI 上当前支持的所有功能,请参阅 API 功能概述。

上下文窗口

Claude Opus 4.7、Claude Opus 4.6 和 Claude Sonnet 4.6 在 Vertex AI 上有 100 万令牌上下文窗口。其他 Claude 模型,包括 Sonnet 4.5 和 Sonnet 4(已弃用),有 20 万令牌上下文窗口。

Vertex AI 将请求有效负载限制为 30 MB。发送大型文档或多个图像时,您可能会在达到令牌限制之前达到此限制。

全局、多区域和区域端点

Google Vertex AI 提供三种端点类型:

  • 全局端点: 动态路由以获得最大可用性
  • 多区域端点: 在地理区域内(例如美国或欧盟)进行动态路由,以实现数据驻留和高可用性
  • 区域端点: 通过特定地理区域保证数据路由

区域和多区域端点包括相对于全局端点的 10% 定价溢价。

这仅适用于 Claude Sonnet 4.5 和未来的模型。较旧的模型(Claude Sonnet 4(已弃用)、Opus 4(已弃用)及更早版本)保持其现有的定价结构。

何时使用每个选项

全局端点(推荐):

  • 提供最大可用性和正常运行时间
  • 动态将请求路由到具有可用容量的区域
  • 无定价溢价
  • 最适合数据驻留灵活的应用程序
  • 仅支持按使用量付费流量(预配吞吐量需要区域端点)

多区域端点:

  • 在地理区域内(目前为 us 和 eu)跨区域动态路由请求
  • 当您需要在广泛的地理范围内进行数据驻留但希望获得比单个区域更高的可用性时很有用
  • 相对于全局端点的 10% 定价溢价
  • 仅支持按使用量付费流量(预配吞吐量需要区域端点)

区域端点:

  • 通过特定地理区域路由流量
  • 单区域数据驻留、严格合规要求或预配吞吐量所需
  • 支持按使用量付费和预配吞吐量
  • 10% 定价溢价反映了专用区域容量的基础设施成本

实现

使用全局端点(推荐):

初始化客户端时将 region 参数设置为 "global":

使用多区域端点:

将 region 参数设置为多区域标识符:"us" 表示美国或 "eu" 表示欧盟。SDK 将请求路由到相应的多区域端点(https://aiplatform.us.rep.googleapis.com 或 https://aiplatform.eu.rep.googleapis.com),该端点在该地理范围内的区域之间动态平衡流量。

使用区域端点:

指定特定区域,如 "us-east1" 或 "europe-west1":

Claude Mythos Preview 是一个研究预览版,可供 Google Vertex AI 上的受邀客户使用。有关更多信息,请参阅 Project Glasswing。

其他资源

  • Google Vertex AI 定价: cloud.google.com/vertex-ai/generative-ai/pricing
  • Claude 模型文档: Vertex AI 上的 Claude
  • Google 博客文章: Claude 模型的全局端点
  • Anthropic 定价详情: 定价文档
⚠️
claude-3-5-haiku@20241022
Claude Haiku 3 ⚠️claude-3-haiku@20240307
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us"  # 多区域标识符:"us" 或 "eu"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us-east1"  # 指定特定区域

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)