Claude Platform Docs
  • 消息
  • 托管智能体
  • 管理

Search...
⌘K
第一步
Claude 简介快速入门
使用 Claude 构建
功能概览使用 Messages API停止原因与回退拒绝与回退回退额度
模型能力
扩展思考自适应思考努力程度任务预算(测试版)快速模式(研究预览)结构化输出引用流式传输消息批量处理搜索结果流式传输拒绝多语言支持嵌入
工具
概览工具使用的工作原理教程:构建使用工具的智能体定义工具处理工具调用并行工具使用工具运行器(SDK)严格工具使用工具使用与提示缓存服务器工具故障排除网页搜索工具网页抓取工具代码执行工具顾问工具记忆工具Bash 工具计算机使用工具文本编辑器工具
工具基础设施
工具参考管理工具上下文工具组合工具搜索编程式工具调用细粒度工具流式传输
上下文管理
上下文窗口压缩上下文编辑提示缓存对话中系统消息构建编排模式缓存诊断(测试版)令牌计数
处理文件
Files APIPDF 支持图像与视觉
技能
概览快速入门最佳实践企业技能API 中的技能
MCP
远程 MCP 服务器MCP 连接器
云平台上的 Claude
Amazon BedrockAmazon Bedrock(旧版)AWS 上的 Claude PlatformMicrosoft FoundryVertex AI

Log in
Vertex AI
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claude Platform Docs

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Claude on Google Cloud

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
消息/云平台上的 Claude

Vertex AI 上的 Claude

Anthropic 的 Claude 模型可通过 Vertex AI 使用。

Was this page helpful?

  • 安装用于访问 Vertex AI 的 SDK
  • 访问 Vertex AI
  • 模型可用性
  • 发出请求
  • 数据保留
  • 活动日志记录
  • 功能支持
  • 支持的功能亮点
  • 不支持的功能
  • 上下文窗口
  • 全球、多区域和区域端点
  • 何时使用各选项
  • 实现方式
  • 其他资源

用于访问 Claude 的 Vertex API 与 Messages API 几乎完全相同,但在请求格式上有两个关键区别:

  • 在 Vertex 中,model 不在请求正文中传递,而是在 Google Cloud 端点 URL 中指定。
  • 在 Vertex 中,anthropic_version 在请求正文中传递(而不是作为请求头),并且必须设置为值 vertex-2023-10-16。

Anthropic 的官方客户端 SDK 也支持 Vertex。本指南将引导您使用 Anthropic 的客户端 SDK 之一向 Vertex AI 上的 Claude 发出请求。

请注意,本指南假设您已经拥有一个能够使用 Vertex AI 的 GCP 项目。有关所需设置和完整演练的更多信息,请参阅 Vertex AI 上的 Anthropic Claude 模型。

安装用于访问 Vertex AI 的 SDK

首先,安装您所选语言的 Anthropic 客户端 SDK。

访问 Vertex AI

模型可用性

请注意,Anthropic 模型的可用性因区域而异。在 Vertex AI Model Garden 中搜索"Claude",或访问 Anthropic Claude 模型以获取最新信息。

API 模型 ID

生命周期术语(已弃用、已停用)在模型弃用中定义。合作伙伴运营平台上的生命周期日期由合作伙伴设定,可能与 Claude API 的时间表不同。有关 Vertex AI 上任何模型的当前停用日期,请参阅 Google Cloud 关于 Vertex AI 上 Claude 模型的文档。

模型Vertex AI API 模型 ID
Claude Fable 5claude-fable-5
Claude Opus 4.8claude-opus-4-8
Claude Opus 4.7claude-opus-4-7
Claude Opus 4.6claude-opus-4-6
Claude Sonnet 4.6claude-sonnet-4-6
Claude Sonnet 4.5claude-sonnet-4-5@20250929
Claude Sonnet 4
已弃用。
claude-sonnet-4@20250514
Claude Sonnet 3.7
已停用。
claude-3-7-sonnet@20250219
Claude Opus 4.5claude-opus-4-5@20251101
Claude Opus 4.1
已弃用。
claude-opus-4-1@20250805
Claude Opus 4
已弃用。


正在升级到更新的 Claude 模型?在 Claude Code 中运行 /claude-api migrate,即可在整个代码库中应用模型 ID 替换和破坏性参数变更。该技能会检测您的代码所针对的云平台,并针对该平台调整模型 ID 格式和功能变更。请参阅迁移到更新的 Claude 模型。

发出请求

在运行请求之前,您可能需要运行 gcloud auth application-default login 以通过 GCP 进行身份验证。

以下示例展示了如何在 Vertex AI 上使用 Claude 生成文本:

有关更多详细信息,请参阅客户端 SDK 和官方 Vertex AI 文档。

Claude 也可通过 Amazon Bedrock、AWS 上的 Claude Platform 和 Microsoft Foundry 使用。

数据保留

此服务的数据处理由 Google Cloud Vertex AI 管理。有关详细信息,请参阅 Vertex AI 与零数据保留。

活动日志记录

Vertex 提供了请求-响应日志记录服务,允许客户记录与您的使用相关的提示和补全内容。

Anthropic 建议您至少以 30 天滚动周期记录您的活动,以便了解您的活动并调查任何潜在的滥用行为。



开启此服务不会让 Google 或 Anthropic 访问您的内容。

功能支持

有关 Vertex AI 可用性的完整功能列表,请参阅功能概览。

支持的功能亮点

  • Messages API
  • 提示缓存
  • 扩展思考
  • 工具使用,包括 Bash 工具、计算机使用工具、内存工具和文本编辑器工具
  • 网络搜索工具
  • 引用
  • 结构化输出

不支持的功能

  • 输入源(图像和文档的 URL 源、Files API)
  • 服务器端工具(代码执行、网络抓取、顾问)
  • 智能体基础设施(Agent Skills、MCP 连接器、程序化工具调用)
  • API 端点(Message Batches、Models、Admin、Compliance、Usage and Cost)
  • Claude 托管智能体
  • 服务器端回退(fallbacks 参数;请改用客户端回退模式)

上下文窗口

Claude Fable 5、Claude Opus 4.8、Claude Opus 4.7、Claude Opus 4.6 和 Claude Sonnet 4.6 在 Vertex AI 上拥有 100 万令牌的上下文窗口。其他 Claude 模型,包括 Sonnet 4.5 和 Sonnet 4(已弃用),拥有 20 万令牌的上下文窗口。

Vertex AI 将请求负载限制为 30 MB。当发送大型文档或大量图像时,您可能会在达到令牌限制之前先达到此限制。

全球、多区域和区域端点

Vertex AI 提供三种端点类型:

  • 全球端点: 动态路由以实现最大可用性
  • 多区域端点: 在某个地理区域内(例如美国或欧盟)进行动态路由,在满足数据驻留要求的同时保持高可用性
  • 区域端点: 保证数据通过特定地理区域进行路由

区域端点和多区域端点的定价比全球端点高 10%。



这仅适用于 Claude Sonnet 4.5 及未来的模型。较早的模型(Claude Sonnet 4(已弃用)、Opus 4(已弃用)及更早版本)保持其现有的定价结构。

何时使用各选项

全球端点(推荐):

  • 提供最大的可用性和正常运行时间
  • 动态将请求路由到具有可用容量的区域
  • 无定价溢价
  • 最适合对数据驻留要求灵活的应用程序
  • 仅支持按需付费流量(预配置吞吐量需要区域端点)

多区域端点:

  • 在某个地理区域内(目前为 us 和 eu)跨区域动态路由请求
  • 当您需要在较大地理范围内满足数据驻留要求,同时希望获得比单一区域更高的可用性时非常有用
  • 比全球端点高 10% 的定价溢价
  • 仅支持按需付费流量(预配置吞吐量需要区域端点)

区域端点:

  • 通过特定地理区域路由流量
  • 适用于单一区域数据驻留、严格的合规要求或预配置吞吐量
  • 同时支持按需付费和预配置吞吐量
  • 10% 的定价溢价反映了专用区域容量的基础设施成本

实现方式

使用全球端点(推荐):

在初始化客户端时将 region 参数设置为 "global":

使用多区域端点:

将 region 参数设置为多区域标识符:"us" 表示美国,"eu" 表示欧盟。SDK 会将请求路由到相应的多区域端点(https://aiplatform.us.rep.googleapis.com 或 https://aiplatform.eu.rep.googleapis.com),该端点会在该地理范围内的各区域之间动态平衡流量。

使用区域端点:

指定特定区域,如 "us-east1" 或 "europe-west1":



Claude Mythos Preview 是一个研究预览版,仅面向 Vertex AI 上受邀的客户提供。有关更多信息,请参阅 Project Glasswing。

其他资源

  • Vertex AI 定价: cloud.google.com/vertex-ai/generative-ai/pricing
  • Claude 模型文档: Vertex AI 上的 Claude
  • Google 博客文章: Claude 模型的全球端点
  • Anthropic 定价详情: 云平台定价
claude-opus-4@20250514
Claude Haiku 4.5claude-haiku-4-5@20251001
Claude Haiku 3.5
已弃用。
claude-3-5-haiku@20241022
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us"  # Multi-region identifier: "us" or "eu"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us-east1"  # Specify a specific region

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)