第三方平台上的 Claude

Vertex AI 上的 Claude

Anthropic 的 Claude 模型现已通过 Vertex AI 正式上线。

Vertex AI 访问 Claude 的 API 与 Messages API 几乎完全相同，支持所有相同的选项，但有两个关键区别：

在 Vertex 中，model 不在请求体中传递，而是在 Google Cloud 端点 URL 中指定。
在 Vertex 中，anthropic_version 在请求体中传递（而非作为请求头），且必须设置为 vertex-2023-10-16。

Vertex 也受到 Anthropic 官方客户端 SDK 的支持。本指南将引导您完成使用 Python 或 TypeScript 在 Vertex AI 上向 Claude 发送请求的过程。

请注意，本指南假设您已经拥有一个能够使用 Vertex AI 的 GCP 项目。有关所需设置的更多信息以及完整的操作指南，请参阅使用 Anthropic 的 Claude 3 模型。

安装用于访问 Vertex AI 的 SDK

首先，安装 Anthropic 适用于您所选语言的客户端 SDK。

pip install -U google-cloud-aiplatform "anthropic[vertex]"

访问 Vertex AI

模型可用性

请注意，Anthropic 模型的可用性因区域而异。在 Vertex AI Model Garden 中搜索"Claude"，或前往使用 Claude 3 获取最新信息。

API 模型 ID

模型	Vertex AI API 模型 ID
Claude Opus 4.6	claude-opus-4-6
Claude Sonnet 4.5	claude-sonnet-4-5@20250929
Claude Sonnet 4	claude-sonnet-4@20250514
Claude Sonnet 3.7 ⚠️	claude-3-7-sonnet@20250219
Claude Opus 4.5	claude-opus-4-5@20251101
Claude Opus 4.1	claude-opus-4-1@20250805
Claude Opus 4	claude-opus-4@20250514
Claude Haiku 4.5	claude-haiku-4-5@20251001
Claude Haiku 3.5 ⚠️	claude-3-5-haiku@20241022
Claude Haiku 3	claude-3-haiku@20240307

发送请求

在运行请求之前，您可能需要运行 gcloud auth application-default login 以通过 GCP 进行身份验证。

以下示例展示了如何在 Vertex AI 上使用 Claude 生成文本：

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

有关更多详细信息，请参阅我们的客户端 SDK 和官方 Vertex AI 文档。

活动日志

Vertex 提供了一项请求-响应日志服务，允许客户记录与您的使用相关的提示和补全内容。

Anthropic 建议您至少以 30 天滚动的方式记录您的活动，以便了解您的活动情况并调查任何潜在的滥用行为。

启用此服务不会让 Google 或 Anthropic 访问您的内容。

功能支持

您可以在此处找到 Vertex 当前支持的所有功能。

全球端点与区域端点

从 Claude Sonnet 4.5 及所有未来模型开始，Google Vertex AI 提供两种端点类型：

全球端点：动态路由以实现最大可用性
区域端点：保证数据通过特定地理区域路由

区域端点相比全球端点有 10% 的价格溢价。

这仅适用于 Claude Sonnet 4.5 及未来的模型。较旧的模型（Claude Sonnet 4、Opus 4 及更早版本）保持其现有的定价结构。

何时使用每种选项

全球端点（推荐）：

提供最大的可用性和正常运行时间
动态将请求路由到有可用容量的区域
无价格溢价
最适合数据驻留要求灵活的应用
仅支持按需付费流量（预配置吞吐量需要区域端点）

区域端点：

通过特定地理区域路由流量
数据驻留和合规要求所必需
支持按需付费和预配置吞吐量
10% 的价格溢价反映了专用区域容量的基础设施成本

实现方式

使用全球端点（推荐）：

在初始化客户端时将 region 参数设置为 "global"：

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

使用区域端点：

指定特定区域，如 "us-east1" 或 "europe-west1"：

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us-east1"  # Specify a specific region

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

其他资源

Google Vertex AI 定价： cloud.google.com/vertex-ai/generative-ai/pricing
Claude 模型文档： Vertex AI 上的 Claude
Google 博客文章： Claude 模型的全球端点
Anthropic 定价详情： 定价文档

Was this page helpful?

第三方平台上的 Claude

Vertex AI 上的 Claude

Anthropic 的 Claude 模型现已通过 Vertex AI 正式上线。

Vertex AI 访问 Claude 的 API 与 Messages API 几乎完全相同，支持所有相同的选项，但有两个关键区别：

在 Vertex 中，model 不在请求体中传递，而是在 Google Cloud 端点 URL 中指定。
在 Vertex 中，anthropic_version 在请求体中传递（而非作为请求头），且必须设置为 vertex-2023-10-16。

Vertex 也受到 Anthropic 官方客户端 SDK 的支持。本指南将引导您完成使用 Python 或 TypeScript 在 Vertex AI 上向 Claude 发送请求的过程。

请注意，本指南假设您已经拥有一个能够使用 Vertex AI 的 GCP 项目。有关所需设置的更多信息以及完整的操作指南，请参阅使用 Anthropic 的 Claude 3 模型。

安装用于访问 Vertex AI 的 SDK

首先，安装 Anthropic 适用于您所选语言的客户端 SDK。

pip install -U google-cloud-aiplatform "anthropic[vertex]"

访问 Vertex AI

模型可用性

请注意，Anthropic 模型的可用性因区域而异。在 Vertex AI Model Garden 中搜索"Claude"，或前往使用 Claude 3 获取最新信息。

API 模型 ID

模型	Vertex AI API 模型 ID
Claude Opus 4.6	claude-opus-4-6
Claude Sonnet 4.5	claude-sonnet-4-5@20250929
Claude Sonnet 4	claude-sonnet-4@20250514
Claude Sonnet 3.7 ⚠️	claude-3-7-sonnet@20250219
Claude Opus 4.5	claude-opus-4-5@20251101
Claude Opus 4.1	claude-opus-4-1@20250805
Claude Opus 4	claude-opus-4@20250514
Claude Haiku 4.5	claude-haiku-4-5@20251001
Claude Haiku 3.5 ⚠️	claude-3-5-haiku@20241022
Claude Haiku 3	claude-3-haiku@20240307

发送请求

在运行请求之前，您可能需要运行 gcloud auth application-default login 以通过 GCP 进行身份验证。

以下示例展示了如何在 Vertex AI 上使用 Claude 生成文本：

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

有关更多详细信息，请参阅我们的客户端 SDK 和官方 Vertex AI 文档。

活动日志

Vertex 提供了一项请求-响应日志服务，允许客户记录与您的使用相关的提示和补全内容。

Anthropic 建议您至少以 30 天滚动的方式记录您的活动，以便了解您的活动情况并调查任何潜在的滥用行为。

启用此服务不会让 Google 或 Anthropic 访问您的内容。

功能支持

您可以在此处找到 Vertex 当前支持的所有功能。

全球端点与区域端点

从 Claude Sonnet 4.5 及所有未来模型开始，Google Vertex AI 提供两种端点类型：

全球端点：动态路由以实现最大可用性
区域端点：保证数据通过特定地理区域路由

区域端点相比全球端点有 10% 的价格溢价。

这仅适用于 Claude Sonnet 4.5 及未来的模型。较旧的模型（Claude Sonnet 4、Opus 4 及更早版本）保持其现有的定价结构。

何时使用每种选项

全球端点（推荐）：

提供最大的可用性和正常运行时间
动态将请求路由到有可用容量的区域
无价格溢价
最适合数据驻留要求灵活的应用
仅支持按需付费流量（预配置吞吐量需要区域端点）

区域端点：

通过特定地理区域路由流量
数据驻留和合规要求所必需
支持按需付费和预配置吞吐量
10% 的价格溢价反映了专用区域容量的基础设施成本

实现方式

使用全球端点（推荐）：

在初始化客户端时将 region 参数设置为 "global"：

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

使用区域端点：

指定特定区域，如 "us-east1" 或 "europe-west1"：

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us-east1"  # Specify a specific region

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

其他资源

Google Vertex AI 定价： cloud.google.com/vertex-ai/generative-ai/pricing
Claude 模型文档： Vertex AI 上的 Claude
Google 博客文章： Claude 模型的全球端点
Anthropic 定价详情： 定价文档

Was this page helpful?