用於存取 Claude 的 Vertex API 與 Messages API 幾乎相同,但在請求格式上有兩個主要差異:
model 不會在請求主體中傳遞,而是在 Google Cloud 端點 URL 中指定。anthropic_version 會在請求主體中傳遞(而非作為標頭),且必須設定為 vertex-2023-10-16 這個值。Anthropic 的官方用戶端 SDK 也支援 Vertex。本指南將引導您使用 Anthropic 的其中一個用戶端 SDK 向 Vertex AI 上的 Claude 發出請求。
請注意,本指南假設您已擁有可使用 Vertex AI 的 GCP 專案。如需設定所需的更多資訊及完整操作說明,請參閱 Vertex AI 上的 Anthropic Claude 模型。
首先,安裝您所選語言的 Anthropic 用戶端 SDK。
請注意,Anthropic 模型的可用性因地區而異。請在 Vertex AI Model Garden 中搜尋「Claude」,或前往 Anthropic Claude 模型以取得最新資訊。
生命週期術語(已棄用、已停用)的定義請參閱模型棄用。合作夥伴營運平台上的生命週期日期由合作夥伴設定,可能與 Claude API 的時程不同。如需 Vertex AI 上任何模型的目前停用日期,請參閱 Google Cloud 關於 Vertex AI 上 Claude 模型的文件。
| 模型 | Vertex AI API 模型 ID |
|---|---|
| Claude Fable 5 | claude-fable-5 |
| Claude Opus 4.8 | claude-opus-4-8 |
| Claude Opus 4.7 | claude-opus-4-7 |
| Claude Opus 4.6 | claude-opus-4-6 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 |
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 已棄用。 | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 已停用。 | claude-3-7-sonnet@20250219 |
| Claude Opus 4.5 | claude-opus-4-5@20251101 |
| Claude Opus 4.1 已棄用。 | claude-opus-4-1@20250805 |
| Claude Opus 4 已棄用。 | claude-opus-4@20250514 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
| Claude Haiku 3.5 已棄用。 | claude-3-5-haiku@20241022 |
正在升級至較新的 Claude 模型嗎?在 Claude Code 中執行 /claude-api migrate,即可在您的程式碼庫中套用模型 ID 替換及重大參數變更。此技能會偵測您的程式碼所針對的雲端平台,並針對該平台調整模型 ID 格式與功能變更。請參閱遷移至較新的 Claude 模型。
在執行請求之前,您可能需要執行 gcloud auth application-default login 以向 GCP 進行驗證。
以下範例展示如何在 Vertex AI 上使用 Claude 生成文字:
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)如需更多詳細資訊,請參閱用戶端 SDK 和官方 Vertex AI 文件。
Claude 也可透過 Amazon Bedrock、AWS 上的 Claude Platform 和 Microsoft Foundry 使用。
此服務的資料處理由 Google Cloud Vertex AI 管理。如需詳細資訊,請參閱 Vertex AI 與零資料保留。
Vertex 提供請求-回應記錄服務,讓客戶能夠記錄與您的使用情況相關的提示和完成內容。
Anthropic 建議您至少以 30 天滾動方式記錄您的活動,以便了解您的活動並調查任何潛在的濫用情況。
開啟此服務不會讓 Google 或 Anthropic 存取您的內容。
如需完整的功能清單及其在 Vertex AI 上的可用性,請參閱功能概覽。
fallbacks 參數;請改用用戶端備援模式)Claude Fable 5、Claude Opus 4.8、Claude Opus 4.7、Claude Opus 4.6 和 Claude Sonnet 4.6 在 Vertex AI 上擁有 100 萬 token 的上下文視窗。其他 Claude 模型,包括 Sonnet 4.5 和 Sonnet 4(已棄用),擁有 20 萬 token 的上下文視窗。
Vertex AI 將請求酬載限制為 30 MB。當傳送大型文件或大量圖片時,您可能會在達到 token 限制之前先達到此限制。
Vertex AI 提供三種端點類型:
地區和多地區端點的價格比全域端點高 10%。
這僅適用於 Claude Sonnet 4.5 及未來的模型。較舊的模型(Claude Sonnet 4(已棄用)、Opus 4(已棄用)及更早版本)維持其現有的定價結構。
全域端點(建議):
多地區端點:
us 和 eu)跨地區動態路由請求地區端點:
使用全域端點(建議):
在初始化用戶端時,將 region 參數設定為 "global":
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)使用多地區端點:
將 region 參數設定為多地區識別碼:美國使用 "us",歐盟使用 "eu"。SDK 會將請求路由至對應的多地區端點(https://aiplatform.us.rep.googleapis.com 或 https://aiplatform.eu.rep.googleapis.com),該端點會在該地理範圍內的各地區之間動態平衡流量。
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us" # Multi-region identifier: "us" or "eu"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)使用地區端點:
指定特定地區,例如 "us-east1" 或 "europe-west1":
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us-east1" # Specify a specific region
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Claude Mythos Preview 是一個研究預覽版本,僅供 Vertex AI 上受邀的客戶使用。如需更多資訊,請參閱 Project Glasswing。
Was this page helpful?