• 訊息
  • 託管代理
  • 管理

Search...
⌘K
第一步
Claude 簡介快速入門
使用 Claude 進行建構
功能概覽使用 Messages API停止原因與備援拒絕與備援備援額度
模型能力
擴展思考自適應思考努力程度任務預算(測試版)快速模式(研究預覽)結構化輸出引用串流訊息批次處理搜尋結果串流拒絕多語言支援嵌入
工具
概覽工具使用的運作方式教學:建構使用工具的代理定義工具處理工具呼叫平行工具使用工具執行器(SDK)嚴格工具使用搭配提示快取的工具使用伺服器工具疑難排解網頁搜尋工具網頁擷取工具程式碼執行工具顧問工具記憶體工具Bash 工具電腦使用工具文字編輯器工具
工具基礎架構
工具參考管理工具上下文工具組合工具搜尋程式化工具呼叫細粒度工具串流
上下文管理
上下文視窗壓縮上下文編輯提示快取對話中系統訊息建構協調模式快取診斷(測試版)Token 計數
處理檔案
Files APIPDF 支援圖片與視覺
技能
概覽快速入門最佳實務企業技能API 中的技能
MCP
遠端 MCP 伺服器MCP 連接器
雲端平台上的 Claude
Amazon BedrockAmazon Bedrock(舊版)AWS 上的 Claude PlatformMicrosoft FoundryVertex AI

Log in
Vertex AI
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
訊息/雲端平台上的 Claude

Vertex AI 上的 Claude

Anthropic 的 Claude 模型可透過 Vertex AI 使用。

用於存取 Claude 的 Vertex API 與 Messages API 幾乎相同,但在請求格式上有兩個主要差異:

  • 在 Vertex 中,model 不會在請求主體中傳遞,而是在 Google Cloud 端點 URL 中指定。
  • 在 Vertex 中,anthropic_version 會在請求主體中傳遞(而非作為標頭),且必須設定為 vertex-2023-10-16 這個值。

Anthropic 的官方用戶端 SDK 也支援 Vertex。本指南將引導您使用 Anthropic 的其中一個用戶端 SDK 向 Vertex AI 上的 Claude 發出請求。

請注意,本指南假設您已擁有可使用 Vertex AI 的 GCP 專案。如需設定所需的更多資訊及完整操作說明,請參閱 Vertex AI 上的 Anthropic Claude 模型。

安裝用於存取 Vertex AI 的 SDK

首先,安裝您所選語言的 Anthropic 用戶端 SDK。

存取 Vertex AI

模型可用性

請注意,Anthropic 模型的可用性因地區而異。請在 Vertex AI Model Garden 中搜尋「Claude」,或前往 Anthropic Claude 模型以取得最新資訊。

API 模型 ID

生命週期術語(已棄用、已停用)的定義請參閱模型棄用。合作夥伴營運平台上的生命週期日期由合作夥伴設定,可能與 Claude API 的時程不同。如需 Vertex AI 上任何模型的目前停用日期,請參閱 Google Cloud 關於 Vertex AI 上 Claude 模型的文件。

模型Vertex AI API 模型 ID
Claude Fable 5claude-fable-5
Claude Opus 4.8claude-opus-4-8
Claude Opus 4.7claude-opus-4-7
Claude Opus 4.6claude-opus-4-6
Claude Sonnet 4.6claude-sonnet-4-6
Claude Sonnet 4.5claude-sonnet-4-5@20250929
Claude Sonnet 4
已棄用。
claude-sonnet-4@20250514
Claude Sonnet 3.7
已停用。
claude-3-7-sonnet@20250219
Claude Opus 4.5claude-opus-4-5@20251101
Claude Opus 4.1
已棄用。
claude-opus-4-1@20250805
Claude Opus 4
已棄用。
claude-opus-4@20250514
Claude Haiku 4.5claude-haiku-4-5@20251001
Claude Haiku 3.5
已棄用。
claude-3-5-haiku@20241022


正在升級至較新的 Claude 模型嗎?在 Claude Code 中執行 /claude-api migrate,即可在您的程式碼庫中套用模型 ID 替換及重大參數變更。此技能會偵測您的程式碼所針對的雲端平台,並針對該平台調整模型 ID 格式與功能變更。請參閱遷移至較新的 Claude 模型。

發出請求

在執行請求之前,您可能需要執行 gcloud auth application-default login 以向 GCP 進行驗證。

以下範例展示如何在 Vertex AI 上使用 Claude 生成文字:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

如需更多詳細資訊,請參閱用戶端 SDK 和官方 Vertex AI 文件。

Claude 也可透過 Amazon Bedrock、AWS 上的 Claude Platform 和 Microsoft Foundry 使用。

資料保留

此服務的資料處理由 Google Cloud Vertex AI 管理。如需詳細資訊,請參閱 Vertex AI 與零資料保留。

活動記錄

Vertex 提供請求-回應記錄服務,讓客戶能夠記錄與您的使用情況相關的提示和完成內容。

Anthropic 建議您至少以 30 天滾動方式記錄您的活動,以便了解您的活動並調查任何潛在的濫用情況。



開啟此服務不會讓 Google 或 Anthropic 存取您的內容。

功能支援

如需完整的功能清單及其在 Vertex AI 上的可用性,請參閱功能概覽。

支援的功能重點

  • Messages API
  • 提示快取
  • 擴展思考
  • 工具使用,包括 Bash 工具、電腦使用工具、記憶體工具和文字編輯器工具
  • 網頁搜尋工具
  • 引用
  • 結構化輸出

不支援的功能

  • 輸入來源(圖片和文件的 URL 來源、Files API)
  • 伺服器端工具(程式碼執行、網頁擷取、advisor)
  • 代理基礎架構(Agent Skills、MCP 連接器、程式化工具呼叫)
  • API 端點(Message Batches、Models、Admin、Compliance、Usage and Cost)
  • Claude Managed Agents
  • 伺服器端備援(fallbacks 參數;請改用用戶端備援模式)

上下文視窗

Claude Fable 5、Claude Opus 4.8、Claude Opus 4.7、Claude Opus 4.6 和 Claude Sonnet 4.6 在 Vertex AI 上擁有 100 萬 token 的上下文視窗。其他 Claude 模型,包括 Sonnet 4.5 和 Sonnet 4(已棄用),擁有 20 萬 token 的上下文視窗。

Vertex AI 將請求酬載限制為 30 MB。當傳送大型文件或大量圖片時,您可能會在達到 token 限制之前先達到此限制。

全域、多地區和地區端點

Vertex AI 提供三種端點類型:

  • 全域端點: 動態路由以達到最高可用性
  • 多地區端點: 在地理區域內(例如美國或歐盟)進行動態路由,以實現資料駐留並保持高可用性
  • 地區端點: 保證資料透過特定地理區域路由

地區和多地區端點的價格比全域端點高 10%。



這僅適用於 Claude Sonnet 4.5 及未來的模型。較舊的模型(Claude Sonnet 4(已棄用)、Opus 4(已棄用)及更早版本)維持其現有的定價結構。

各選項的使用時機

全域端點(建議):

  • 提供最高的可用性和正常運作時間
  • 動態將請求路由至具有可用容量的地區
  • 無價格加成
  • 最適合資料駐留具有彈性的應用程式
  • 僅支援隨用隨付流量(佈建輸送量需要地區端點)

多地區端點:

  • 在地理區域內(目前為 us 和 eu)跨地區動態路由請求
  • 當您需要在廣泛地理範圍內的資料駐留,但希望獲得比單一地區更高的可用性時很有用
  • 比全域端點高 10% 的價格加成
  • 僅支援隨用隨付流量(佈建輸送量需要地區端點)

地區端點:

  • 透過特定地理區域路由流量
  • 適用於單一地區資料駐留、嚴格的合規要求或佈建輸送量
  • 同時支援隨用隨付和佈建輸送量
  • 10% 的價格加成反映了專用地區容量的基礎架構成本

實作

使用全域端點(建議):

在初始化用戶端時,將 region 參數設定為 "global":

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

使用多地區端點:

將 region 參數設定為多地區識別碼:美國使用 "us",歐盟使用 "eu"。SDK 會將請求路由至對應的多地區端點(https://aiplatform.us.rep.googleapis.com 或 https://aiplatform.eu.rep.googleapis.com),該端點會在該地理範圍內的各地區之間動態平衡流量。

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us"  # Multi-region identifier: "us" or "eu"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

使用地區端點:

指定特定地區,例如 "us-east1" 或 "europe-west1":

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us-east1"  # Specify a specific region

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)


Claude Mythos Preview 是一個研究預覽版本,僅供 Vertex AI 上受邀的客戶使用。如需更多資訊,請參閱 Project Glasswing。

其他資源

  • Vertex AI 定價: cloud.google.com/vertex-ai/generative-ai/pricing
  • Claude 模型文件: Vertex AI 上的 Claude
  • Google 部落格文章: Claude 模型的全域端點
  • Anthropic 定價詳情: 雲端平台定價

Was this page helpful?

  • 安裝用於存取 Vertex AI 的 SDK
  • 存取 Vertex AI
  • 模型可用性
  • 發出請求
  • 資料保留
  • 活動記錄
  • 功能支援
  • 支援的功能重點
  • 不支援的功能
  • 上下文視窗
  • 全域、多地區和地區端點
  • 各選項的使用時機
  • 實作
  • 其他資源