Vertex APIでClaudeにアクセスする方法は、Messages APIとほぼ同じで、同じオプションをすべてサポートしていますが、2つの主な違いがあります:
modelはリクエストボディで渡されません。代わりに、Google CloudエンドポイントURLで指定されます。anthropic_versionはリクエストボディで渡され(ヘッダーではなく)、値をvertex-2023-10-16に設定する必要があります。VertexはAnthropicの公式クライアントSDKでもサポートされています。このガイドでは、AnthropicのクライアントSDKの1つを使用してVertex AI上のClaudeにリクエストを送信する方法を説明します。
このガイドでは、Vertex AIを使用できるGCPプロジェクトがすでにあることを前提としています。セットアップに必要な情報と完全なウォークスルーについては、AnthropicのClaude 3モデルを使用するを参照してください。
まず、選択した言語用のAnthropicのクライアントSDKをインストールします。
Anthropicモデルの可用性はリージョンによって異なることに注意してください。Vertex AI Model Gardenで「Claude」を検索するか、Claude 3を使用するにアクセスして最新情報を確認してください。
| モデル | Vertex AI APIモデルID |
|---|---|
| Claude Opus 4.6 | claude-opus-4-6 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 |
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 ⚠️ | claude-3-7-sonnet@20250219 |
| Claude Opus 4.5 | claude-opus-4-5@20251101 |
| Claude Opus 4.1 | claude-opus-4-1@20250805 |
| Claude Opus 4 | claude-opus-4@20250514 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
| Claude Haiku 3.5 ⚠️ | claude-3-5-haiku@20241022 |
| Claude Haiku 3 ⚠️ | claude-3-haiku@20240307 |
リクエストを実行する前に、gcloud auth application-default loginを実行してGCPで認証する必要がある場合があります。
以下の例は、Vertex AI上のClaudeからテキストを生成する方法を示しています:
MODEL_ID=claude-opus-4-6
LOCATION=global
PROJECT_ID=MY_PROJECT_ID
curl \
-X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://$LOCATION-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/publishers/anthropic/models/${MODEL_ID}:streamRawPredict -d \
'{
"anthropic_version": "vertex-2023-10-16",
"messages": [{
"role": "user",
"content": "Hey Claude!"
}],
"max_tokens": 100,
}'詳細については、クライアントSDKと公式Vertex AI ドキュメントを参照してください。
ClaudeはAmazon BedrockとMicrosoft Foundryを通じても利用可能です。
Vertexはリクエスト-レスポンスログサービスを提供しており、使用に関連するプロンプトと完了をログに記録できます。
Anthropicは、アクティビティを理解し、潜在的な悪用を調査するために、少なくとも30日間のローリングベースでアクティビティをログに記録することをお勧めします。
このサービスを有効にしても、GoogleやAnthropicがコンテンツにアクセスすることはできません。
Vertex AI上で現在サポートされているすべての機能については、API機能概要を参照してください。
Claude Opus 4.6とClaude Sonnet 4.6は、Vertex AI上で100万トークンのコンテキストウィンドウを備えています。Sonnet 4.5やSonnet 4を含む他のClaudeモデルは、20万トークンのコンテキストウィンドウを備えています。
Vertex AIはリクエストペイロードを30 MBに制限しています。大きなドキュメントまたは多くの画像を送信する場合、トークン制限に達する前にこの制限に達する可能性があります。
Google Vertex AIは3つのエンドポイントタイプを提供しています:
リージョナルおよびマルチリージョンエンドポイントには、グローバルエンドポイントに対する10%の価格プレミアムが含まれます。
これはClaude Sonnet 4.5以降のモデルにのみ適用されます。古いモデル(Claude Sonnet 4、Opus 4、およびそれ以前)は既存の価格構造を維持しています。
グローバルエンドポイント(推奨):
マルチリージョンエンドポイント:
us、euは近日中)リージョナルエンドポイント:
グローバルエンドポイントを使用する(推奨):
クライアントを初期化するときにregionパラメータを"global"に設定します:
# ant CLIはまだVertex AIをサポートしていません。マルチリージョンエンドポイントを使用する:
regionパラメータを"us"などのマルチリージョン識別子に設定します。SDKはマルチリージョンエンドポイント(たとえば、https://aiplatform.us.rep.googleapis.com)にリクエストをルーティングし、その地理的領域内のリージョン全体でトラフィックを動的にバランスします。
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us" # マルチリージョン:USリージョン内でルーティング
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-6",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)リージョナルエンドポイントを使用する:
"us-east1"や"europe-west1"などの特定のリージョンを指定します:
# ant CLIはまだVertex AIをサポートしていません。Claude Mythos Previewは、Google Vertex AIの招待されたお客様向けのリサーチプレビューです。詳細については、Project Glasswingを参照してください。
Was this page helpful?