Vertex API で Claude にアクセスする方法は、Messages API とほぼ同じで、同じオプションをすべてサポートしていますが、2 つの主な違いがあります:
model はリクエストボディで渡されません。代わりに、Google Cloud エンドポイント URL で指定されます。anthropic_version はリクエストボディで渡され(ヘッダーではなく)、値を vertex-2023-10-16 に設定する必要があります。Vertex は Anthropic の公式 client SDKs でもサポートされています。このガイドでは、Anthropic の client SDKs のいずれかを使用して、Vertex AI 上の Claude にリクエストを送信する方法を説明します。
このガイドでは、Vertex AI を使用できる GCP プロジェクトがすでにあることを前提としています。セットアップに必要な情報と完全なウォークスルーについては、Anthropic から Claude 3 モデルを使用する を参照してください。
まず、選択した言語用の Anthropic の client SDK をインストールします。
Anthropic モデルの可用性はリージョンによって異なることに注意してください。Vertex AI Model Garden で「Claude」を検索するか、Use Claude 3 にアクセスして最新情報を確認してください。
| モデル | Vertex AI API モデル ID |
|---|---|
| Claude Opus 4.7 | claude-opus-4-7 |
| Claude Opus 4.6 | claude-opus-4-6 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 |
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 ⚠️ | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 ⚠️ | claude-3-7-sonnet@20250219 |
| Claude Opus 4.5 | claude-opus-4-5@20251101 |
| Claude Opus 4.1 | claude-opus-4-1@20250805 |
| Claude Opus 4 ⚠️ | claude-opus-4@20250514 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
| Claude Haiku 3.5 ⚠️ | claude-3-5-haiku@20241022 |
| Claude Haiku 3 ⚠️ | claude-3-haiku@20240307 |
リクエストを実行する前に、gcloud auth application-default login を実行して GCP で認証する必要がある場合があります。
以下の例は、Vertex AI 上の Claude からテキストを生成する方法を示しています:
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)詳細については、client SDKs と公式の Vertex AI ドキュメント を参照してください。
Claude は Amazon Bedrock と Microsoft Foundry を通じても利用可能です。
Vertex は リクエスト-レスポンスログサービス を提供しており、お客様がプロンプトと完了内容をログに記録できます。
Anthropic は、アクティビティを理解し、潜在的な悪用を調査するために、少なくとも 30 日間のローリングベースでアクティビティをログに記録することをお勧めします。
このサービスを有効にしても、Google または Anthropic はコンテンツにアクセスできません。
Vertex AI で現在サポートされているすべての機能については、API 機能概要 を参照してください。
Claude Opus 4.7、Claude Opus 4.6、および Claude Sonnet 4.6 は、Vertex AI で 1M トークンのコンテキストウィンドウ を備えています。Sonnet 4.5 や Sonnet 4(非推奨)を含む他の Claude モデルは、200k トークンのコンテキストウィンドウを備えています。
Vertex AI はリクエストペイロードを 30 MB に制限しています。大きなドキュメントまたは多くの画像を送信する場合、トークン制限に達する前にこの制限に達する可能性があります。
Google Vertex AI は 3 つのエンドポイントタイプを提供しています:
リージョナルおよびマルチリージョンエンドポイントには、グローバルエンドポイントよりも 10% の価格プレミアムが含まれます。
これは Claude Sonnet 4.5 以降のモデルにのみ適用されます。古いモデル(Claude Sonnet 4(非推奨)、Opus 4(非推奨)、およびそれ以前)は既存の価格構造を維持しています。
グローバルエンドポイント(推奨):
マルチリージョンエンドポイント:
us と eu)全体で動的にルーティングリージョナルエンドポイント:
グローバルエンドポイントを使用する(推奨):
クライアントを初期化するときに region パラメータを "global" に設定します:
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)マルチリージョンエンドポイントを使用する:
region パラメータをマルチリージョン識別子に設定します:米国の場合は "us"、欧州連合の場合は "eu"。SDK はリクエストを対応するマルチリージョンエンドポイント(https://aiplatform.us.rep.googleapis.com または https://aiplatform.eu.rep.googleapis.com)にルーティングし、その地理的領域内のリージョン全体でトラフィックを動的に分散します。
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us" # マルチリージョン識別子:「us」または「eu」
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)リージョナルエンドポイントを使用する:
"us-east1" や "europe-west1" などの特定のリージョンを指定します:
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us-east1" # 特定のリージョンを指定
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Claude Mythos Preview は、Google Vertex AI で招待されたお客様向けに利用可能な研究プレビューです。詳細については、Project Glasswing を参照してください。
Was this page helpful?