Was this page helpful?
Vertex API untuk mengakses Claude hampir identik dengan Messages API dan mendukung semua opsi yang sama, dengan dua perbedaan utama:
model tidak diteruskan dalam badan permintaan. Sebaliknya, model ditentukan dalam URL endpoint Google Cloud.anthropic_version diteruskan dalam badan permintaan (bukan sebagai header), dan harus diatur ke nilai vertex-2023-10-16.Vertex juga didukung oleh client SDKs resmi Anthropic. Panduan ini memandu Anda membuat permintaan ke Claude di Vertex AI menggunakan salah satu client SDKs Anthropic.
Perhatikan bahwa panduan ini mengasumsikan Anda sudah memiliki proyek GCP yang dapat menggunakan Vertex AI. Lihat menggunakan model Claude 3 dari Anthropic untuk informasi lebih lanjut tentang setup yang diperlukan, serta panduan lengkap.
Pertama, instal client SDK Anthropic untuk bahasa pilihan Anda.
Perhatikan bahwa ketersediaan model Anthropic bervariasi menurut wilayah. Cari "Claude" di Vertex AI Model Garden atau buka Gunakan Claude 3 untuk informasi terbaru.
| Model | ID model Vertex AI API |
|---|---|
| Claude Opus 4.7 | claude-opus-4-7 |
| Claude Opus 4.6 | claude-opus-4-6 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 |
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 ⚠️ | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 ⚠️ | claude-3-7-sonnet@20250219 |
| Claude Opus 4.5 | claude-opus-4-5@20251101 |
| Claude Opus 4.1 | claude-opus-4-1@20250805 |
| Claude Opus 4 ⚠️ | claude-opus-4@20250514 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
Sebelum menjalankan permintaan, Anda mungkin perlu menjalankan gcloud auth application-default login untuk autentikasi dengan GCP.
Contoh berikut menunjukkan cara menghasilkan teks dari Claude di Vertex AI:
Lihat client SDKs dan dokumentasi Vertex AI resmi untuk detail lebih lanjut.
Claude juga tersedia melalui Amazon Bedrock dan Microsoft Foundry.
Vertex menyediakan layanan pencatatan permintaan-respons yang memungkinkan pelanggan untuk mencatat prompt dan penyelesaian yang terkait dengan penggunaan Anda.
Anthropic merekomendasikan agar Anda mencatat aktivitas Anda setidaknya pada dasar rolling 30 hari untuk memahami aktivitas Anda dan menyelidiki potensi penyalahgunaan.
Mengaktifkan layanan ini tidak memberikan Google atau Anthropic akses apa pun ke konten Anda.
Untuk semua fitur yang saat ini didukung di Vertex AI, lihat ringkasan fitur API.
Claude Opus 4.7, Claude Opus 4.6, dan Claude Sonnet 4.6 memiliki jendela konteks 1M-token di Vertex AI. Model Claude lainnya, termasuk Sonnet 4.5 dan Sonnet 4 (deprecated), memiliki jendela konteks 200k-token.
Vertex AI membatasi payload permintaan hingga 30 MB. Saat mengirim dokumen besar atau banyak gambar, Anda mungkin mencapai batas ini sebelum batas token.
Google Vertex AI menawarkan tiga jenis endpoint:
Endpoint regional dan multi-region mencakup premium harga 10% di atas endpoint global.
Ini berlaku untuk Claude Sonnet 4.5 dan model masa depan saja. Model yang lebih lama (Claude Sonnet 4 (deprecated), Opus 4 (deprecated), dan sebelumnya) mempertahankan struktur harga yang ada.
Endpoint global (direkomendasikan):
Endpoint multi-region:
us dan eu)Endpoint regional:
Menggunakan endpoint global (direkomendasikan):
Atur parameter region ke "global" saat menginisialisasi klien:
Menggunakan endpoint multi-region:
Atur parameter region ke pengidentifikasi multi-region: "us" untuk Amerika Serikat atau "eu" untuk Uni Eropa. SDK merutkan permintaan ke endpoint multi-region yang sesuai (https://aiplatform.us.rep.googleapis.com atau https://aiplatform.eu.rep.googleapis.com), yang secara dinamis menyeimbangkan lalu lintas di seluruh wilayah dalam geografi tersebut.
Menggunakan endpoint regional:
Tentukan wilayah tertentu seperti "us-east1" atau "europe-west1":
Claude Mythos Preview adalah pratinjau penelitian yang tersedia untuk pelanggan yang diundang di Google Vertex AI. Untuk informasi lebih lanjut, lihat Project Glasswing.
| Claude Haiku 3.5 ⚠️ |
| claude-3-5-haiku@20241022 |
| Claude Haiku 3 ⚠️ | claude-3-haiku@20240307 |
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us" # Multi-region identifier: "us" or "eu"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us-east1" # Specify a specific region
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)