Claude di Vertex AI
API Vertex untuk mengakses Claude hampir identik dengan Messages API dan mendukung semua opsi yang sama, dengan dua perbedaan utama:
- Di Vertex,
modeltidak dilewatkan dalam badan permintaan. Sebaliknya, itu ditentukan dalam URL endpoint Google Cloud. - Di Vertex,
anthropic_versiondilewatkan dalam badan permintaan (bukan sebagai header), dan harus diatur ke nilaivertex-2023-10-16.
Vertex juga didukung oleh SDK klien resmi Anthropic. Panduan ini akan memandu Anda melalui proses membuat permintaan ke Claude di Vertex AI dalam Python atau TypeScript.
Perhatikan bahwa panduan ini mengasumsikan Anda sudah memiliki proyek GCP yang dapat menggunakan Vertex AI. Lihat menggunakan model Claude 3 dari Anthropic untuk informasi lebih lanjut tentang pengaturan yang diperlukan, serta panduan lengkap.
Instal SDK untuk mengakses Vertex AI
Pertama, instal SDK klien Anthropic untuk bahasa pilihan Anda.
pip install -U google-cloud-aiplatform "anthropic[vertex]"npm install @anthropic-ai/vertex-sdkMengakses Vertex AI
Ketersediaan Model
Perhatikan bahwa ketersediaan model Anthropic bervariasi menurut wilayah. Cari "Claude" di Vertex AI Model Garden atau buka Gunakan Claude 3 untuk informasi terbaru.
ID model API
| Model | ID model API Vertex AI |
|---|---|
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 | claude-3-7-sonnet@20250219 |
| Claude Opus 4.1 | claude-opus-4-1@20250805 |
| Claude Opus 4 | claude-opus-4@20250514 |
| Claude Opus 3 | claude-3-opus@20240229 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
| Claude Haiku 3.5 | claude-3-5-haiku@20241022 |
| Claude Haiku 3 | claude-3-haiku@20240307 |
Membuat permintaan
Sebelum menjalankan permintaan, Anda mungkin perlu menjalankan gcloud auth application-default login untuk autentikasi dengan GCP.
Contoh berikut menunjukkan cara menghasilkan teks dari Claude di Vertex AI:
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-sonnet-4-5@20250929",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Lihat SDK klien kami dan dokumentasi Vertex AI resmi untuk detail lebih lanjut.
Pencatatan aktivitas
Vertex menyediakan layanan pencatatan permintaan-respons yang memungkinkan pelanggan untuk mencatat prompt dan penyelesaian yang terkait dengan penggunaan Anda.
Anthropic merekomendasikan agar Anda mencatat aktivitas Anda setidaknya pada dasar 30 hari bergulir untuk memahami aktivitas Anda dan menyelidiki potensi penyalahgunaan.
Mengaktifkan layanan ini tidak memberikan Google atau Anthropic akses apa pun ke konten Anda.
Dukungan fitur
Anda dapat menemukan semua fitur yang saat ini didukung di Vertex di sini.
Endpoint global vs regional
Mulai dengan Claude Sonnet 4.5 dan semua model di masa depan, Google Vertex AI menawarkan dua jenis endpoint:
- Endpoint global: Perutean dinamis untuk ketersediaan maksimal
- Endpoint regional: Perutean data yang dijamin melalui wilayah geografis tertentu
Endpoint regional mencakup premium harga 10% dibandingkan endpoint global.
Ini berlaku untuk Claude Sonnet 4.5 dan model di masa depan saja. Model yang lebih lama (Claude Sonnet 4, Opus 4, dan sebelumnya) mempertahankan struktur harga yang ada.
Kapan menggunakan setiap opsi
Endpoint global (direkomendasikan):
- Memberikan ketersediaan dan uptime maksimal
- Secara dinamis merutkan permintaan ke wilayah dengan kapasitas yang tersedia
- Tidak ada premium harga
- Terbaik untuk aplikasi di mana residensi data fleksibel
- Hanya mendukung lalu lintas bayar sesuai penggunaan (throughput yang disediakan memerlukan endpoint regional)
Endpoint regional:
- Merutkan lalu lintas melalui wilayah geografis tertentu
- Diperlukan untuk persyaratan residensi data dan kepatuhan
- Mendukung lalu lintas bayar sesuai penggunaan dan throughput yang disediakan
- Premium harga 10% mencerminkan biaya infrastruktur untuk kapasitas regional yang didedikasikan
Implementasi
Menggunakan endpoint global (direkomendasikan):
Atur parameter region ke "global" saat menginisialisasi klien:
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-sonnet-4-5@20250929",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Menggunakan endpoint regional:
Tentukan wilayah tertentu seperti "us-east1" atau "europe-west1":
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us-east1" # Specify a specific region
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-sonnet-4-5@20250929",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Sumber daya tambahan
- Harga Google Vertex AI: cloud.google.com/vertex-ai/generative-ai/pricing
- Dokumentasi model Claude: Claude di Vertex AI
- Postingan blog Google: Endpoint global untuk model Claude
- Detail harga Anthropic: Dokumentasi harga