Was this page helpful?
Claude에 액세스하기 위한 Vertex API는 Messages API와 거의 동일하며 동일한 모든 옵션을 지원하지만 두 가지 주요 차이점이 있습니다:
model이 요청 본문에 전달되지 않습니다. 대신 Google Cloud 엔드포인트 URL에 지정됩니다.anthropic_version이 요청 본문에 전달되며(헤더가 아님), vertex-2023-10-16 값으로 설정되어야 합니다.Vertex는 또한 Anthropic의 공식 클라이언트 SDK에서 지원됩니다. 이 가이드는 Anthropic의 클라이언트 SDK 중 하나를 사용하여 Vertex AI의 Claude에 요청을 하는 방법을 안내합니다.
이 가이드는 Vertex AI를 사용할 수 있는 GCP 프로젝트가 이미 있다고 가정합니다. 필요한 설정 및 전체 연습에 대한 자세한 내용은 Anthropic에서 Claude 3 모델 사용을 참조하세요.
먼저 선택한 언어에 대해 Anthropic의 클라이언트 SDK를 설치합니다.
Anthropic 모델 가용성은 지역에 따라 다릅니다. Vertex AI Model Garden에서 "Claude"를 검색하거나 Claude 3 사용으로 이동하여 최신 정보를 확인하세요.
| 모델 | Vertex AI API 모델 ID |
|---|---|
| Claude Opus 4.7 | claude-opus-4-7 |
| Claude Opus 4.6 | claude-opus-4-6 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 |
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 ⚠️ | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 ⚠️ | claude-3-7-sonnet@20250219 |
| Claude Opus 4.5 | claude-opus-4-5@20251101 |
| Claude Opus 4.1 | claude-opus-4-1@20250805 |
| Claude Opus 4 ⚠️ | claude-opus-4@20250514 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
| Claude Haiku 3.5 |
요청을 실행하기 전에 GCP로 인증하기 위해 gcloud auth application-default login을 실행해야 할 수 있습니다.
다음 예제는 Vertex AI의 Claude에서 텍스트를 생성하는 방법을 보여줍니다:
자세한 내용은 클라이언트 SDK 및 공식 Vertex AI 문서를 참조하세요.
Claude는 또한 Amazon Bedrock 및 Microsoft Foundry를 통해 사용 가능합니다.
Vertex는 요청-응답 로깅 서비스를 제공하여 고객이 사용과 관련된 프롬프트 및 완성을 로깅할 수 있습니다.
Anthropic은 활동을 이해하고 잠재적인 오용을 조사하기 위해 최소 30일 롤링 기준으로 활동을 로깅할 것을 권장합니다.
이 서비스를 켜도 Google이나 Anthropic에 콘텐츠에 대한 액세스 권한이 부여되지 않습니다.
Vertex AI에서 현재 지원되는 모든 기능은 API 기능 개요를 참조하세요.
Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6은 Vertex AI에서 1M 토큰 컨텍스트 윈도우를 가집니다. Sonnet 4.5 및 Sonnet 4(더 이상 사용되지 않음)를 포함한 다른 Claude 모델은 200k 토큰 컨텍스트 윈도우를 가집니다.
Vertex AI는 요청 페이로드를 30MB로 제한합니다. 큰 문서나 많은 이미지를 보낼 때 토큰 제한에 도달하기 전에 이 제한에 도달할 수 있습니다.
Google Vertex AI는 세 가지 엔드포인트 유형을 제공합니다:
지역 및 다중 지역 엔드포인트는 글로벌 엔드포인트보다 10% 가격 프리미엄을 포함합니다.
이는 Claude Sonnet 4.5 및 향후 모델에만 적용됩니다. 이전 모델(Claude Sonnet 4(더 이상 사용되지 않음), Opus 4(더 이상 사용되지 않음) 및 이전 버전)은 기존 가격 구조를 유지합니다.
글로벌 엔드포인트(권장):
다중 지역 엔드포인트:
us 및 eu) 내의 지역 전체에서 요청을 동적으로 라우팅지역 엔드포인트:
글로벌 엔드포인트 사용(권장):
클라이언트를 초기화할 때 region 매개변수를 "global"로 설정합니다:
다중 지역 엔드포인트 사용:
region 매개변수를 다중 지역 식별자로 설정합니다: 미국의 경우 "us" 또는 유럽 연합의 경우 "eu". SDK는 해당 다중 지역 엔드포인트(https://aiplatform.us.rep.googleapis.com 또는 https://aiplatform.eu.rep.googleapis.com)로 요청을 라우팅하며, 이는 해당 지리 내의 지역 전체에서 트래픽을 동적으로 균형 조정합니다.
지역 엔드포인트 사용:
"us-east1" 또는 "europe-west1"과 같은 특정 지역을 지정합니다:
Claude Mythos Preview는 Google Vertex AI의 초대된 고객에게 제공되는 연구 미리보기입니다. 자세한 내용은 Project Glasswing을 참조하세요.
| claude-3-5-haiku@20241022 |
| Claude Haiku 3 ⚠️ | claude-3-haiku@20240307 |
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us" # Multi-region identifier: "us" or "eu"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us-east1" # Specify a specific region
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)