Was this page helpful?
이 가이드는 Python, TypeScript 또는 직접 HTTP 요청을 사용하여 Foundry에서 Claude를 설정하고 API 호출을 수행하는 과정을 안내합니다. Foundry에서 Claude에 액세스할 수 있으면 Azure 구독을 통해 Microsoft Marketplace에서 Claude 사용량에 대해 청구되므로, Azure 구독을 통해 비용을 관리하면서 Claude의 최신 기능에 액세스할 수 있습니다.
지역 가용성: 출시 시점에 Claude는 Foundry 리소스에서 Global Standard 배포 유형으로 사용할 수 있습니다(US DataZone 곧 제공 예정). Microsoft Marketplace에서 Claude의 가격은 Anthropic의 표준 API 가격을 사용합니다. 자세한 내용은 가격 페이지를 방문하세요.
이 미리보기 플랫폼 통합에서 Claude 모델은 Anthropic의 인프라에서 실행됩니다. 이것은 Azure를 통한 청구 및 액세스를 위한 상업적 통합입니다. Microsoft의 독립 처리자로서, Microsoft Foundry를 통해 Claude를 사용하는 고객은 Anthropic의 데이터 사용 약관의 적용을 받습니다. Anthropic은 제로 데이터 보존 가용성을 포함하여 업계 최고 수준의 안전 및 데이터 약속을 계속 제공합니다.
시작하기 전에 다음 사항을 확인하세요:
Anthropic의 클라이언트 SDK는 플랫폼별 패키지를 통해 Foundry를 지원합니다.
Foundry는 2단계 계층 구조를 사용합니다: 리소스에는 보안 및 청구 구성이 포함되고, 배포는 API를 통해 호출하는 모델 인스턴스입니다. 먼저 Foundry 리소스를 생성한 다음 그 안에 하나 이상의 Claude 배포를 생성합니다.
Azure에서 서비스를 사용하고 관리하는 데 필요한 Foundry 리소스를 생성합니다. 다음 지침에 따라 Foundry 리소스를 생성할 수 있습니다. 또는 Foundry 리소스 생성을 포함하는 Foundry 프로젝트를 생성하는 것부터 시작할 수 있습니다.
리소스를 프로비저닝하려면:
{resource}로 사용합니다 (예: https://{resource}.services.ai.azure.com/anthropic/v1/*)리소스를 생성한 후 Claude 모델을 배포하여 API 호출에 사용할 수 있도록 합니다:
claude-sonnet-4-6)my-claude-deployment). 배포 이름은 생성 후 변경할 수 없습니다.선택한 배포 이름은 API 요청의 model 매개변수에 전달하는 값이 됩니다. 동일한 모델의 여러 배포를 서로 다른 이름으로 생성하여 별도의 구성이나 속도 제한을 관리할 수 있습니다.
Foundry의 Claude는 API 키와 Entra ID 토큰의 두 가지 인증 방법을 지원합니다. 두 방법 모두 https://{resource}.services.ai.azure.com/anthropic/v1/* 형식의 Azure 호스팅 엔드포인트를 사용합니다.
Foundry Claude 리소스를 프로비저닝한 후 Foundry 포털에서 API 키를 얻을 수 있습니다:
api-key 또는 x-api-key 헤더를 사용하거나 SDK에 제공합니다Python 및 TypeScript SDK는 API 키와 리소스 이름 또는 기본 URL이 필요합니다. SDK는 다음 환경 변수가 정의되어 있으면 자동으로 읽습니다:
ANTHROPIC_FOUNDRY_API_KEY - API 키ANTHROPIC_FOUNDRY_RESOURCE - 리소스 이름 (예: example-resource)ANTHROPIC_FOUNDRY_BASE_URL - 리소스 이름의 대안; 전체 기본 URL (예: https://example-resource.services.ai.azure.com/anthropic/)resource와 base_url 매개변수는 상호 배타적입니다. 리소스 이름(SDK가 https://{resource}.services.ai.azure.com/anthropic/으로 URL을 구성하는 데 사용)이나 전체 기본 URL 중 하나만 제공하세요.
API 키 사용 예시:
API 키를 안전하게 보관하세요. 버전 관리에 커밋하거나 공개적으로 공유하지 마세요. API 키에 액세스할 수 있는 사람은 누구나 Foundry 리소스를 통해 Claude에 요청할 수 있습니다.
향상된 보안과 중앙 집중식 액세스 관리를 위해 Entra ID(이전의 Azure Active Directory) 토큰을 사용할 수 있습니다:
Authorization: Bearer {TOKEN} 헤더에 토큰을 사용합니다Entra ID 사용 예시:
Azure Entra ID 인증을 사용하면 Azure RBAC를 사용하여 액세스를 관리하고, 조직의 ID 관리와 통합하며, API 키를 수동으로 관리하는 것을 피할 수 있습니다.
Foundry는 디버깅 및 추적을 위해 HTTP 응답 헤더에 요청 식별자를 포함합니다. 지원팀에 문의할 때 request-id와 apim-request-id 값을 모두 제공하면 Anthropic과 Azure 시스템 모두에서 요청을 빠르게 찾고 조사하는 데 도움이 됩니다.
Foundry의 Claude는 Claude의 강력한 기능 대부분을 지원합니다. 현재 지원되는 모든 기능은 개요 문서에서 확인할 수 있습니다.
/v1/organizations/* 엔드포인트)/v1/models)/v1/messages/batches)Foundry의 Claude에서 오는 API 응답은 표준 Claude API 응답 형식을 따릅니다. 여기에는 응답 본문의 usage 객체가 포함되어 있으며, 요청에 대한 상세한 토큰 소비 정보를 제공합니다. usage 객체는 모든 플랫폼(자사 API, Foundry, Amazon Bedrock 및 Google Vertex AI)에서 일관됩니다.
Foundry에 특화된 응답 헤더에 대한 자세한 내용은 상관 요청 ID 섹션을 참조하세요.
다음 Claude 모델은 Foundry를 통해 사용할 수 있습니다. 최신 세대 모델(Opus 4.6, Sonnet 4.6, Haiku 4.5)은 가장 진보된 기능을 제공합니다:
| 모델 | 기본 배포 이름 |
|---|---|
| Claude Opus 4.6 | claude-opus-4-6 |
| Claude Opus 4.5 | claude-opus-4-5 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 |
| Claude Sonnet 4.5 | claude-sonnet-4-5 |
| Claude Opus 4.1 | claude-opus-4-1 |
| Claude Haiku 4.5 | claude-haiku-4-5 |
기본적으로 배포 이름은 위에 표시된 모델 ID와 일치합니다. 그러나 Foundry 포털에서 다른 이름으로 사용자 정의 배포를 생성하여 다른 구성, 버전 또는 속도 제한을 관리할 수 있습니다. API 요청에서는 모델 ID가 아닌 배포 이름을 사용하세요.
Azure는 표준 Azure 패턴을 통해 Claude 사용에 대한 포괄적인 모니터링 및 로깅 기능을 제공합니다:
Anthropic은 사용 패턴을 이해하고 잠재적인 문제를 조사하기 위해 최소 30일 롤링 기준으로 활동을 로깅할 것을 권장합니다.
Azure의 로깅 서비스는 Azure 구독 내에서 구성됩니다. 로깅을 활성화해도 청구 및 서비스 운영에 필요한 것 이상으로 Microsoft나 Anthropic에 콘텐츠에 대한 액세스를 제공하지 않습니다.
오류: 401 Unauthorized 또는 Invalid API key
오류: 403 Forbidden
오류: 429 Too Many Requests
Foundry는 응답에 Anthropic의 표준 속도 제한 헤더(anthropic-ratelimit-tokens-limit, anthropic-ratelimit-tokens-remaining, anthropic-ratelimit-tokens-reset, anthropic-ratelimit-input-tokens-limit, anthropic-ratelimit-input-tokens-remaining, anthropic-ratelimit-input-tokens-reset, anthropic-ratelimit-output-tokens-limit, anthropic-ratelimit-output-tokens-remaining, anthropic-ratelimit-output-tokens-reset)를 포함하지 않습니다. 대신 Azure의 모니터링 도구를 통해 속도 제한을 관리하세요.
오류: Model not found 또는 Deployment not found
claude-sonnet-4-6).오류: Invalid model parameter
import os
from anthropic import AnthropicFoundry
client = AnthropicFoundry(
api_key=os.environ.get("ANTHROPIC_FOUNDRY_API_KEY"),
resource="example-resource", # your resource name
)
message = client.messages.create(
model="claude-opus-4-6",
max_tokens=1024,
messages=[{"role": "user", "content": "Hello!"}],
)
print(message.content)import os
from anthropic import AnthropicFoundry
from azure.identity import DefaultAzureCredential, get_bearer_token_provider
# Get Azure Entra ID token using token provider pattern
token_provider = get_bearer_token_provider(
DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)
# Create client with Entra ID authentication
client = AnthropicFoundry(
resource="example-resource", # your resource name
azure_ad_token_provider=token_provider, # Use token provider for Entra ID auth
)
# Make request
message = client.messages.create(
model="claude-opus-4-6",
max_tokens=1024,
messages=[{"role": "user", "content": "Hello!"}],
)
print(message.content)