Diese Anleitung führt Sie durch den Prozess der Einrichtung und der Durchführung von API-Aufrufen an Claude in Foundry in Python, TypeScript oder unter Verwendung direkter HTTP-Anfragen. Wenn Sie auf Claude in Foundry zugreifen können, werden Sie für die Claude-Nutzung im Microsoft Marketplace mit Ihrem Azure-Abonnement abgerechnet, sodass Sie auf Claudes neueste Funktionen zugreifen können und gleichzeitig die Kosten über Ihr Azure-Abonnement verwalten können.
Regionale Verfügbarkeit: Bei der Einführung ist Claude als Global Standard-Bereitstellungstyp in Foundry-Ressourcen verfügbar, wobei US DataZone bald verfügbar sein wird. Die Preisgestaltung für Claude im Microsoft Marketplace verwendet die Standard-API-Preisgestaltung von Anthropic. Besuchen Sie unsere Preisseite für Details.
In dieser Vorschau-Plattformintegration werden Claude-Modelle auf der Infrastruktur von Anthropic ausgeführt. Dies ist eine kommerzielle Integration für die Abrechnung und den Zugriff über Azure. Als unabhängiger Verarbeiter für Microsoft unterliegen Kunden, die Claude über Microsoft Foundry nutzen, den Datenschutzbestimmungen von Anthropic. Anthropic setzt sich weiterhin für seine branchenführenden Sicherheits- und Datenverpflichtungen ein, einschließlich der Verfügbarkeit von Null-Datenspeicherung.
Bevor Sie beginnen, stellen Sie sicher, dass Sie über Folgendes verfügen:
Die Client-SDKs von Anthropic unterstützen Foundry über plattformspezifische Pakete.
# Python
pip install -U "anthropic"
# Typescript
npm install @anthropic-ai/foundry-sdkFoundry verwendet eine zweistufige Hierarchie: Ressourcen enthalten Ihre Sicherheits- und Abrechnungskonfiguration, während Bereitstellungen die Modellinstanzen sind, die Sie über die API aufrufen. Sie erstellen zunächst eine Foundry-Ressource und dann eine oder mehrere Claude-Bereitstellungen darin.
Erstellen Sie eine Foundry-Ressource, die erforderlich ist, um Dienste in Azure zu nutzen und zu verwalten. Sie können diese Anweisungen befolgen, um eine Foundry-Ressource zu erstellen. Alternativ können Sie mit der Erstellung eines Foundry-Projekts beginnen, was die Erstellung einer Foundry-Ressource beinhaltet.
So stellen Sie Ihre Ressource bereit:
{resource} in API-Endpunkten verwenden (z. B. https://{resource}.services.ai.azure.com/anthropic/v1/*)Nach der Erstellung Ihrer Ressource stellen Sie ein Claude-Modell bereit, um es für API-Aufrufe verfügbar zu machen:
claude-sonnet-4-5)my-claude-deployment). Der Bereitstellungsname kann nach der Erstellung nicht mehr geändert werden.Der Bereitstellungsname, den Sie wählen, wird zum Wert, den Sie im model-Parameter Ihrer API-Anfragen übergeben. Sie können mehrere Bereitstellungen desselben Modells mit unterschiedlichen Namen erstellen, um separate Konfigurationen oder Ratenlimits zu verwalten.
Claude on Foundry unterstützt zwei Authentifizierungsmethoden: API-Schlüssel und Entra ID-Token. Beide Methoden verwenden Azure-gehostete Endpunkte im Format https://{resource}.services.ai.azure.com/anthropic/v1/*.
Nach der Bereitstellung Ihrer Foundry Claude-Ressource können Sie einen API-Schlüssel aus dem Foundry-Portal abrufen:
api-key- oder x-api-key-Header in Ihren Anfragen, oder stellen Sie ihn dem SDK zur VerfügungDie Python- und TypeScript-SDKs erfordern einen API-Schlüssel und entweder einen Ressourcennamen oder eine Basis-URL. Die SDKs lesen diese automatisch aus den folgenden Umgebungsvariablen, falls definiert:
ANTHROPIC_FOUNDRY_API_KEY - Ihr API-SchlüsselANTHROPIC_FOUNDRY_RESOURCE - Ihr Ressourcenname (z. B. example-resource)ANTHROPIC_FOUNDRY_BASE_URL - Alternative zum Ressourcennamen; die vollständige Basis-URL (z. B. https://example-resource.services.ai.azure.com/anthropic/)Die Parameter resource und base_url schließen sich gegenseitig aus. Geben Sie entweder den Ressourcennamen an (den das SDK verwendet, um die URL als https://{resource}.services.ai.azure.com/anthropic/ zu konstruieren) oder die vollständige Basis-URL direkt.
Beispiel mit API-Schlüssel:
import os
from anthropic import AnthropicFoundry
client = AnthropicFoundry(
api_key=os.environ.get("ANTHROPIC_FOUNDRY_API_KEY"),
resource='example-resource', # your resource name
)
message = client.messages.create(
model="claude-sonnet-4-5",
max_tokens=1024,
messages=[{"role": "user", "content": "Hello!"}]
)
print(message.content)Halten Sie Ihre API-Schlüssel sicher. Committen Sie sie niemals in die Versionskontrolle und teilen Sie sie nicht öffentlich. Jeder, der Zugriff auf Ihren API-Schlüssel hat, kann Anfragen an Claude über Ihre Foundry-Ressource stellen.
Für verbesserte Sicherheit und zentralisierte Zugriffsverwaltung können Sie Entra ID-Token (ehemals Azure Active Directory) verwenden:
Authorization: Bearer {TOKEN}Beispiel mit Entra ID:
import os
from anthropic import AnthropicFoundry
from azure.identity import DefaultAzureCredential, get_bearer_token_provider
# Get Azure Entra ID token using token provider pattern
token_provider = get_bearer_token_provider(
DefaultAzureCredential(),
"https://cognitiveservices.azure.com/.default"
)
# Create client with Entra ID authentication
client = AnthropicFoundry(
resource='example-resource', # your resource name
azure_ad_token_provider=token_provider # Use token provider for Entra ID auth
)
# Make request
message = client.messages.create(
model="claude-sonnet-4-5",
max_tokens=1024,
messages=[{"role": "user", "content": "Hello!"}]
)
print(message.content)Die Azure Entra ID-Authentifizierung ermöglicht es Ihnen, den Zugriff mit Azure RBAC zu verwalten, sich in die Identitätsverwaltung Ihrer Organisation zu integrieren und API-Schlüssel nicht manuell zu verwalten.
Foundry enthält Request-Identifikatoren in HTTP-Antwortheadern zum Debuggen und Tracing. Wenn Sie den Support kontaktieren, geben Sie sowohl die request-id- als auch die apim-request-id-Werte an, um Teams dabei zu helfen, Ihre Anfrage schnell in beiden Anthropic- und Azure-Systemen zu lokalisieren und zu untersuchen.
Claude on Foundry unterstützt die meisten leistungsstarken Funktionen von Claude. Sie können alle derzeit unterstützten Funktionen hier finden.
/v1/organizations/* Endpunkte)/v1/models)/v1/messages/batches)API-Antworten von Claude on Foundry folgen dem Standard-Anthropic API-Antwortformat. Dies beinhaltet das usage-Objekt in Antworttexten, das detaillierte Informationen zum Token-Verbrauch für Ihre Anfragen liefert. Das usage-Objekt ist über alle Plattformen hinweg konsistent (First-Party-API, Foundry, Amazon Bedrock und Google Vertex AI).
Weitere Informationen zu Antwortheadern, die spezifisch für Foundry sind, finden Sie im Abschnitt Korrelations-Request-IDs.
Die folgenden Claude-Modelle sind über Foundry verfügbar. Die Modelle der neuesten Generation (Sonnet 4.5, Opus 4.1 und Haiku 4.5) bieten die fortschrittlichsten Funktionen:
| Modell | Standard-Bereitstellungsname |
|---|---|
| Claude Opus 4.5 | claude-opus-4-5 |
| Claude Sonnet 4.5 | claude-sonnet-4-5 |
| Claude Opus 4.1 | claude-opus-4-1 |
| Claude Haiku 4.5 | claude-haiku-4-5 |
Standardmäßig stimmen Bereitstellungsnamen mit den oben gezeigten Modell-IDs überein. Sie können jedoch benutzerdefinierte Bereitstellungen mit unterschiedlichen Namen im Foundry-Portal erstellen, um verschiedene Konfigurationen, Versionen oder Ratenlimits zu verwalten. Verwenden Sie den Bereitstellungsnamen (nicht unbedingt die Modell-ID) in Ihren API-Anfragen.
Azure bietet umfassende Überwachungs- und Protokollierungsfunktionen für Ihre Claude-Nutzung über Standard-Azure-Muster:
Anthropic empfiehlt, Ihre Aktivität mindestens auf einer 30-Tage-Rollbasis zu protokollieren, um Nutzungsmuster zu verstehen und potenzielle Probleme zu untersuchen.
Die Protokollierungsdienste von Azure werden in Ihrem Azure-Abonnement konfiguriert. Das Aktivieren der Protokollierung gibt Microsoft oder Anthropic keinen Zugriff auf Ihren Inhalt über das hinaus, was für die Abrechnung und den Betrieb des Dienstes erforderlich ist.
Fehler: 401 Unauthorized oder Invalid API key
Fehler: 403 Forbidden
Fehler: 429 Too Many Requests
Foundry enthält nicht die Standard-Ratenlimit-Header von Anthropic (anthropic-ratelimit-tokens-limit, anthropic-ratelimit-tokens-remaining, anthropic-ratelimit-tokens-reset, anthropic-ratelimit-input-tokens-limit, anthropic-ratelimit-input-tokens-remaining, anthropic-ratelimit-input-tokens-reset, anthropic-ratelimit-output-tokens-limit, anthropic-ratelimit-output-tokens-remaining und anthropic-ratelimit-output-tokens-reset) in Antworten. Verwalten Sie die Ratenlimitierung stattdessen über die Überwachungstools von Azure.
Fehler: Model not found oder Deployment not found
claude-sonnet-4-5).Fehler: Invalid model parameter