Loading...
  • Erstellen
  • Admin
  • Modelle & Preise
  • Client-SDKs
  • API-Referenz
Search...
⌘K
Log in
Datenspeicherort
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Admin/Administration

Datenspeicherort

Verwalten Sie, wo die Modellableitung ausgeführt wird und wo Daten mit geografischen Kontrollen gespeichert werden.

Was this page helpful?

  • Inference Geo
  • API-Verwendung
  • Antwort
  • Modellverfügbarkeit
  • Einschränkungen auf Workspace-Ebene
  • Workspace Geo
  • Preisgestaltung
  • Batch API-Unterstützung
  • Migration von Legacy-Opt-outs
  • Was sich geändert hat
  • Was mit Ihrem Workspace passiert ist
  • Wenn Sie Global Routing verwenden möchten
  • Auswirkungen auf die Preisgestaltung
  • Aktuelle Einschränkungen
  • Nächste Schritte

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

Mit Datenspeicherort-Kontrollen können Sie verwalten, wo Ihre Daten verarbeitet und gespeichert werden. Zwei unabhängige Einstellungen regeln dies:

  • Inference Geo: Steuert, wo die Modellableitung ausgeführt wird, auf Basis einzelner Anfragen. Wird über den inference_geo API-Parameter oder als Workspace-Standard festgelegt.
  • Workspace Geo: Steuert, wo Daten im Ruhezustand gespeichert werden und wo die Endpoint-Verarbeitung (Bildtranskodierung, Code-Ausführung usw.) stattfindet. Wird auf Workspace-Ebene in der Console konfiguriert.

Inference Geo

Der inference_geo-Parameter steuert, wo die Modellableitung für eine bestimmte API-Anfrage ausgeführt wird. Fügen Sie ihn zu jedem POST /v1/messages-Aufruf hinzu.

WertBeschreibung
"global"Standard. Die Ableitung kann in jeder verfügbaren Geografie für optimale Leistung und Verfügbarkeit ausgeführt werden.
"us"Die Ableitung wird nur in US-basierter Infrastruktur ausgeführt.

API-Verwendung

Antwort

Das usage-Objekt der Antwort enthält ein inference_geo-Feld, das angibt, wo die Ableitung ausgeführt wurde:

Output
{
  "usage": {
    "input_tokens": 25,
    "output_tokens": 150,
    "inference_geo": "us"
  }
}

Modellverfügbarkeit

Der inference_geo-Parameter wird auf Claude Opus 4.6 und allen nachfolgenden Modellen unterstützt. Ältere Modelle, die vor Opus 4.6 veröffentlicht wurden, unterstützen den Parameter nicht. Anfragen mit inference_geo auf Legacy-Modellen geben einen 400-Fehler zurück.

Der inference_geo-Parameter ist nur auf der Claude API (1P) verfügbar. Auf Plattformen von Drittanbietern (AWS Bedrock, Google Vertex AI) wird die Inferenzregion durch die Endpoint-URL oder das Inferenzprofil bestimmt, daher ist inference_geo nicht anwendbar. Der inference_geo-Parameter ist auch nicht über den OpenAI SDK-Kompatibilitäts-Endpoint verfügbar.

Einschränkungen auf Workspace-Ebene

Workspace-Einstellungen unterstützen auch die Einschränkung, welche Inference-Geos verfügbar sind:

  • allowed_inference_geos: Beschränkt, welche Geos ein Workspace verwenden kann. Wenn eine Anfrage ein inference_geo angibt, das nicht in dieser Liste enthalten ist, gibt die API einen Fehler zurück.
  • default_inference_geo: Legt die Fallback-Geo fest, wenn inference_geo in einer Anfrage weggelassen wird. Einzelne Anfragen können dies überschreiben, indem sie inference_geo explizit festlegen.

Diese Einstellungen können über die Console oder die Admin API unter dem Feld data_residency konfiguriert werden.

Workspace Geo

Workspace Geo wird beim Erstellen eines Workspace festgelegt und kann danach nicht mehr geändert werden. Derzeit ist "us" die einzige verfügbare Workspace-Geo.

Um Workspace Geo festzulegen, erstellen Sie einen neuen Workspace in der Console:

  1. Gehen Sie zu Settings > Workspaces.
  2. Erstellen Sie einen neuen Workspace.
  3. Wählen Sie die Workspace-Geo aus.

Preisgestaltung

Die Preisgestaltung für Datenspeicherort variiert je nach Modellgeneration:

  • Claude Opus 4.6 und neuer: US-only Inference (inference_geo: "us") wird mit dem 1,1-fachen des Standardsatzes über alle Token-Preiskategorien hinweg berechnet (Input-Token, Output-Token, Cache-Schreibvorgänge und Cache-Lesevorgänge).
  • Global Routing (inference_geo: "global" oder weggelassen): Standardpreise gelten.
  • Ältere Modelle: Die vorhandene Preisgestaltung bleibt unverändert, unabhängig von inference_geo-Einstellungen.

Diese Preisgestaltung gilt nur für die Claude API (1P). Plattformen von Drittanbietern (AWS Bedrock, Google Vertex AI) haben ihre eigene regionale Preisgestaltung. Weitere Informationen finden Sie auf der Preisseite.

Wenn Sie Priority Tier verwenden, wirkt sich der 1,1x-Multiplikator für US-only Inference auch darauf aus, wie Token gegen Ihre Priority Tier-Kapazität gezählt werden. Jedes Token, das mit inference_geo: "us" verbraucht wird, reduziert 1,1 Token aus Ihrem zugesagten TPM, konsistent mit der Art und Weise, wie andere Preismultiplikatoren (wie Prompt-Caching) die Abbauraten beeinflussen.

Batch API-Unterstützung

Der inference_geo-Parameter wird auf der Batch API unterstützt. Jede Anfrage in einem Batch kann ihren eigenen inference_geo-Wert angeben.

Migration von Legacy-Opt-outs

Wenn Ihre Organisation zuvor aus dem Global Routing abgemeldet hat, um die Inferenz in den USA zu halten, wurde Ihr Workspace automatisch mit allowed_inference_geos: ["us"] und default_inference_geo: "us" konfiguriert. Es sind keine Code-Änderungen erforderlich. Ihre bestehenden Anforderungen an die Datenspeicherung werden weiterhin durch die neuen Geo-Kontrollen durchgesetzt.

Was sich geändert hat

Das Legacy-Opt-out war eine Einstellung auf Organisationsebene, die alle Anfragen auf US-basierte Infrastruktur beschränkte. Die neuen Datenspeicherort-Kontrollen ersetzen dies durch zwei Mechanismen:

  • Kontrolle pro Anfrage: Der inference_geo-Parameter ermöglicht es Ihnen, "us" oder "global" bei jedem API-Aufruf anzugeben, was Ihnen Flexibilität auf Anfrage-Ebene gibt.
  • Workspace-Kontrollen: Die Einstellungen default_inference_geo und allowed_inference_geos in der Console ermöglichen es Ihnen, Geo-Richtlinien über alle Schlüssel in einem Workspace durchzusetzen.

Was mit Ihrem Workspace passiert ist

Ihr Workspace wurde automatisch migriert:

Legacy-EinstellungNeues Äquivalent
Global Routing Opt-out (nur US)allowed_inference_geos: ["us"], default_inference_geo: "us"

Alle API-Anfragen mit Schlüsseln aus Ihrem Workspace werden weiterhin auf US-basierter Infrastruktur ausgeführt. Es ist keine Aktion erforderlich, um Ihr aktuelles Verhalten beizubehalten.

Wenn Sie Global Routing verwenden möchten

Wenn sich Ihre Anforderungen an die Datenspeicherung geändert haben und Sie die Vorteile des Global Routing für bessere Leistung und Verfügbarkeit nutzen möchten, aktualisieren Sie die Inference Geo-Einstellungen Ihres Workspace, um "global" in die zulässigen Geos einzubeziehen und legen Sie default_inference_geo auf "global" fest. Weitere Informationen finden Sie unter Einschränkungen auf Workspace-Ebene.

Auswirkungen auf die Preisgestaltung

Legacy-Modelle sind von dieser Migration nicht betroffen. Aktuelle Preise für neuere Modelle finden Sie unter Preisgestaltung.

Aktuelle Einschränkungen

  • Gemeinsame Ratenlimits: Ratenlimits werden über alle Geos hinweg gemeinsam genutzt.
  • Inference Geo: Nur "us" und "global" sind beim Start verfügbar. Weitere Regionen werden im Laufe der Zeit hinzugefügt.
  • Workspace Geo: Derzeit ist nur "us" verfügbar. Workspace Geo kann nach der Workspace-Erstellung nicht geändert werden.

Nächste Schritte

Preisgestaltung

Zeigen Sie Details zur Preisgestaltung für Datenspeicherort an.

Workspaces

Erfahren Sie mehr über die Workspace-Konfiguration.

Usage and Cost API

Verfolgen Sie Nutzung und Kosten nach Datenspeicherort.

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    inference_geo="us",
    messages=[
        {"role": "user", "content": "Summarize the key points of this document."}
    ],
)

print(response.content[0].text)
# Check where inference actually ran
print(f"Inference geo: {response.usage.inference_geo}")