Questa funzionalità è idonea per la Zero Data Retention (ZDR). Quando la tua organizzazione dispone di un accordo ZDR, i dati inviati tramite questa funzionalità non vengono conservati dopo che la risposta dell'API è stata restituita.
I controlli di residenza dei dati ti consentono di gestire dove i tuoi dati vengono elaborati e archiviati. Due impostazioni indipendenti governano questo aspetto:
inference_geo o come impostazione predefinita del workspace.Claude Managed Agents non supporta il parametro inference_geo, ma rispetta il Workspace geo configurato nella Console. Con le sandbox self-hosted, l'esecuzione degli strumenti e il filesystem della sandbox rimangono sull'infrastruttura che controlli tu.
Il parametro inference_geo controlla dove viene eseguita l'inferenza del modello per una specifica richiesta API. Aggiungilo a qualsiasi chiamata POST /v1/messages.
| Valore | Descrizione |
|---|---|
"global" | Predefinito. L'inferenza può essere eseguita in qualsiasi area geografica disponibile per prestazioni e disponibilità ottimali. |
"us" | L'inferenza viene eseguita solo su infrastruttura basata negli Stati Uniti. |
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
inference_geo="us",
messages=[
{"role": "user", "content": "Summarize the key points of this document."}
],
)
print(response.content[0].text)
# Verifica dove è stata effettivamente eseguita l'inferenza
print(f"Inference geo: {response.usage.inference_geo}")L'oggetto usage della risposta include un campo inference_geo che indica dove è stata eseguita l'inferenza:
{
"usage": {
"input_tokens": 25,
"output_tokens": 150,
"inference_geo": "us"
}
}Il parametro inference_geo è supportato su Claude Opus 4.6, Claude Sonnet 4.6 e modelli successivi. Le richieste con inference_geo su Claude Opus 4.5, Claude Sonnet 4.5, Claude Haiku 4.5 o modelli precedenti restituiscono un errore 400.
Il parametro inference_geo è disponibile sull'API Claude (first-party) e su Claude Platform on AWS. Su Amazon Bedrock, Vertex AI e Microsoft Foundry, la regione di inferenza è determinata dall'URL dell'endpoint o dal profilo di inferenza, quindi inference_geo non è applicabile. Il parametro inference_geo non è inoltre disponibile tramite l'endpoint di compatibilità OpenAI SDK.
Le impostazioni del workspace supportano anche la restrizione delle inference geo disponibili:
allowed_inference_geos: Limita quali geo un workspace può utilizzare. Se una richiesta specifica un inference_geo non presente in questo elenco, l'API restituisce un errore.default_inference_geo: Imposta la geo di fallback quando inference_geo viene omesso da una richiesta. Le singole richieste possono sovrascrivere questa impostazione specificando esplicitamente inference_geo.Queste impostazioni possono essere configurate tramite la Console o l'Admin API nel campo data_residency.
Il Workspace geo viene impostato quando crei un workspace e non può essere modificato successivamente. Attualmente, "us" è l'unico workspace geo disponibile.
Per impostare il workspace geo, crea un nuovo workspace nella Console:
Claude Platform on AWS: Il Workspace geo non è configurabile. I workspace vengono forniti tramite la AWS Console e la pagina Workspaces della Claude Console è di sola lettura. Le sessioni di Claude Managed Agents su questa piattaforma vengono eseguite con un Workspace geo effettivo di "us", che è attualmente l'unico workspace geo disponibile. Consulta Claude Platform on AWS per le considerazioni sulla residenza dei dati specifiche di quella piattaforma.
I prezzi della residenza dei dati variano in base alla generazione del modello:
inference_geo: "us") ha un prezzo pari a 1,1x la tariffa standard su tutte le categorie di prezzo dei token (token di input, token di output, scritture in cache e letture dalla cache).inference_geo: "global"): Si applicano i prezzi standard.inference_geo (vedi Disponibilità dei modelli); si applicano i prezzi standard. Le richieste che includono il parametro restituiscono un errore 400.Questi prezzi si applicano all'API Claude (first-party) e a Claude Platform on AWS. Le piattaforme gestite dai partner (Bedrock e Vertex AI) hanno i propri prezzi regionali. Consulta Prezzi della residenza dei dati per i dettagli.
Se utilizzi Priority Tier, il moltiplicatore 1,1x per l'inferenza solo negli Stati Uniti influisce anche sul modo in cui i token vengono conteggiati rispetto alla tua capacità Priority Tier. Ogni token consumato con inference_geo: "us" sottrae 1,1 token dal tuo TPM impegnato, coerentemente con il modo in cui altri moltiplicatori di prezzo (come la cache dei prompt) influiscono sui tassi di consumo.
Il parametro inference_geo è supportato sulla Batch API. Ogni richiesta in un batch può specificare il proprio valore inference_geo.
Se la tua organizzazione aveva precedentemente disattivato il routing globale per mantenere l'inferenza negli Stati Uniti, il tuo workspace è stato configurato automaticamente con allowed_inference_geos: ["us"] e default_inference_geo: "us". Non sono necessarie modifiche al codice. I tuoi requisiti esistenti di residenza dei dati continuano a essere applicati tramite i nuovi controlli geo.
L'opt-out legacy era un'impostazione a livello di organizzazione che limitava tutte le richieste all'infrastruttura basata negli Stati Uniti. I nuovi controlli di residenza dei dati lo sostituiscono con due meccanismi:
inference_geo ti consente di specificare "us" o "global" su ogni chiamata API, offrendoti flessibilità a livello di richiesta.default_inference_geo e allowed_inference_geos nella Console ti consentono di applicare policy geo su tutte le chiavi di un workspace.Il tuo workspace è stato migrato automaticamente:
| Impostazione legacy | Nuovo equivalente |
|---|---|
| Opt-out dal routing globale (solo US) | allowed_inference_geos: ["us"], default_inference_geo: "us" |
Tutte le richieste API che utilizzano chiavi del tuo workspace continuano a essere eseguite su infrastruttura basata negli Stati Uniti. Non è necessaria alcuna azione per mantenere il comportamento attuale.
Se i tuoi requisiti di residenza dei dati sono cambiati e vuoi sfruttare il routing globale per migliori prestazioni e disponibilità, aggiorna le impostazioni inference geo del tuo workspace per includere "global" nelle geo consentite e imposta default_inference_geo su "global". Consulta Restrizioni a livello di workspace per i dettagli.
I modelli legacy non sono interessati da questa migrazione. Per i prezzi attuali sui modelli più recenti, consulta Prezzi.
"us" e "global"."us". Il Workspace geo non può essere modificato dopo la creazione del workspace.Visualizza i dettagli sui prezzi della residenza dei dati.
Scopri di più sulla configurazione dei workspace.
Monitora l'utilizzo e i costi per residenza dei dati.
Was this page helpful?