Prompt caching ottimizza l'utilizzo dell'API consentendo di riprendere da prefissi specifici nei tuoi prompt. Questo riduce significativamente il tempo di elaborazione e i costi per attività ripetitive o prompt con elementi coerenti.
This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
Ci sono due modi per abilitare prompt caching:
cache_control al livello superiore della tua richiesta. Il sistema applica automaticamente il breakpoint della cache all'ultimo blocco cacheable e lo sposta in avanti man mano che le conversazioni crescono. Ideale per conversazioni multi-turno dove la cronologia dei messaggi in crescita dovrebbe essere memorizzata automaticamente.cache_control direttamente su singoli blocchi di contenuto per un controllo granulare su esattamente cosa viene memorizzato.Il modo più semplice per iniziare è con il caching automatico:
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=1024,
cache_control={"type": "ephemeral"},
system="You are an AI assistant tasked with analyzing literary works. Your goal is to provide insightful commentary on themes, characters, and writing style.",
messages=[
{
"role": "user",
"content": "Analyze the major themes in 'Pride and Prejudice'.",
}
],
)
print(response.usage.model_dump_json())Con il caching automatico, il sistema memorizza tutto il contenuto fino a e incluso l'ultimo blocco cacheable. Nelle richieste successive con lo stesso prefisso, il contenuto memorizzato viene riutilizzato automaticamente.
Quando invii una richiesta con prompt caching abilitato:
Questo è particolarmente utile per:
Per impostazione predefinita, la cache ha una durata di 5 minuti. La cache viene aggiornata senza costi aggiuntivi ogni volta che il contenuto memorizzato viene utilizzato.
Se ritieni che 5 minuti sia troppo breve, Anthropic offre anche una durata della cache di 1 ora a costo aggiuntivo.
Per ulteriori informazioni, vedi durata della cache di 1 ora.
Prompt caching memorizza l'intero prefisso
Prompt caching fa riferimento all'intero prompt - tools, system e messages (in quell'ordine) fino a e incluso il blocco designato con cache_control.
Prompt caching introduce una nuova struttura di prezzi. La tabella seguente mostra il prezzo per milione di token per ogni modello supportato:
| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.7 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.6 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.5 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.6 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI) | $0.80 / MTok | $1 / MTok | $1.60 / MTok | $0.08 / MTok | $4 / MTok |
La tabella sopra riflette i seguenti moltiplicatori di prezzo per prompt caching:
Questi moltiplicatori si sommano ad altri modificatori di prezzo come lo sconto Batch API e la residenza dei dati. Vedi prezzi per i dettagli completi.
Prompt caching (sia automatico che esplicito) è supportato su tutti i modelli Claude attivi.
Il caching automatico è il modo più semplice per abilitare prompt caching. Invece di posizionare cache_control su singoli blocchi di contenuto, aggiungi un singolo campo cache_control al livello superiore del corpo della tua richiesta. Il sistema applica automaticamente il breakpoint della cache all'ultimo blocco cacheable.
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=1024,
cache_control={"type": "ephemeral"},
system="You are a helpful assistant that remembers our conversation.",
messages=[
{"role": "user", "content": "My name is Alex. I work on machine learning."},
{
"role": "assistant",
"content": "Nice to meet you, Alex! How can I help with your ML work today?",
},
{"role": "user", "content": "What did I say I work on?"},
],
)
print(response.usage.model_dump_json())Con il caching automatico, il punto della cache si sposta in avanti automaticamente man mano che le conversazioni crescono. Ogni nuova richiesta memorizza tutto fino all'ultimo blocco cacheable, e il contenuto precedente viene letto dalla cache.
| Richiesta | Contenuto | Comportamento della cache |
|---|---|---|
| Richiesta 1 | System + User(1) + Asst(1) + User(2) ◀ cache | Tutto scritto nella cache |
| Richiesta 2 | System + User(1) + Asst(1) + User(2) + Asst(2) + User(3) ◀ cache | System fino a User(2) letto dalla cache; Asst(2) + User(3) scritto nella cache |
| Richiesta 3 | System + User(1) + Asst(1) + User(2) + Asst(2) + User(3) + Asst(3) + User(4) ◀ cache | System fino a User(3) letto dalla cache; Asst(3) + User(4) scritto nella cache |
Il breakpoint della cache si sposta automaticamente all'ultimo blocco cacheable in ogni richiesta, quindi non è necessario aggiornare alcun marcatore cache_control man mano che la conversazione cresce.
Per impostazione predefinita, il caching automatico utilizza un TTL di 5 minuti. Puoi specificare un TTL di 1 ora a 2 volte il prezzo del token di input di base:
{ "cache_control": { "type": "ephemeral", "ttl": "1h" } }Il caching automatico è compatibile con i breakpoint della cache espliciti. Quando utilizzati insieme, il breakpoint della cache automatica utilizza uno dei 4 slot di breakpoint disponibili.
Questo ti consente di combinare entrambi gli approcci. Ad esempio, utilizza breakpoint espliciti per memorizzare il tuo prompt di sistema e gli strumenti in modo indipendente, mentre il caching automatico gestisce la conversazione:
{
"model": "claude-opus-4-7",
"max_tokens": 1024,
"cache_control": { "type": "ephemeral" },
"system": [
{
"type": "text",
"text": "You are a helpful assistant.",
"cache_control": { "type": "ephemeral" }
}
],
"messages": [{ "role": "user", "content": "What are the key terms?" }]
}Il caching automatico utilizza la stessa infrastruttura di caching sottostante. I prezzi, le soglie minime di token, i requisiti di ordinamento del contesto e la finestra di lookback di 20 blocchi si applicano allo stesso modo dei breakpoint espliciti.
cache_control esplicito con lo stesso TTL, il caching automatico è un no-op.cache_control esplicito con un TTL diverso, l'API restituisce un errore 400.Il caching automatico è disponibile su Claude API e Azure AI Foundry (anteprima). Il supporto per Amazon Bedrock e Google Vertex AI arriverà in seguito.
Per un maggiore controllo sulla caching, puoi posizionare cache_control direttamente su singoli blocchi di contenuto. Questo è utile quando è necessario memorizzare diverse sezioni che cambiano a frequenze diverse, o quando è necessario un controllo granulare su esattamente cosa viene memorizzato.
Posiziona il contenuto statico (definizioni di strumenti, istruzioni di sistema, contesto, esempi) all'inizio del tuo prompt. Contrassegna la fine del contenuto riutilizzabile per la caching utilizzando il parametro cache_control.
I prefissi della cache vengono creati nel seguente ordine: tools, system, quindi messages. Questo ordine forma una gerarchia in cui ogni livello si basa su quelli precedenti.
Puoi utilizzare un solo breakpoint della cache alla fine del tuo contenuto statico, e il sistema troverà automaticamente il prefisso più lungo che una richiesta precedente ha già scritto nella cache. Comprendere come funziona aiuta a ottimizzare la tua strategia di caching.
Tre principi fondamentali:
Le scritture della cache avvengono solo al tuo breakpoint. Contrassegnare un blocco con cache_control scrive esattamente una voce della cache: un hash del prefisso che termina a quel blocco. Il sistema non scrive voci per nessuna posizione precedente. Poiché l'hash è cumulativo, coprendo tutto fino a e incluso il breakpoint, modificare qualsiasi blocco al o prima del breakpoint produce un hash diverso nella richiesta successiva.
Le letture della cache guardano all'indietro per le voci che le richieste precedenti hanno scritto. Su ogni richiesta il sistema calcola l'hash del prefisso al tuo breakpoint e verifica la presenza di una voce della cache corrispondente. Se non esiste, cammina all'indietro un blocco alla volta, verificando se l'hash del prefisso a ogni posizione precedente corrisponde a qualcosa già nella cache. Sta cercando scritture precedenti, non contenuto stabile.
La finestra di lookback è di 20 blocchi. Il sistema verifica al massimo 20 posizioni per breakpoint, contando il breakpoint stesso come il primo. Se il sistema non trova alcuna voce corrispondente in quella finestra, il controllo si ferma (o riprende dal breakpoint esplicito successivo, se presente).
Esempio: Lookback in una conversazione in crescita
Aggiungi nuovi blocchi ad ogni turno e imposta cache_control sul blocco finale di ogni richiesta:
Errore comune: Breakpoint su contenuto che cambia ad ogni richiesta
Il tuo prompt ha un grande contesto di sistema statico (blocchi 1 attraverso 5) seguito da un blocco per richiesta contenente un timestamp e il messaggio dell'utente (blocco 6). Imposti cache_control sul blocco 6:
Il lookback non trova contenuto stabile dietro il tuo breakpoint e lo memorizza. Trova voci che le richieste precedenti hanno già scritto, e le scritture avvengono solo ai breakpoint. Sposta cache_control al blocco 5, l'ultimo blocco che rimane lo stesso tra le richieste, e ogni richiesta successiva legge il prefisso memorizzato. Il caching automatico colpisce la stessa trappola: posiziona il breakpoint sull'ultimo blocco cacheable, che in questa struttura è quello che cambia ad ogni richiesta, quindi utilizza un breakpoint esplicito al blocco 5 invece.
Punto chiave: Posiziona cache_control sull'ultimo blocco il cui prefisso è identico tra le richieste che desideri condividere una cache. In una conversazione in crescita il blocco finale funziona finché ogni turno aggiunge meno di 20 blocchi: il contenuto precedente non cambia mai, quindi il lookback della richiesta successiva trova la scrittura precedente. Per un prompt con un suffisso variabile (timestamp, contesto per richiesta, il messaggio in arrivo), posiziona il breakpoint alla fine del prefisso statico, non sul blocco variabile.
Puoi definire fino a 4 breakpoint della cache se desideri:
Limitazione importante: Il lookback può trovare solo voci che le richieste precedenti hanno già scritto. Se una conversazione in crescita spinge il tuo breakpoint 20 o più blocchi oltre l'ultima scrittura, la finestra di lookback la manca. Aggiungi un secondo breakpoint più vicino a quella posizione dall'inizio in modo che una scrittura si accumuli lì prima che ne avrai bisogno.
I breakpoint della cache stessi non aggiungono alcun costo. Sei addebitato solo per:
Aggiungere più breakpoint cache_control non aumenta i tuoi costi - paghi comunque lo stesso importo in base a quale contenuto è effettivamente memorizzato e letto. I breakpoint ti danno semplicemente il controllo su quali sezioni possono essere memorizzate in modo indipendente.
La lunghezza minima del prompt cacheable è:
I prompt più brevi non possono essere memorizzati, anche se contrassegnati con cache_control. Qualsiasi richiesta di memorizzare meno di questo numero di token verrà elaborata senza caching, e non verrà restituito alcun errore. Per verificare se un prompt è stato memorizzato, controlla i campi di utilizzo della risposta fields: se sia cache_creation_input_tokens che cache_read_input_tokens sono 0, il prompt non è stato memorizzato (probabilmente perché non ha soddisfatto il requisito di lunghezza minima).
Se il tuo prompt è leggermente al di sotto del minimo per il modello che stai utilizzando, espandere il contenuto memorizzato per raggiungere la soglia è spesso utile. Le letture della cache costano significativamente meno dei token di input non memorizzati, quindi raggiungere il minimo può ridurre i costi per i prompt frequentemente riutilizzati.
Per le richieste simultanee, nota che una voce della cache diventa disponibile solo dopo l'inizio della prima risposta. Se hai bisogno di cache hit per richieste parallele, attendi la prima risposta prima di inviare le richieste successive.
Attualmente, "ephemeral" è l'unico tipo di cache supportato, che per impostazione predefinita ha una durata di 5 minuti.
La maggior parte dei blocchi nella richiesta può essere memorizzata. Questo include:
toolssystemmessages.content, per turni sia utente che assistentemessages.content, nei turni utentemessages.content, in turni sia utente che assistenteOgnuno di questi elementi può essere memorizzato, automaticamente o contrassegnandoli con cache_control.
Mentre la maggior parte dei blocchi di richiesta può essere memorizzata, ci sono alcune eccezioni:
I blocchi di thinking non possono essere memorizzati direttamente con cache_control. Tuttavia, i blocchi di thinking POSSONO essere memorizzati insieme ad altro contenuto quando appaiono nei turni dell'assistente precedenti. Quando memorizzati in questo modo, CONTANO come token di input quando letti dalla cache.
I blocchi di sub-contenuto (come citazioni) stessi non possono essere memorizzati direttamente. Invece, memorizza il blocco di livello superiore.
Nel caso delle citazioni, i blocchi di contenuto del documento di livello superiore che servono come materiale di origine per le citazioni possono essere memorizzati. Questo ti consente di utilizzare prompt caching con citazioni in modo efficace memorizzando i documenti a cui le citazioni faranno riferimento.
I blocchi di testo vuoti non possono essere memorizzati.
Le modifiche al contenuto memorizzato possono invalidare parte o tutta la cache.
Come descritto in Strutturazione del tuo prompt, la cache segue la gerarchia: tools → system → messages. Le modifiche a ogni livello invalidano quel livello e tutti i livelli successivi.
La tabella seguente mostra quali parti della cache vengono invalidate da diversi tipi di modifiche. ✘ indica che la cache viene invalidata, mentre ✓ indica che la cache rimane valida.
| Cosa cambia | Cache degli strumenti | Cache di sistema | Cache dei messaggi | Impatto |
|---|---|---|---|---|
| Definizioni di strumenti | ✘ | ✘ | ✘ | Modificare le definizioni di strumenti (nomi, descrizioni, parametri) invalida l'intera cache |
| Interruttore di ricerca web | ✓ | ✘ | ✘ | Abilitare/disabilitare la ricerca web modifica il prompt di sistema |
| Interruttore di citazioni | ✓ | ✘ | ✘ | Abilitare/disabilitare le citazioni modifica il prompt di sistema |
| Impostazione di velocità | ✓ | ✘ | ✘ | Passare tra speed: "fast" e velocità standard invalida le cache di sistema e messaggi |
| Scelta dello strumento | ✓ | ✓ | ✘ | Le modifiche al parametro tool_choice influiscono solo sui blocchi di messaggi |
| Immagini | ✓ | ✓ | ✘ | Aggiungere/rimuovere immagini ovunque nel prompt influisce sui blocchi di messaggi |
| Parametri di thinking | ✓ | ✓ | ✘ | Le modifiche alle impostazioni di extended thinking (abilita/disabilita, budget) influiscono sui blocchi di messaggi |
| Risultati non di strumenti passati alle richieste di extended thinking | ✓ | ✓ | ✘ | Quando i risultati non di strumenti vengono passati nelle richieste mentre extended thinking è abilitato, tutti i blocchi di thinking precedentemente memorizzati vengono rimossi dal contesto, e tutti i messaggi nel contesto che seguono quei blocchi di thinking vengono rimossi dalla cache. Per ulteriori dettagli, vedi Caching con blocchi di thinking. |
Monitora le prestazioni della cache utilizzando questi campi di risposta dell'API, all'interno di usage nella risposta (o evento message_start se streaming):
cache_creation_input_tokens: Numero di token scritti nella cache quando si crea una nuova voce.cache_read_input_tokens: Numero di token recuperati dalla cache per questa richiesta.input_tokens: Numero di token di input che non sono stati letti da o utilizzati per creare una cache (cioè, token dopo l'ultimo breakpoint della cache).Comprensione della suddivisione dei token
Il campo input_tokens rappresenta solo i token che vengono dopo l'ultimo breakpoint della cache nella tua richiesta - non tutti i token di input che hai inviato.
Per calcolare il totale dei token di input:
total_input_tokens = cache_read_input_tokens + cache_creation_input_tokens + input_tokensSpiegazione spaziale:
cache_read_input_tokens = token prima del breakpoint già memorizzati (letture)cache_creation_input_tokens = token prima del breakpoint in fase di memorizzazione ora (scritture)input_tokens = token dopo il tuo ultimo breakpoint (non idonei per la cache)Esempio: Se hai una richiesta con 100.000 token di contenuto memorizzato (letto dalla cache), 0 token di nuovo contenuto in fase di memorizzazione e 50 token nel tuo messaggio utente (dopo il breakpoint della cache):
cache_read_input_tokens: 100.000cache_creation_input_tokens: 0input_tokens: 50Questo è importante per comprendere sia i costi che i limiti di velocità, poiché input_tokens sarà tipicamente molto più piccolo del tuo input totale quando utilizzi il caching in modo efficace.
Quando si utilizza extended thinking con prompt caching, i thinking blocks hanno un comportamento speciale:
Caching automatico insieme ad altri contenuti: Sebbene i thinking blocks non possono essere esplicitamente contrassegnati con cache_control, vengono memorizzati nella cache come parte del contenuto della richiesta quando effettui successive chiamate API con risultati di strumenti. Questo accade comunemente durante l'uso di strumenti quando passi i thinking blocks indietro per continuare la conversazione.
Conteggio dei token di input: Quando i thinking blocks vengono letti dalla cache, contano come token di input nelle tue metriche di utilizzo. Questo è importante per il calcolo dei costi e il budgeting dei token.
Modelli di invalidazione della cache:
cache_control esplicitiPer ulteriori dettagli sull'invalidazione della cache, vedi Cosa invalida la cache.
Esempio con uso di strumenti:
Request 1: User: "What's the weather in Paris?"
Response: [thinking_block_1] + [tool_use block 1]
Request 2:
User: ["What's the weather in Paris?"],
Assistant: [thinking_block_1] + [tool_use block 1],
User: [tool_result_1, cache=True]
Response: [thinking_block_2] + [text block 2]
# Request 2 caches its request content (not the response)
# The cache includes: user message, thinking_block_1, tool_use block 1, and tool_result_1
Request 3:
User: ["What's the weather in Paris?"],
Assistant: [thinking_block_1] + [tool_use block 1],
User: [tool_result_1, cache=True],
Assistant: [thinking_block_2] + [text block 2],
User: [Text response, cache=True]
# Non-tool-result user block causes all thinking blocks to be ignored
# This request is processed as if thinking blocks were never presentQuando viene incluso un blocco utente non relativo ai risultati degli strumenti, designa un nuovo ciclo dell'assistente e tutti i precedenti thinking blocks vengono rimossi dal contesto.
Per informazioni più dettagliate, vedi la documentazione extended thinking.
A partire dal 5 febbraio 2026, il prompt caching utilizzerà l'isolamento a livello di workspace invece dell'isolamento a livello di organizzazione. Le cache saranno isolate per workspace, garantendo la separazione dei dati tra i workspace all'interno della stessa organizzazione. Questo cambiamento si applica all'API Claude e ad Azure AI Foundry (anteprima); Amazon Bedrock e Google Vertex AI manterranno l'isolamento della cache a livello di organizzazione. Se utilizzi più workspace, rivedi la tua strategia di caching per tenere conto di questo cambiamento.
Isolamento dell'organizzazione: Le cache sono isolate tra le organizzazioni. Diverse organizzazioni non condividono mai le cache, anche se utilizzano prompt identici.
Corrispondenza esatta: Gli hit della cache richiedono segmenti di prompt identici al 100%, inclusi tutto il testo e le immagini fino a e incluso il blocco contrassegnato con controllo della cache.
Generazione di token di output: Il prompt caching non ha alcun effetto sulla generazione di token di output. La risposta che ricevi sarà identica a quella che otterresti se il prompt caching non fosse utilizzato.
Per ottimizzare le prestazioni del prompt caching:
Personalizza la tua strategia di prompt caching al tuo scenario:
Se riscontri comportamenti inaspettati:
cache_control siano negli stessi percorsitool_choice e l'utilizzo delle immagini rimangono coerenti tra le chiamatecache_creation_input_tokens che cache_read_input_tokens saranno 0tool_use abbiano un ordine stabile poiché alcuni linguaggi (ad esempio, Swift, Go) randomizzano l'ordine delle chiavi durante la conversione JSON, interrompendo le cacheLe modifiche a tool_choice o la presenza/assenza di immagini in qualsiasi punto del prompt invalideranno la cache, richiedendo la creazione di una nuova voce della cache. Per ulteriori dettagli sull'invalidazione della cache, vedi Cosa invalida la cache.
Se ritieni che 5 minuti sia troppo breve, Anthropic offre anche una durata della cache di 1 ora a costo aggiuntivo.
Per utilizzare la cache estesa, includi ttl nella definizione di cache_control in questo modo:
"cache_control": {
"type": "ephemeral",
"ttl": "1h"
}La risposta includerà informazioni dettagliate sulla cache come le seguenti:
{
"usage": {
"input_tokens": 2048,
"cache_read_input_tokens": 1800,
"cache_creation_input_tokens": 248,
"output_tokens": 503,
"cache_creation": {
"ephemeral_5m_input_tokens": 456,
"ephemeral_1h_input_tokens": 100
}
}
}Nota che il campo cache_creation_input_tokens attuale è uguale alla somma dei valori nell'oggetto cache_creation.
Se hai prompt che vengono utilizzati a una cadenza regolare (cioè, prompt di sistema che vengono utilizzati più frequentemente di ogni 5 minuti), continua a utilizzare la cache di 5 minuti, poiché continuerà a essere aggiornata senza costi aggiuntivi.
La cache di 1 ora è meglio utilizzata nei seguenti scenari:
La cache di 5 minuti e 1 ora si comportano allo stesso modo rispetto alla latenza. Generalmente vedrai un tempo-al-primo-token migliorato per documenti lunghi.
Puoi utilizzare sia controlli della cache di 1 ora che di 5 minuti nella stessa richiesta, ma con un vincolo importante: Le voci della cache con TTL più lungo devono apparire prima di TTL più brevi (cioè, una voce della cache di 1 ora deve apparire prima di qualsiasi voce della cache di 5 minuti).
Quando si mescolano i TTL, l'API determina tre posizioni di fatturazione nel tuo prompt:
A: Il conteggio dei token al massimo hit della cache (o 0 se nessun hit).B: Il conteggio dei token al massimo blocco cache_control di 1 ora dopo A (o uguale a A se nessuno esiste).C: Il conteggio dei token all'ultimo blocco cache_control.Se B e/o C sono più grandi di A, saranno necessariamente cache miss, perché A è il massimo hit della cache.
Ti verrà addebitato per:
A.(B - A).(C - B).Ecco 3 esempi. Questo raffigura i token di input di 3 richieste, ognuna delle quali ha diversi hit della cache e cache miss. Ognuna ha un diverso prezzo calcolato, mostrato nelle caselle colorate, di conseguenza.
Per aiutarti a iniziare con il prompt caching, il cookbook sul prompt caching fornisce esempi dettagliati e best practice.
I seguenti frammenti di codice mostrano vari modelli di prompt caching. Questi esempi dimostrano come implementare il caching in diversi scenari, aiutandoti a comprendere le applicazioni pratiche di questa funzionalità:
La memorizzazione nella cache dei prompt (sia automatica che esplicita) è idonea per ZDR. Anthropic non memorizza il testo grezzo dei tuoi prompt o delle risposte di Claude.
Le rappresentazioni della cache KV (key-value) e gli hash crittografici del contenuto memorizzato nella cache vengono mantenuti solo in memoria e non vengono archiviati a riposo. Le voci della cache hanno una durata minima di 5 minuti (standard) o 60 minuti (estesa), dopo di che vengono eliminate prontamente, anche se non immediatamente. Le voci della cache sono isolate tra le organizzazioni.
Per l'idoneità a ZDR in tutte le funzioni, vedi API e conservazione dei dati.
Was this page helpful?