Questa guida descrive come lavorare con le immagini in Claude, incluse le migliori pratiche, esempi di codice e limitazioni da tenere a mente.
Utilizza le capacità di visione di Claude tramite:
Puoi includere più immagini in una singola richiesta (fino a 20 per claude.ai e 100 per richieste API). Claude analizzerà tutte le immagini fornite quando formula la sua risposta. Questo può essere utile per confrontare o contrastare le immagini.
Se invii un'immagine più grande di 8000x8000 px, verrà rifiutata. Se invii più di 20 immagini in una richiesta API, questo limite è 2000x2000 px.
Sebbene l'API supporti 100 immagini per richiesta, esiste un limite di dimensione della richiesta di 32MB per gli endpoint standard.
Per prestazioni ottimali, consigliamo di ridimensionare le immagini prima di caricarle se sono troppo grandi. Se il bordo lungo della tua immagine è superiore a 1568 pixel, o la tua immagine è superiore a ~1.600 token, verrà prima ridimensionata, preservando le proporzioni, finché non rientra nei limiti di dimensione.
Se la tua immagine di input è troppo grande e deve essere ridimensionata, aumenterà la latenza del time-to-first-token, senza darti alcuna prestazione aggiuntiva del modello. Le immagini molto piccole sotto i 200 pixel su qualsiasi bordo possono degradare le prestazioni.
Per migliorare il time-to-first-token, consigliamo di ridimensionare le immagini a non più di 1,15 megapixel (e entro 1568 pixel in entrambe le dimensioni).
Ecco una tabella delle dimensioni massime delle immagini accettate dalla nostra API che non verranno ridimensionate per i rapporti di aspetto comuni. Con Claude Sonnet 4.5, queste immagini utilizzano approssimativamente 1.600 token e circa $4,80/1K immagini.
| Rapporto di aspetto | Dimensione immagine |
|---|---|
| 1:1 | 1092x1092 px |
| 3:4 | 951x1268 px |
| 2:3 | 896x1344 px |
| 9:16 | 819x1456 px |
| 1:2 | 784x1568 px |
Ogni immagine che includi in una richiesta a Claude conta verso l'utilizzo dei tuoi token. Per calcolare il costo approssimativo, moltiplica il numero approssimativo di token dell'immagine per il prezzo per token del modello che stai utilizzando.
Se la tua immagine non ha bisogno di essere ridimensionata, puoi stimare il numero di token utilizzati attraverso questo algoritmo: tokens = (width px * height px)/750
Ecco esempi di tokenizzazione approssimativa e costi per diverse dimensioni di immagini entro i vincoli di dimensione dell'API basati sul prezzo per token di Claude Sonnet 4.5 di $3 per milione di token di input:
| Dimensione immagine | # di token | Costo / immagine | Costo / 1K immagini |
|---|---|---|---|
| 200x200 px(0,04 megapixel) | ~54 | ~$0,00016 | ~$0,16 |
| 1000x1000 px(1 megapixel) | ~1334 | ~$0,004 | ~$4,00 |
| 1092x1092 px(1,19 megapixel) | ~1590 | ~$0,0048 | ~$4,80 |
Quando fornisci immagini a Claude, tieni presente quanto segue per i migliori risultati:
Molte delle tecniche di prompt che funzionano bene per le interazioni basate su testo con Claude possono essere applicate anche ai prompt basati su immagini.
Questi esempi dimostrano le migliori strutture di prompt che coinvolgono immagini.
Proprio come con il posizionamento della query del documento, Claude funziona meglio quando le immagini vengono prima del testo. Le immagini posizionate dopo il testo o interpolate con il testo funzioneranno comunque bene, ma se il tuo caso d'uso lo consente, consigliamo una struttura immagine-poi-testo.
I seguenti esempi dimostrano come utilizzare le capacità di visione di Claude utilizzando vari linguaggi di programmazione e approcci. Puoi fornire immagini a Claude in tre modi:
imageGli esempi di prompt codificati in base64 utilizzano queste variabili:
# Per le immagini basate su URL, puoi utilizzare l'URL direttamente nella tua richiesta JSON
# Per le immagini codificate in base64, devi prima codificare l'immagine
# Esempio di come codificare un'immagine in base64 in bash:
BASE64_IMAGE_DATA=$(curl -s "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg" | base64)
# I dati codificati possono ora essere utilizzati nelle tue chiamate APIDi seguito sono riportati esempi di come includere immagini in una richiesta dell'API Messages utilizzando immagini codificate in base64 e riferimenti URL:
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "base64",
"media_type": "image/jpeg",
"data": "'"$BASE64_IMAGE_DATA"'"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}'curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "url",
"url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}'Per le immagini che utilizzerai ripetutamente o quando vuoi evitare il sovraccarico di codifica, utilizza l'API Files:
# Per prima cosa, carica la tua immagine nell'API Files
curl -X POST https://api.anthropic.com/v1/files \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: files-api-2025-04-14" \
-F "[email protected]"
# Quindi utilizza il file_id restituito nel tuo messaggio
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: files-api-2025-04-14" \
-H "content-type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "file",
"file_id": "file_abc123"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}'Vedi Esempi dell'API Messages per ulteriori esempi di codice e dettagli dei parametri.
Sebbene le capacità di comprensione delle immagini di Claude siano all'avanguardia, ci sono alcune limitazioni di cui essere consapevoli:
Rivedi e verifica sempre attentamente le interpretazioni delle immagini di Claude, specialmente per i casi d'uso ad alto rischio. Non utilizzare Claude per compiti che richiedono una precisione perfetta o un'analisi di immagini sensibili senza supervisione umana.
Pronto a iniziare a costruire con immagini usando Claude? Ecco alcune risorse utili:
Se hai altre domande, non esitare a contattare il nostro team di supporto. Puoi anche unirti alla nostra comunità di sviluppatori per connetterti con altri creatori e ottenere aiuto dagli esperti di Anthropic.