Ce guide décrit comment travailler avec des images dans Claude, y compris les meilleures pratiques, des exemples de code et les limitations à garder à l'esprit.
Utilisez les capacités de vision de Claude via :
Vous pouvez inclure plusieurs images dans une seule requête (jusqu'à 20 pour claude.ai et 100 pour les requêtes API). Claude analysera toutes les images fournies lors de la formulation de sa réponse. Cela peut être utile pour comparer ou contraster des images.
Si vous soumettez une image plus grande que 8000x8000 px, elle sera rejetée. Si vous soumettez plus de 20 images dans une requête API, cette limite est de 2000x2000 px.
Bien que l'API supporte 100 images par requête, il existe une limite de taille de requête de 32 Mo pour les points de terminaison standard.
Pour des performances optimales, nous recommandons de redimensionner les images avant de les télécharger si elles sont trop grandes. Si le bord long de votre image dépasse 1568 pixels, ou si votre image dépasse environ 1 600 tokens, elle sera d'abord réduite, en préservant le rapport d'aspect, jusqu'à ce qu'elle soit dans les limites de taille.
Si votre image d'entrée est trop grande et doit être redimensionnée, cela augmentera la latence du time-to-first-token, sans vous donner de performance de modèle supplémentaire. Les très petites images de moins de 200 pixels sur un bord donné peuvent dégrader les performances.
Pour améliorer le time-to-first-token, nous recommandons de redimensionner les images à pas plus de 1,15 mégapixels (et dans 1568 pixels dans les deux dimensions).
Voici un tableau des tailles d'image maximales acceptées par notre API qui ne seront pas redimensionnées pour les rapports d'aspect courants. Avec Claude Sonnet 4.5, ces images utilisent environ 1 600 tokens et environ 4,80 $/1 000 images.
| Rapport d'aspect | Taille de l'image |
|---|---|
| 1:1 | 1092x1092 px |
| 3:4 | 951x1268 px |
| 2:3 | 896x1344 px |
| 9:16 | 819x1456 px |
| 1:2 | 784x1568 px |
Chaque image que vous incluez dans une requête à Claude compte dans votre utilisation de tokens. Pour calculer le coût approximatif, multipliez le nombre approximatif de tokens d'image par le prix par token du modèle que vous utilisez.
Si votre image n'a pas besoin d'être redimensionnée, vous pouvez estimer le nombre de tokens utilisés via cet algorithme : tokens = (width px * height px)/750
Voici des exemples de tokenisation approximative et de coûts pour différentes tailles d'image dans les contraintes de taille de notre API basées sur le prix par token de Claude Sonnet 4.5 de 3 $ par million de tokens d'entrée :
| Taille de l'image | Nombre de tokens | Coût / image | Coût / 1 000 images |
|---|---|---|---|
| 200x200 px(0,04 mégapixels) | ~54 | ~0,00016 $ | ~0,16 $ |
| 1000x1000 px(1 mégapixel) | ~1334 | ~0,004 $ | ~4,00 $ |
| 1092x1092 px(1,19 mégapixels) | ~1590 | ~0,0048 $ | ~4,80 $ |
Lorsque vous fournissez des images à Claude, gardez à l'esprit les points suivants pour de meilleurs résultats :
Beaucoup des techniques de prompting qui fonctionnent bien pour les interactions textuelles avec Claude peuvent également être appliquées aux prompts basés sur des images.
Ces exemples démontrent les meilleures structures de prompts impliquant des images.
Tout comme avec le placement de requête de document, Claude fonctionne mieux lorsque les images viennent avant le texte. Les images placées après le texte ou interpolées avec le texte fonctionneront toujours bien, mais si votre cas d'usage le permet, nous recommandons une structure image-puis-texte.
Les exemples suivants démontrent comment utiliser les capacités de vision de Claude en utilisant divers langages de programmation et approches. Vous pouvez fournir des images à Claude de trois façons :
imageLes exemples de prompts en base64 utilisent ces variables :
# Pour les images basées sur URL, vous pouvez utiliser l'URL directement dans votre requête JSON
# Pour les images codées en base64, vous devez d'abord encoder l'image
# Exemple de comment encoder une image en base64 dans bash :
BASE64_IMAGE_DATA=$(curl -s "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg" | base64)
# Les données encodées peuvent maintenant être utilisées dans vos appels APIVoici des exemples de comment inclure des images dans une requête Messages API en utilisant des images codées en base64 et des références URL :
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "base64",
"media_type": "image/jpeg",
"data": "'"$BASE64_IMAGE_DATA"'"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}'curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "url",
"url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}'Pour les images que vous utiliserez à plusieurs reprises ou lorsque vous voulez éviter les frais d'encodage, utilisez l'API Files :
# D'abord, téléchargez votre image vers l'API Files
curl -X POST https://api.anthropic.com/v1/files \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: files-api-2025-04-14" \
-F "[email protected]"
# Ensuite, utilisez le file_id retourné dans votre message
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: files-api-2025-04-14" \
-H "content-type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "file",
"file_id": "file_abc123"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}'Voir Exemples de l'API Messages pour plus d'exemples de code et de détails sur les paramètres.
Bien que les capacités de compréhension d'images de Claude soient à la pointe de la technologie, il y a quelques limitations à connaître :
Examinez toujours attentivement et vérifiez les interprétations d'images de Claude, en particulier pour les cas d'usage à enjeux élevés. N'utilisez pas Claude pour les tâches nécessitant une précision parfaite ou l'analyse d'images sensibles sans surveillance humaine.
Prêt à commencer à construire avec des images en utilisant Claude ? Voici quelques ressources utiles :
Si vous avez d'autres questions, n'hésitez pas à contacter notre équipe d'assistance. Vous pouvez également rejoindre notre communauté de développeurs pour vous connecter avec d'autres créateurs et obtenir de l'aide d'experts Anthropic.