Esta guía describe cómo trabajar con imágenes en Claude, incluyendo mejores prácticas, ejemplos de código y limitaciones a tener en cuenta.
Usa las capacidades de visión de Claude a través de:
Puedes incluir múltiples imágenes en una sola solicitud (hasta 20 para claude.ai y 100 para solicitudes de API). Claude analizará todas las imágenes proporcionadas al formular su respuesta. Esto puede ser útil para comparar o contrastar imágenes.
Si envías una imagen más grande que 8000x8000 px, será rechazada. Si envías más de 20 imágenes en una solicitud de API, este límite es de 2000x2000 px.
Aunque la API admite 100 imágenes por solicitud, hay un límite de tamaño de solicitud de 32MB para puntos finales estándar.
Para un rendimiento óptimo, recomendamos cambiar el tamaño de las imágenes antes de cargarlas si son demasiado grandes. Si el borde largo de tu imagen tiene más de 1568 píxeles, o tu imagen tiene más de ~1,600 tokens, primero se reducirá, preservando la relación de aspecto, hasta que esté dentro de los límites de tamaño.
Si tu imagen de entrada es demasiado grande y necesita ser redimensionada, aumentará la latencia del tiempo hasta el primer token, sin darte ningún rendimiento de modelo adicional. Las imágenes muy pequeñas menores a 200 píxeles en cualquier borde dado pueden degradar el rendimiento.
Para mejorar el tiempo hasta el primer token, recomendamos cambiar el tamaño de las imágenes a no más de 1.15 megapíxeles (y dentro de 1568 píxeles en ambas dimensiones).
Aquí hay una tabla de tamaños máximos de imagen aceptados por nuestra API que no serán redimensionados para relaciones de aspecto comunes. Con Claude Sonnet 4.5, estas imágenes utilizan aproximadamente 1,600 tokens y alrededor de $4.80/1K imágenes.
| Relación de aspecto | Tamaño de imagen |
|---|---|
| 1:1 | 1092x1092 px |
| 3:4 | 951x1268 px |
| 2:3 | 896x1344 px |
| 9:16 | 819x1456 px |
| 1:2 | 784x1568 px |
Cada imagen que incluyas en una solicitud a Claude cuenta hacia tu uso de tokens. Para calcular el costo aproximado, multiplica el número aproximado de tokens de imagen por el precio por token del modelo que estés usando.
Si tu imagen no necesita ser redimensionada, puedes estimar el número de tokens utilizados a través de este algoritmo: tokens = (ancho px * alto px)/750
Aquí hay ejemplos de tokenización aproximada y costos para diferentes tamaños de imagen dentro de las restricciones de tamaño de nuestra API basados en el precio por token de Claude Sonnet 4.5 de $3 por millón de tokens de entrada:
| Tamaño de imagen | # de Tokens | Costo / imagen | Costo / 1K imágenes |
|---|---|---|---|
| 200x200 px(0.04 megapíxeles) | ~54 | ~$0.00016 | ~$0.16 |
| 1000x1000 px(1 megapíxel) | ~1334 | ~$0.004 | ~$4.00 |
| 1092x1092 px(1.19 megapíxeles) | ~1590 | ~$0.0048 | ~$4.80 |
Al proporcionar imágenes a Claude, ten en cuenta lo siguiente para obtener los mejores resultados:
Muchas de las técnicas de prompting que funcionan bien para interacciones basadas en texto con Claude también se pueden aplicar a prompts basados en imágenes.
Estos ejemplos demuestran estructuras de prompts de mejores prácticas que involucran imágenes.
Al igual que con la colocación de consulta de documentos, Claude funciona mejor cuando las imágenes vienen antes del texto. Las imágenes colocadas después del texto o interpoladas con texto seguirán funcionando bien, pero si tu caso de uso lo permite, recomendamos una estructura de imagen-luego-texto.
Los siguientes ejemplos demuestran cómo usar las capacidades de visión de Claude usando varios lenguajes de programación y enfoques. Puedes proporcionar imágenes a Claude de tres formas:
imageLos prompts de ejemplo base64 utilizan estas variables:
A continuación se muestran ejemplos de cómo incluir imágenes en una solicitud de API de Mensajes usando imágenes codificadas en base64 y referencias de URL:
Para imágenes que usarás repetidamente o cuando quieras evitar la sobrecarga de codificación, usa la API de Archivos:
Consulta ejemplos de API de Mensajes para más código de ejemplo y detalles de parámetros.
Aunque las capacidades de comprensión de imágenes de Claude son de vanguardia, hay algunas limitaciones a tener en cuenta:
Siempre revisa y verifica cuidadosamente las interpretaciones de imágenes de Claude, especialmente para casos de uso de alto riesgo. No uses Claude para tareas que requieran precisión perfecta o análisis de imágenes sensibles sin supervisión humana.
¿Listo para comenzar a construir con imágenes usando Claude? Aquí hay algunos recursos útiles:
Si tienes otras preguntas, no dudes en comunicarte con nuestro equipo de soporte. También puedes unirte a nuestra comunidad de desarrolladores para conectar con otros creadores y obtener ayuda de expertos de Anthropic.
# Para imágenes basadas en URL, puedes usar la URL directamente en tu solicitud JSON
# Para imágenes codificadas en base64, primero necesitas codificar la imagen
# Ejemplo de cómo codificar una imagen a base64 en bash:
BASE64_IMAGE_DATA=$(curl -s "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg" | base64)
# Los datos codificados ahora se pueden usar en tus llamadas de APIcurl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "base64",
"media_type": "image/jpeg",
"data": "'"$BASE64_IMAGE_DATA"'"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}'curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "url",
"url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}'# Primero, carga tu imagen a la API de Archivos
curl -X POST https://api.anthropic.com/v1/files \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: files-api-2025-04-14" \
-F "[email protected]"
# Luego usa el file_id devuelto en tu mensaje
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: files-api-2025-04-14" \
-H "content-type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "file",
"file_id": "file_abc123"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}'