Это руководство описывает, как работать с изображениями в Claude, включая лучшие практики, примеры кода и ограничения, которые следует учитывать.
Используйте возможности зрения Claude через:
Вы можете включить несколько изображений в один запрос (до 20 для claude.ai и 100 для запросов API). Claude будет анализировать все предоставленные изображения при формулировании своего ответа. Это может быть полезно для сравнения или противопоставления изображений.
Если вы отправите изображение размером более 8000x8000 пикселей, оно будет отклонено. Если вы отправите более 20 изображений в одном запросе API, это ограничение составляет 2000x2000 пикселей.
Хотя API поддерживает 100 изображений на запрос, существует ограничение размера запроса 32 МБ для стандартных конечных точек.
Для оптимальной производительности мы рекомендуем изменять размер изображений перед загрузкой, если они слишком большие. Если длинный край вашего изображения превышает 1568 пикселей или ваше изображение содержит более ~1600 токенов, оно сначала будет уменьшено, сохраняя соотношение сторон, пока не будет соответствовать ограничениям размера.
Если ваше входное изображение слишком большое и требует изменения размера, это увеличит задержку time-to-first-token, не давая вам никакого дополнительного улучшения производительности модели. Очень маленькие изображения размером менее 200 пикселей с любой стороны могут снизить производительность.
Чтобы улучшить time-to-first-token, мы рекомендуем изменять размер изображений не более чем до 1,15 мегапикселей (и в пределах 1568 пикселей в обоих измерениях).
Вот таблица максимальных размеров изображений, принимаемых нашим API, которые не будут изменены для распространенных соотношений сторон. С Claude Sonnet 4.5 эти изображения используют примерно 1600 токенов и около $4,80 за 1000 изображений.
| Соотношение сторон | Размер изображения |
|---|---|
| 1:1 | 1092x1092 px |
| 3:4 | 951x1268 px |
| 2:3 | 896x1344 px |
| 9:16 | 819x1456 px |
| 1:2 | 784x1568 px |
Каждое изображение, которое вы включаете в запрос к Claude, учитывается в использовании токенов. Чтобы рассчитать приблизительную стоимость, умножьте приблизительное количество токенов изображения на цену за токен модели, которую вы используете.
Если ваше изображение не требует изменения размера, вы можете оценить количество используемых токенов с помощью этого алгоритма: tokens = (width px * height px)/750
Вот примеры приблизительной токенизации и стоимости для различных размеров изображений в пределах ограничений размера API на основе цены Claude Sonnet 4.5 в размере $3 за миллион входных токенов:
| Размер изображения | # токенов | Стоимость / изображение | Стоимость / 1000 изображений |
|---|---|---|---|
| 200x200 px (0,04 мегапикселя) | ~54 | ~$0,00016 | ~$0,16 |
| 1000x1000 px (1 мегапиксель) | ~1334 | ~$0,004 | ~$4,00 |
| 1092x1092 px (1,19 мегапикселя) | ~1590 | ~$0,0048 | ~$4,80 |
При предоставлении изображений Claude учитывайте следующее для получения наилучших результатов:
Многие из методов подсказок, которые хорошо работают для текстовых взаимодействий с Claude, также могут быть применены к подсказкам на основе изображений.
Эти примеры демонстрируют лучшие практики структуры подсказок, включающих изображения.
Как и при размещении запроса к документу, Claude работает лучше всего, когда изображения идут перед текстом. Изображения, размещенные после текста или чередующиеся с текстом, все еще будут работать хорошо, но если ваш вариант использования позволяет, мы рекомендуем структуру изображение-затем-текст.
Следующие примеры демонстрируют, как использовать возможности зрения Claude с использованием различных языков программирования и подходов. Вы можете предоставить изображения Claude тремя способами:
imageПримеры подсказок base64 используют эти переменные:
# Для изображений на основе URL вы можете использовать URL непосредственно в вашем JSON запросе
# Для изображений, закодированных в base64, вам нужно сначала закодировать изображение
# Пример кодирования изображения в base64 в bash:
BASE64_IMAGE_DATA=$(curl -s "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg" | base64)
# Закодированные данные теперь можно использовать в ваших вызовах APIНиже приведены примеры того, как включить изображения в запрос Messages API, используя изображения, закодированные в base64, и ссылки на URL:
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "base64",
"media_type": "image/jpeg",
"data": "'"$BASE64_IMAGE_DATA"'"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}'curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "url",
"url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}'Для изображений, которые вы будете использовать повторно или когда вы хотите избежать затрат на кодирование, используйте Files API:
# Сначала загрузите ваше изображение в Files API
curl -X POST https://api.anthropic.com/v1/files \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: files-api-2025-04-14" \
-F "[email protected]"
# Затем используйте возвращенный file_id в вашем сообщении
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: files-api-2025-04-14" \
-H "content-type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "file",
"file_id": "file_abc123"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}'Дополнительные примеры кода и детали параметров см. в примерах Messages API.
Хотя возможности понимания изображений Claude являются передовыми, есть некоторые ограничения, о которых следует знать:
Всегда тщательно проверяйте и верифицируйте интерпретации изображений Claude, особенно для высокорисковых вариантов использования. Не используйте Claude для задач, требующих идеальной точности или чувствительного анализа изображений без надзора человека.
Готовы начать создавать с изображениями, используя Claude? Вот несколько полезных ресурсов:
Если у вас есть какие-либо другие вопросы, не стесняйтесь обращаться к нашей команде поддержки. Вы также можете присоединиться к нашему сообществу разработчиков, чтобы общаться с другими создателями и получать помощь от экспертов Anthropic.