Was this page helpful?
Это руководство описывает, как работать с изображениями в Claude, включая лучшие практики, примеры кода и ограничения, которые следует учитывать.
Используйте возможности зрения Claude через:
Вы можете включить несколько изображений в один запрос: до 20 для claude.ai и до 600 для API-запросов (100 для моделей с контекстным окном 200k токенов). Claude анализирует все предоставленные изображения при формировании ответа. Это может быть полезно для сравнения или сопоставления изображений.
Если вы отправляете изображение размером более 8000x8000 пикселей, оно будет отклонено. Если вы отправляете более 20 изображений в одном API-запросе, это ограничение составляет 2000x2000 пикселей.
Хотя API поддерживает до 600 изображений на запрос, ограничения размера запроса (32 МБ для стандартных конечных точек; ниже на некоторых сторонних платформах) могут быть достигнуты раньше. Для большого количества изображений рассмотрите загрузку через Files API и ссылку по file_id, чтобы уменьшить размер полезной нагрузки запроса.
Даже при использовании Files API запросы с большим количеством крупных изображений могут завершиться ошибкой до достижения лимита в 600 изображений. Уменьшите размеры изображений или размеры файлов (например, путём понижения дискретизации) перед загрузкой (см. Оценка размера изображения).
Для оптимальной производительности измените размер изображений перед загрузкой, если они слишком большие. Если длинная сторона вашего изображения превышает 1568 пикселей или ваше изображение содержит более ~1600 токенов, оно сначала масштабируется с сохранением соотношения сторон до тех пор, пока не окажется в пределах ограничений размера.
Если входное изображение слишком большое и требует изменения размера, это увеличивает задержку времени до первого токена без какой-либо пользы для качества вывода. Очень маленькие изображения размером менее 200 пикселей по любой стороне могут ухудшить качество вывода.
Чтобы улучшить время до первого токена, рассмотрите возможность изменения размера изображений до не более 1,15 мегапикселей (и в пределах 1568 пикселей по обоим измерениям).
Ниже приведена таблица максимальных размеров изображений, принимаемых API без изменения размера для распространённых соотношений сторон. С Claude Sonnet 4.6 эти изображения используют приблизительно 1600 токенов и около $4,80/1k изображений.
| Соотношение сторон | Размер изображения |
|---|---|
| 1:1 | 1092x1092 пкс |
| 3:4 | 951x1268 пкс |
| 2:3 | 896x1344 пкс |
| 9:16 | 819x1456 пкс |
| 1:2 | 784x1568 пкс |
Каждое изображение, которое вы включаете в запрос к Claude, учитывается в использовании токенов. Чтобы рассчитать приблизительную стоимость, умножьте приблизительное количество токенов изображения на цену за токен модели, которую вы используете.
Если ваше изображение не требует изменения размера, вы можете оценить количество использованных токенов по этому алгоритму: tokens = (width px * height px)/750
Вот примеры приблизительной токенизации и стоимости для различных размеров изображений в пределах ограничений размера API на основе цены за токен Claude Sonnet 4.6 в $3 за миллион входных токенов:
| Размер изображения | Кол-во токенов | Стоимость / изображение | Стоимость / 1k изображений |
|---|---|---|---|
| 200x200 пкс (0,04 мегапикселя) | ~54 | ~$0,00016 | ~$0,16 |
| 1000x1000 пкс (1 мегапиксель) | ~1334 | ~$0,004 | ~$4,00 |
| 1092x1092 пкс (1,19 мегапикселя) | ~1590 | ~$0,0048 | ~$4,80 |
При предоставлении изображений Claude учитывайте следующее для достижения наилучших результатов:
Многие из техник составления подсказок, которые хорошо работают для текстового взаимодействия с Claude, также могут применяться к подсказкам на основе изображений.
Эти примеры демонстрируют лучшие практики структур подсказок с изображениями.
Так же как размещение длинных документов перед запросом улучшает результаты в текстовых подсказках, Claude работает лучше всего, когда изображения идут перед текстом. Изображения, размещённые после текста или перемежающиеся с текстом, также работают хорошо, но если ваш вариант использования позволяет, предпочтительна структура «изображение, затем текст».
Следующие примеры демонстрируют, как использовать возможности зрения Claude с использованием различных языков программирования и подходов. Вы можете предоставлять изображения Claude тремя способами:
imageПримеры подсказок с base64 используют следующие переменные:
Ниже приведены примеры того, как включать изображения в запрос Messages API с использованием изображений в кодировке base64 и URL-ссылок:
Для изображений, которые вы будете использовать повторно, или когда вы хотите избежать накладных расходов на кодирование, используйте Files API. Загрузите изображение один раз, а затем ссылайтесь на возвращённый file_id в последующих сообщениях вместо повторной отправки данных в формате base64.
В многоходовых разговорах и агентных рабочих процессах каждый запрос повторно
отправляет полную историю разговора. Если изображения закодированы в base64,
полные байты изображения включаются в полезную нагрузку при каждом ходе, что
может значительно увеличить размер запроса и задержку по мере роста разговора.
Загрузка изображений в Files API и ссылка на них по file_id позволяет
поддерживать небольшой размер полезной нагрузки запросов независимо от того,
сколько изображений накапливается в истории разговора.
Смотрите примеры Messages API для получения дополнительных примеров кода и сведений о параметрах.
Хотя возможности понимания изображений Claude находятся на передовом уровне, существуют некоторые ограничения, о которых следует знать:
Всегда тщательно проверяйте и верифицируйте интерпретации изображений Claude, особенно в случаях с высокими ставками. Не используйте Claude для задач, требующих идеальной точности или анализа чувствительных изображений без человеческого контроля.
Готовы начать работу с изображениями с помощью Claude? Вот несколько полезных ресурсов:
Если у вас есть другие вопросы, обратитесь в службу поддержки. Вы также можете присоединиться к сообществу разработчиков, чтобы связаться с другими создателями и получить помощь от экспертов Anthropic.
# Для изображений на основе URL вы можете использовать URL напрямую в вашем JSON-запросе
# Для изображений в кодировке base64 вам сначала нужно закодировать изображение
# Пример того, как закодировать изображение в base64 в bash:
BASE64_IMAGE_DATA=$(curl -s "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg" | base64)
# Закодированные данные теперь можно использовать в ваших API-вызовахcurl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d @- <<EOF
{
"model": "claude-opus-4-6",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "base64",
"media_type": "image/jpeg",
"data": "$BASE64_IMAGE_DATA"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}
EOFcurl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d '{
"model": "claude-opus-4-6",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "url",
"url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}'# Сначала загрузите изображение в Files API
curl -X POST https://api.anthropic.com/v1/files \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: files-api-2025-04-14" \
-F "[email protected]"
# Затем используйте возвращённый file_id в вашем сообщении
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: files-api-2025-04-14" \
-H "content-type: application/json" \
-d '{
"model": "claude-opus-4-6",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "file",
"file_id": "file_abc123"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}'