このガイドでは、ベストプラクティス、コード例、および留意すべき制限事項を含む、Claude での画像の操作方法について説明します。
Claude のビジョン機能は以下を通じて使用できます:
1 つのリクエストに複数の画像を含めることができます(claude.ai の場合は最大 20 枚、API リクエストの場合は 100 枚)。Claude は応答を作成する際に、提供されたすべての画像を分析します。これは画像を比較または対比するのに役立ちます。
8000x8000 px を超える画像を送信すると、拒否されます。1 つの API リクエストで 20 枚を超える画像を送信する場合、この制限は 2000x2000 px です。
API は 1 リクエストあたり 100 画像をサポートしていますが、標準エンドポイントには 32MB リクエストサイズ制限 があります。
最適なパフォーマンスのために、アップロード前に画像が大きすぎる場合はサイズを変更することをお勧めします。画像の長辺が 1568 ピクセルを超える場合、または画像が約 1,600 トークンを超える場合、最初にアスペクト比を保持しながらスケールダウンされ、サイズ制限内に収まります。
入力画像が大きすぎてサイズ変更が必要な場合、追加のモデルパフォーマンスを提供することなく、time-to-first-token のレイテンシが増加します。いずれかのエッジで 200 ピクセル未満の非常に小さい画像はパフォーマンスを低下させる可能性があります。
time-to-first-token を改善するために、画像を 1.15 メガピクセル以下(両方の寸法で 1568 ピクセル以内)にサイズ変更することをお勧めします。
以下は、一般的なアスペクト比に対してサイズ変更されない API が受け入れる最大画像サイズの表です。Claude Sonnet 3.7 モデルでは、これらの画像は約 1,600 トークンを使用し、1K 画像あたり約 $4.80 です。
| アスペクト比 | 画像サイズ |
|---|---|
| 1 | 1092x1092 px |
| 3 | 951x1268 px |
| 2 | 896x1344 px |
| 9 | 819x1456 px |
| 1 | 784x1568 px |
Claude へのリクエストに含める各画像は、トークン使用量にカウントされます。概算コストを計算するには、概算画像トークン数に使用しているモデルの トークンあたりの価格 を掛けます。
画像をサイズ変更する必要がない場合、このアルゴリズムを使用してトークン数を推定できます:tokens = (width px * height px)/750
以下は、Claude Sonnet 3.7 のトークンあたりの価格 $3/100 万入力トークンに基づいて、API のサイズ制約内のさまざまな画像サイズの概算トークン化とコストの例です:
| 画像サイズ | トークン数 | 画像あたりのコスト | 1K 画像あたりのコスト |
|---|---|---|---|
| 200x200 px(0.04 メガピクセル) | 約 54 | 約 $0.00016 | 約 $0.16 |
| 1000x1000 px(1 メガピクセル) | 約 1334 | 約 $0.004 | 約 $4.00 |
| 1092x1092 px(1.19 メガピクセル) | 約 1590 | 約 $0.0048 | 約 $4.80 |
Claude に画像を提供する場合、最良の結果を得るために以下を念頭に置いてください:
Claude とのテキストベースのインタラクションでうまく機能する プロンプティング技術 の多くは、画像ベースのプロンプトにも適用できます。
これらの例は、画像を含むベストプラクティスプロンプト構造を示しています。
ドキュメント-クエリの配置と同様に、Claude は画像がテキストの前にある場合に最適に機能します。 テキストの後に配置された画像またはテキストと混在した画像も良好に機能しますが、 ユースケースが許可する場合は、画像-テキスト構造をお勧めします。
以下の例は、さまざまなプログラミング言語とアプローチを使用して Claude のビジョン機能を使用する方法を示しています。Claude に画像を提供する方法は 3 つあります:
image コンテンツブロック内の base64 エンコードされた画像としてbase64 例プロンプトは以下の変数を使用します:
# URL ベースの画像の場合、JSON リクエストで URL を直接使用できます
# base64 エンコードされた画像の場合、最初に画像をエンコードする必要があります
# bash で画像を base64 にエンコードする方法の例:
BASE64_IMAGE_DATA=$(curl -s "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg" | base64)
# エンコードされたデータは API 呼び出しで使用できるようになりました以下は、base64 エンコードされた画像と URL 参照を使用して Messages API リクエストに画像を含める方法の例です:
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "base64",
"media_type": "image/jpeg",
"data": "'"$BASE64_IMAGE_DATA"'"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}'curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "url",
"url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}'繰り返し使用する画像や、エンコーディングのオーバーヘッドを回避したい場合は、Files API を使用してください:
# まず、画像を Files API にアップロードします
curl -X POST https://api.anthropic.com/v1/files \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: files-api-2025-04-14" \
-F "[email protected]"
# 次に、返された file_id をメッセージで使用します
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: files-api-2025-04-14" \
-H "content-type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "file",
"file_id": "file_abc123"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}'詳細については、Messages API の例 を参照してください。
Claude の画像理解機能は最先端ですが、注意すべき制限事項があります:
特に高リスクのユースケースでは、Claude の画像解釈を常に慎重に確認および検証してください。完全な精度が必要なタスクや人間の監視なしで機密の画像分析に Claude を使用しないでください。
Claude を使用して画像でビルドを開始する準備はできていますか?以下は役立つリソースです:
ご質問がある場合は、お気軽に サポートチーム にお問い合わせください。また、開発者コミュニティ に参加して、他のクリエイターとつながり、Anthropic の専門家からサポートを受けることができます。