Loading...
    • ビルド
    • 管理
    • モデルと料金
    • クライアントSDK
    • APIリファレンス
    Search...
    ⌘K
    はじめに
    Claudeの概要クイックスタート
    Claudeで構築する
    機能概要Messages APIの使用停止理由の処理
    モデルの機能
    拡張思考適応的思考エフォート高速モード(ベータ:リサーチプレビュー)構造化出力引用ストリーミングメッセージバッチ処理検索結果ストリーミング拒否多言語サポート埋め込み
    ツール
    概要ツール使用の仕組みウェブ検索ツールウェブフェッチツールコード実行ツールメモリツールBashツールコンピューター使用ツールテキストエディタツール
    ツールインフラ
    ツール検索プログラムによるツール呼び出し細粒度ツールストリーミング
    コンテキスト管理
    コンテキストウィンドウコンパクションコンテキスト編集プロンプトキャッシュトークンカウント
    ファイルの操作
    Files APIPDFサポート画像とビジョン
    スキル
    概要クイックスタートベストプラクティスエンタープライズ向けスキルAPIのスキル
    MCP
    リモートMCPサーバーMCPコネクター
    プロンプトエンジニアリング
    概要プロンプトのベストプラクティスConsoleプロンプトツール
    テストと評価
    成功の定義と評価の構築ConsoleでのEvaluation Toolの使用レイテンシの削減
    ガードレールの強化
    幻覚の低減出力の一貫性向上ジェイルブレイクの軽減プロンプトリークの低減
    リソース
    用語集
    リリースノート
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    ファイルの操作

    ビジョン

    Claudeのビジョン機能により、画像を理解・分析することができ、マルチモーダルなインタラクションの可能性が広がります。

    このガイドでは、Claudeで画像を扱う方法について、ベストプラクティス、コード例、および注意すべき制限事項を説明します。


    ビジョンの使い方

    Claudeのビジョン機能は以下の方法で使用できます:

    • claude.ai。ファイルをアップロードするように画像をアップロードするか、チャットウィンドウに画像を直接ドラッグ&ドロップします。
    • Console Workbench。すべてのユーザーメッセージブロックの右上に画像を追加するボタンが表示されます。
    • APIリクエスト。このガイドの例を参照してください。

    アップロード前に

    基本事項と制限

    1回のリクエストに複数の画像を含めることができます:claude.aiでは最大20枚、APIリクエストでは最大600枚(200kトークンのコンテキストウィンドウを持つモデルでは100枚)です。Claudeは応答を作成する際に提供されたすべての画像を分析します。これは画像を比較・対比する際に役立ちます。

    8000x8000 pxを超える画像を送信すると拒否されます。1回のAPIリクエストで20枚を超える画像を送信する場合、この制限は2000x2000 pxになります。

    APIは1リクエストあたり最大600枚の画像をサポートしていますが、リクエストサイズの制限(標準エンドポイントでは32 MB;一部のサードパーティプラットフォームではより低い)に先に達する場合があります。多数の画像を扱う場合は、Files APIでアップロードし、file_idで参照することでリクエストのペイロードを小さく保つことを検討してください。

    Files APIを使用する場合でも、多数の大きな画像を含むリクエストは600枚の上限に達する前に失敗することがあります。アップロード前に画像の寸法やファイルサイズを縮小してください(例:ダウンサンプリングによる)(画像サイズの評価を参照)。

    画像サイズの評価

    最適なパフォーマンスのために、画像が大きすぎる場合はアップロード前にリサイズしてください。画像の長辺が1568ピクセルを超える場合、または画像が約1,600トークンを超える場合、アスペクト比を維持しながらサイズ制限内に収まるまで縮小されます。

    入力画像が大きすぎてリサイズが必要な場合、出力品質に利益をもたらすことなく最初のトークンまでの時間のレイテンシが増加します。いずれかの辺が200ピクセル未満の非常に小さな画像は、出力品質を低下させる可能性があります。

    最初のトークンまでの時間を改善するために、 画像を1.15メガピクセル以下(かつ両辺とも1568ピクセル以内)に リサイズすることを検討してください。

    以下は、一般的なアスペクト比においてAPIが受け入れる最大画像サイズ(リサイズされない)の表です。Claude Sonnet 4.6では、これらの画像は約1,600トークンを使用し、1,000枚あたり約$4.80かかります。

    アスペクト比画像サイズ
    1:11092x1092 px
    3:4951x1268 px
    2:3896x1344 px
    9:16819x1456 px
    1:2784x1568 px

    画像コストの計算

    Claudeへのリクエストに含める各画像は、トークン使用量にカウントされます。おおよそのコストを計算するには、おおよその画像トークン数に使用しているモデルのトークン単価を掛けてください。

    画像をリサイズする必要がない場合、次のアルゴリズムで使用トークン数を推定できます:tokens = (width px * height px)/750

    以下は、APIのサイズ制約内でのさまざまな画像サイズに対するおおよそのトークン化とコストの例です(Claude Sonnet 4.6の入力トークン単価$3/100万トークンに基づく):

    画像サイズトークン数コスト/枚コスト/1,000枚
    200x200 px(0.04メガピクセル)~54~$0.00016~$0.16
    1000x1000 px(1メガピクセル)~1334~$0.004~$4.00
    1092x1092 px(1.19メガピクセル)~1590~$0.0048~$4.80

    画像品質の確保

    Claudeに画像を提供する際、最良の結果を得るために以下の点に注意してください:

    • 画像フォーマット:サポートされている画像フォーマットを使用してください:JPEG、PNG、GIF、またはWebP。
    • 画像の鮮明さ:画像が鮮明で、ぼやけたりピクセル化されていないことを確認してください。
    • テキスト:画像に重要なテキストが含まれている場合、判読可能で小さすぎないことを確認してください。テキストを拡大するためだけに重要な視覚的コンテキストを切り取らないようにしてください。

    プロンプトの例

    Claudeとのテキストベースのインタラクションでうまく機能するプロンプティング技術の多くは、画像ベースのプロンプトにも適用できます。

    これらの例は、画像を含むベストプラクティスのプロンプト構造を示しています。

    テキストプロンプトでクエリの前に長いドキュメントを配置すると結果が改善されるのと同様に、Claudeは画像がテキストの前に来る場合に最もよく機能します。テキストの後や間に配置された画像でも良好なパフォーマンスを発揮しますが、ユースケースが許す場合は、画像→テキストの構造を優先してください。

    プロンプト例について

    以下の例は、さまざまなプログラミング言語とアプローチを使用してClaudeのビジョン機能を使用する方法を示しています。Claudeに画像を提供する方法は3つあります:

    1. imageコンテンツブロックにbase64エンコードされた画像として
    2. オンラインでホストされている画像へのURL参照として
    3. Files APIを使用して(一度アップロードして複数回使用)

    base64の例のプロンプトでは、以下の変数を使用します:

    以下は、base64エンコードされた画像とURL参照を使用してMessages APIリクエストに画像を含める方法の例です:

    Base64エンコード画像の例

    URLベースの画像の例

    Files API 画像の例

    繰り返し使用する画像や、エンコードのオーバーヘッドを避けたい場合は、Files APIを使用してください。画像を一度アップロードし、base64データを再送信する代わりに、返されたfile_idを後続のメッセージで参照します。

    マルチターン会話やエージェントワークフローでは、各リクエストで会話履歴全体が再送信されます。画像がbase64エンコードされている場合、会話が長くなるにつれて、毎ターンのペイロードに完全な画像バイトが含まれ、リクエストサイズとレイテンシが大幅に増加する可能性があります。Files APIに画像をアップロードしてfile_idで参照することで、会話履歴に画像がいくつ蓄積されても、リクエストペイロードを小さく保つことができます。

    詳細なコード例とパラメータの詳細については、Messages API の例を参照してください。


    制限事項

    Claude の画像理解機能は最先端ですが、注意すべきいくつかの制限があります:

    • 人物の識別: Claude は画像内の人物に名前を付けることを禁止されており、そのような要求を拒否します。
    • 精度: Claude は低品質、回転した、または200ピクセル未満の非常に小さな画像を解釈する際に、幻覚を起こしたり間違いを犯したりすることがあります。
    • 空間的推論: Claude の空間的推論能力には限界があります。アナログ時計の文字盤を読んだり、チェスの駒の正確な位置を説明したりするなど、正確な位置特定やレイアウトを必要とするタスクに苦労することがあります。
    • カウント: Claude は画像内のオブジェクトのおおよその数を示すことができますが、特に多数の小さなオブジェクトがある場合は常に正確とは限りません。
    • AI生成画像: Claude は画像がAI生成かどうかを知ることができず、尋ねられた場合に誤った回答をする可能性があります。偽造または合成画像を検出するために使用しないでください。
    • 不適切なコンテンツ: Claude は利用規約に違反する不適切または露骨な画像を処理しません。
    • 医療アプリケーション: Claude は一般的な医療画像を分析できますが、CTやMRIなどの複雑な診断スキャンを解釈するように設計されていません。Claude の出力は、専門的な医療アドバイスや診断の代替とみなすべきではありません。

    特に重要度の高いユースケースでは、Claude の画像解釈を常に注意深くレビューして確認してください。人間の監視なしに、完璧な精度や機密性の高い画像分析を必要とするタスクに Claude を使用しないでください。


    FAQ


    ビジョンをさらに深く探る

    Claude を使用して画像でのビルドを始める準備はできましたか?役立つリソースをいくつかご紹介します:

    • マルチモーダルクックブック:このクックブックには、画像の使い始め方とベストプラクティスの技術に関するヒントがあり、画像での最高品質のパフォーマンスを確保します。チャートやグラフの解釈と分析やフォームからのコンテンツ抽出などのタスクを実行するために、画像を使って Claude を効果的にプロンプトする方法をご覧ください。
    • APIリファレンス:Messages APIのドキュメント。画像を含むAPIコールの例も含まれています。

    他にご質問がある場合は、サポートチームにお問い合わせください。また、開発者コミュニティに参加して、他のクリエイターとつながり、Anthropic の専門家からサポートを受けることもできます。

    Was this page helpful?

    • Base64エンコード画像の例
    • URLベースの画像の例
    • Files API 画像の例
    • FAQ
        # URLベースの画像の場合、JSONリクエストでURLを直接使用できます
    
        # base64エンコードされた画像の場合、まず画像をエンコードする必要があります
        # bashでbase64に画像をエンコードする方法の例:
        BASE64_IMAGE_DATA=$(curl -s "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg" | base64)
    
        # エンコードされたデータをAPIコールで使用できるようになりました
    curl https://api.anthropic.com/v1/messages \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "content-type: application/json" \
      -d @- <<EOF
    {
      "model": "claude-opus-4-6",
      "max_tokens": 1024,
      "messages": [
        {
          "role": "user",
          "content": [
            {
              "type": "image",
              "source": {
                "type": "base64",
                "media_type": "image/jpeg",
                "data": "$BASE64_IMAGE_DATA"
              }
            },
            {
              "type": "text",
              "text": "Describe this image."
            }
          ]
        }
      ]
    }
    EOF
    curl https://api.anthropic.com/v1/messages \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "content-type: application/json" \
      -d '{
        "model": "claude-opus-4-6",
        "max_tokens": 1024,
        "messages": [
          {
            "role": "user",
            "content": [
              {
                "type": "image",
                "source": {
                  "type": "url",
                  "url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
                }
              },
              {
                "type": "text",
                "text": "Describe this image."
              }
            ]
          }
        ]
      }'
    # まず、Files APIに画像をアップロードします
    curl -X POST https://api.anthropic.com/v1/files \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "anthropic-beta: files-api-2025-04-14" \
      -F "[email protected]"
    
    # 次に、返されたfile_idをメッセージで使用します
    curl https://api.anthropic.com/v1/messages \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "anthropic-beta: files-api-2025-04-14" \
      -H "content-type: application/json" \
      -d '{
        "model": "claude-opus-4-6",
        "max_tokens": 1024,
        "messages": [
          {
            "role": "user",
            "content": [
              {
                "type": "image",
                "source": {
                  "type": "file",
                  "file_id": "file_abc123"
                }
              },
              {
                "type": "text",
                "text": "Describe this image."
              }
            ]
          }
        ]
      }'