Loading...
    • 開発者ガイド
    • API リファレンス
    • MCP
    • リソース
    • リリースノート
    Search...
    ⌘K
    はじめに
    Claude の紹介クイックスタート
    モデルと料金
    モデル概要モデルの選び方Claude 4.6 の新機能移行ガイドモデルの廃止料金
    Claude で構築する
    機能概要Messages API の使用停止理由の処理プロンプトのベストプラクティス
    コンテキスト管理
    コンテキストウィンドウコンパクションコンテキスト編集
    機能
    プロンプトキャッシング拡張思考適応型思考エフォートメッセージのストリーミングバッチ処理引用多言語サポートトークンカウントエンベディングビジョンPDF サポートFiles API検索結果構造化出力
    ツール
    概要ツール使用の実装方法きめ細かいツールストリーミングBash ツールコード実行ツールプログラムによるツール呼び出しコンピュータ使用ツールテキストエディタツールWeb フェッチツールWeb 検索ツールメモリツールツール検索ツール
    Agent Skills
    概要クイックスタートベストプラクティスエンタープライズ向け SkillsAPI での Skills の使用
    Agent SDK
    概要クイックスタートTypeScript SDKTypeScript V2(プレビュー)Python SDK移行ガイド
    API での MCP
    MCP コネクタリモート MCP サーバー
    サードパーティプラットフォームの Claude
    Amazon BedrockMicrosoft FoundryVertex AI
    プロンプトエンジニアリング
    概要プロンプトジェネレータープロンプトテンプレートの使用プロンプト改善ツール明確かつ直接的に例を使う(マルチショットプロンプティング)Claude に考えさせる(CoT)XML タグを使うClaude に役割を与える(システムプロンプト)複雑なプロンプトを連鎖させる長文コンテキストのヒント拡張思考のヒント
    テストと評価
    成功基準の定義テストケースの開発評価ツールの使用レイテンシの削減
    ガードレールの強化
    ハルシネーションの削減出力の一貫性を高めるジェイルブレイクの軽減ストリーミング拒否プロンプト漏洩の防止Claude をキャラクターに保つ
    管理とモニタリング
    Admin API 概要データレジデンシーワークスペースUsage and Cost APIClaude Code Analytics APIゼロデータリテンション
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    機能

    ビジョン

    Claudeのビジョン機能により、画像の理解と分析が可能になり、マルチモーダルインタラクションのエキサイティングな可能性が開かれます。

    Was this page helpful?

    • Base64エンコード画像の例
    • URLベース画像の例
    • Files API画像の例
    • FAQ

    このガイドでは、Claudeで画像を扱う方法について、ベストプラクティス、コード例、留意すべき制限事項を含めて説明します。


    ビジョンの使い方

    Claudeのビジョン機能は以下の方法で使用できます:

    • claude.ai。ファイルをアップロードするように画像をアップロードするか、チャットウィンドウに直接画像をドラッグ&ドロップします。
    • Console Workbench。すべてのUserメッセージブロックの右上に画像を追加するボタンが表示されます。
    • APIリクエスト。このガイドの例を参照してください。

    アップロードする前に

    基本と制限

    1回のリクエストに複数の画像を含めることができます(claude.aiでは最大20枚、APIリクエストでは最大100枚)。Claudeは応答を作成する際に、提供されたすべての画像を分析します。これは画像の比較や対照に役立ちます。

    8000x8000 pxを超える画像を送信すると、拒否されます。1回のAPIリクエストで20枚以上の画像を送信する場合、この制限は2000x2000 pxになります。

    APIはリクエストあたり100枚の画像をサポートしていますが、標準エンドポイントには32MBのリクエストサイズ制限があります。

    画像サイズの評価

    最適なパフォーマンスのために、画像が大きすぎる場合はアップロード前にリサイズすることをお勧めします。画像の長辺が1568ピクセルを超える場合、または画像が約1,600トークンを超える場合、アスペクト比を維持しながらサイズ制限内に収まるまで縮小されます。

    入力画像が大きすぎてリサイズが必要な場合、追加のモデルパフォーマンスを得ることなく最初のトークンまでの時間のレイテンシが増加します。いずれかの辺が200ピクセル未満の非常に小さな画像は、パフォーマンスが低下する可能性があります。

    最初のトークンまでの時間を改善するために、 画像を1.15メガピクセル以下(かつ両方の次元で1568ピクセル以内)に リサイズすることをお勧めします。

    以下は、一般的なアスペクト比でリサイズされないAPIが受け入れる最大画像サイズの表です。Claude Opus 4.6では、これらの画像は約1,600トークンを使用し、約$4.80/1K画像のコストがかかります。

    アスペクト比画像サイズ
    1:11092x1092 px
    3:4951x1268 px
    2:3896x1344 px
    9:16819x1456 px
    1:2784x1568 px

    画像コストの計算

    リクエストに含める各画像は、トークン使用量にカウントされます。おおよそのコストを計算するには、画像トークンの概算数に使用しているモデルのトークン単価を掛けます。

    画像のリサイズが不要な場合、次のアルゴリズムで使用トークン数を推定できます:tokens = (width px * height px)/750

    以下は、Claude Opus 4.6の入力トークン単価(100万トークンあたり$3)に基づく、APIのサイズ制約内のさまざまな画像サイズのおおよそのトークン化とコストの例です:

    画像サイズトークン数コスト / 画像コスト / 1K画像
    200x200 px(0.04メガピクセル)~54~$0.00016~$0.16
    1000x1000 px(1メガピクセル)~1334~$0.004~$4.00
    1092x1092 px(1.19メガピクセル)~1590~$0.0048~$4.80

    画像品質の確保

    Claudeに画像を提供する際、最良の結果を得るために以下の点に留意してください:

    • 画像フォーマット:サポートされている画像フォーマットを使用してください:JPEG、PNG、GIF、またはWebP。
    • 画像の鮮明さ:画像が鮮明で、ぼやけすぎたりピクセル化されていないことを確認してください。
    • テキスト:画像に重要なテキストが含まれている場合、読みやすく小さすぎないことを確認してください。テキストを拡大するためだけに重要な視覚的コンテキストをトリミングすることは避けてください。

    プロンプトの例

    テキストベースのClaudeとのインタラクションでうまく機能するプロンプト技術の多くは、画像ベースのプロンプトにも適用できます。

    これらの例は、画像を含むベストプラクティスのプロンプト構造を示しています。

    ドキュメントクエリの配置と同様に、Claudeは画像がテキストの前に来る場合に 最も良く機能します。テキストの後に配置された画像やテキストに挿入された画像でも 良好なパフォーマンスを発揮しますが、ユースケースが許す場合は、 画像→テキストの構造をお勧めします。

    プロンプト例について

    以下の例は、さまざまなプログラミング言語とアプローチを使用してClaudeのビジョン機能を使用する方法を示しています。Claudeに画像を提供する方法は3つあります:

    1. imageコンテンツブロック内のbase64エンコード画像として
    2. オンラインでホストされている画像へのURL参照として
    3. Files API を使用(一度アップロードして複数回使用)

    base64の例のプロンプトでは、以下の変数を使用します:

    以下は、base64エンコード画像とURL参照を使用してMessages APIリクエストに画像を含める方法の例です:

    Base64エンコード画像の例

    URLベース画像の例

    Files API画像の例

    繰り返し使用する画像や、エンコードのオーバーヘッドを避けたい場合は、Files APIを使用してください:

    その他のコード例やパラメータの詳細については、Messages APIの例を参照してください。


    制限事項

    Claudeの画像理解機能は最先端ですが、いくつかの制限事項があります:

    • 人物の識別:Claudeは画像内の人物を識別(つまり名前を特定)するために使用することはできません。そのような要求は拒否されます。
    • 精度:Claudeは、低品質、回転した、または200ピクセル未満の非常に小さな画像を解釈する際に、ハルシネーションや誤りが発生する可能性があります。
    • 空間推論:Claudeの空間推論能力には限界があります。正確な位置特定やレイアウトを必要とするタスク(アナログ時計の文字盤の読み取りやチェスの駒の正確な位置の説明など)では困難が生じる場合があります。
    • カウント:Claudeは画像内のオブジェクトのおおよその数を提供できますが、特に多数の小さなオブジェクトの場合、常に正確であるとは限りません。
    • AI生成画像:Claudeは画像がAI生成かどうかを判断できず、質問された場合に誤る可能性があります。偽の画像や合成画像の検出にClaudeを頼らないでください。
    • 不適切なコンテンツ:Claudeは利用規約に違反する不適切または露骨な画像を処理しません。
    • 医療アプリケーション:Claudeは一般的な医療画像を分析できますが、CTやMRIなどの複雑な診断スキャンの解釈を目的として設計されていません。Claudeの出力は、専門的な医療アドバイスや診断の代替と見なすべきではありません。

    特に重要なユースケースでは、Claudeの画像解釈を常に慎重にレビューし検証してください。人間の監視なしに、完璧な精度や機密性の高い画像分析を必要とするタスクにClaudeを使用しないでください。


    FAQ


    ビジョンをさらに深く探る

    Claudeで画像を使った構築を始める準備はできましたか?以下にいくつかの役立つリソースをご紹介します:

    • マルチモーダルクックブック:このクックブックには、画像の使い始め方や、画像で最高品質のパフォーマンスを確保するためのベストプラクティステクニックに関するヒントが含まれています。チャートやグラフの解釈・分析やフォームからのコンテンツ抽出などのタスクを実行するために、画像を使ってClaudeに効果的にプロンプトを与える方法をご覧ください。
    • APIリファレンス:Messages APIのドキュメントをご覧ください。画像を含むAPIコールの例も含まれています。

    その他のご質問がございましたら、お気軽にサポートチームまでお問い合わせください。また、開発者コミュニティに参加して、他のクリエイターとつながり、Anthropicの専門家からサポートを受けることもできます。

        # URLベースの画像の場合、JSONリクエストでURLを直接使用できます
        
        # base64エンコード画像の場合、まず画像をエンコードする必要があります
        # bashで画像をbase64にエンコードする例:
        BASE64_IMAGE_DATA=$(curl -s "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg" | base64)
        
        # エンコードされたデータをAPIコールで使用できます
    curl https://api.anthropic.com/v1/messages \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "content-type: application/json" \
      -d '{
        "model": "claude-opus-4-6",
        "max_tokens": 1024,
        "messages": [
          {
            "role": "user",
            "content": [
              {
                "type": "image",
                "source": {
                  "type": "base64",
                  "media_type": "image/jpeg",
                  "data": "'"$BASE64_IMAGE_DATA"'"
                }
              },
              {
                "type": "text",
                "text": "Describe this image."
              }
            ]
          }
        ]
      }'
    curl https://api.anthropic.com/v1/messages \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "content-type: application/json" \
      -d '{
        "model": "claude-opus-4-6",
        "max_tokens": 1024,
        "messages": [
          {
            "role": "user",
            "content": [
              {
                "type": "image",
                "source": {
                  "type": "url",
                  "url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
                }
              },
              {
                "type": "text",
                "text": "Describe this image."
              }
            ]
          }
        ]
      }'
    # まず、Files APIに画像をアップロードします
    curl -X POST https://api.anthropic.com/v1/files \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "anthropic-beta: files-api-2025-04-14" \
      -F "[email protected]"
    
    # 次に、返されたfile_idをメッセージで使用します
    curl https://api.anthropic.com/v1/messages \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "anthropic-beta: files-api-2025-04-14" \
      -H "content-type: application/json" \
      -d '{
        "model": "claude-opus-4-6",
        "max_tokens": 1024,
        "messages": [
          {
            "role": "user",
            "content": [
              {
                "type": "image",
                "source": {
                  "type": "file",
                  "file_id": "file_abc123"
                }
              },
              {
                "type": "text",
                "text": "Describe this image."
              }
            ]
          }
        ]
      }'