Loading...
    • 開発者ガイド
    • APIリファレンス
    • MCP
    • リソース
    • リリースノート
    Search...
    ⌘K
    最初のステップ
    Claudeの紹介クイックスタート
    モデルと価格
    モデル概要モデルの選択Claude 4.5の新機能Claude 4.5への移行モデルの廃止予定価格
    Claudeで構築
    機能概要Messages APIの使用コンテキストウィンドウプロンプトのベストプラクティス
    機能
    プロンプトキャッシングコンテキスト編集拡張思考エフォートストリーミングメッセージバッチ処理引用多言語対応トークンカウント埋め込みビジョンPDF対応Files API検索結果構造化出力
    ツール
    概要ツール使用の実装方法細粒度ツールストリーミングBashツールコード実行ツールプログラマティックツール呼び出しコンピュータ使用ツールテキストエディタツールWebフェッチツールWeb検索ツールメモリツールツール検索ツール
    エージェントスキル
    概要クイックスタートベストプラクティスAPIでスキルを使用
    Agent SDK
    概要クイックスタートTypeScript SDKTypeScript V2(プレビュー)Python SDK移行ガイド
    APIのMCP
    MCPコネクタリモートMCPサーバー
    サードパーティプラットフォームのClaude
    Amazon BedrockMicrosoft FoundryVertex AI
    プロンプトエンジニアリング
    概要プロンプトジェネレータプロンプトテンプレートの使用プロンプト改善ツール明確で直接的に例を使用(マルチショットプロンプティング)Claudeに考えさせる(CoT)XMLタグを使用Claudeに役割を与える(システムプロンプト)Claudeの応答を事前入力複雑なプロンプトをチェーン長いコンテキストのヒント拡張思考のヒント
    テストと評価
    成功基準の定義テストケースの開発評価ツールの使用レイテンシの削減
    ガードレールの強化
    ハルシネーションの削減出力の一貫性を向上ジェイルブレイクの軽減ストリーミング拒否プロンプトリークの削減Claudeをキャラクターのままに
    管理とモニタリング
    Admin API概要使用状況とコストAPIClaude Code Analytics API
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    機能

    ビジョン

    Claudeのビジョン機能により、画像を理解および分析できるようになり、マルチモーダルインタラクションの興味深い可能性が開かれます。
    • Base64エンコードされた画像の例
    • URLベースの画像の例
    • Files API画像の例
    • FAQ

    このガイドでは、Claudeで画像を操作する方法について説明します。ベストプラクティス、コード例、および留意すべき制限事項が含まれています。


    ビジョンの使用方法

    Claudeのビジョン機能は以下の方法で使用できます:

    • claude.ai。ファイルのように画像をアップロードするか、チャットウィンドウに画像を直接ドラッグアンドドロップします。
    • Console Workbench。すべてのユーザーメッセージブロックの右上に画像を追加するボタンが表示されます。
    • APIリクエスト。このガイドの例を参照してください。

    アップロード前に

    基本と制限

    1つのリクエストに複数の画像を含めることができます(claude.aiでは最大20枚、APIリクエストでは最大100枚)。Claudeは応答を作成する際に提供されたすべての画像を分析します。これは画像を比較または対比するのに役立つ場合があります。

    8000x8000 pxより大きい画像を送信すると、拒否されます。1つのAPIリクエストで20枚以上の画像を送信する場合、この制限は2000x2000 pxです。

    APIは1リクエストあたり100枚の画像をサポートしていますが、標準エンドポイントには32MBのリクエストサイズ制限があります。

    画像サイズの評価

    最適なパフォーマンスのために、アップロード前に画像が大きすぎる場合はサイズを変更することをお勧めします。画像の長辺が1568ピクセルを超える場合、または画像が約1,600トークンを超える場合、最初にアスペクト比を保持しながらスケールダウンされ、サイズ制限内に収まるようになります。

    入力画像が大きすぎてサイズを変更する必要がある場合、モデルのパフォーマンスが向上することなく、time-to-first-tokenのレイテンシが増加します。200ピクセル未満の非常に小さい画像は、パフォーマンスを低下させる可能性があります。

    time-to-first-tokenを改善するために、画像を最大1.15メガピクセル(両方の寸法で1568ピクセル以内)にサイズ変更することをお勧めします。

    以下は、一般的なアスペクト比でサイズ変更されないAPIが受け入れる最大画像サイズの表です。Claude Sonnet 4.5では、これらの画像は約1,600トークンを使用し、1,000枚あたり約$4.80です。

    アスペクト比画像サイズ
    1:11092x1092 px
    3:4951x1268 px
    2:3896x1344 px
    9:16819x1456 px
    1:2784x1568 px

    画像コストの計算

    Claudeへのリクエストに含める各画像は、トークン使用量にカウントされます。概算コストを計算するには、概算画像トークン数に、使用しているモデルのトークンあたりの価格を掛けます。

    画像をサイズ変更する必要がない場合、このアルゴリズムを使用してトークン数を推定できます:tokens = (width px * height px)/750

    以下は、Claude Sonnet 4.5のトークンあたり$3(100万入力トークンあたり)の価格に基づいて、APIのサイズ制限内のさまざまな画像サイズの概算トークン化とコストの例です:

    画像サイズトークン数画像あたりのコスト1,000枚あたりのコスト
    200x200 px(0.04メガピクセル)~54~$0.00016~$0.16
    1000x1000 px(1メガピクセル)~1334~$0.004~$4.00
    1092x1092 px(1.19メガピクセル)~1590~$0.0048~$4.80

    画像品質の確保

    Claudeに画像を提供する場合、最良の結果を得るために以下の点に注意してください:

    • 画像形式:サポートされている画像形式を使用してください:JPEG、PNG、GIF、またはWebP。
    • 画像の明確さ:画像が明確で、ぼやけたりピクセル化されたりしていないことを確認してください。
    • テキスト:画像に重要なテキストが含まれている場合は、読みやすく、小さすぎないことを確認してください。テキストを拡大するためだけに重要な視覚的コンテキストをトリミングしないでください。

    プロンプトの例

    Claudeとのテキストベースのインタラクションでうまく機能するプロンプティング技術の多くは、画像ベースのプロンプトにも適用できます。

    これらの例は、画像を含むベストプラクティスプロンプト構造を示しています。

    ドキュメント-クエリの配置と同様に、Claudeは画像がテキストの前に来るときに最も良く機能します。テキストの後に配置された画像またはテキストと補間された画像は依然として良好に機能しますが、ユースケースが許可する場合は、画像-テキスト構造をお勧めします。

    プロンプト例について

    以下の例は、さまざまなプログラミング言語とアプローチを使用してClaudeのビジョン機能を使用する方法を示しています。Claudeに画像を提供する方法は3つあります:

    1. imageコンテンツブロック内のbase64エンコードされた画像として
    2. オンラインでホストされている画像へのURL参照として
    3. Files APIを使用(1回アップロード、複数回使用)

    base64の例プロンプトは、これらの変数を使用します:

    以下は、base64エンコードされた画像とURL参照を使用してMessages APIリクエストに画像を含める方法の例です:

    Base64エンコードされた画像の例

    URLベースの画像の例

    Files API画像の例

    繰り返し使用する画像や、エンコーディングのオーバーヘッドを回避したい場合は、Files APIを使用してください:

    詳細なコード例とパラメータについては、Messages APIの例を参照してください。


    制限事項

    Claudeの画像理解機能は最先端ですが、認識すべき制限事項があります:

    • 人物の識別:Claudeは使用できません画像内の人物を識別(つまり、名前を付ける)するために、そうすることを拒否します。
    • 精度:Claudeは、低品質、回転、または200ピクセル未満の非常に小さい画像を解釈する際に、幻覚を見たり、間違いを犯したりする可能性があります。
    • 空間推論:Claudeの空間推論能力は限定的です。アナログ時計の文字盤を読むやチェスの駒の正確な位置を説明するなど、正確なローカライゼーションまたはレイアウトが必要なタスクで苦労する可能性があります。
    • カウント:Claudeは画像内のオブジェクトの概算数を提供できますが、特に多数の小さなオブジェクトの場合、常に正確であるとは限りません。
    • AI生成画像:Claudeは画像がAI生成されているかどうかを知らず、尋ねられた場合は間違っている可能性があります。偽造または合成画像を検出するために信頼しないでください。
    • 不適切なコンテンツ:Claudeは、当社の利用可能ポリシーに違反する不適切または露骨な画像を処理しません。
    • 医療アプリケーション:Claudeは一般的な医療画像を分析できますが、CTやMRIなどの複雑な診断スキャンを解釈するように設計されていません。Claudeの出力は、専門的な医学的助言または診断の代替と見なされるべきではありません。

    特に高リスクのユースケースでは、Claudeの画像解釈を常に慎重に確認および検証してください。完全な精度が必要なタスクや、人間の監視なしに機密の画像分析を使用しないでください。


    FAQ


    ビジョン機能をさらに深く掘り下げる

    Claudeを使用して画像で構築を開始する準備はできていますか?以下は役立つリソースです:

    • マルチモーダルクックブック:このクックブックには、画像の開始方法とベストプラクティス技術に関するヒントがあり、画像を使用した最高品質のパフォーマンスを確保します。チャートの解釈と分析やフォームからのコンテンツ抽出などのタスクを実行するために、Claudeに画像を効果的にプロンプトする方法を確認してください。
    • APIリファレンス:Messages APIのドキュメントにアクセスして、画像を含むAPIコールの例を確認してください。

    ご質問がある場合は、サポートチームにお気軽にお問い合わせください。また、開発者コミュニティに参加して、他のクリエイターと交流し、Anthropicの専門家からサポートを受けることもできます。

        # URLベースの画像の場合、JSONリクエストでURLを直接使用できます
        
        # base64エンコードされた画像の場合、最初に画像をエンコードする必要があります
        # bashで画像をbase64にエンコードする方法の例:
        BASE64_IMAGE_DATA=$(curl -s "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg" | base64)
        
        # エンコードされたデータはAPIコールで使用できるようになります
    curl https://api.anthropic.com/v1/messages \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "content-type: application/json" \
      -d '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 1024,
        "messages": [
          {
            "role": "user",
            "content": [
              {
                "type": "image",
                "source": {
                  "type": "base64",
                  "media_type": "image/jpeg",
                  "data": "'"$BASE64_IMAGE_DATA"'"
                }
              },
              {
                "type": "text",
                "text": "Describe this image."
              }
            ]
          }
        ]
      }'
    curl https://api.anthropic.com/v1/messages \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "content-type: application/json" \
      -d '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 1024,
        "messages": [
          {
            "role": "user",
            "content": [
              {
                "type": "image",
                "source": {
                  "type": "url",
                  "url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
                }
              },
              {
                "type": "text",
                "text": "Describe this image."
              }
            ]
          }
        ]
      }'
    # まず、画像をFiles APIにアップロードします
    curl -X POST https://api.anthropic.com/v1/files \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "anthropic-beta: files-api-2025-04-14" \
      -F "[email protected]"
    
    # 次に、返されたfile_idをメッセージで使用します
    curl https://api.anthropic.com/v1/messages \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "anthropic-beta: files-api-2025-04-14" \
      -H "content-type: application/json" \
      -d '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 1024,
        "messages": [
          {
            "role": "user",
            "content": [
              {
                "type": "image",
                "source": {
                  "type": "file",
                  "file_id": "file_abc123"
                }
              },
              {
                "type": "text",
                "text": "Describe this image."
              }
            ]
          }
        ]
      }'