Loading...
    • 開發者指南
    • API 參考
    • MCP
    • 資源
    • 發行說明
    Search...
    ⌘K
    開始使用
    Claude 簡介快速開始
    模型與定價
    模型概覽選擇模型Claude 4.5 新功能遷移至 Claude 4.5模型棄用定價
    使用 Claude 構建
    功能概覽使用 Messages API上下文窗口提示詞最佳實踐
    功能
    提示詞快取上下文編輯擴展思考努力串流消息批次處理引用多語言支援Token 計數嵌入視覺PDF 支援Files API搜尋結果結構化輸出
    工具
    概覽如何實現工具使用細粒度工具串流Bash 工具代碼執行工具程式化工具調用計算機使用工具文字編輯器工具網頁擷取工具網頁搜尋工具記憶體工具工具搜尋工具
    Agent Skills
    概覽快速開始最佳實踐使用 API 的 Skills
    Agent SDK
    概覽快速開始TypeScript SDKTypeScript V2 (預覽)Python SDK遷移指南
    API 中的 MCP
    MCP 連接器遠端 MCP 伺服器
    第三方平台上的 Claude
    Amazon BedrockMicrosoft FoundryVertex AI
    提示詞工程
    概覽提示詞生成器使用提示詞範本提示詞改進器清晰直接使用範例 (多次提示)讓 Claude 思考 (CoT)使用 XML 標籤給 Claude 一個角色 (系統提示詞)預填 Claude 的回應鏈接複雜提示詞長上下文提示擴展思考提示
    測試與評估
    定義成功標準開發測試案例使用評估工具降低延遲
    加強防護欄
    減少幻覺增加輸出一致性緩解越獄串流拒絕減少提示詞洩露保持 Claude 的角色
    管理和監控
    Admin API 概覽使用量和成本 APIClaude Code Analytics API
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    功能

    視覺

    Claude 的視覺功能允許它理解和分析圖像,為多模態互動開啟了令人興奮的可能性。

    本指南介紹如何在 Claude 中使用圖像,包括最佳實踐、代碼示例和需要注意的限制。


    如何使用視覺

    通過以下方式使用 Claude 的視覺功能:

    • claude.ai。上傳圖像就像上傳文件一樣,或直接將圖像拖放到聊天窗口中。
    • Console Workbench。在每個用戶消息塊的右上角會出現一個添加圖像的按鈕。
    • API 請求。請參閱本指南中的示例。

    上傳前

    基礎知識和限制

    您可以在單個請求中包含多個圖像(claude.ai 最多 20 個,API 請求最多 100 個)。Claude 將在制定響應時分析所有提供的圖像。這對於比較或對比圖像很有幫助。

    如果您提交的圖像大於 8000x8000 像素,將被拒絕。如果您在一個 API 請求中提交超過 20 個圖像,此限制為 2000x2000 像素。

    雖然 API 支持每個請求 100 個圖像,但標準端點有 32MB 請求大小限制。

    評估圖像大小

    為了獲得最佳性能,如果圖像太大,我們建議在上傳前調整圖像大小。如果您的圖像長邊超過 1568 像素,或您的圖像超過約 1,600 個令牌,它將首先被縮小,保持寬高比,直到它在大小限制內。

    如果您的輸入圖像太大需要調整大小,它將增加 首令牌時間 的延遲,而不會為您提供任何額外的模型性能。任何邊小於 200 像素的非常小的圖像可能會降低性能。

    為了改進 首令牌時間,我們建議 將圖像調整為不超過 1.15 百萬像素(且在兩個維度上都在 1568 像素內)。

    以下是我們的 API 接受的常見寬高比的最大圖像大小表,這些圖像不會被調整大小。使用 Claude Sonnet 4.5,這些圖像使用約 1,600 個令牌,每 1K 個圖像約 $4.80。

    寬高比圖像大小
    1:11092x1092 px
    3:4951x1268 px
    2:3896x1344 px
    9:16819x1456 px
    1:2784x1568 px

    計算圖像成本

    您在請求 Claude 中包含的每個圖像都計入您的令牌使用量。要計算近似成本,請將近似圖像令牌數乘以您使用的 模型的每令牌價格。

    如果您的圖像不需要調整大小,您可以通過此算法估計使用的令牌數:tokens = (width px * height px)/750

    以下是基於 Claude Sonnet 4.5 每令牌價格 $3 每百萬輸入令牌的 API 大小限制內不同圖像大小的近似令牌化和成本示例:

    圖像大小令牌數每個圖像成本每 1K 個圖像成本
    200x200 px(0.04 百萬像素)~54~$0.00016~$0.16
    1000x1000 px(1 百萬像素)~1334~$0.004~$4.00
    1092x1092 px(1.19 百萬像素)~1590~$0.0048~$4.80

    確保圖像質量

    向 Claude 提供圖像時,請記住以下幾點以獲得最佳結果:

    • 圖像格式:使用支持的圖像格式:JPEG、PNG、GIF 或 WebP。
    • 圖像清晰度:確保圖像清晰,不要太模糊或像素化。
    • 文本:如果圖像包含重要文本,請確保其清晰易讀且不要太小。避免為了放大文本而裁剪掉關鍵視覺背景。

    提示示例

    許多 適用於與 Claude 進行基於文本互動的提示技術 也可以應用於基於圖像的提示。

    這些示例演示了涉及圖像的最佳實踐提示結構。

    就像文檔查詢放置一樣,Claude 在圖像位於文本之前時效果最好。 放在文本之後或與文本交錯的圖像仍然會表現良好,但如果您的用例允許, 我們建議採用圖像優先的結構。

    關於提示示例

    以下示例演示了如何使用各種編程語言和方法使用 Claude 的視覺功能。您可以通過三種方式向 Claude 提供圖像:

    1. 作為 image 內容塊中的 base64 編碼圖像
    2. 作為對在線託管圖像的 URL 引用
    3. 使用文件 API(上傳一次,多次使用)

    base64 示例提示使用這些變量:

    以下是如何使用 base64 編碼圖像和 URL 引用在 Messages API 請求中包含圖像的示例:

    Base64 編碼圖像示例

    基於 URL 的圖像示例

    文件 API 圖像示例

    對於您將重複使用的圖像或當您想避免編碼開銷時,請使用 文件 API:

    有關更多示例代碼和參數詳細信息,請參閱 Messages API 示例。


    限制

    雖然 Claude 的圖像理解功能是最先進的,但需要注意一些限制:

    • 人物識別:Claude 不能用於 識別(即命名)圖像中的人物,並將拒絕這樣做。
    • 準確性:Claude 在解釋低質量、旋轉或非常小的圖像(小於 200 像素)時可能會產生幻覺或犯錯誤。
    • 空間推理:Claude 的空間推理能力有限。它可能在需要精確定位或佈局的任務中遇到困難,例如讀取模擬時鐘面或描述國際象棋棋子的確切位置。
    • 計數:Claude 可以給出圖像中對象的近似計數,但可能並不總是精確準確,尤其是對於大量小對象。
    • AI 生成的圖像:Claude 不知道圖像是否是 AI 生成的,如果被問到可能會不正確。不要依賴它來檢測虛假或合成圖像。
    • 不當內容:Claude 不會處理違反我們 可接受使用政策 的不當或明確圖像。
    • 醫療保健應用:雖然 Claude 可以分析一般醫療圖像,但它不是為解釋複雜的診斷掃描(如 CT 或 MRI)而設計的。Claude 的輸出不應被視為專業醫療建議或診斷的替代品。

    始終仔細審查和驗證 Claude 的圖像解釋,特別是對於高風險用例。不要在沒有人工監督的情況下使用 Claude 進行需要完美精度或敏感圖像分析的任務。


    常見問題


    深入探索視覺功能

    準備好開始使用 Claude 的影像功能進行開發了嗎?以下是一些有用的資源:

    • 多模態食譜:此食譜包含有關開始使用影像和最佳實踐技術的提示,以確保影像的最高品質效能。了解如何有效地使用影像提示 Claude 來執行任務,例如解釋和分析圖表或從表單中提取內容。
    • API 參考:造訪我們的 Messages API 文件,包括涉及影像的範例 API 呼叫。

    如果您有任何其他問題,請隨時聯絡我們的支援團隊。您也可以加入我們的開發者社群,與其他創作者聯繫並獲得 Anthropic 專家的幫助。

    • Base64 編碼圖像示例
    • 基於 URL 的圖像示例
    • 文件 API 圖像示例
        # 對於基於 URL 的圖像,您可以直接在 JSON 請求中使用 URL
        
        # 對於 base64 編碼的圖像,您需要先對圖像進行編碼
        # 在 bash 中將圖像編碼為 base64 的示例:
        BASE64_IMAGE_DATA=$(curl -s "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg" | base64)
        
        # 編碼的數據現在可以在您的 API 調用中使用
    curl https://api.anthropic.com/v1/messages \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "content-type: application/json" \
      -d '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 1024,
        "messages": [
          {
            "role": "user",
            "content": [
              {
                "type": "image",
                "source": {
                  "type": "base64",
                  "media_type": "image/jpeg",
                  "data": "'"$BASE64_IMAGE_DATA"'"
                }
              },
              {
                "type": "text",
                "text": "Describe this image."
              }
            ]
          }
        ]
      }'
    curl https://api.anthropic.com/v1/messages \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "content-type: application/json" \
      -d '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 1024,
        "messages": [
          {
            "role": "user",
            "content": [
              {
                "type": "image",
                "source": {
                  "type": "url",
                  "url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
                }
              },
              {
                "type": "text",
                "text": "Describe this image."
              }
            ]
          }
        ]
      }'
    # 首先,將您的圖像上傳到文件 API
    curl -X POST https://api.anthropic.com/v1/files \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "anthropic-beta: files-api-2025-04-14" \
      -F "[email protected]"
    
    # 然後在您的消息中使用返回的 file_id
    curl https://api.anthropic.com/v1/messages \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "anthropic-beta: files-api-2025-04-14" \
      -H "content-type: application/json" \
      -d '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 1024,
        "messages": [
          {
            "role": "user",
            "content": [
              {
                "type": "image",
                "source": {
                  "type": "file",
                  "file_id": "file_abc123"
                }
              },
              {
                "type": "text",
                "text": "Describe this image."
              }
            ]
          }
        ]
      }'