Loading...
    • 開發者指南
    • API 參考
    • MCP
    • 資源
    • 發行說明
    Search...
    ⌘K

    第一步

    Claude 介紹快速入門

    模型與定價

    模型概覽選擇模型Claude 4.5 的新功能遷移到 Claude 4.5模型棄用定價

    使用 Claude 建構

    功能概覽使用 Messages API上下文視窗提示詞最佳實踐

    功能

    提示詞快取上下文編輯延伸思考串流訊息批次處理引用多語言支援Token 計數嵌入向量視覺PDF 支援Files API搜尋結果Google Sheets 附加元件

    工具

    概述如何實現工具使用代幣高效工具使用細粒度工具串流Bash 工具代碼執行工具電腦使用工具文字編輯工具網頁擷取工具網路搜尋工具記憶工具

    代理技能

    概述在 API 中開始使用 Agent Skills技能編寫最佳實踐使用 Agent Skills 與 API

    Agent SDK

    概述Agent SDK 參考 - TypeScriptPython SDK

    指南

    串流輸入處理權限會話管理託管 Agent SDK修改系統提示SDK 中的 MCP自訂工具SDK 中的子代理SDK 中的斜線命令SDK 中的代理技能追蹤成本和使用量待辦事項清單SDK 中的外掛程式

    API 中的 MCP

    MCP 連接器遠端 MCP 伺服器

    Claude 在第三方平台上

    Amazon BedrockVertex AI

    提示工程

    概述提示詞生成器使用提示模板提示詞改進器保持清晰和直接使用範例(多樣提示)讓 Claude 思考(思維鏈)使用 XML 標籤給 Claude 分配角色(系統提示詞)預填 Claude 的回應串接複雜提示長文本技巧延伸思考技巧

    測試與評估

    定義成功標準開發測試案例使用評估工具降低延遲

    加強防護措施

    減少幻覺提高輸出一致性防範越獄handle-streaming-refusals減少提示詞洩漏保持 Claude 的角色特性

    管理和監控

    Admin API 概述使用量和成本 APIClaude Code 分析 API
    Console
    測試與評估

    降低延遲

    降低延遲

    延遲是指模型處理提示並生成輸出所需的時間。延遲可能受到各種因素的影響,例如模型的大小、提示的複雜性,以及支持模型和交互點的底層基礎設施。

    最好先設計一個在沒有模型或提示約束的情況下運作良好的提示,然後再嘗試延遲降低策略。過早嘗試降低延遲可能會阻止您發現最佳性能的樣子。


    如何測量延遲

    在討論延遲時,您可能會遇到幾個術語和測量方法:

    • 基準延遲:這是模型處理提示並生成回應所需的時間,不考慮每秒輸入和輸出令牌數。它提供了模型速度的一般概念。
    • 首個令牌時間 (TTFT):此指標測量模型從發送提示開始生成回應的第一個令牌所需的時間。當您使用串流(稍後會詳細介紹)並希望為用戶提供響應式體驗時,這特別相關。

    要更深入了解這些術語,請查看我們的詞彙表。


    如何降低延遲

    1. 選擇正確的模型

    降低延遲最直接的方法之一是為您的用例選擇適當的模型。Anthropic 提供了一系列具有不同能力和性能特徵的模型。考慮您的具體需求,選擇在速度和輸出品質方面最適合您需求的模型。

    對於速度關鍵的應用程式,Claude Haiku 4.5 在保持高智能的同時提供最快的回應時間:

    import anthropic
    
    client = anthropic.Anthropic()
    
    # 對於時間敏感的應用程式,使用 Claude Haiku 4.5
    message = client.messages.create(
        model="claude-haiku-4-5",
        max_tokens=100,
        messages=[{
            "role": "user",
            "content": "Summarize this customer feedback in 2 sentences: [feedback text]"
        }]
    )

    有關模型指標的更多詳細信息,請參閱我們的模型概述頁面。

    2. 優化提示和輸出長度

    在保持高性能的同時,最小化輸入提示和預期輸出中的令牌數量。模型需要處理和生成的令牌越少,回應就越快。

    以下是一些幫助您優化提示和輸出的技巧:

    • 清晰但簡潔:在提示中清晰簡潔地傳達您的意圖。避免不必要的細節或冗餘信息,同時記住 claude 缺乏上下文,如果指令不清楚,可能不會做出預期的邏輯跳躍。
    • 要求更短的回應:直接要求 Claude 簡潔。Claude 3 系列模型相比之前的世代具有改進的可操控性。如果 Claude 輸出不必要的長度,請要求 Claude 抑制其健談性。
      由於 LLM 計算令牌而不是單詞,要求確切的單詞計數或單詞計數限制不如要求段落或句子計數限制有效。
    • 設置適當的輸出限制:使用 max_tokens 參數設置生成回應最大長度的硬限制。這可以防止 Claude 生成過長的輸出。

      注意:當回應達到 max_tokens 令牌時,回應將被截斷,可能在句子中間或單詞中間,因此這是一種可能需要後處理的粗糙技術,通常最適合多選或短答案回應,其中答案就在開頭。

    • 實驗溫度參數:temperature 參數控制輸出的隨機性。較低的值(例如 0.2)有時可以導致更集中和更短的回應,而較高的值(例如 0.8)可能導致更多樣化但可能更長的輸出。

    在提示清晰度、輸出品質和令牌計數之間找到正確的平衡可能需要一些實驗。

    3. 利用串流

    串流是一個功能,允許模型在完整輸出完成之前開始發送回應。這可以顯著改善應用程式的感知響應性,因為用戶可以實時看到模型的輸出。

    啟用串流後,您可以在模型輸出到達時處理它,更新用戶界面或並行執行其他任務。這可以大大增強用戶體驗,使您的應用程式感覺更具互動性和響應性。

    訪問串流 Messages 了解如何為您的用例實現串流。

    • 1. 選擇正確的模型
    • 2. 優化提示和輸出長度
    • 3. 利用串流
    © 2025 ANTHROPIC PBC

    Products

    • Claude
    • Claude Code
    • Max plan
    • Team plan
    • Enterprise plan
    • Download app
    • Pricing
    • Log in

    Features

    • Claude and Slack
    • Claude in Excel

    Models

    • Opus
    • Sonnet
    • Haiku

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Claude Developer Platform

    • Overview
    • Developer docs
    • Pricing
    • Amazon Bedrock
    • Google Cloud’s Vertex AI
    • Console login

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Help and security

    • Availability
    • Status
    • Support center

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy

    Products

    • Claude
    • Claude Code
    • Max plan
    • Team plan
    • Enterprise plan
    • Download app
    • Pricing
    • Log in

    Features

    • Claude and Slack
    • Claude in Excel

    Models

    • Opus
    • Sonnet
    • Haiku

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Claude Developer Platform

    • Overview
    • Developer docs
    • Pricing
    • Amazon Bedrock
    • Google Cloud’s Vertex AI
    • Console login

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Help and security

    • Availability
    • Status
    • Support center

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    © 2025 ANTHROPIC PBC