Loading...
    • 开发者指南
    • API 参考
    • MCP
    • 资源
    • 发布说明
    Search...
    ⌘K

    第一步

    Claude 简介快速开始

    模型与定价

    模型概览选择模型Claude 4.5 的新功能迁移到 Claude 4.5模型弃用定价

    使用 Claude 构建

    功能概览使用 Messages API上下文窗口提示词最佳实践

    功能

    提示词缓存上下文编辑扩展思考流式消息批处理引用多语言支持Token 计数嵌入向量视觉PDF 支持Files API搜索结果Google Sheets 插件

    工具

    概述如何实现工具使用令牌高效的工具使用细粒度工具流式传输Bash 工具代码执行工具计算机使用工具文本编辑器工具Web fetch 工具网络搜索工具记忆工具

    代理技能

    概述在 API 中开始使用 Agent Skills技能创作最佳实践通过 API 使用 Agent Skills

    Agent SDK

    概览TypeScript SDKPython SDK

    指南

    流式输入处理权限会话管理托管 Agent SDK修改系统提示词SDK 中的 MCP自定义工具SDK 中的子代理SDK 中的斜杠命令SDK 中的代理技能跟踪成本和使用情况待办事项列表SDK 中的插件

    API 中的 MCP

    MCP 连接器远程 MCP 服务器

    Claude 在第三方平台上

    Amazon BedrockVertex AI

    提示词工程

    概述提示词生成器使用提示模板提示词改进器保持清晰和直接使用示例(多示例提示)让 Claude 思考(思维链)使用XML标签给Claude分配角色(系统提示)预填充 Claude 的响应链式复杂提示长文本技巧扩展思考技巧

    测试与评估

    定义成功标准开发测试用例使用评估工具减少延迟

    加强防护措施

    减少幻觉提高输出一致性缓解越狱handle-streaming-refusals减少提示词泄露保持Claude的角色特征

    管理和监控

    Admin API 概述使用量和成本 APIClaude Code 分析 API
    Console
    功能

    嵌入向量

    文本嵌入向量是文本的数值表示,能够测量语义相似性。本指南介绍嵌入向量、其应用以及如何使用嵌入模型进行搜索、推荐和异常检测等任务。

    实施嵌入向量之前

    在选择嵌入向量提供商时,您可以根据需求和偏好考虑以下几个因素:

    • 数据集大小和领域特异性:模型训练数据集的大小及其与您要嵌入的领域的相关性。更大或更具领域特异性的数据通常会产生更好的领域内嵌入向量
    • 推理性能:嵌入查找速度和端到端延迟。这对于大规模生产部署来说是一个特别重要的考虑因素
    • 定制化:在私有数据上继续训练的选项,或针对非常特定领域的模型专业化。这可以提高在独特词汇表上的性能

    如何通过 Anthropic 获取嵌入向量

    Anthropic 不提供自己的嵌入模型。一个拥有广泛选择和能力的嵌入向量提供商,涵盖了上述所有考虑因素的是 Voyage AI。

    Voyage AI 制作最先进的嵌入模型,并为特定行业领域(如金融和医疗保健)提供定制模型,或为个别客户提供定制微调模型。

    本指南的其余部分针对 Voyage AI,但我们鼓励您评估各种嵌入向量供应商,以找到最适合您特定用例的选择。

    可用模型

    Voyage 推荐使用以下文本嵌入模型:

    模型上下文长度嵌入维度描述
    voyage-3-large32,0001024(默认)、256、512、2048最佳通用和多语言检索质量。详情请参见博客文章。
    voyage-3.532,0001024(默认)、256、512、2048针对通用和多语言检索质量进行优化。详情请参见博客文章。
    voyage-3.5-lite32,0001024(默认)、256、512、2048针对延迟和成本进行优化。详情请参见博客文章。
    voyage-code-332,0001024(默认)、256、512、2048针对代码检索进行优化。详情请参见博客文章。
    voyage-finance-232,0001024针对金融检索和 RAG 进行优化。详情请参见博客文章。
    voyage-law-216,0001024针对法律和长上下文检索和 RAG 进行优化。同时在所有领域都有改进的性能。详情请参见博客文章。

    此外,推荐以下多模态嵌入模型:

    模型上下文长度嵌入维度描述
    voyage-multimodal-3320001024丰富的多模态嵌入模型,可以向量化交错的文本和内容丰富的图像,如 PDF、幻灯片、表格、图形等的截图。详情请参见博客文章。

    需要帮助决定使用哪个文本嵌入模型?查看常见问题解答。

    Voyage AI 入门

    要访问 Voyage 嵌入向量:

    1. 在 Voyage AI 网站上注册
    2. 获取 API 密钥
    3. 为方便起见,将 API 密钥设置为环境变量:
    export VOYAGE_API_KEY="<your secret key>"

    您可以通过使用官方的voyageai Python 包或 HTTP 请求来获取嵌入向量,如下所述。

    Voyage Python 库

    可以使用以下命令安装 voyageai 包:

    pip install -U voyageai

    然后,您可以创建一个客户端对象并开始使用它来嵌入您的文本:

    import voyageai
    
    vo = voyageai.Client()
    # 这将自动使用环境变量 VOYAGE_API_KEY。
    # 或者,您可以使用 vo = voyageai.Client(api_key="<your secret key>")
    
    texts = ["Sample text 1", "Sample text 2"]
    
    result = vo.embed(texts, model="voyage-3.5", input_type="document")
    print(result.embeddings[0])
    print(result.embeddings[1])

    result.embeddings 将是一个包含两个嵌入向量的列表,每个向量包含 1024 个浮点数。运行上述代码后,两个嵌入向量将在屏幕上打印出来:

    [-0.013131560757756233, 0.019828535616397858, ...]   # "Sample text 1" 的嵌入向量
    [-0.0069352793507277966, 0.020878976210951805, ...]  # "Sample text 2" 的嵌入向量

    在创建嵌入向量时,您可以为 embed() 函数指定一些其他参数。

    有关 Voyage python 包的更多信息,请参见Voyage 文档。

    Voyage HTTP API

    您也可以通过请求 Voyage HTTP API 来获取嵌入向量。例如,您可以在终端中通过 curl 命令发送 HTTP 请求:

    curl https://api.voyageai.com/v1/embeddings \
      -H "Content-Type: application/json" \
      -H "Authorization: Bearer $VOYAGE_API_KEY" \
      -d '{
        "input": ["Sample text 1", "Sample text 2"],
        "model": "voyage-3.5"
      }'

    您将得到的响应是一个包含嵌入向量和令牌使用情况的 JSON 对象:

    {
      "object": "list",
      "data": [
        {
          "embedding": [-0.013131560757756233, 0.019828535616397858, ...],
          "index": 0
        },
        {
          "embedding": [-0.0069352793507277966, 0.020878976210951805, ...],
          "index": 1
        }
      ],
      "model": "voyage-3.5",
      "usage": {
        "total_tokens": 10
      }
    }
    

    有关 Voyage HTTP API 的更多信息,请参见Voyage 文档。

    AWS Marketplace

    Voyage 嵌入向量在AWS Marketplace上可用。在 AWS 上访问 Voyage 的说明可在此处找到。

    快速入门示例

    现在我们知道如何获取嵌入向量,让我们看一个简短的示例。

    假设我们有一个包含六个文档的小语料库要检索

    documents = [
        "The Mediterranean diet emphasizes fish, olive oil, and vegetables, believed to reduce chronic diseases.",
        "Photosynthesis in plants converts light energy into glucose and produces essential oxygen.",
        "20th-century innovations, from radios to smartphones, centered on electronic advancements.",
        "Rivers provide water, irrigation, and habitat for aquatic species, vital for ecosystems.",
        "Apple's conference call to discuss fourth fiscal quarter results and business updates is scheduled for Thursday, November 2, 2023 at 2:00 p.m. PT / 5:00 p.m. ET.",
        "Shakespeare's works, like 'Hamlet' and 'A Midsummer Night's Dream,' endure in literature."
    ]
    

    我们首先使用 Voyage 将每个文档转换为嵌入向量

    import voyageai
    
    vo = voyageai.Client()
    
    # 嵌入文档
    doc_embds = vo.embed(
        documents, model="voyage-3.5", input_type="document"
    ).embeddings

    嵌入向量将允许我们在向量空间中进行语义搜索/检索。给定一个示例查询,

    query = "When is Apple's conference call scheduled?"

    我们将其转换为嵌入向量,并进行最近邻搜索,根据嵌入空间中的距离找到最相关的文档。

    import numpy as np
    
    # 嵌入查询
    query_embd = vo.embed(
        [query], model="voyage-3.5", input_type="query"
    ).embeddings[0]
    
    # 计算相似性
    # Voyage 嵌入向量被归一化为长度 1,因此点积
    # 和余弦相似性是相同的。
    similarities = np.dot(doc_embds, query_embd)
    
    retrieved_id = np.argmax(similarities)
    print(documents[retrieved_id])

    请注意,我们分别使用 input_type="document" 和 input_type="query" 来嵌入文档和查询。更多规范可以在这里找到。

    输出将是第 5 个文档,这确实是与查询最相关的:

    Apple's conference call to discuss fourth fiscal quarter results and business updates is scheduled for Thursday, November 2, 2023 at 2:00 p.m. PT / 5:00 p.m. ET.

    如果您正在寻找关于如何使用嵌入向量进行 RAG 的详细教程集,包括向量数据库,请查看我们的RAG 教程。

    常见问题解答

    定价

    访问 Voyage 的定价页面获取最新的定价详情。

    • 如何通过 Anthropic 获取嵌入向量
    • Voyage AI 入门
    • Voyage Python 库
    • Voyage HTTP API
    • AWS Marketplace
    © 2025 ANTHROPIC PBC

    Products

    • Claude
    • Claude Code
    • Max plan
    • Team plan
    • Enterprise plan
    • Download app
    • Pricing
    • Log in

    Features

    • Claude and Slack
    • Claude in Excel

    Models

    • Opus
    • Sonnet
    • Haiku

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Claude Developer Platform

    • Overview
    • Developer docs
    • Pricing
    • Amazon Bedrock
    • Google Cloud’s Vertex AI
    • Console login

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Help and security

    • Availability
    • Status
    • Support center

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy

    Products

    • Claude
    • Claude Code
    • Max plan
    • Team plan
    • Enterprise plan
    • Download app
    • Pricing
    • Log in

    Features

    • Claude and Slack
    • Claude in Excel

    Models

    • Opus
    • Sonnet
    • Haiku

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Claude Developer Platform

    • Overview
    • Developer docs
    • Pricing
    • Amazon Bedrock
    • Google Cloud’s Vertex AI
    • Console login

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Help and security

    • Availability
    • Status
    • Support center

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    © 2025 ANTHROPIC PBC