Loading...
    • 开发者指南
    • API 参考
    • MCP
    • 资源
    • 发布说明
    Search...
    ⌘K
    快速开始
    Claude 简介快速入门
    模型与定价
    模型概览选择模型Claude 4.5 新功能迁移到 Claude 4.5模型弃用定价
    使用 Claude 构建
    功能概览使用 Messages API上下文窗口提示词最佳实践
    能力
    提示词缓存上下文编辑扩展思考工作量流式消息批量处理引用多语言支持Token 计数嵌入视觉PDF 支持Files API搜索结果结构化输出
    工具
    概览如何实现工具使用细粒度工具流式传输Bash 工具代码执行工具程序化工具调用计算机使用工具文本编辑器工具Web 获取工具Web 搜索工具内存工具工具搜索工具
    Agent Skills
    概览快速入门最佳实践在 API 中使用 Skills
    Agent SDK
    概览快速入门TypeScript SDKTypeScript V2(预览版)Python SDK迁移指南
    API 中的 MCP
    MCP 连接器远程 MCP 服务器
    第三方平台上的 Claude
    Amazon BedrockMicrosoft FoundryVertex AI
    提示词工程
    概览提示词生成器使用提示词模板提示词改进器清晰直接使用示例(多轮提示)让 Claude 思考(CoT)使用 XML 标签给 Claude 一个角色(系统提示词)预填充 Claude 的响应链接复杂提示词长上下文提示扩展思考提示
    测试与评估
    定义成功标准开发测试用例使用评估工具降低延迟
    加强防护栏
    减少幻觉提高输出一致性缓解越狱流式拒绝减少提示词泄露保持 Claude 的角色
    管理和监控
    Admin API 概览使用和成本 APIClaude Code Analytics API
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    第三方平台上的 Claude

    Vertex AI 上的 Claude

    Anthropic 的 Claude 模型现已通过 Vertex AI 正式推出。

    通过 Vertex API 访问 Claude 与 Messages API 几乎相同,支持所有相同的选项,但有两个关键区别:

    • 在 Vertex 中,model 不在请求体中传递。相反,它在 Google Cloud 端点 URL 中指定。
    • 在 Vertex 中,anthropic_version 在请求体中传递(而不是作为标头),并且必须设置为值 vertex-2023-10-16。

    Vertex 也受到 Anthropic 官方 客户端 SDK 的支持。本指南将引导您完成在 Python 或 TypeScript 中向 Vertex AI 上的 Claude 发出请求的过程。

    请注意,本指南假设您已经拥有能够使用 Vertex AI 的 GCP 项目。有关所需的设置以及完整的演练,请参阅 使用 Anthropic 的 Claude 3 模型。

    安装用于访问 Vertex AI 的 SDK

    首先,为您选择的语言安装 Anthropic 的 客户端 SDK。

    pip install -U google-cloud-aiplatform "anthropic[vertex]"
    • 安装用于访问 Vertex AI 的 SDK
    • 访问 Vertex AI

    访问 Vertex AI

    模型可用性

    请注意,Anthropic 模型的可用性因地区而异。在 Vertex AI 模型库 中搜索"Claude",或访问 使用 Claude 3 以获取最新信息。

    API 模型 ID

    模型Vertex AI API 模型 ID
    Claude Sonnet 4.5claude-sonnet-4-5@20250929
    Claude Sonnet 4claude-sonnet-4@20250514
    Claude Sonnet 3.7 ⚠️claude-3-7-sonnet@20250219
    Claude Opus 4.5claude-opus-4-5@20251101
    Claude Opus 4.1claude-opus-4-1@20250805
    Claude Opus 4claude-opus-4@20250514
    Claude Opus 3 ⚠️claude-3-opus@20240229
    Claude Haiku 4.5claude-haiku-4-5@20251001
    Claude Haiku 3.5 ⚠️claude-3-5-haiku@20241022
    Claude Haiku 3claude-3-haiku@20240307

    发出请求

    在运行请求之前,您可能需要运行 gcloud auth application-default login 来使用 GCP 进行身份验证。

    以下示例展示了如何从 Vertex AI 上的 Claude 生成文本:

    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "global"
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-sonnet-4-5@20250929",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)

    有关更多详细信息,请参阅我们的 客户端 SDK 和官方 Vertex AI 文档。

    活动日志

    Vertex 提供了一个 请求-响应日志服务,允许客户记录与您的使用相关的提示和完成。

    Anthropic 建议您至少在 30 天滚动基础上记录您的活动,以便了解您的活动并调查任何潜在的滥用。

    启用此服务不会向 Google 或 Anthropic 提供对您内容的任何访问权限。

    功能支持

    您可以在 此处 找到 Vertex 上当前支持的所有功能。

    全局端点与区域端点

    从 Claude Sonnet 4.5 和所有未来模型 开始,Google Vertex AI 提供两种端点类型:

    • 全局端点:动态路由以获得最大可用性
    • 区域端点:通过特定地理区域保证数据路由

    区域端点的价格比全局端点高 10%。

    这仅适用于 Claude Sonnet 4.5 和未来模型。较旧的模型(Claude Sonnet 4、Opus 4 及更早版本)保持其现有的定价结构。

    何时使用每个选项

    全局端点(推荐):

    • 提供最大可用性和正常运行时间
    • 动态将请求路由到具有可用容量的区域
    • 无价格溢价
    • 最适合数据驻留灵活的应用程序
    • 仅支持按使用量付费流量(预配吞吐量需要区域端点)

    区域端点:

    • 通过特定地理区域路由流量
    • 数据驻留和合规性要求所需
    • 支持按使用量付费和预配吞吐量
    • 10% 的价格溢价反映了专用区域容量的基础设施成本

    实现

    使用全局端点(推荐):

    初始化客户端时将 region 参数设置为 "global":

    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "global"
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-sonnet-4-5@20250929",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)

    使用区域端点:

    指定特定区域,如 "us-east1" 或 "europe-west1":

    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "us-east1"  # Specify a specific region
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-sonnet-4-5@20250929",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)

    其他资源

    • Google Vertex AI 定价: cloud.google.com/vertex-ai/generative-ai/pricing
    • Claude 模型文档: Vertex AI 上的 Claude
    • Google 博客文章: Claude 模型的全局端点
    • Anthropic 定价详情: 定价文档