Loading...
    • 开发者指南
    • API 参考
    • MCP
    • 资源
    • 更新日志
    Search...
    ⌘K
    入门
    Claude 简介快速开始
    模型与定价
    模型概览选择模型Claude 4.6 新特性迁移指南模型弃用定价
    使用 Claude 构建
    功能概览使用 Messages API处理停止原因提示词最佳实践
    上下文管理
    上下文窗口压缩上下文编辑
    能力
    提示缓存扩展思考自适应思考推理力度流式消息批量处理引用多语言支持Token 计数嵌入视觉PDF 支持Files API搜索结果结构化输出
    工具
    概览如何实现工具使用细粒度工具流式传输Bash 工具代码执行工具程序化工具调用计算机使用工具文本编辑器工具网页抓取工具网页搜索工具记忆工具工具搜索工具
    Agent Skills
    概览快速开始最佳实践企业级 Skills通过 API 使用 Skills
    Agent SDK
    概览快速开始TypeScript SDKTypeScript V2(预览版)Python SDK迁移指南
    API 中的 MCP
    MCP 连接器远程 MCP 服务器
    第三方平台上的 Claude
    Amazon BedrockMicrosoft FoundryVertex AI
    提示工程
    概览提示词生成器使用提示词模板提示词优化器清晰直接使用示例(多样本提示)让 Claude 思考(思维链)使用 XML 标签赋予 Claude 角色(系统提示词)链式复杂提示长上下文技巧扩展思考技巧
    测试与评估
    定义成功标准开发测试用例使用评估工具降低延迟
    加强安全护栏
    减少幻觉提高输出一致性防范越狱攻击流式拒绝减少提示词泄露保持 Claude 角色设定
    管理与监控
    Admin API 概览数据驻留工作空间用量与成本 APIClaude Code Analytics API零数据留存
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    第三方平台上的 Claude

    Vertex AI 上的 Claude

    Anthropic 的 Claude 模型现已通过 Vertex AI 正式上线。

    Vertex AI 访问 Claude 的 API 与 Messages API 几乎完全相同,支持所有相同的选项,但有两个关键区别:

    • 在 Vertex 中,model 不在请求体中传递,而是在 Google Cloud 端点 URL 中指定。
    • 在 Vertex 中,anthropic_version 在请求体中传递(而非作为请求头),且必须设置为 vertex-2023-10-16。

    Vertex 也受到 Anthropic 官方客户端 SDK 的支持。本指南将引导您完成使用 Python 或 TypeScript 在 Vertex AI 上向 Claude 发送请求的过程。

    请注意,本指南假设您已经拥有一个能够使用 Vertex AI 的 GCP 项目。有关所需设置的更多信息以及完整的操作指南,请参阅使用 Anthropic 的 Claude 3 模型。

    安装用于访问 Vertex AI 的 SDK

    首先,安装 Anthropic 适用于您所选语言的客户端 SDK。

    pip install -U google-cloud-aiplatform "anthropic[vertex]"

    访问 Vertex AI

    模型可用性

    请注意,Anthropic 模型的可用性因区域而异。在 Vertex AI Model Garden 中搜索"Claude",或前往使用 Claude 3 获取最新信息。

    API 模型 ID

    模型Vertex AI API 模型 ID
    Claude Opus 4.6claude-opus-4-6
    Claude Sonnet 4.5claude-sonnet-4-5@20250929
    Claude Sonnet 4claude-sonnet-4@20250514
    Claude Sonnet 3.7 ⚠️claude-3-7-sonnet@20250219
    Claude Opus 4.5claude-opus-4-5@20251101
    Claude Opus 4.1claude-opus-4-1@20250805
    Claude Opus 4claude-opus-4@20250514
    Claude Haiku 4.5claude-haiku-4-5@20251001
    Claude Haiku 3.5 ⚠️claude-3-5-haiku@20241022
    Claude Haiku 3claude-3-haiku@20240307

    发送请求

    在运行请求之前,您可能需要运行 gcloud auth application-default login 以通过 GCP 进行身份验证。

    以下示例展示了如何在 Vertex AI 上使用 Claude 生成文本:

    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "global"
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)

    有关更多详细信息,请参阅我们的客户端 SDK 和官方 Vertex AI 文档。

    活动日志

    Vertex 提供了一项请求-响应日志服务,允许客户记录与您的使用相关的提示和补全内容。

    Anthropic 建议您至少以 30 天滚动的方式记录您的活动,以便了解您的活动情况并调查任何潜在的滥用行为。

    启用此服务不会让 Google 或 Anthropic 访问您的内容。

    功能支持

    您可以在此处找到 Vertex 当前支持的所有功能。

    全球端点与区域端点

    从 Claude Sonnet 4.5 及所有未来模型开始,Google Vertex AI 提供两种端点类型:

    • 全球端点:动态路由以实现最大可用性
    • 区域端点:保证数据通过特定地理区域路由

    区域端点相比全球端点有 10% 的价格溢价。

    这仅适用于 Claude Sonnet 4.5 及未来的模型。较旧的模型(Claude Sonnet 4、Opus 4 及更早版本)保持其现有的定价结构。

    何时使用每种选项

    全球端点(推荐):

    • 提供最大的可用性和正常运行时间
    • 动态将请求路由到有可用容量的区域
    • 无价格溢价
    • 最适合数据驻留要求灵活的应用
    • 仅支持按需付费流量(预配置吞吐量需要区域端点)

    区域端点:

    • 通过特定地理区域路由流量
    • 数据驻留和合规要求所必需
    • 支持按需付费和预配置吞吐量
    • 10% 的价格溢价反映了专用区域容量的基础设施成本

    实现方式

    使用全球端点(推荐):

    在初始化客户端时将 region 参数设置为 "global":

    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "global"
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)

    使用区域端点:

    指定特定区域,如 "us-east1" 或 "europe-west1":

    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "us-east1"  # Specify a specific region
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)

    其他资源

    • Google Vertex AI 定价: cloud.google.com/vertex-ai/generative-ai/pricing
    • Claude 模型文档: Vertex AI 上的 Claude
    • Google 博客文章: Claude 模型的全球端点
    • Anthropic 定价详情: 定价文档

    Was this page helpful?

    • 安装用于访问 Vertex AI 的 SDK
    • 访问 Vertex AI