• 消息
  • 托管智能体
  • 管理
Search...
⌘K
组织
管理 API工作区
身份验证
概览工作负载身份联合WIF 参考
监控
用量与成本 API速率限制 APIClaude Code 分析 API
数据与合规
数据驻留API 与数据保留
合规 API
概览获取访问权限活动动态聊天、文件和项目组织、用户、角色和群组设计您的集成错误常见问题
Log in
速率限制 API
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
管理/监控

速率限制 API

使用速率限制 API 以编程方式查询您组织的 API 速率限制。

Admin API 不适用于个人账户。 如需与团队成员协作并添加成员,请在 Console → Settings → Organization 中设置您的组织。

速率限制 API 提供了以编程方式访问为您的组织及其工作区配置的速率限制的能力。这与 Claude Console 中限制页面上显示的信息相同。

使用此 API 可以:

  • 保持网关和代理同步: 在启动时和按计划读取您当前的限制,而不是硬编码那些在 Anthropic 调整后会过时的值。
  • 支持内部告警: 将来自用量和成本 API 的使用数据与您配置的限制进行比较。
  • 审计工作区配置: 验证工作区覆盖设置是否与您的配置自动化所预期的一致。

需要 Admin API 密钥

此 API 是 Admin API 的一部分。这些端点需要 Admin API 密钥(以 sk-ant-admin... 开头),它与标准 API 密钥不同。只有具有管理员角色的组织成员才能通过 Claude Console 配置 Admin API 密钥。

快速开始

列出为您的组织配置的速率限制:

cURL
curl "https://api.anthropic.com/v1/organizations/rate_limits" \
  --header "anthropic-version: 2023-06-01" \
  --header "x-api-key: $ANTHROPIC_ADMIN_KEY"

组织速率限制

/v1/organizations/rate_limits 端点返回在组织级别应用于 Messages API 及其支持资源的速率限制。其他产品的限制(例如 Claude 托管智能体)不包含在内。

关键概念

  • 速率限制组: 响应中的每个条目代表一个速率限制组。模型速率限制被分组,以便多个模型版本共享一组限制,其他组则涵盖诸如 Message Batches API、Files API、Token Counting API、智能体技能和网络搜索工具等资源。
  • group_type: 标识该条目涵盖的限制类别。有关取值列表,请参阅按组类型筛选。
  • models 列表: 对于 model_group 条目,models 字段列出了计入该组限制的每个模型 ID 和别名。使用此列表可以查找任何模型字符串所属的组。对于其他组类型,models 为 null。
  • limits 列表: 每个组都包含一个 {type, value} 对的列表。type 字段标识限制器(例如 requests_per_minute、input_tokens_per_minute 或 output_tokens_per_minute),value 是配置的限制值。有关每个限制器的测量和执行方式,请参阅速率限制。

有关完整的参数详情和响应架构,请参阅组织速率限制 API 参考。

列出所有组织速率限制

cURL
curl "https://api.anthropic.com/v1/organizations/rate_limits" \
  --header "anthropic-version: 2023-06-01" \
  --header "x-api-key: $ANTHROPIC_ADMIN_KEY"
{
  "data": [
    {
      "type": "rate_limit",
      "group_type": "model_group",
      "models": [
        "claude-opus-4-5",
        "claude-opus-4-5-20251101",
        "claude-opus-4-6",
        "claude-opus-4-7",
        "claude-opus-4-8"
      ],
      "limits": [
        { "type": "requests_per_minute", "value": 4000 },
        { "type": "input_tokens_per_minute", "value": 10000000 },
        { "type": "output_tokens_per_minute", "value": 800000 }
      ]
    },
    {
      "type": "rate_limit",
      "group_type": "batch",
      "models": null,
      "limits": [{ "type": "enqueued_batch_requests", "value": 500000 }]
    }
  ],
  "next_page": null
}

查找特定模型的限制

将任何模型 ID 或别名作为 model 查询参数传递,以仅返回包含该模型的条目:

cURL
curl "https://api.anthropic.com/v1/organizations/rate_limits?model=claude-opus-4-8" \
  --header "anthropic-version: 2023-06-01" \
  --header "x-api-key: $ANTHROPIC_ADMIN_KEY"

如果模型字符串不匹配任何组,端点将返回 404 错误。model 参数仅在组织端点上受支持;工作区端点不接受该参数。

工作区速率限制

/v1/organizations/workspaces/{workspace_id}/rate_limits 端点返回为单个工作区配置的速率限制覆盖设置。

响应仅包含覆盖设置,因此响应中缺失的任何内容都将从组织继承:

  • data 中不存在的组表示完全没有工作区覆盖设置。工作区将继承该组的组织级别限制(并非无限制)。
  • 在存在的组中,limits[] 中不存在的限制器类型表示该限制器没有工作区覆盖设置。工作区将继承该限制器的组织值。
  • 对于每个存在的限制器,org_limit 是同一限制器的组织级别值,如果组织没有为该限制器类型配置限制,则为 null。

有关完整的参数详情和响应架构,请参阅工作区速率限制 API 参考。

要检索您组织的工作区 ID,请使用列出工作区端点,或在 Claude Console 中查找。默认工作区不能有速率限制覆盖设置,因此在此端点上没有对应条目;请使用组织端点读取其限制。

cURL
curl "https://api.anthropic.com/v1/organizations/workspaces/wrkspc_01JwQvzr7rXLA5AGx3HKfFUJ/rate_limits" \
  --header "anthropic-version: 2023-06-01" \
  --header "x-api-key: $ANTHROPIC_ADMIN_KEY"
{
  "data": [
    {
      "type": "workspace_rate_limit",
      "group_type": "model_group",
      "models": [
        "claude-opus-4-5",
        "claude-opus-4-5-20251101",
        "claude-opus-4-6",
        "claude-opus-4-7",
        "claude-opus-4-8"
      ],
      "limits": [
        { "type": "requests_per_minute", "value": 1000, "org_limit": 4000 },
        { "type": "input_tokens_per_minute", "value": 500000, "org_limit": 10000000 }
      ]
    }
  ],
  "next_page": null
}

按组类型筛选

两个端点都接受可选的 group_type 查询参数,用于将响应限制为单个类别:

cURL
curl "https://api.anthropic.com/v1/organizations/rate_limits?group_type=batch" \
  --header "anthropic-version: 2023-06-01" \
  --header "x-api-key: $ANTHROPIC_ADMIN_KEY"

有效值为 model_group、batch、token_count、files、skills 和 web_search。

分页

两个端点都接受 page 查询参数并返回 next_page 字段。目前响应始终为单页,因此 next_page 为 null。请基于 next_page 进行循环,以便当响应增长时,您的客户端无需更改即可正确分页。

常见问题

models 列表中会出现哪些模型字符串?

计入该组的每个模型 ID 和别名,包括带日期的 ID(例如 claude-sonnet-4-5-20250929)和不带日期的别名(例如 claude-sonnet-4-5)。查找您传递给 Messages API 的任何模型字符串,您会在恰好一个 model_group 条目中找到它。

如果工作区响应中缺少某个组意味着什么?

该工作区没有针对该组的覆盖设置,将继承组织级别的限制。查询组织端点以查看继承的值。

我可以使用此 API 更新速率限制吗?

不可以。要设置工作区速率限制,请在 Claude Console 中打开工作区并使用限制选项卡。

另请参阅

  • 速率限制
  • Admin API
  • Admin API 参考
  • 工作区
  • 用量和成本 API

Was this page helpful?

  • 快速开始
  • 组织速率限制
  • 关键概念
  • 列出所有组织速率限制
  • 查找特定模型的限制
  • 工作区速率限制
  • 按组类型筛选
  • 分页
  • 常见问题
  • models 列表中会出现哪些模型字符串?
  • 如果工作区响应中缺少某个组意味着什么?
  • 我可以使用此 API 更新速率限制吗?
  • 另请参阅