Anthropicは3つのサービスティアを提供しています。
Standardティアは、すべてのAPIリクエストのデフォルトのサービスティアです。APIはこれらのリクエストを他のすべてのリクエストと同様に優先順位付けし、ベストエフォートの可用性で処理します。
APIはこのティアのリクエストを他のすべてのリクエストよりも優先します。この優先順位付けにより、ピーク時であっても「サーバー過負荷」エラーを最小限に抑えることができます。
詳細については、Priority Tierを始めるを参照してください。
リクエストを処理する際、Anthropicは以下のシナリオでリクエストをPriority Tierに割り当てることを決定します。
AnthropicはPriority Tierキャパシティに対する使用量を以下のようにカウントします。
入力トークン
inference_geo: "us")リクエストの場合、入力トークンは1トークンにつき1.1トークンとしてカウント出力トークン
inference_geo: "us")リクエストの場合、出力トークンは1トークンにつき1.1トークンとしてカウントそれ以外の場合、リクエストはStandardティアで処理されます。
これらの消費レートは、各トークンタイプの相対的な価格設定を反映しています。たとえば、米国限定推論はOpus 4.6、Sonnet 4.6、およびそれ以降のモデルで1.1倍の価格設定となっているため、inference_geo: "us"で消費される各トークンは、Priority Tierキャパシティから1.1トークン分を消費します。
Priority Tierに割り当てられたリクエストは、Priority Tierキャパシティと通常のレート制限の両方から消費されます。 リクエストの処理がレート制限を超える場合、そのリクエストは拒否されます。
service_tierパラメータを設定することで、リクエストに使用できるサービスティアを制御できます。
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
messages=[{"role": "user", "content": "Hello, Claude!"}],
service_tier="auto", # Automatically use Priority Tier when available, fallback to standard
)
print(message.usage.service_tier)service_tierパラメータは以下の値を受け付けます。
"auto"(デフォルト) - 利用可能な場合はPriority Tierキャパシティを使用し、利用できない場合は他のキャパシティにフォールバックします"standard_only" - Standardティアのキャパシティのみを使用します。Priority Tierキャパシティを使用したくない場合に便利ですレスポンスのusageオブジェクトには、リクエストに割り当てられたサービスティアも含まれます。
{
"usage": {
"input_tokens": 410,
"cache_creation_input_tokens": 0,
"cache_read_input_tokens": 0,
"output_tokens": 585,
"service_tier": "priority"
}
}これにより、リクエストにどのサービスティアが割り当てられたかを確認できます。
Priority Tierコミットメントがあるモデルでservice_tier="auto"をリクエストした場合、以下のレスポンスヘッダーが情報を提供します。
anthropic-priority-input-tokens-limit: 10000
anthropic-priority-input-tokens-remaining: 9618
anthropic-priority-input-tokens-reset: 2025-01-12T23:11:59Z
anthropic-priority-output-tokens-limit: 10000
anthropic-priority-output-tokens-remaining: 6000
anthropic-priority-output-tokens-reset: 2025-01-12T23:12:21Zこれらのヘッダーの有無を確認することで、制限を超えていた場合でも、リクエストがPriority Tierの対象であったかどうかを検出できます。
以下に関心がある場合は、Priority Tierキャパシティへのコミットを検討することをお勧めします。
Priority Tierへのコミットには、以下を決定する必要があります。
購入する入力トークンと出力トークンの比率は重要です。Priority Tierキャパシティを実際のトラフィックパターンに合わせてサイジングすることで、購入したトークンの利用率を最大化できます。
Priority Tierは、Claude Mythos PreviewおよびClaude Mythos 5を除く、利用可能なすべてのClaudeモデル(Claude Fable 5およびClaude Opus 4.8を含む)でサポートされています。
利用可能なモデルの詳細については、モデルの概要を確認してください。
Priority Tierの使用を開始するには:
service_tierパラメータをautoに設定します。Was this page helpful?