Was this page helpful?
This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
effortパラメータを使用すると、リクエストに応答する際にClaudeがトークンを使用することにどの程度積極的であるかを制御できます。これにより、応答の徹底性とトークン効率のバランスを取ることができ、すべて単一のモデルで実現できます。effortパラメータは、サポートされているすべてのモデルで一般的に利用可能であり、ベータヘッダーは必要ありません。
effortパラメータは、Claude Mythos Preview、Claude Opus 4.7、Claude Opus 4.6、Claude Sonnet 4.6、およびClaude Opus 4.5でサポートされています。
Claude Opus 4.6およびSonnet 4.6では、effortは思考の深さを制御するための推奨される方法としてbudget_tokensに置き換わります。effortを適応的思考(thinking: {type: "adaptive"})と組み合わせて使用すると、最高の体験が得られます。budget_tokensはOpus 4.6およびSonnet 4.6で引き続き受け入れられていますが、非推奨であり、将来のモデルリリースで削除される予定です。high(デフォルト)およびmax effortでは、Claudeはほぼ常に思考します。より低いeffortレベルでは、より単純な問題については思考をスキップする可能性があります。
デフォルトでは、Claudeは高いeffortを使用し、優れた結果を得るために必要なだけのトークンを使用します。effortレベルをmaxに上げて絶対的に最高の機能を実現することも、トークン使用量をより控えめにして速度とコストを最適化しながら機能の低下を受け入れることもできます。
effortを"high"に設定すると、effortパラメータを完全に省略した場合とまったく同じ動作が生成されます。
effortパラメータは、以下を含むすべてのトークンに影響します:
このアプローチには2つの大きな利点があります:
| レベル | 説明 | 典型的な使用例 |
|---|---|---|
max | トークン支出に制約のない絶対的な最大機能。Claude Mythos Preview、Claude Opus 4.7、Claude Opus 4.6、およびClaude Sonnet 4.6で利用可能。 | 最も深い推論と最も徹底的な分析が必要なタスク |
xhigh | 長期的な作業のための拡張機能。Claude Opus 4.7で利用可能。 | 長時間実行されるエージェント型およびコーディングタスク(30分以上)、数百万のトークン予算を持つもの |
high | 高い機能。パラメータを設定しない場合と同等。 | 複雑な推論、難しいコーディング問題、エージェント型タスク |
medium | 適度なトークン節約を伴うバランスの取れたアプローチ。 | 速度、コスト、パフォーマンスのバランスが必要なエージェント型タスク |
low | 最も効率的。機能の低下を伴う大幅なトークン節約。 | サブエージェントなど、最高の速度と最低のコストが必要なより単純なタスク |
Effortは動作シグナルであり、厳密なトークン予算ではありません。より低いeffortレベルでは、Claudeは十分に難しい問題については引き続き思考しますが、同じ問題についてはより高いeffortレベルよりも少なく思考します。
Sonnet 4.6はhigh effortにデフォルト設定されています。予期しないレイテンシを避けるため、Sonnet 4.6を使用する場合はeffortを明示的に設定してください:
コーディングおよびエージェント型ユースケースではxhighから始め、ほとんどの知能に敏感なワークロードではhighを最小値として使用してください。コスト重視のワークロードではmediumにステップダウンするか、評価でxhighで測定可能な余裕が示されている場合のみmaxにステップアップしてください。
APIのデフォルトはhighです。xhighを使用するには、effortを明示的に設定してください。渡す値がデフォルトをオーバーライドします。
| Effort | Claude Opus 4.7のガイダンス |
|---|---|
low | 効率的ですが、短くスコープされたタスクに最適です。タスクに複数のセクションがある場合は、lowと明示的なチェックリストを組み合わせてください。 |
medium | コストを削減しながら良い結果を得たい平均的なワークフロー向けのドロップイン。 |
high | 知能とトークン消費のバランスが必要な高度なユースケース。これは多くの場合、品質とトークン効率のバランスを取る最適なポイントです。 |
xhigh | コーディングおよびエージェント型作業、および繰り返しのツール呼び出し、詳細なウェブ検索、知識ベース検索などの探索的タスクの推奨開始点。highよりも意味のあるほど高いトークン使用量が予想されます。 |
max | 本当にフロンティアな問題のために予約してください。ほとんどのワークロードではmaxは比較的小さな品質向上のために大幅なコストを追加し、構造化出力またはあまり知能に敏感でないタスクでは過度な思考につながる可能性があります。 |
Claude Opus 4.7は、特にlowおよびmediumでeffortレベルをClaude Opus 4.6よりも厳密に尊重します。より低いeffortレベルでは、モデルはその仕事を要求されたものにスコープし、それ以上のことはしません。Claude Opus 4.7で複雑な問題に対する浅い推論が観察される場合は、プロンプトの周りで作業するのではなく、effortを上げてください。レイテンシのためにeffortを低く保つ必要がある場合は、「このタスクは複数ステップの推論を含みます。応答する前に慎重に考えてください。」のような対象を絞ったガイダンスを追加してください。
Claude Opus 4.7をxhighまたはmax effortで実行する場合は、大きなmax_tokensを設定して、モデルがサブエージェントとツール呼び出し全体で思考および行動する余地を持つようにしてください。64kトークンから始めてそこから調整することが合理的なデフォルトです。
ツールを使用する場合、effortパラメータはツール呼び出しの周りの説明とツール呼び出し自体の両方に影響します。より低いeffortレベルは傾向として:
より高いeffortレベルは以下を行う可能性があります:
effortパラメータは拡張思考と並行して機能します。その動作はモデルに依存します:
thinking設定は必要ありません)。thinking: {type: "disabled"}は拒否されます。Effortは、Opus 4.7およびOpus 4.6と同じ方法で思考の深さを制御します。thinking: {type: "adaptive"})を使用し、effortは思考の深さを制御するための推奨される方法です。手動拡張思考(thinking: {type: "enabled", budget_tokens: N})はOpus 4.7ではサポートされなくなりました。代わりにeffortで適応的思考を使用してください。high、xhigh、およびmax effortでは、Claudeはほぼ常に深く思考します。より低いレベルでは、より単純な問題については思考をスキップする可能性があります。thinking: {type: "adaptive"})を使用し、effortは思考の深さを制御するための推奨される方法です。budget_tokensはOpus 4.6で引き続き受け入れられていますが、非推奨であり、将来のリリースで削除される予定です。highおよびmax effortでは、Claudeはほぼ常に深く思考します。より低いレベルでは、より単純な問題については思考をスキップする可能性があります。effortパラメータは、拡張思考が有効になっているかどうかに関わらず使用できます。思考なしで使用する場合でも、テキスト応答とツール呼び出しの全体的なトークン支出を制御します。
highにデフォルト設定されていますが、正しい開始点はモデルとワークロードに依存します。client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=4096,
messages=[
{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures",
}
],
output_config={"effort": "medium"},
)
print(response.content[0].text)thinking: {type: "enabled", budget_tokens: N}thinking: {type: "enabled", budget_tokens: N})を使用し、effortは思考トークン予算と並行して機能します。タスクのeffortレベルを設定してから、タスクの複雑さに基づいて思考トークン予算を設定してください。