Was this page helpful?
This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
effortパラメータを使用すると、リクエストに応答する際にClaudeがトークンを使用することにどの程度積極的かを制御できます。これにより、単一のモデルで応答の徹底性とトークン効率のバランスを取ることができます。effortパラメータは、サポートされているすべてのモデルで一般的に利用可能であり、ベータヘッダーは不要です。
effortパラメータはClaude Mythos Preview、Claude Opus 4.6、Claude Sonnet 4.6、およびClaude Opus 4.5でサポートされています。
Claude Opus 4.6およびSonnet 4.6の場合、effortは思考の深さを制御するための推奨される方法としてbudget_tokensに置き換わります。effortを適応的思考(thinking: {type: "adaptive"})と組み合わせて使用すると、最高の体験が得られます。Opus 4.6およびSonnet 4.6ではbudget_tokensはまだ受け入れられていますが、非推奨であり、将来のモデルリリースで削除される予定です。high(デフォルト)およびmaxeffortでは、Claudeはほぼ常に思考します。より低いeffortレベルでは、より単純な問題については思考をスキップする可能性があります。
デフォルトでは、Claudeは高いeffortを使用し、優れた結果を得るために必要なだけのトークンを使用します。effortレベルをmaxに上げて絶対的に最高の機能を得るか、またはトークン使用をより控えめにして速度とコストを最適化しながら機能の低下を受け入れることができます。
effortを"high"に設定すると、effortパラメータを完全に省略した場合とまったく同じ動作が生成されます。
effortパラメータは、以下を含むすべてのトークンに影響します:
このアプローチには2つの主な利点があります:
| レベル | 説明 | 典型的な使用例 |
|---|---|---|
max | トークン支出に制約のない絶対的な最大機能。Claude Mythos Preview、Claude Opus 4.6、およびClaude Sonnet 4.6で利用可能。 | 最も深い推論と最も徹底的な分析が必要なタスク |
high | 高い機能。パラメータを設定しないのと同等。 | 複雑な推論、難しいコーディング問題、エージェンティックタスク |
medium | 中程度のトークン節約を伴うバランスの取れたアプローチ。 | 速度、コスト、パフォーマンスのバランスが必要なエージェンティックタスク |
low | 最も効率的。機能の低下を伴う大幅なトークン節約。 | サブエージェントなど、最高の速度と最低のコストが必要なより単純なタスク |
Effortは動作シグナルであり、厳密なトークン予算ではありません。より低いeffortレベルでは、Claudeは十分に難しい問題については引き続き思考しますが、同じ問題に対してより高いeffortレベルよりも少なく思考します。
Sonnet 4.6はhigh effortがデフォルトです。Sonnet 4.6を使用する場合は、予期しないレイテンシを避けるためにeffortを明示的に設定してください:
ツールを使用する場合、effortパラメータはツール呼び出しの周囲の説明とツール呼び出し自体の両方に影響します。より低いeffortレベルは傾向として:
より高いeffortレベルは以下を行う可能性があります:
effortパラメータは拡張思考と一緒に機能します。その動作はモデルに依存します:
thinking設定は不要)。thinking: {type: "disabled"}は拒否されます。Effortは、Opus 4.6と同じ方法で思考の深さを制御します。thinking: {type: "adaptive"})を使用し、effortは思考の深さを制御するための推奨される方法です。Opus 4.6ではbudget_tokensはまだ受け入れられていますが、非推奨であり、将来のリリースで削除される予定です。highおよびmax effortでは、Claudeはほぼ常に深く思考します。より低いレベルでは、より単純な問題については思考をスキップする可能性があります。thinking: {type: "enabled", budget_tokens: N})での手動思考はまだ機能していますが、非推奨です。thinking: {type: "enabled", budget_tokens: N})を使用し、effortは思考トークン予算と一緒に機能します。タスクのeffortレベルを設定してから、タスクの複雑さに基づいて思考トークン予算を設定します。effortパラメータは、拡張思考が有効になっているかどうかに関わらず使用できます。思考なしで使用する場合、テキスト応答とツール呼び出しの全体的なトークン支出を制御します。
highですが、正しい開始点はモデルとワークロードに依存します。curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-opus-4-6",
"max_tokens": 4096,
"messages": [{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
"output_config": {
"effort": "medium"
}
}'