effortパラメータを使用すると、リクエストに応答する際にClaudeがトークンをどの程度積極的に使用するかを制御できます。これにより、単一のモデルで応答の徹底性とトークン効率のトレードオフを調整できます。effortパラメータは、ベータヘッダーを必要とせず、サポートされているすべてのモデルで一般利用可能です。
effortパラメータはClaude Opus 4.6およびClaude Opus 4.5でサポートされています。
Claude Opus 4.6では、思考の深さを制御する推奨方法として、effortがbudget_tokensに代わるものとなります。最良の体験を得るには、effortとアダプティブシンキング(thinking: {type: "adaptive"})を組み合わせてください。budget_tokensはOpus 4.6でまだ受け付けられますが、非推奨であり、将来のモデルリリースで削除される予定です。high(デフォルト)およびmaxのeffortでは、Claudeはほぼ常に思考します。より低いeffortレベルでは、単純な問題に対して思考をスキップする場合があります。
デフォルトでは、Claudeは高いeffortを使用し、優れた結果を得るために必要なだけのトークンを消費します。effortレベルをmaxに上げることで絶対的に最高の能力を発揮させたり、下げることでトークン使用量をより控えめにし、能力の若干の低下を許容しつつ速度とコストを最適化したりできます。
effortを"high"に設定すると、effortパラメータを完全に省略した場合とまったく同じ動作になります。
effortパラメータは、応答内のすべてのトークンに影響します。これには以下が含まれます:
このアプローチには2つの大きな利点があります:
| レベル | 説明 | 典型的なユースケース |
|---|---|---|
max | トークン消費に制約のない絶対的な最大能力。Opus 4.6のみ — 他のモデルでmaxを使用するリクエストはエラーを返します。 | 最も深い推論と最も徹底的な分析を必要とするタスク |
high | 高い能力。パラメータを設定しない場合と同等。 | 複雑な推論、難しいコーディング問題、エージェントタスク |
medium | 適度なトークン節約によるバランスの取れたアプローチ。 | 速度、コスト、パフォーマンスのバランスが必要なエージェントタスク |
low | 最も効率的。能力の若干の低下を伴う大幅なトークン節約。 | 最高の速度と最低のコストが必要な単純なタスク(サブエージェントなど) |
effortは動作シグナルであり、厳密なトークン予算ではありません。低いeffortレベルでも、十分に難しい問題に対してはClaudeは思考します — ただし、同じ問題に対して高いeffortレベルの場合よりも思考量が少なくなります。
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)maxを使用するリクエストはエラーを返します。ツールを使用する場合、effortパラメータはツール呼び出し周辺の説明とツール呼び出し自体の両方に影響します。低いeffortレベルでは以下の傾向があります:
高いeffortレベルでは以下の傾向があります:
effortパラメータは拡張思考と併用できます。その動作はモデルによって異なります:
thinking: {type: "adaptive"})を使用し、effortが思考の深さを制御する推奨方法です。budget_tokensはOpus 4.6でまだ受け付けられますが、非推奨であり、将来のリリースで削除される予定です。highおよびmaxのeffortでは、Claudeはほぼ常に深く思考します。低いレベルでは、単純な問題に対して思考をスキップする場合があります。thinking: {type: "enabled", budget_tokens: N})を使用し、effortは思考トークン予算と併用されます。タスクに応じたeffortレベルを設定し、タスクの複雑さに基づいて思考トークン予算を設定してください。effortパラメータは、拡張思考の有効・無効にかかわらず使用できます。思考なしで使用する場合でも、テキスト応答とツール呼び出しの全体的なトークン消費を制御します。
Was this page helpful?