Loading...
  • ビルド
  • 管理
  • モデルと料金
  • クライアントSDK
  • APIリファレンス
Search...
⌘K
Log in
エフォート
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
ビルド/モデル機能

Effort

effortパラメータを使用してClaudeが応答時に使用するトークン数を制御し、応答の徹底性とトークン効率のバランスを取ります。

Was this page helpful?

  • effortの仕組み
  • Effortレベル
  • Sonnet 4.6の推奨effortレベル
  • Claude Opus 4.7の推奨effortレベル
  • effortパラメータを調整する場合
  • ツール使用によるeffort
  • 拡張思考によるeffort

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

effortパラメータを使用すると、リクエストに応答する際にClaudeがトークンを使用することにどの程度積極的であるかを制御できます。これにより、応答の徹底性とトークン効率のバランスを取ることができ、すべて単一のモデルで実現できます。effortパラメータは、サポートされているすべてのモデルで一般的に利用可能であり、ベータヘッダーは必要ありません。

effortパラメータは、Claude Mythos Preview、Claude Opus 4.7、Claude Opus 4.6、Claude Sonnet 4.6、およびClaude Opus 4.5でサポートされています。

Claude Opus 4.6およびSonnet 4.6では、effortは思考の深さを制御するための推奨される方法としてbudget_tokensに置き換わります。effortを適応的思考(thinking: {type: "adaptive"})と組み合わせて使用すると、最高の体験が得られます。budget_tokensはOpus 4.6およびSonnet 4.6で引き続き受け入れられていますが、非推奨であり、将来のモデルリリースで削除される予定です。high(デフォルト)およびmax effortでは、Claudeはほぼ常に思考します。より低いeffortレベルでは、より単純な問題については思考をスキップする可能性があります。

effortの仕組み

デフォルトでは、Claudeは高いeffortを使用し、優れた結果を得るために必要なだけのトークンを使用します。effortレベルをmaxに上げて絶対的に最高の機能を実現することも、トークン使用量をより控えめにして速度とコストを最適化しながら機能の低下を受け入れることもできます。

effortを"high"に設定すると、effortパラメータを完全に省略した場合とまったく同じ動作が生成されます。

effortパラメータは、以下を含むすべてのトークンに影響します:

  • テキスト応答と説明
  • ツール呼び出しと関数の引数
  • 拡張思考(有効な場合)

このアプローチには2つの大きな利点があります:

  1. 使用するために思考を有効にする必要がありません。
  2. ツール呼び出しを含むすべてのトークン支出に影響を与えることができます。たとえば、より低いeffortはClaudeがより少ないツール呼び出しを行うことを意味します。これにより、効率性をより細かく制御できます。

Effortレベル

レベル説明典型的な使用例
maxトークン支出に制約のない絶対的な最大機能。Claude Mythos Preview、Claude Opus 4.7、Claude Opus 4.6、およびClaude Sonnet 4.6で利用可能。最も深い推論と最も徹底的な分析が必要なタスク
xhigh長期的な作業のための拡張機能。Claude Opus 4.7で利用可能。長時間実行されるエージェント型およびコーディングタスク(30分以上)、数百万のトークン予算を持つもの
high高い機能。パラメータを設定しない場合と同等。複雑な推論、難しいコーディング問題、エージェント型タスク
medium適度なトークン節約を伴うバランスの取れたアプローチ。速度、コスト、パフォーマンスのバランスが必要なエージェント型タスク
low最も効率的。機能の低下を伴う大幅なトークン節約。サブエージェントなど、最高の速度と最低のコストが必要なより単純なタスク

Effortは動作シグナルであり、厳密なトークン予算ではありません。より低いeffortレベルでは、Claudeは十分に難しい問題については引き続き思考しますが、同じ問題についてはより高いeffortレベルよりも少なく思考します。

Sonnet 4.6の推奨effortレベル

Sonnet 4.6はhigh effortにデフォルト設定されています。予期しないレイテンシを避けるため、Sonnet 4.6を使用する場合はeffortを明示的に設定してください:

  • Medium effort(推奨デフォルト):ほとんどのアプリケーションで速度、コスト、パフォーマンスの最適なバランス。エージェント型コーディング、ツール多用ワークフロー、コード生成に適しています。
  • Low effort: 大量または低レイテンシのワークロード向け。より高速なターンアラウンドが優先されるチャットおよび非コーディングユースケースに適しています。
  • High effort: Sonnet 4.6から最大の知能が必要なタスク向け。
  • Max effort: トークン支出に制約のない絶対的に最高の機能が必要なタスク向け。

Claude Opus 4.7の推奨effortレベル

コーディングおよびエージェント型ユースケースではxhighから始め、ほとんどの知能に敏感なワークロードではhighを最小値として使用してください。コスト重視のワークロードではmediumにステップダウンするか、評価でxhighで測定可能な余裕が示されている場合のみmaxにステップアップしてください。

APIのデフォルトはhighです。xhighを使用するには、effortを明示的に設定してください。渡す値がデフォルトをオーバーライドします。

EffortClaude Opus 4.7のガイダンス
low効率的ですが、短くスコープされたタスクに最適です。タスクに複数のセクションがある場合は、lowと明示的なチェックリストを組み合わせてください。
mediumコストを削減しながら良い結果を得たい平均的なワークフロー向けのドロップイン。
high知能とトークン消費のバランスが必要な高度なユースケース。これは多くの場合、品質とトークン効率のバランスを取る最適なポイントです。
xhighコーディングおよびエージェント型作業、および繰り返しのツール呼び出し、詳細なウェブ検索、知識ベース検索などの探索的タスクの推奨開始点。highよりも意味のあるほど高いトークン使用量が予想されます。
max本当にフロンティアな問題のために予約してください。ほとんどのワークロードではmaxは比較的小さな品質向上のために大幅なコストを追加し、構造化出力またはあまり知能に敏感でないタスクでは過度な思考につながる可能性があります。

Claude Opus 4.7は、特にlowおよびmediumでeffortレベルをClaude Opus 4.6よりも厳密に尊重します。より低いeffortレベルでは、モデルはその仕事を要求されたものにスコープし、それ以上のことはしません。Claude Opus 4.7で複雑な問題に対する浅い推論が観察される場合は、プロンプトの周りで作業するのではなく、effortを上げてください。レイテンシのためにeffortを低く保つ必要がある場合は、「このタスクは複数ステップの推論を含みます。応答する前に慎重に考えてください。」のような対象を絞ったガイダンスを追加してください。

Claude Opus 4.7をxhighまたはmax effortで実行する場合は、大きなmax_tokensを設定して、モデルがサブエージェントとツール呼び出し全体で思考および行動する余地を持つようにしてください。64kトークンから始めてそこから調整することが合理的なデフォルトです。

基本的な使用方法

effortパラメータを調整する場合

  • max effortを使用する場合は、制約なしで絶対的に最高の機能が必要な場合:最も徹底的な推論と最も深い分析。Claude Mythos Preview、Claude Opus 4.7、Claude Opus 4.6、およびClaude Sonnet 4.6で利用可能。
  • xhigh effortを使用する場合は、繰り返しのツール呼び出しや詳細な検索など、拡張探索が必要な高度なコーディングと複雑なエージェント型作業向け。Claude Opus 4.7で利用可能。
  • high effort(デフォルト)を使用する場合は、Claudeの最高の仕事が必要な場合:複雑な推論、ニュアンスのある分析、難しいコーディング問題、または品質が最優先事項であるあらゆるタスク。
  • medium effortを、高いeffortの完全なトークン支出なしで堅実なパフォーマンスを望む場合のバランスの取れたオプションとして使用してください。
  • low effortを、速度を最適化している場合(Claudeがより少ないトークンで応答するため)またはコストを最適化している場合に使用してください。たとえば、単純な分類タスク、クイックルックアップ、または限界的な品質向上が追加のレイテンシまたは支出を正当化しない大量使用ケース。

ツール使用によるeffort

ツールを使用する場合、effortパラメータはツール呼び出しの周りの説明とツール呼び出し自体の両方に影響します。より低いeffortレベルは傾向として:

  • 複数の操作をより少ないツール呼び出しに組み合わせる
  • より少ないツール呼び出しを行う
  • 前置きなしで直接アクションに進む
  • 完了後に簡潔な確認メッセージを使用する

より高いeffortレベルは以下を行う可能性があります:

  • より多くのツール呼び出しを行う
  • アクションを取る前に計画を説明する
  • 変更の詳細な概要を提供する
  • より包括的なコードコメントを含める

拡張思考によるeffort

effortパラメータは拡張思考と並行して機能します。その動作はモデルに依存します:

  • Claude Mythos Previewは適応的思考をデフォルトで使用します(thinking設定は必要ありません)。thinking: {type: "disabled"}は拒否されます。Effortは、Opus 4.7およびOpus 4.6と同じ方法で思考の深さを制御します。
  • Claude Opus 4.7は適応的思考(thinking: {type: "adaptive"})を使用し、effortは思考の深さを制御するための推奨される方法です。手動拡張思考(thinking: {type: "enabled", budget_tokens: N})はOpus 4.7ではサポートされなくなりました。代わりにeffortで適応的思考を使用してください。high、xhigh、およびmax effortでは、Claudeはほぼ常に深く思考します。より低いレベルでは、より単純な問題については思考をスキップする可能性があります。
  • Claude Opus 4.6は適応的思考(thinking: {type: "adaptive"})を使用し、effortは思考の深さを制御するための推奨される方法です。budget_tokensはOpus 4.6で引き続き受け入れられていますが、非推奨であり、将来のリリースで削除される予定です。highおよびmax effortでは、Claudeはほぼ常に深く思考します。より低いレベルでは、より単純な問題については思考をスキップする可能性があります。
  • はを使用します(effortが思考の深さを制御します)。での手動思考()は引き続き機能していますが、非推奨です。

effortパラメータは、拡張思考が有効になっているかどうかに関わらず使用できます。思考なしで使用する場合でも、テキスト応答とツール呼び出しの全体的なトークン支出を制御します。

ベストプラクティス

  1. effortを明示的に設定してください: APIはhighにデフォルト設定されていますが、正しい開始点はモデルとワークロードに依存します。
  2. 速度に敏感なまたは単純なタスクにはlowを使用してください: レイテンシが重要な場合またはタスクが単純な場合、低いeffortは応答時間とコストを大幅に削減できます。
  3. ユースケースをテストしてください: effortレベルの影響はタスクタイプによって異なります。デプロイする前に特定のユースケースでパフォーマンスを評価してください。
  4. 動的effortを検討してください: タスクの複雑さに基づいてeffortを調整してください。単純なクエリはlowのeffortを保証する可能性がありますが、エージェント型コーディングと複雑な推論はhighのeffortから利益を得ます。
client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures",
        }
    ],
    output_config={"effort": "medium"},
)

print(response.content[0].text)
Claude Sonnet 4.6
適応的思考
インターリーブモード
thinking: {type: "enabled", budget_tokens: N}
  • Claude Opus 4.5およびその他のClaude 4モデルは手動思考(thinking: {type: "enabled", budget_tokens: N})を使用し、effortは思考トークン予算と並行して機能します。タスクのeffortレベルを設定してから、タスクの複雑さに基づいて思考トークン予算を設定してください。