Loading...
    • ビルド
    • 管理
    • モデルと料金
    • クライアントSDK
    • APIリファレンス
    Search...
    ⌘K
    はじめに
    Claudeの概要クイックスタート
    Claudeで構築する
    機能概要Messages APIの使用停止理由の処理
    モデルの機能
    拡張思考適応的思考エフォート高速モード(ベータ:リサーチプレビュー)構造化出力引用ストリーミングメッセージバッチ処理検索結果ストリーミング拒否多言語サポート埋め込み
    ツール
    概要ツール使用の仕組みウェブ検索ツールウェブフェッチツールコード実行ツールメモリツールBashツールコンピューター使用ツールテキストエディタツール
    ツールインフラ
    ツール検索プログラムによるツール呼び出し細粒度ツールストリーミング
    コンテキスト管理
    コンテキストウィンドウコンパクションコンテキスト編集プロンプトキャッシュトークンカウント
    ファイルの操作
    Files APIPDFサポート画像とビジョン
    スキル
    概要クイックスタートベストプラクティスエンタープライズ向けスキルAPIのスキル
    MCP
    リモートMCPサーバーMCPコネクター
    プロンプトエンジニアリング
    概要プロンプトのベストプラクティスConsoleプロンプトツール
    テストと評価
    成功の定義と評価の構築ConsoleでのEvaluation Toolの使用レイテンシの削減
    ガードレールの強化
    幻覚の低減出力の一貫性向上ジェイルブレイクの軽減プロンプトリークの低減
    リソース
    用語集
    リリースノート
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    モデルの機能

    エフォート

    effortパラメータを使用してClaudeが応答時に使用するトークン数を制御し、応答の徹底性とトークン効率のバランスを取ります。

    Was this page helpful?

    • effortの仕組み
    • Effortレベル
    • Sonnet 4.6の推奨effortレベル
    • effortパラメータを調整する時期

    This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

    effortパラメータを使用すると、リクエストに応答する際にClaudeがトークンを使用することにどの程度積極的かを制御できます。これにより、単一のモデルで応答の徹底性とトークン効率のバランスを取ることができます。effortパラメータは、サポートされているすべてのモデルで一般的に利用可能であり、ベータヘッダーは不要です。

    effortパラメータはClaude Mythos Preview、Claude Opus 4.6、Claude Sonnet 4.6、およびClaude Opus 4.5でサポートされています。

    Claude Opus 4.6およびSonnet 4.6の場合、effortは思考の深さを制御するための推奨される方法としてbudget_tokensに置き換わります。effortを適応的思考(thinking: {type: "adaptive"})と組み合わせて使用すると、最高の体験が得られます。Opus 4.6およびSonnet 4.6ではbudget_tokensはまだ受け入れられていますが、非推奨であり、将来のモデルリリースで削除される予定です。high(デフォルト)およびmaxeffortでは、Claudeはほぼ常に思考します。より低いeffortレベルでは、より単純な問題については思考をスキップする可能性があります。

    effortの仕組み

    デフォルトでは、Claudeは高いeffortを使用し、優れた結果を得るために必要なだけのトークンを使用します。effortレベルをmaxに上げて絶対的に最高の機能を得るか、またはトークン使用をより控えめにして速度とコストを最適化しながら機能の低下を受け入れることができます。

    effortを"high"に設定すると、effortパラメータを完全に省略した場合とまったく同じ動作が生成されます。

    effortパラメータは、以下を含むすべてのトークンに影響します:

    • テキスト応答と説明
    • ツール呼び出しと関数の引数
    • 拡張思考(有効な場合)

    このアプローチには2つの主な利点があります:

    1. 思考を有効にする必要がなく、これを使用できます。
    2. ツール呼び出しを含むすべてのトークン支出に影響を与えることができます。たとえば、より低いeffortはClaudeがより少ないツール呼び出しを行うことを意味します。これにより、効率に対する制御がはるかに大きくなります。

    Effortレベル

    レベル説明典型的な使用例
    maxトークン支出に制約のない絶対的な最大機能。Claude Mythos Preview、Claude Opus 4.6、およびClaude Sonnet 4.6で利用可能。最も深い推論と最も徹底的な分析が必要なタスク
    high高い機能。パラメータを設定しないのと同等。複雑な推論、難しいコーディング問題、エージェンティックタスク
    medium中程度のトークン節約を伴うバランスの取れたアプローチ。速度、コスト、パフォーマンスのバランスが必要なエージェンティックタスク
    low最も効率的。機能の低下を伴う大幅なトークン節約。サブエージェントなど、最高の速度と最低のコストが必要なより単純なタスク

    Effortは動作シグナルであり、厳密なトークン予算ではありません。より低いeffortレベルでは、Claudeは十分に難しい問題については引き続き思考しますが、同じ問題に対してより高いeffortレベルよりも少なく思考します。

    Sonnet 4.6の推奨effortレベル

    Sonnet 4.6はhigh effortがデフォルトです。Sonnet 4.6を使用する場合は、予期しないレイテンシを避けるためにeffortを明示的に設定してください:

    • 中程度のエフォート(推奨デフォルト):ほとんどのアプリケーションにおいて、速度、コスト、パフォーマンスの最適なバランス。エージェンティックコーディング、ツール集約的なワークフロー、コード生成に適しています。
    • 低いエフォート: 高ボリュームまたはレイテンシに敏感なワークロード向け。より高速なターンアラウンドが優先される、チャットおよび非コーディングのユースケースに適しています。
    • 高いエフォート: Sonnet 4.6から最大の知能が必要なタスク向け。
    • 最大エフォート: トークン支出に制約のない絶対的に最高の機能が必要なタスク向け。

    基本的な使用方法

    effortパラメータを調整する時期

    • 最大エフォートを使用する場合は、制約なしで絶対的に最高の機能が必要な場合:最も徹底的な推論と最も深い分析。Claude Mythos Preview、Claude Opus 4.6、およびClaude Sonnet 4.6で利用可能。
    • 高いエフォート(デフォルト)を使用する場合は、Claudeの最高の仕事が必要な場合:複雑な推論、微妙な分析、難しいコーディング問題、または品質が最優先事項であるあらゆるタスク。
    • 中程度のエフォートをバランスの取れたオプションとして使用する場合は、高いエフォートの完全なトークン支出なしで堅実なパフォーマンスが必要な場合。
    • 低いエフォートを使用する場合は、速度(Claudeがより少ないトークンで応答するため)またはコストを最適化している場合。たとえば、単純な分類タスク、クイックルックアップ、または限界的な品質改善が追加のレイテンシまたは支出を正当化しない高ボリュームのユースケース。

    ツール使用時のエフォート

    ツールを使用する場合、effortパラメータはツール呼び出しの周囲の説明とツール呼び出し自体の両方に影響します。より低いeffortレベルは傾向として:

    • 複数の操作をより少ないツール呼び出しに組み合わせる
    • より少ないツール呼び出しを行う
    • 前置きなしで直接アクションに進む
    • 完了後に簡潔な確認メッセージを使用する

    より高いeffortレベルは以下を行う可能性があります:

    • より多くのツール呼び出しを行う
    • アクションを取る前に計画を説明する
    • 変更の詳細な概要を提供する
    • より包括的なコードコメントを含める

    拡張思考を伴うエフォート

    effortパラメータは拡張思考と一緒に機能します。その動作はモデルに依存します:

    • Claude Mythos Previewは適応的思考をデフォルトで使用します(thinking設定は不要)。thinking: {type: "disabled"}は拒否されます。Effortは、Opus 4.6と同じ方法で思考の深さを制御します。
    • Claude Opus 4.6は適応的思考(thinking: {type: "adaptive"})を使用し、effortは思考の深さを制御するための推奨される方法です。Opus 4.6ではbudget_tokensはまだ受け入れられていますが、非推奨であり、将来のリリースで削除される予定です。highおよびmax effortでは、Claudeはほぼ常に深く思考します。より低いレベルでは、より単純な問題については思考をスキップする可能性があります。
    • Claude Sonnet 4.6は適応的思考を使用します(effortが思考の深さを制御する場所)。インターリーブモード(thinking: {type: "enabled", budget_tokens: N})での手動思考はまだ機能していますが、非推奨です。
    • Claude Opus 4.5およびその他のClaude 4モデルは手動思考(thinking: {type: "enabled", budget_tokens: N})を使用し、effortは思考トークン予算と一緒に機能します。タスクのeffortレベルを設定してから、タスクの複雑さに基づいて思考トークン予算を設定します。

    effortパラメータは、拡張思考が有効になっているかどうかに関わらず使用できます。思考なしで使用する場合、テキスト応答とツール呼び出しの全体的なトークン支出を制御します。

    ベストプラクティス

    1. effortを明示的に設定する: APIはデフォルトでhighですが、正しい開始点はモデルとワークロードに依存します。
    2. 速度に敏感なまたは単純なタスクに低を使用する: レイテンシが重要な場合またはタスクが単純な場合、低いeffortは応答時間とコストを大幅に削減できます。
    3. ユースケースをテストする: effortレベルの影響はタスクタイプによって異なります。デプロイする前に、特定のユースケースでパフォーマンスを評価してください。
    4. 動的effortを検討する: タスクの複雑さに基づいてeffortを調整します。単純なクエリは低いeffortを保証する可能性がありますが、エージェンティックコーディングと複雑な推論は高いeffortから利益を得ます。
    curl https://api.anthropic.com/v1/messages \
        --header "x-api-key: $ANTHROPIC_API_KEY" \
        --header "anthropic-version: 2023-06-01" \
        --header "content-type: application/json" \
        --data '{
            "model": "claude-opus-4-6",
            "max_tokens": 4096,
            "messages": [{
                "role": "user",
                "content": "Analyze the trade-offs between microservices and monolithic architectures"
            }],
            "output_config": {
                "effort": "medium"
            }
        }'