Loading...
    • 開発者ガイド
    • API リファレンス
    • MCP
    • リソース
    • リリースノート
    Search...
    ⌘K
    はじめに
    Claude の紹介クイックスタート
    モデルと料金
    モデル概要モデルの選び方Claude 4.6 の新機能移行ガイドモデルの廃止料金
    Claude で構築する
    機能概要Messages API の使用停止理由の処理プロンプトのベストプラクティス
    モデルの機能
    拡張思考適応型思考エフォート高速モード(リサーチプレビュー)構造化出力引用メッセージのストリーミングバッチ処理PDF サポート検索結果多言語サポートエンベディングビジョン
    ツール
    概要ツール使用の実装方法Web 検索ツールWeb フェッチツールコード実行ツールメモリツールBash ツールコンピュータ使用ツールテキストエディタツール
    ツールインフラストラクチャ
    ツール検索プログラムによるツール呼び出しきめ細かいツールストリーミング
    コンテキスト管理
    コンテキストウィンドウコンパクションコンテキスト編集プロンプトキャッシングトークンカウント
    ファイルとアセット
    Files API
    Agent Skills
    概要クイックスタートベストプラクティスエンタープライズ向け SkillsAPI での Skills の使用
    Agent SDK
    概要クイックスタートTypeScript SDKTypeScript V2(プレビュー)Python SDK移行ガイド
    API での MCP
    MCP コネクタリモート MCP サーバー
    サードパーティプラットフォームでの Claude
    Amazon BedrockMicrosoft FoundryVertex AI
    プロンプトエンジニアリング
    概要プロンプトジェネレータープロンプトテンプレートの使用プロンプト改善ツール明確かつ直接的に例を使う(マルチショットプロンプティング)Claude に考えさせる(CoT)XML タグを使うClaude に役割を与える(システムプロンプト)複雑なプロンプトを連鎖させる長文コンテキストのヒント拡張思考のヒント
    テストと評価
    成功基準の定義テストケースの開発評価ツールの使用レイテンシの削減
    ガードレールの強化
    ハルシネーションの削減出力の一貫性を高めるジェイルブレイクの軽減ストリーミング拒否プロンプト漏洩の削減Claude をキャラクターに保つ
    管理とモニタリング
    Admin API 概要データレジデンシーワークスペース使用量とコスト APIClaude Code Analytics APIゼロデータリテンション
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    モデルの機能

    Effort

    effortパラメータを使用してClaudeの応答時のトークン使用量を制御し、応答の徹底性とトークン効率のトレードオフを調整します。

    effortパラメータを使用すると、リクエストに応答する際にClaudeがトークンをどの程度積極的に使用するかを制御できます。これにより、単一のモデルで応答の徹底性とトークン効率のトレードオフを調整できます。effortパラメータは、ベータヘッダーを必要とせず、サポートされているすべてのモデルで一般利用可能です。

    effortパラメータはClaude Opus 4.6およびClaude Opus 4.5でサポートされています。

    Claude Opus 4.6では、思考の深さを制御する推奨方法として、effortがbudget_tokensに代わるものとなります。最良の体験を得るには、effortとアダプティブシンキング(thinking: {type: "adaptive"})を組み合わせてください。budget_tokensはOpus 4.6でまだ受け付けられますが、非推奨であり、将来のモデルリリースで削除される予定です。high(デフォルト)およびmaxのeffortでは、Claudeはほぼ常に思考します。より低いeffortレベルでは、単純な問題に対して思考をスキップする場合があります。

    effortの仕組み

    デフォルトでは、Claudeは高いeffortを使用し、優れた結果を得るために必要なだけのトークンを消費します。effortレベルをmaxに上げることで絶対的に最高の能力を発揮させたり、下げることでトークン使用量をより控えめにし、能力の若干の低下を許容しつつ速度とコストを最適化したりできます。

    effortを"high"に設定すると、effortパラメータを完全に省略した場合とまったく同じ動作になります。

    effortパラメータは、応答内のすべてのトークンに影響します。これには以下が含まれます:

    • テキスト応答と説明
    • ツール呼び出しと関数引数
    • 拡張思考(有効な場合)

    このアプローチには2つの大きな利点があります:

    1. 使用するために思考を有効にする必要がありません。
    2. ツール呼び出しを含むすべてのトークン消費に影響を与えることができます。例えば、低いeffortではClaudeが行うツール呼び出しの回数が減ります。これにより、効率性に対するはるかに大きな制御が可能になります。

    effortレベル

    レベル説明典型的なユースケース
    maxトークン消費に制約のない絶対的な最大能力。Opus 4.6のみ — 他のモデルでmaxを使用するリクエストはエラーを返します。最も深い推論と最も徹底的な分析を必要とするタスク
    high高い能力。パラメータを設定しない場合と同等。複雑な推論、難しいコーディング問題、エージェントタスク
    medium適度なトークン節約によるバランスの取れたアプローチ。速度、コスト、パフォーマンスのバランスが必要なエージェントタスク
    low最も効率的。能力の若干の低下を伴う大幅なトークン節約。最高の速度と最低のコストが必要な単純なタスク(サブエージェントなど)

    effortは動作シグナルであり、厳密なトークン予算ではありません。低いeffortレベルでも、十分に難しい問題に対してはClaudeは思考します — ただし、同じ問題に対して高いeffortレベルの場合よりも思考量が少なくなります。

    基本的な使い方

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=4096,
        messages=[{
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures"
        }],
        output_config={
            "effort": "medium"
        }
    )
    
    print(response.content[0].text)

    effortパラメータをいつ調整すべきか?

    • max effortは、制約なしで絶対的に最高の能力が必要な場合に使用します — 最も徹底的な推論と最も深い分析が求められる場合です。Opus 4.6でのみ利用可能で、他のモデルでmaxを使用するリクエストはエラーを返します。
    • high effort(デフォルト)は、Claudeの最高の仕事が必要な場合に使用します — 複雑な推論、繊細な分析、難しいコーディング問題、または品質が最優先のタスクに適しています。
    • medium effortは、high effortの完全なトークン消費なしに堅実なパフォーマンスが必要な場合のバランスの取れたオプションとして使用します。
    • low effortは、速度(Claudeがより少ないトークンで回答するため)またはコストを最適化する場合に使用します — 例えば、単純な分類タスク、クイックルックアップ、またはわずかな品質向上が追加のレイテンシやコストに見合わない大量処理のユースケースに適しています。

    ツール使用時のeffort

    ツールを使用する場合、effortパラメータはツール呼び出し周辺の説明とツール呼び出し自体の両方に影響します。低いeffortレベルでは以下の傾向があります:

    • 複数の操作をより少ないツール呼び出しにまとめる
    • ツール呼び出しの回数を減らす
    • 前置きなしに直接アクションに進む
    • 完了後に簡潔な確認メッセージを使用する

    高いeffortレベルでは以下の傾向があります:

    • より多くのツール呼び出しを行う
    • アクションを実行する前に計画を説明する
    • 変更の詳細な要約を提供する
    • より包括的なコードコメントを含める

    拡張思考とのeffort

    effortパラメータは拡張思考と併用できます。その動作はモデルによって異なります:

    • Claude Opus 4.6はアダプティブシンキング(thinking: {type: "adaptive"})を使用し、effortが思考の深さを制御する推奨方法です。budget_tokensはOpus 4.6でまだ受け付けられますが、非推奨であり、将来のリリースで削除される予定です。highおよびmaxのeffortでは、Claudeはほぼ常に深く思考します。低いレベルでは、単純な問題に対して思考をスキップする場合があります。
    • Claude Opus 4.5は手動思考(thinking: {type: "enabled", budget_tokens: N})を使用し、effortは思考トークン予算と併用されます。タスクに応じたeffortレベルを設定し、タスクの複雑さに基づいて思考トークン予算を設定してください。

    effortパラメータは、拡張思考の有効・無効にかかわらず使用できます。思考なしで使用する場合でも、テキスト応答とツール呼び出しの全体的なトークン消費を制御します。

    ベストプラクティス

    1. highから始める:パフォーマンスとトークン効率のトレードオフのために、より低いeffortレベルを使用してください。
    2. 速度重視または単純なタスクにはlowを使用する:レイテンシが重要な場合やタスクが単純な場合、low effortは応答時間とコストを大幅に削減できます。
    3. ユースケースをテストする:effortレベルの影響はタスクの種類によって異なります。デプロイ前に、特定のユースケースでパフォーマンスを評価してください。
    4. 動的なeffortを検討する:タスクの複雑さに応じてeffortを調整してください。単純なクエリにはlow effortが適している一方、エージェントコーディングや複雑な推論にはhigh effortが有効です。

    Was this page helpful?

    • effortの仕組み
    • effortレベル
    • effortパラメータをいつ調整すべきか?
    • ツール使用時のeffort
    • 拡張思考とのeffort