Loading...
    • 開発者ガイド
    • APIリファレンス
    • MCP
    • リソース
    • リリースノート
    Search...
    ⌘K
    最初のステップ
    Claudeの紹介クイックスタート
    モデルと価格
    モデル概要モデルの選択Claude 4.5の新機能Claude 4.5への移行モデルの廃止予定価格
    Claudeで構築
    機能概要Messages APIの使用コンテキストウィンドウプロンプトのベストプラクティス
    機能
    プロンプトキャッシングコンテキスト編集拡張思考エフォートストリーミングメッセージバッチ処理引用多言語対応トークンカウント埋め込みビジョンPDF対応Files API検索結果構造化出力
    ツール
    概要ツール使用の実装方法細粒度ツールストリーミングBashツールコード実行ツールプログラマティックツール呼び出しコンピュータ使用ツールテキストエディタツールWebフェッチツールWeb検索ツールメモリツールツール検索ツール
    エージェントスキル
    概要クイックスタートベストプラクティスAPIでスキルを使用
    Agent SDK
    概要クイックスタートTypeScript SDKTypeScript V2(プレビュー)Python SDK移行ガイド
    APIのMCP
    MCPコネクタリモートMCPサーバー
    サードパーティプラットフォームのClaude
    Amazon BedrockMicrosoft FoundryVertex AI
    プロンプトエンジニアリング
    概要プロンプトジェネレータプロンプトテンプレートの使用プロンプト改善ツール明確で直接的に例を使用(マルチショットプロンプティング)Claudeに考えさせる(CoT)XMLタグを使用Claudeに役割を与える(システムプロンプト)Claudeの応答を事前入力複雑なプロンプトをチェーン長いコンテキストのヒント拡張思考のヒント
    テストと評価
    成功基準の定義テストケースの開発評価ツールの使用レイテンシの削減
    ガードレールの強化
    ハルシネーションの削減出力の一貫性を向上ジェイルブレイクの軽減ストリーミング拒否プロンプトリークの削減Claudeをキャラクターのままに
    管理とモニタリング
    Admin API概要使用状況とコストAPIClaude Code Analytics API
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Claudeで構築

    コンテキストウィンドウ

    言語モデルが参照できるテキストの量とその生成方法を理解する

    コンテキストウィンドウの理解

    「コンテキストウィンドウ」とは、言語モデルが新しいテキストを生成する際に参照できるテキストの全体量と、生成する新しいテキストを合わせたものを指します。これは言語モデルが学習した大規模なデータコーパスとは異なり、モデルの「ワーキングメモリ」を表しています。より大きなコンテキストウィンドウにより、モデルはより複雑で長いプロンプトを理解して応答できますが、より小さなコンテキストウィンドウはモデルが長いプロンプトを処理したり、長い会話を通じて一貫性を保つ能力を制限する可能性があります。

    以下の図は、APIリクエストの標準的なコンテキストウィンドウの動作を示しています1:

    コンテキストウィンドウ図

    1claude.aiなどのチャットインターフェースの場合、コンテキストウィンドウは「先入れ先出し」のローリングシステムで設定することもできます。

    • 段階的なトークン蓄積: 会話がターンを進むにつれて、各ユーザーメッセージとアシスタント応答がコンテキストウィンドウ内に蓄積されます。前のターンは完全に保持されます。
    • 線形成長パターン: コンテキスト使用量は各ターンで線形に増加し、前のターンは完全に保持されます。
    • 200Kトークン容量: 利用可能な総コンテキストウィンドウ(200,000トークン)は、会話履歴を保存し、Claudeから新しい出力を生成するための最大容量を表します。
    • 入出力フロー: 各ターンは以下で構成されます:
      • 入力フェーズ: すべての前の会話履歴と現在のユーザーメッセージを含みます
      • 出力フェーズ: テキスト応答を生成し、これが将来の入力の一部になります

    拡張思考を使用したコンテキストウィンドウ

    拡張思考を使用する場合、思考に使用されるトークンを含むすべての入力トークンと出力トークンがコンテキストウィンドウ制限にカウントされます。ただし、マルチターン状況ではいくつかのニュアンスがあります。

    思考予算トークンはmax_tokensパラメータのサブセットであり、出力トークンとして請求され、レート制限にカウントされます。

    ただし、前の思考ブロックはClaudeAPIによってコンテキストウィンドウ計算から自動的に削除され、モデルが後続のターンで「見る」会話履歴の一部ではなく、実際の会話コンテンツのためにトークン容量を保持します。

    以下の図は、拡張思考が有効な場合の特殊なトークン管理を示しています:

    拡張思考を使用したコンテキストウィンドウ図

    • 拡張思考の削除: 拡張思考ブロック(濃い灰色で表示)は各ターンの出力フェーズ中に生成されますが、後続のターンの入力トークンとして転送されません。思考ブロックを自分で削除する必要はありません。Claude APIが会話履歴の一部として返された場合、自動的にこれを行います。
    • 技術実装の詳細:
      • APIは、会話履歴の一部として返された場合、前のターンの思考ブロックを自動的に除外します。
      • 拡張思考トークンは、生成中に1回だけ出力トークンとして請求されます。
      • 有効なコンテキストウィンドウ計算は以下のようになります:context_window = (input_tokens - previous_thinking_tokens) + current_turn_tokens。
      • 思考トークンにはthinkingブロックとredacted_thinkingブロックの両方が含まれます。

    このアーキテクチャはトークン効率的であり、思考ブロックは実質的な長さを持つことができるため、トークン浪費なしで広範な推論を可能にします。

    コンテキストウィンドウと拡張思考の詳細については、拡張思考ガイドをご覧ください。

    拡張思考とツール使用を使用したコンテキストウィンドウ

    以下の図は、拡張思考とツール使用を組み合わせた場合のコンテキストウィンドウトークン管理を示しています:

    拡張思考とツール使用を使用したコンテキストウィンドウ図

    1. 1

      最初のターンアーキテクチャ

      • 入力コンポーネント: ツール構成とユーザーメッセージ
      • 出力コンポーネント: 拡張思考+テキスト応答+ツール使用リクエスト
      • トークン計算: すべての入力および出力コンポーネントがコンテキストウィンドウにカウントされ、すべての出力コンポーネントが出力トークンとして請求されます。
    2. 2

      ツール結果の処理(ターン2)

      • 入力コンポーネント: 最初のターンのすべてのブロックとtool_result。拡張思考ブロックは対応するツール結果と一緒に返される必要があります。これは思考ブロックを返す必要がある唯一のケースです。
      • 出力コンポーネント: ツール結果がClaudeに返された後、Claudeはテキストのみで応答します(次のuserメッセージまで追加の拡張思考はありません)。
      • トークン計算: すべての入力および出力コンポーネントがコンテキストウィンドウにカウントされ、すべての出力コンポーネントが出力トークンとして請求されます。
    3. 3

      3番目のステップ

      • 入力コンポーネント: すべての入力と前のターンの出力は、思考ブロックを除いて転送されます。思考ブロックはClaudeがツール使用サイクル全体を完了したため、この時点で削除できます。APIは返された場合、思考ブロックを自動的に削除するか、この段階で自分で削除することができます。これは次のUserターンを追加する場所でもあります。
      • 出力コンポーネント: ツール使用サイクルの外に新しいUserターンがあるため、Claudeは新しい拡張思考ブロックを生成して続行します。
      • トークン計算: 前の思考トークンはコンテキストウィンドウ計算から自動的に削除されます。他のすべての前のブロックはトークンウィンドウの一部としてカウントされ、現在のAssistantターンの思考ブロックはコンテキストウィンドウの一部としてカウントされます。
    • 拡張思考を使用したツール使用の考慮事項:
      • ツール結果を投稿する場合、その特定のツールリクエストに付随する完全な未修正の思考ブロック(署名/編集済み部分を含む)を含める必要があります。
      • 拡張思考を使用したツール使用の有効なコンテキストウィンドウ計算は以下のようになります:context_window = input_tokens + current_turn_tokens。
      • システムは暗号署名を使用して思考ブロックの真正性を検証します。ツール使用中に思考ブロックを保持しないと、Claudeの推論の連続性が破損する可能性があります。したがって、思考ブロックを変更すると、APIはエラーを返します。

    Claude 4モデルはインターリーブ思考をサポートしており、これによりClaudeはツール呼び出し間で考えることができ、ツール結果を受け取った後、より高度な推論を行うことができます。

    Claude Sonnet 3.7はインターリーブ思考をサポートしていないため、非tool_resultユーザーターンの間に拡張思考とツール呼び出しのインターリーブはありません。

    拡張思考を使用したツールの使用の詳細については、拡張思考ガイドをご覧ください。

    1Mトークンコンテキストウィンドウ

    Claude Sonnet 4および4.5は、1百万トークンのコンテキストウィンドウをサポートしています。この拡張コンテキストウィンドウにより、より大きなドキュメントを処理し、より長い会話を維持し、より広範なコードベースで作業できます。

    1Mトークンコンテキストウィンドウは現在、使用層4の組織とカスタムレート制限を持つ組織のベータ版です。1MトークンコンテキストウィンドウはClaudeソネット4およびソネット4.5でのみ利用可能です。

    1Mトークンコンテキストウィンドウを使用するには、APIリクエストにcontext-1m-2025-08-07ベータヘッダーを含めます:

    from anthropic import Anthropic
    
    client = Anthropic()
    
    response = client.beta.messages.create(
        model="claude-sonnet-4-5",
        max_tokens=1024,
        messages=[
            {"role": "user", "content": "Process this large document..."}
        ],
        betas=["context-1m-2025-08-07"]
    )

    重要な考慮事項:

    • ベータステータス: これはベータ機能であり、変更の対象となります。機能と価格は将来のリリースで変更または削除される可能性があります。
    • 使用層要件: 1Mトークンコンテキストウィンドウは、使用層4の組織とカスタムレート制限を持つ組織で利用可能です。下位層の組織は、この機能にアクセスするために使用層4に進める必要があります。
    • 可用性: 1Mトークンコンテキストウィンドウは現在、Claude API、Microsoft Foundry、Amazon Bedrock、およびGoogle CloudのVertex AIで利用可能です。
    • 価格: 200Kトークンを超えるリクエストは、プレミアム料金(入力2倍、出力1.5倍の価格)で自動的に請求されます。詳細については、価格ドキュメントをご覧ください。
    • レート制限: 長いコンテキストリクエストには専用のレート制限があります。詳細については、レート制限ドキュメントをご覧ください。
    • マルチモーダルの考慮事項: 大量の画像またはPDFを処理する場合、ファイルのトークン使用量が異なる可能性があることに注意してください。大きなプロンプトを大量の画像と組み合わせる場合、リクエストサイズ制限に達する可能性があります。

    Claude Sonnet 4.5およびHaiku 4.5のコンテキスト認識

    Claude Sonnet 4.5およびClaude Haiku 4.5はコンテキスト認識機能を備えており、これらのモデルが会話全体を通じて残りのコンテキストウィンドウ(つまり「トークン予算」)を追跡できます。これにより、Claudeは利用可能なスペースの量を理解することで、タスクを実行し、コンテキストをより効果的に管理できます。Claudeは、残りのトークン数を推測する必要があるのではなく、このコンテキストを正確に使用してタスクを最後まで継続するようにネイティブに訓練されています。モデルにとって、コンテキスト認識がないことは、時計なしで料理番組に参加するようなものです。Claude 4.5モデルは、モデルに残りのコンテキストについて明示的に通知することでこれを変更し、利用可能なトークンを最大限に活用できるようにします。

    動作方法:

    会話の開始時に、Claudeは総コンテキストウィンドウに関する情報を受け取ります:

    <budget:token_budget>200000</budget:token_budget>

    予算は200Kトークン(標準)、500Kトークン(Claude.ai Enterprise)、または1Mトークン(ベータ、適格な組織向け)に設定されます。

    各ツール呼び出しの後、Claudeは残りの容量に関する更新を受け取ります:

    <system_warning>Token usage: 35000/200000; 165000 remaining</system_warning>

    この認識により、Claudeは作業に残っている容量を決定し、長時間実行されるタスクでより効果的な実行を可能にします。画像トークンはこれらの予算に含まれます。

    利点:

    コンテキスト認識は特に以下の場合に価値があります:

    • 継続的な焦点が必要な長時間実行されるエージェントセッション
    • 状態遷移が重要なマルチコンテキストウィンドウワークフロー
    • 慎重なトークン管理が必要な複雑なタスク

    コンテキスト認識を活用するためのプロンプトガイダンスについては、Claude 4ベストプラクティスガイドをご覧ください。

    新しいClaudeモデルでのコンテキストウィンドウ管理

    新しいClaudeモデル(Claude Sonnet 3.7以降)では、プロンプトトークンと出力トークンの合計がモデルのコンテキストウィンドウを超える場合、システムはコンテキストを静かに切り詰めるのではなく、検証エラーを返します。この変更はより予測可能な動作を提供しますが、より慎重なトークン管理が必要です。

    トークン使用量を計画し、コンテキストウィンドウ制限内に留まるようにするには、トークンカウントAPIを使用して、Claudeに送信する前にメッセージが使用するトークン数を推定できます。

    モデル別のコンテキストウィンドウサイズのリストについては、モデル比較テーブルをご覧ください。

    次のステップ

    モデル比較テーブル

    モデル別のコンテキストウィンドウサイズと入出力トークン価格のリストについては、モデル比較テーブルをご覧ください。

    拡張思考の概要

    拡張思考の動作方法と、ツール使用やプロンプトキャッシングなどの他の機能と一緒に実装する方法の詳細をご覧ください。

    • 1Mトークンコンテキストウィンドウ
    • Claude Sonnet 4.5およびHaiku 4.5のコンテキスト認識
    • 新しいClaudeモデルでのコンテキストウィンドウ管理