モデルと料金モデル

Claude Opus 5の新機能

Claude Opus 5の新機能と動作変更の概要。

Claude Opus 5は、Claude Opus 4.8から段階的に大きく進化したモデルであり、深い推論、エージェント的タスクおよび長期タスク、テスト時計算のスケーリングにおいて最大の向上を実現しています。このページでは、デフォルトで有効な思考、会話途中でのツール変更、思考を無効化できる条件に関する破壊的変更など、Claude Opus 5のすべての新要素をまとめています。

新しいモデル

モデル	APIモデルID	説明
Claude Opus 5	`claude-opus-5`	複雑なエージェント型コーディングとエンタープライズ業務向け

Claude Opus 5は、1Mトークンのコンテキストウィンドウ（1Mトークンがデフォルトかつ最大であり、より小さいコンテキストのバリアントはありません）、128kの最大出力トークン、そしてデフォルトで有効な思考を備えています。

完全な価格と仕様については、モデル概要を参照してください。

新機能

会話途中でのツール変更（ベータ）

セッションの間ずっと固定のツールリストを再送信する代わりに、プロンプトキャッシュを保持したまま、会話のターン間でツールを追加または削除できます。会話途中でのツール変更はベータ版です。リクエストにmid-conversation-tool-changes-2026-07-01ベータヘッダーを含めてください。使用方法については、会話途中でのツール変更を参照してください。

デフォルトフォールバックモード

fallbacksパラメータは新しい"default"モードをサポートします。これは、自分で管理するモデルリストの代わりに、拒否カテゴリごとにAnthropicが推奨するフォールバックモデルを適用します。fallbacksパラメータ全体はベータ版です。server-side-fallback-2026-07-01ベータヘッダーを使用してください。これは"default"モードと明示的なモデルリストの両方をサポートします（以前のserver-side-fallback-2026-06-01ヘッダーは明示的なリストのみを受け付けます）。拒否とフォールバックを参照してください。

プロンプトキャッシュの最小値の引き下げ

Claude Opus 5でキャッシュ可能なプロンプトの最小長は512トークンで、Claude Opus 4.8の1,024トークンから引き下げられました。Claude Opus 4.8ではキャッシュするには短すぎたプロンプトも、コードを変更することなくキャッシュエントリを作成できるようになりました。モデルごとの最小値については、プロンプトキャッシングを参照してください。

高速モード

高速モード（リサーチプレビュー）は、Claude APIでのみClaude Opus 5に対して利用可能です。現在、Amazon Bedrock、Google Cloud、Microsoft Foundryでは利用できません。Claude Opus 5の高速モードの価格は、入力トークン100万あたり10ドル、出力トークン100万あたり50ドルです。アクセス方法、サポートされているモデル、価格については、高速モードを参照してください。

動作の変更

デフォルトで有効な思考

Claude Opus 4.8では、thinking: {"type": "adaptive"}を設定しない限り、リクエストは思考なしで実行されます。Claude Opus 5では、同じリクエストが思考を有効にして実行されます。モデルは各ターンでいつ、どの程度思考するかを決定し、effortパラメータが思考の深さを制御します。ワイヤ上の値は変更されていません。thinking: {"type": "adaptive"}は引き続き有効であり、デフォルトと同等です。

max_tokensは合計出力（思考と応答テキスト）に対するハードリミットであるため、Claude Opus 4.8で思考なしで実行していたワークロードについては見直してください。

APIでは、以下のeffortの制限に従う限り、思考を無効化するオプションが引き続き利用できます。

effortの重要性の増大

Claude Opus 5は、これまでのどのOpusモデルよりも確実に、追加のeffortをより良い結果に変換するため、選択するeffortレベルの重みが増しています。low、medium、high、xhigh、maxの全段階が利用可能で、maxは可能な限り深い推論のための最上位レベルです。デフォルトのhighから始めて、評価に基づいてどちらの方向にも調整してください。品質が維持される場合はレベルを下げてトークンとレイテンシを節約し、最も要求の厳しい作業にはレベルを上げます。xhighまたはmaxのeffortで実行する場合は、モデルがサブエージェントやツール呼び出しにわたって思考し行動する余地を持てるように、大きなmax_tokensを設定してください。

このリクエストはeffortを最大のmaxまで引き上げます：

client = anthropic.Anthropic()

with client.messages.stream(
    model="claude-opus-5",
    max_tokens=64000,
    output_config={"effort": "max"},
    messages=[
        {
            "role": "user",
            "content": "Explain why the sum of two even numbers is always even.",
        }
    ],
) as stream:
    response = stream.get_final_message()

print(response)

Claude Opus 5では思考はデフォルトで有効なので、thinkingフィールドは不要です。

思考の無効化にはeffort `high`以下が必要

Claude Opus 5では、thinking: {"type": "disabled"}はeffortレベルがhigh以下の場合にのみ受け付けられます。effortがxhighまたはmaxの状態でthinking: {"type": "disabled"}を設定すると、400エラーが返されます。これはClaude Opus 5以降で一般提供されている動作であり、各リクエストで強制されます。また、思考の無効化がeffortレベルとは独立していたClaude Opus 4.8からの破壊的変更です。現在、高いeffortレベルで思考を無効化している場合は、思考を無効のままにしてeffortをhigh以下に設定するか、effortレベルを維持してthinkingフィールドを削除してください。

思考を無効にすると、Claude Opus 5はtool_useブロックを出力する代わりにツール呼び出しをテキスト出力に書き込んだり、可視の応答に内部XMLタグを含めたりすることがあります。可能な限り、思考を有効にしたまま、より低いeffortレベルでトークンコストを制御してください。思考を無効にする必要がある統合については、プロンプトによる緩和策として思考を無効にして実行するを参照してください。

モデルの動作の違い

上記のAPIの変更に加えて、Claude Opus 5はコードを変更しなくても気づく可能性のある点でClaude Opus 4.8とは異なる動作をします。デフォルトのユーザー向け応答や文書成果物はより長くなります。エージェント型セッションでは、モデルはより頻繁に進捗をユーザーに説明します。マルチエージェントフレームワークでは、サブエージェントへの委任をより積極的に行います。また、指示されなくても自身の作業を検証するため、以前のモデルから引き継いだ検証指示（「最終検証ステップを含める」「サブエージェントを使って検証する」）は削除してください。これらはClaude Opus 5では過剰な検証を引き起こします。これらの各動作を調整するプロンプトパターンについては、Claude Opus 5へのプロンプティングを参照してください。

能力の向上

Claude Opus 4.8と比較して、Claude Opus 5は漸進的な改善ではなく段階的に大きな進化であり、Claude Fable 5の半分のコストでフロンティアレベルの知能を提供します。最大の向上は以下の分野です：

深い推論：長い問題の連鎖にわたって多段階の分析を維持します。
エージェント型コーディングと長期タスク：長時間のツール使用ループにわたってタスクに集中し続け、スタブやプレースホルダーを残すことなく、複数ファイルにまたがる機能、大規模なリファクタリング、エンドツーエンドの機能開発を完了します。
テスト時計算のスケーリング：追加のeffort（maxレベルまで）をより良い結果に変換します。
低いeffortレベルでの効率性：lowとmediumのeffortは、より高い設定のトークンとレイテンシのごく一部で高い品質を実現します。
コードレビューとバグ発見：1回のパスあたり高い割合で実際のバグを発見し、誤検出が少なく、低いeffortレベルでも正確さを維持します。
ビジョン：チャート、ドキュメント、図を理解し、UIやフロントエンドのビジュアルを再現します。反復的に分析、切り抜き、検証するためのツールが与えられたときに最も強力です。
長いコンテキストでの作業：1Mトークンのコンテキストウィンドウがデフォルトかつ最大であり、ウィンドウ全体を通して一貫した指示追従、ツール呼び出し、推論を行います。
オフィスおよびドキュメントタスク：複雑な数式を含む複数シートのスプレッドシートを生成・編集し、よく構造化されたスライドデッキを作成します。
マルチエージェント調整：効果的なライター・検証者パターンでサブエージェントのチームを運用し、エージェント同士が互いの作業を上書きするケースがほとんどありません。

これらの能力を最大限に引き出すプロンプトパターンについては、Claude Opus 5へのプロンプティングを参照してください。

価格

Claude Opus 5の価格は、入力トークン100万あたり5ドル、出力トークン100万あたり25ドルで、Claude Opus 4.8から変更ありません。

バッチ処理、プロンプトキャッシング、高速モードの料金を含む完全な価格については、価格を参照してください。

提供状況

Claude Opus 5は以下で利用可能です：

Claude API: すべてのお客様がclaude-opus-5として利用できます。
AWS: Claude in Amazon Bedrockを通じてanthropic.claude-opus-5として利用できます。Claude Opus 5は、同じインフラストラクチャで提供されるbedrock-runtime上のInvokeModel APIからもアクセスできます。Claude on Amazon Bedrock（レガシー）統合のARNバージョン付きモデルIDテーブルには含まれていません。
Google Cloud: Claude on Google Cloudを通じてclaude-opus-5として利用できます。
Microsoft Foundry: Claude in Microsoft Foundryを通じて利用できます。

Claude Opus 4.8は、これらすべてのプラットフォームで引き続き利用可能です。

移行ガイド

Claude Opus 4.8から移行するには、モデルIDを更新してください：

model = "claude-opus-4-8"  # Before
model = "claude-opus-5"  # After

次に、2つの動作の変更を確認してください。思考はデフォルトで有効であり、effortがxhighまたはmaxの状態で思考を無効化すると400エラーが返されます。手順の詳細については、移行ガイドを参照してください。

次のステップ

モデル概要

現行のすべてのClaudeモデルの完全な仕様と価格。

Claude Opus 5へのプロンプティング

Claude Opus 5に固有の動作の違いとプロンプトパターン。

Effort

lowからmaxまで、Claudeが応答時に使用するトークン数を制御します。

思考

デフォルトで有効な思考の仕組みと、無効化できる条件。

タスクバジェット

Claudeに作業のペース配分の目安となるトークンバジェットを与えます。

移行ガイド

以前のClaudeバージョンから最新のClaudeモデルへ移行するためのガイド。

高速モード

プレミアム価格で、Claude Opusモデルから1秒あたりより多くの出力トークンを取得します。

Was this page helpful?

モデルと料金モデル

Claude Opus 5の新機能

Claude Opus 5の新機能と動作変更の概要。

新しいモデル

モデル	APIモデルID	説明
Claude Opus 5	`claude-opus-5`	複雑なエージェント型コーディングとエンタープライズ業務向け

完全な価格と仕様については、モデル概要を参照してください。

新機能

会話途中でのツール変更（ベータ）

デフォルトフォールバックモード

プロンプトキャッシュの最小値の引き下げ

高速モード

動作の変更

デフォルトで有効な思考

APIでは、以下のeffortの制限に従う限り、思考を無効化するオプションが引き続き利用できます。

effortの重要性の増大

このリクエストはeffortを最大のmaxまで引き上げます：

client = anthropic.Anthropic()

with client.messages.stream(
    model="claude-opus-5",
    max_tokens=64000,
    output_config={"effort": "max"},
    messages=[
        {
            "role": "user",
            "content": "Explain why the sum of two even numbers is always even.",
        }
    ],
) as stream:
    response = stream.get_final_message()

print(response)

Claude Opus 5では思考はデフォルトで有効なので、thinkingフィールドは不要です。

思考の無効化にはeffort `high`以下が必要

モデルの動作の違い

能力の向上

深い推論：長い問題の連鎖にわたって多段階の分析を維持します。
エージェント型コーディングと長期タスク：長時間のツール使用ループにわたってタスクに集中し続け、スタブやプレースホルダーを残すことなく、複数ファイルにまたがる機能、大規模なリファクタリング、エンドツーエンドの機能開発を完了します。
テスト時計算のスケーリング：追加のeffort（maxレベルまで）をより良い結果に変換します。
低いeffortレベルでの効率性：lowとmediumのeffortは、より高い設定のトークンとレイテンシのごく一部で高い品質を実現します。
コードレビューとバグ発見：1回のパスあたり高い割合で実際のバグを発見し、誤検出が少なく、低いeffortレベルでも正確さを維持します。
ビジョン：チャート、ドキュメント、図を理解し、UIやフロントエンドのビジュアルを再現します。反復的に分析、切り抜き、検証するためのツールが与えられたときに最も強力です。
長いコンテキストでの作業：1Mトークンのコンテキストウィンドウがデフォルトかつ最大であり、ウィンドウ全体を通して一貫した指示追従、ツール呼び出し、推論を行います。
オフィスおよびドキュメントタスク：複雑な数式を含む複数シートのスプレッドシートを生成・編集し、よく構造化されたスライドデッキを作成します。
マルチエージェント調整：効果的なライター・検証者パターンでサブエージェントのチームを運用し、エージェント同士が互いの作業を上書きするケースがほとんどありません。

これらの能力を最大限に引き出すプロンプトパターンについては、Claude Opus 5へのプロンプティングを参照してください。

価格

Claude Opus 5の価格は、入力トークン100万あたり5ドル、出力トークン100万あたり25ドルで、Claude Opus 4.8から変更ありません。

バッチ処理、プロンプトキャッシング、高速モードの料金を含む完全な価格については、価格を参照してください。

提供状況

Claude Opus 5は以下で利用可能です：

Claude API: すべてのお客様がclaude-opus-5として利用できます。
AWS: Claude in Amazon Bedrockを通じてanthropic.claude-opus-5として利用できます。Claude Opus 5は、同じインフラストラクチャで提供されるbedrock-runtime上のInvokeModel APIからもアクセスできます。Claude on Amazon Bedrock（レガシー）統合のARNバージョン付きモデルIDテーブルには含まれていません。
Google Cloud: Claude on Google Cloudを通じてclaude-opus-5として利用できます。
Microsoft Foundry: Claude in Microsoft Foundryを通じて利用できます。

Claude Opus 4.8は、これらすべてのプラットフォームで引き続き利用可能です。

移行ガイド

Claude Opus 4.8から移行するには、モデルIDを更新してください：

model = "claude-opus-4-8"  # Before
model = "claude-opus-5"  # After

次のステップ

モデル概要

現行のすべてのClaudeモデルの完全な仕様と価格。

Claude Opus 5へのプロンプティング

Claude Opus 5に固有の動作の違いとプロンプトパターン。

Effort

lowからmaxまで、Claudeが応答時に使用するトークン数を制御します。

思考

デフォルトで有効な思考の仕組みと、無効化できる条件。

タスクバジェット

Claudeに作業のペース配分の目安となるトークンバジェットを与えます。

移行ガイド

以前のClaudeバージョンから最新のClaudeモデルへ移行するためのガイド。

高速モード

プレミアム価格で、Claude Opusモデルから1秒あたりより多くの出力トークンを取得します。

Was this page helpful?

新しいモデル

新機能

会話途中でのツール変更（ベータ）

デフォルトフォールバックモード

プロンプトキャッシュの最小値の引き下げ

高速モード

動作の変更

デフォルトで有効な思考

effortの重要性の増大

思考の無効化にはeffort high以下が必要

モデルの動作の違い

能力の向上

価格

提供状況

移行ガイド

次のステップ

新しいモデル

新機能

会話途中でのツール変更（ベータ）

デフォルトフォールバックモード

プロンプトキャッシュの最小値の引き下げ

高速モード

動作の変更

デフォルトで有効な思考

effortの重要性の増大

思考の無効化にはeffort high以下が必要

モデルの動作の違い

能力の向上

価格

提供状況

移行ガイド

次のステップ

新しいモデル

新機能

会話途中でのツール変更（ベータ）

デフォルトフォールバックモード

プロンプトキャッシュの最小値の引き下げ

高速モード

動作の変更

デフォルトで有効な思考

effortの重要性の増大

思考の無効化にはeffort `high`以下が必要

モデルの動作の違い

能力の向上

価格

提供状況

移行ガイド

次のステップ

新しいモデル

新機能

会話途中でのツール変更（ベータ）

デフォルトフォールバックモード

プロンプトキャッシュの最小値の引き下げ

高速モード

動作の変更

デフォルトで有効な思考

effortの重要性の増大

思考の無効化にはeffort `high`以下が必要

モデルの動作の違い

能力の向上

価格

提供状況

移行ガイド

次のステップ