このガイドでは、Messages APIコードの移行について説明します。Claude Managed Agentsを使用している場合は、モデル名の更新以外の変更は必要ありません。
Claude APIスキルで移行を自動化しましょう。 Claude Codeで/claude-api migrateを実行すると、バンドルされているClaude APIスキルが呼び出されます。このページに記載されているすべての移行先モデルに対応しています。
/claude-api migrate this project to claude-opus-4-8このスキルは、モデルIDの置き換えに加え、必要に応じて破壊的なパラメータ変更、プリフィルの置き換え、移行先モデルに合わせたeffortの調整をコードベース全体に適用し、手動で確認すべき項目のチェックリストを生成します。ファイルを編集する前に、移行の範囲(作業ディレクトリ全体、サブディレクトリ、または特定のファイルリスト)を確認するよう求められます。また、このスキルはAmazon Bedrock、Vertex AI、Claude Platform on AWS、Microsoft Foundryの各クライアントを検出し、プラットフォームごとにモデルID形式と機能変更を調整します。
Claude Mythos 5は、招待制のリサーチプレビューであるClaude Mythos Previewの後継となる、アクセス制限付きモデルです。同じ機能を持つ一般提供モデルについては、Claude Fable 5を参照してください。
移行はほぼドロップインで完了します。Claude Mythos 5はClaude Mythos Previewと同じMessages APIおよび同じツール使用パターンを使用しており、両モデルが同じトークナイザーを使用しているため、トークン数はほぼ変わりません。確認すべき主な変更点は、利用できなくなった機能(次のセクションに記載)と思考出力です。
Claude Mythos Previewの廃止スケジュールについては、モデルの廃止を参照してください。
model = "claude-mythos-preview" # Before
model = "claude-mythos-5" # After拡張思考と思考トークン予算: 手動の拡張思考(thinking: {type: "enabled", budget_tokens: N})はclaude-mythos-5ではサポートされておらず、400エラーが返されます。適応型思考は常に有効です。モデルが各リクエストでいつ、どの程度思考するかを判断するため、thinkingの設定は不要です。thinking: {type: "disabled"}はエラーを返します。budget_tokensに直接の代替はありません。思考は適応型であり、effortパラメータは思考予算ではなく、別個の出力レベル制御です。
変更前(Claude Mythos Preview):
client.messages.create(
model="claude-mythos-preview",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 10000},
messages=[{"role": "user", "content": "..."}],
)claude-mythos-5はclaude-mythos-previewと同じトークナイザー(Claude Opus 4.7で導入されたトークナイザー)を使用しています。claude-mythos-previewからの移行では、トークン数はほぼ変わりません。Claude Opus 4.7より前のモデルと比較すると、同じコンテンツでもトークン数が約30%増加する場合があり、コンテンツやワークロードの形態によって異なります。
/v1/messages/count_tokensは、claude-mythos-previewと比較してclaude-mythos-5でもほぼ同じ値を返します。ご自身のワークロードでコストとレイテンシを再度ベースライン測定してください。
claude-mythos-previewからclaude-mythos-5に更新する。thinking: {type: "enabled", budget_tokens: N})を削除する。適応型思考は常に有効であり、thinkingフィールドは不要です。thinking: {type: "disabled"}設定があれば削除する。claude-mythos-5では思考を無効化するとエラーが返されます。budget_tokensを削除する。直接の代替はありません。思考は適応型であり、effortパラメータは思考予算ではなく、別個の出力レベル制御です。thinkingフィールドを解析するコードが、それを表示テキストとしてのみ扱い、同じモデルで継続する際に思考ブロックをそのまま渡していることを確認する。claude-mythos-5ではthinking.displayのデフォルトは"omitted"で、Claude Mythos Previewと同じです。読みやすい要約を受け取るにはを設定してください。を参照してください。Claude Fable 5は、Anthropicが広くリリースしているモデルの中で最も高性能なモデルであり、Claude API、Claude Platform on AWS、Amazon Bedrock、Vertex AI、Microsoft Foundryで一般提供されています。
移行はほぼドロップインで完了します。Claude Fable 5はClaude Opus 4.8と同じMessages APIおよび同じツール使用パターンを使用しています。デフォルトで同じ100万トークンのコンテキストウィンドウと同じ128kの最大出力トークンをサポートしています。両モデルが同じトークナイザーを使用しているため、トークン数はほぼ変わりません。
確認すべき主な変更点は、常時有効な適応型思考、思考出力、安全性分類器による拒否、および価格設定です。移行前にでは価格設定とデータ保持について、変更点ではその他の項目について説明します。
Claude Fable 5の価格は、入力トークン100万あたり$10、出力トークン100万あたり$50です。これに対し、Claude Opus 4.8はそれぞれ$5と$25です。詳細はClaudeの価格を参照してください。
Claude Fable 5は30日間のデータ保持を必要とし、「zero data retention」(ゼロデータ保持)、すなわちZDRの取り決めの下では利用できません。このモデルはCovered Modelに指定されています。データ保持設定がこの要件を満たさない組織からのリクエストは、400 invalid_request_errorを返します。ZDRの取り決めがある組織は、データ保持設定についてAnthropicのアカウントチームにお問い合わせください。Claude Opus 4.8は引き続きZDRの下で利用可能です。または、ワークスペースごとにデータ保持を設定することもできます。モデル固有のデータ保持要件を参照してください。Amazon Bedrock、Vertex AI、Microsoft Foundryでは、データ保持は各プラットフォームによって管理されます。
コードがClaude Opus 4.7以前のものである場合は、まずClaude Opus 4.7からClaude Opus 4.8への移行を適用し、Claude Opus 4.7より前のモデルについてはClaude Opus 4.7への移行手順も適用してください。これらのセクションでは、このセクションで繰り返さない破壊的変更(サンプリングパラメータの拒否、手動拡張思考の拒否、プリフィルの削除、新しいトークナイザー)について説明しています。
model = "claude-opus-4-8" # Before
model = "claude-fable-5" # Afterこのセクションの項目は、モデルIDを置き換えた後に確認すべきAPIおよび動作の違いについて説明しています。
適応型思考が常に有効: claude-fable-5では適応型思考が唯一の思考モードです。モデルが各リクエストでいつ、どの程度思考するかを判断するため、thinkingの設定は不要です。thinking: {type: "disabled"}はエラーを返します。思考の深さを制御するにはeffortパラメータを使用してください。
確認すべき動作変更:Claude Opus 4.8では、thinkingフィールドのないリクエストは思考なしで実行されますが、claude-fable-5では同じリクエストが適応型思考で実行されます。max_tokensは引き続き、思考と応答テキストを合わせた総出力のハードリミットであるため、Claude Opus 4.8で思考なしで実行していたワークロードについては見直してください。コスト制御を参照してください。
変更前(Claude Opus 4.8):
client.messages.create(
model="claude-opus-4-8",
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": "high"},
messages=[{"role": "user", "content": "..."}],
)claude-fable-5は30日間のデータ保持を必要とし、それ以外の場合は400 invalid_request_errorを返します。モデル固有のデータ保持要件を参照してください。claude-opus-4-8からclaude-fable-5に更新する。thinking: {type: "disabled"}設定があれば削除する。claude-fable-5では思考を無効化するとエラーが返され、thinkingフィールドのないリクエストは適応型思考で実行されます。claude-fable-5では引き続きサポートされていません。thinkingフィールドを解析するコードが、それを表示テキストとしてのみ扱い、同じモデルで継続する際に思考ブロックをそのまま渡していることを確認する。claude-fable-5ではthinking.displayのデフォルトはで、Claude Opus 4.8と同じです。読みやすい要約を受け取るにはを設定してください。を参照してください。Claude Opus 4.8は、AnthropicのOpusティアで最も高性能なモデルです。Claude Opus 4.7をベースに構築されています。
Claude Opus 4.8は、既存のClaude Opus 4.7のプロンプトと評価に対して、そのままで高いパフォーマンスを発揮するはずです。すでにClaude Opus 4.7で動作しているコードに対する破壊的なAPI変更はありません。100万トークンのコンテキストウィンドウ、128kの最大出力トークン、適応型思考、プロンプトキャッシング、バッチ処理、Files API、PDFサポート、ビジョン、およびサーバーサイドとクライアントサイドのツールの完全なセットを含む、Claude Opus 4.7と同じ機能セットをサポートしています。さらに、会話途中のシステムメッセージが追加され、拒否停止の詳細が公式にドキュメント化されました。
コードがClaude Opus 4.6以前のものである場合は、Claude Opus 4.8にアップグレードする前に、以下のClaude Opus 4.7への移行手順も適用してください。これらの手順には、4.8へのアップグレードだけではカバーされない破壊的変更(サンプリングパラメータの拒否、手動拡張思考の拒否、新しいトークナイザー)が含まれています。
Microsoft Foundryでは、Claude Opus 4.8はローンチ時点で200kトークンのコンテキストウィンドウを持ちます。100万コンテキストウィンドウはClaude API、Amazon Bedrock、Vertex AIで適用されます。Microsoft FoundryでのClaudeを参照してください。
# Opus への移行
model = "claude-opus-4-7" # Before
model = "claude-opus-4-8" # Afterこれらは破壊的変更ではありません。Claude Opus 4.7で動作するコードは、Claude Opus 4.8でも変更なしで引き続き動作します。以下の項目は、モデルIDを置き換えた後に確認すべき動作の違いについて説明しています。
サンプリングパラメータ(変更なし): temperature、top_p、またはtop_kをデフォルト以外の値に設定すると、Claude Opus 4.7と同様にClaude Opus 4.8でも400エラーが返されます。SDKのリクエスト型は以前のモデルとの互換性のためにこれらのフィールドを定義しているため、これらを設定するコードは型チェックを通過しますが、APIはサーバー側でリクエストを拒否します。Opus 4.7への移行時にこれらのパラメータを削除済みの場合、追加の変更は不要です。
effortのデフォルトはhigh: Claude Opus 4.8では、Claude CodeやMessages APIを含むすべてのサーフェスでeffortパラメータのデフォルトがhighです。すでにeffortを明示的に設定している場合、設定は変更されません。コーディングや高自律性の作業には、xhighを明示的に設定してください。レイテンシとコストの予算に照らしてeffort設定を再評価してください。
100万コンテキストウィンドウがデフォルト: Claude Opus 4.8は、ベータヘッダーなし、ロングコンテキストプレミアムなしで、デフォルトで100万トークンのコンテキストウィンドウを提供します。クライアントが古いモデルとの互換性のためにコンテキストウィンドウのベータヘッダーを渡している場合、Claude Opus 4.8では削除できます。
会話途中のシステムメッセージ: Claude Opus 4.8は、messages配列内でユーザーターンの直後にメッセージを受け付けます(に従います)。最初から適用される指示にはトップレベルのフィールドを使用してください。Claude Opus 4.7を含む以前のモデルは、内のを400エラーで拒否します。指示を更新するためにメッセージ履歴全体を再構築するコードパスを維持している場合は、それらを簡素化し、以前のターンでのヒットを維持できます。
claude-opus-4-7からclaude-opus-4-8に更新する(またはエイリアスを更新する)。effort設定を再評価する。デフォルトはすべてのサーフェスでhighです。コーディングや高自律性の作業には、xhighを明示的に設定してください。stop_detailsを読み取っていることを確認する(Claude Opus 4.7から利用可能、現在は公式にドキュメント化)。Claude Opus 4.7は高度に自律的で、長期的なエージェント作業、ナレッジワーク、ビジョンタスク、メモリタスクにおいて非常に優れたパフォーマンスを発揮します。
Claude Opus 4.7は、同じ$5 / $25(MTokあたり)の価格で、既存のClaude Opus 4.6のプロンプトと評価に対してそのままで高いパフォーマンスを発揮するはずですが、移行にあたって知っておくべき動作およびAPIの変更がいくつかあります。以下を含む、Claude Opus 4.6と同じ機能セットをサポートしています。
# Opus への移行
model = "claude-opus-4-6" # Before
model = "claude-opus-4-7" # After拡張思考の削除: thinking: {type: "enabled", budget_tokens: N}はClaude Opus 4.7以降のモデルではサポートされなくなり、400エラーが返されます。適応型思考(thinking: {type: "adaptive"})に切り替え、思考の深さを制御するにはeffortパラメータを使用してください。Claude Opus 4.7では適応型思考はデフォルトでオフです。thinkingフィールドのないリクエストは思考なしで実行され、Opus 4.6の動作と一致します。有効にするにはthinking: {type: "adaptive"}を明示的に設定してください。
変更前(Claude Opus 4.6):
client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 10000},
messages=[{"role": "user", "content": "..."}],
)effortパラメータを使用すると、Claudeの知能とトークン消費を調整し、能力と引き換えに速度向上とコスト削減を実現できます。コーディングやエージェントのユースケースでは新しいxhigh effortレベルから開始し、知能が重要なほとんどのユースケースでは最低でもhigh effortを使用してください。他のeffortレベルも試して、トークン使用量と知能をさらに調整してください。
max: Max effortは一部のユースケースでパフォーマンス向上をもたらす可能性がありますが、トークン使用量の増加に対して収穫逓減を示す場合があります。この設定は過剰思考に陥りやすい場合もあります。知能を要求するタスクでmax effortをテストしてください。xhigh(新規): Extra high effortは、ほとんどのコーディングおよびエージェントのユースケースに最適な設定です。high: この設定はトークン使用量と知能のバランスを取ります。知能が重要なほとんどのユースケースでは、最低でもhigh effortを使用してください。medium: 知能とのトレードオフでトークン使用量を削減する必要がある、コスト重視のユースケースに適しています。low: 知能を要求しない、短く範囲が限定されたタスクやレイテンシ重視のワークロードに限定してください。このモデルでは、effortが以前のどのOpusよりも重要です。アップグレード時には積極的に試してください。
Claude Opus 4.7には、APIの破壊的変更ではないものの、プロンプトの更新やスキャフォールディングの削除が必要になる可能性のある、Claude Opus 4.6とのいくつかの動作の違いがあります。
応答の長さがユースケースによって変化: Claude Opus 4.7は、固定の冗長性をデフォルトとするのではなく、タスクの複雑さの判断に基づいて応答の長さを調整します。これは通常、単純な検索ではより短い回答、オープンエンドな分析ではより長い回答を意味します。
プロダクトが特定のスタイルや出力の冗長性に依存している場合は、プロンプトの調整が必要になる場合があります。たとえば、冗長性を減らすには、「簡潔で焦点を絞った応答を提供してください。必須でないコンテキストは省略し、例は最小限にしてください。」と追加します。特定の種類の過剰説明が見られる場合は、それを防ぐための的を絞った指示をプロンプトに追加してください。
Claudeが適切な簡潔さでコミュニケーションする方法を示すポジティブな例は、モデルに何をしてはいけないかを伝えるネガティブな例や指示よりも効果的な傾向があります。
より文字通りの指示追従: Claude Opus 4.7は、特に低いeffortレベルにおいて、Claude Opus 4.6よりもプロンプトをより文字通りかつ明示的に解釈します。ある項目への指示を別の項目に暗黙的に一般化することはなく、明示されていないリクエストを推測することもありません。この文字通りの解釈の利点は、精度の向上と無駄な動作の削減です。慎重に調整されたプロンプト、構造化抽出、予測可能な動作が求められるパイプラインなどのAPIユースケースでは、一般的により良いパフォーマンスを発揮します。Claude Opus 4.7への移行では、プロンプトとハーネスのレビューが特に役立つ場合があります。
より直接的なトーン: 新しいモデルと同様に、長文執筆の文体が変化する場合があります。Claude Opus 4.7は、Claude Opus 4.6の温かみのあるスタイルと比較して、より直接的で意見がはっきりしており、承認を前面に出した表現や絵文字が少なくなっています。プロダクトが特定のボイスに依存している場合は、新しいベースラインに対してスタイルプロンプトを再評価してください。
エージェントトレースでの組み込み進捗更新: Claude Opus 4.7は、長いエージェントトレース全体を通じて、より定期的で高品質な更新をユーザーに提供します。中間ステータスメッセージを強制するスキャフォールディング(「ツール呼び出し3回ごとに進捗を要約してください」など)を追加している場合は、削除を試してください。Claude Opus 4.7のユーザー向け更新の長さや内容がユースケースに適していない場合は、これらの更新がどのようなものであるべきかをプロンプトで明示的に記述し、例を提供してください。
デフォルトで生成されるサブエージェントが減少: Claude Opus 4.7は、デフォルトで生成するサブエージェントが少ない傾向があります。ただし、この動作はプロンプトを通じて制御可能です。サブエージェントが望ましい場合について、Claude Opus 4.7に明示的なガイダンスを与えてください。
これらは必須ではありませんが、エクスペリエンスを向上させます。
max_tokens を再評価する: 同じテキストでも Claude Opus 4.7 ではトークン数が多くなるため、コンパクショントリガーを含め、追加の余裕を持たせるように max_tokens パラメータを更新してください。プロンプトによる介入、task_budget、および effort は、コストを制御し、適切なトークン使用を確保するのに役立ちます。
トークン数の想定を監査する: クライアント側でトークンを推定するコードパスや、トークンと文字の固定比率を前提とするコードパスは、Claude Opus 4.7 に対して再テストする必要があります。トークンカウントエンドポイントを使用して検証してください。
タスクバジェット(ベータ版)を採用する: Claude Opus 4.7 では「task budget」(タスクバジェット)が導入されています。これらのバジェットにより、思考、ツール呼び出し、ツール結果、最終出力を含むエージェントループ全体で使用できるトークン数を Claude に通知できます。モデルは実行中のカウントダウンを確認し、それを使用して作業の優先順位を付け、バジェットが消費されるにつれてタスクを適切に完了させます。使用するには、ベータヘッダー task-budgets-2026-03-13 を設定し、出力設定に以下を追加します。
output_config = {
"effort": "high",
"task_budget": {"type": "tokens", "total": 128000},
}claude-opus-4-6 から claude-opus-4-7 に更新する(またはエイリアスを更新する)。temperature、top_p、top_k を削除する。thinking: {type: "enabled", budget_tokens: N} を thinking: {type: "adaptive"} と effort パラメータに置き換える。max_tokens を再調整する。Claude Opus 4.5、Opus 4.1(非推奨)、またはそれ以前のモデルから直接 Claude Opus 4.7 に移行する場合は、**上記の Opus 4.7 の変更すべて**に加えて、Opus 4.5 と Opus 4.7 の間に適用されたこのセクションの累積的な変更を適用してください。Opus 4.6 から移行する場合は、上記の Opus 4.7 セクションのみが必要です。
# Opus への移行
model = "claude-opus-4-5" # Before
model = "claude-opus-4-7" # Afterプリフィルの削除は、上記の Opus 4.7 の破壊的変更で説明されています。
ツールパラメータのクォート処理: Claude Opus 4.6 以降のモデルでは、ツール呼び出し引数の JSON 文字列エスケープがわずかに異なる場合があります(例:Unicode エスケープやフォワードスラッシュエスケープの処理の違い)。ツール呼び出しの input を JSON パーサーを使用せずに生の文字列として解析している場合は、解析ロジックを確認してください。標準の JSON パーサー(json.loads() や JSON.parse() など)は、これらの違いを自動的に処理します。
これらの変更は Opus 4.7 でのエクスペリエンスを向上させます。**(Opus 4.7 では必須)**とマークされた項目は、Opus 4.6 のリリース時にはオプションの推奨事項でしたが、現在は必須です。それ以外は引き続き推奨事項です。
適応型思考に移行する(Opus 4.7 では必須): thinking: {type: "enabled", budget_tokens: N} は Claude Opus 4.7 で 400 エラーを返します。thinking: {type: "adaptive"} に切り替え、effort パラメータを使用して思考の深さを制御してください。適応型思考を参照してください。
Opus 4.1(非推奨)、Sonnet 4(非推奨)、またはそれ以前のモデルから直接 Claude Opus 4.7 に移行する場合は、このガイドの冒頭にある Claude Opus 4.7 の変更と上記の累積的な変更に加えて、このセクションの追加変更を適用してください。
# Opus 4.1から
model = "claude-opus-4-1-20250805" # Before
model = "claude-opus-4-7" # After
# Sonnet 4から
model = "claude-sonnet-4-20250514" # Before
model = "claude-opus-4-7" # After
# Sonnet 3.7から
model = "claude-3-7-sonnet-20250219" # Before
model = "claude-opus-4-7" # Afterサンプリングパラメータを削除する
これは Claude 3.x モデルから移行する場合の破壊的変更です。
Claude Opus 4.7 以降、temperature、top_p、または top_k をデフォルト以外の値に設定すると 400 エラーが返されます。最も安全な移行パスは、これらのパラメータをリクエストから完全に省略し、プロンプトを使用してモデルの動作をガイドすることです。決定論のために temperature = 0 を使用していた場合、それが同一の出力を保証したことはなかったことに注意してください。
# 変更前 - Claude 4以降のモデルではエラーになります
response = client.messages.create(
model="claude-3-7-sonnet-20250219",
temperature=0.7,
top_p=0.9, # Non-default sampling params return 400 on Opus 4.7
# ...
)
# 変更後
response = client.messages.create(
model="claude-opus-4-7",
# ...
)token-efficient-tools-2025-02-19 と output-128k-2025-02-19 を削除してください。すべての Claude 4+ モデルにはトークン効率の良いツール使用が組み込まれており、これらのヘッダーは効果がありません。claude-opus-4-7 に更新するoutput_config.format を使用するthinking: {type: "enabled", budget_tokens: N} を thinking: {type: "adaptive"} と effort パラメータに置き換える(Opus 4.7 では 400 を返す)effort-2025-11-24 ベータヘッダーを削除する(effort は現在 GA)fine-grained-tool-streaming-2025-05-14 ベータヘッダーを削除するClaude Sonnet 4.6 は、強力な知能と高速なパフォーマンスを兼ね備え、改善されたエージェント検索機能と、ウェブ検索またはウェブフェッチと併用した場合の無料コード実行を特徴としています。日常的なコーディング、分析、コンテンツタスクに最適です。
機能の完全な概要については、モデル概要を参照してください。
Sonnet 4.6 の価格は、入力トークン 100 万あたり 3 ドル、出力トークン 100 万あたり 15 ドルです。詳細については、Claude の価格を参照してください。
モデル名を更新する:
# Sonnet 4.5から
model = "claude-sonnet-4-5" # Before
model = "claude-sonnet-4-6" # After
# Sonnet 4から
model = "claude-sonnet-4-20250514" # Before
model = "claude-sonnet-4-6" # Afterアシスタントメッセージのプリフィルはサポートされなくなりました
これは Sonnet 4.5 以前から移行する場合の破壊的変更です。
アシスタントメッセージのプリフィルは Sonnet 4.6 で 400 エラーを返します。代わりに構造化出力、システムプロンプトの指示、または output_config.format を使用してください。
一般的なプリフィルのユースケースと移行方法:
出力フォーマットの制御(JSON/YAML 出力の強制):分類タスクには構造化出力または enum フィールドを持つツールを使用してください。
前置きの排除(「Here is...」などのフレーズの削除):システムプロンプトに直接的な指示を追加してください:「前置きなしで直接応答してください。『Here is...』、『Based on...』などのフレーズで始めないでください。」
不適切な拒否の回避: Claude は現在、適切な拒否がはるかに上手になっています。プリフィルなしでユーザーメッセージに明確なプロンプトを記述すれば十分なはずです。
継続(中断された応答の再開):継続をユーザーメッセージに移動してください:「前回の応答は中断され、[previous_response] で終わりました。中断したところから続けてください。」
サンプリングパラメータを更新する
これは Claude 3.x モデルから移行する場合の破壊的変更です。
temperature または top_p のいずれか一方のみを使用し、両方は使用しないでください。
ツールバージョンを更新する
これは Claude 3.x モデルから移行する場合の破壊的変更です。
最新のツールバージョン(text_editor_20250728、code_execution_20250825)に更新してください。undo_edit コマンドを使用しているコードをすべて削除してください。
refusal 停止理由を処理する
アプリケーションを更新して refusal 停止理由を処理してください。
動作変更に合わせてプロンプトを更新する
fine-grained-tool-streaming-2025-05-14 ベータヘッダーを削除する: きめ細かいツールストリーミングは Sonnet 4.6 で GA となり、ベータヘッダーは不要になりました。output_format を output_config.format に移行する: output_format パラメータは非推奨です。代わりに output_config.format を使用してください。Sonnet 4.5 から Sonnet 4.6 への移行を検討してください。同じ価格帯でより高い知能を提供します。
Sonnet 4.6 は、effort パラメータがなかった Sonnet 4.5 とは対照的に、デフォルトで high の effort レベルになります。Sonnet 4.5 から Sonnet 4.6 に移行する際は、effort パラメータの調整を検討してください。明示的に設定しない場合、デフォルトの effort レベルではレイテンシが高くなる可能性があります。
Sonnet 4.5 で拡張思考を使用していない場合、Sonnet 4.6 でも使用せずに継続できます。ユースケースに適したレベルに effort を明示的に設定する必要があります。思考を無効にした low effort では、拡張思考なしの Sonnet 4.5 と比較して同等以上のパフォーマンスが期待できます。
Sonnet 4.5 で budget_tokens を使用した拡張思考を使用している場合、Sonnet 4.6 でも引き続き機能しますが、非推奨です。effort パラメータを使用した適応型思考に移行してください。
適応型思考は、Sonnet 4.6 での budget_tokens の推奨される代替手段です。特に以下のワークロードパターンに適しています。
high effort から開始してください。レイテンシやトークン使用量が懸念される場合は、medium にスケールダウンしてください。適応型思考を使用する場合、タスクで medium と high の effort を評価してください。適切なレベルは、品質、レイテンシ、トークン使用量の間のワークロードのトレードオフによって異なります。
適応型思考で一貫性のない動作や品質の低下が見られる場合は、まず effort 設定を下げるか、max_tokens をハードリミットとして使用してみてください。budget_tokens を使用した拡張思考は Sonnet 4.6 でも引き続き機能しますが、非推奨であり、推奨されなくなりました。
移行中に一時的に budget_tokens を維持する必要がある場合、約 16k トークンのバジェットは、トークン使用量の暴走リスクなしに、より難しい問題に対する余裕を提供します。この設定は非推奨であり、将来のモデルリリースで削除される予定です。
エージェントコーディング、フロントエンドデザイン、ツールを多用するワークフロー、複雑なエンタープライズワークフローでは、medium effort から開始してください。レイテンシが高すぎる場合は、effort を low に下げることを検討してください。より高い知能が必要な場合は、effort を high に上げるか、Opus 4.7 への移行を検討してください。
チャット、コンテンツ生成、検索、分類、その他の非コーディングタスクでは、拡張思考を使用した low effort から開始してください。より深い処理が必要な場合は、effort を medium に上げてください。
claude-sonnet-4-6 に更新するoutput_config.format を使用するtext_editor_20250728、code_execution_20250825)に更新する。レガシーバージョンはサポートされていません(3.x から移行する場合)undo_edit コマンドを使用しているコードをすべて削除する(該当する場合)temperature または top_p のいずれか一方のみを使用し、両方は使用しない(3.x から移行する場合)Claude Sonnet 4.5 は、強力な知能と高速なパフォーマンスを兼ね備えており、日常的なコーディング、分析、コンテンツタスクに最適です。
機能の完全な概要については、モデル概要を参照してください。
Sonnet 4.5 の価格は、入力トークン 100 万あたり 3 ドル、出力トークン 100 万あたり 15 ドルです。詳細については、Claude の価格を参照してください。
モデル名を更新する:
# Sonnet 4から
model = "claude-sonnet-4-20250514" # Before
model = "claude-sonnet-4-5-20250929" # After
# Sonnet 3.7から
model = "claude-3-7-sonnet-20250219" # Before
model = "claude-sonnet-4-5-20250929" # Afterこれらの破壊的変更は、Claude 3.x Sonnet モデルから移行する場合に適用されます。
サンプリングパラメータを更新する
これは Claude 3.x モデルから移行する場合の破壊的変更です。
temperature または top_p のいずれか一方のみを使用し、両方は使用しないでください。
ツールバージョンを更新する
これは Claude 3.x モデルから移行する場合の破壊的変更です。
最新のツールバージョン(text_editor_20250728、code_execution_20250825)に更新してください。undo_edit コマンドを使用しているコードをすべて削除してください。
refusal 停止理由を処理する
アプリケーションを更新して refusal 停止理由を処理してください。
動作変更に合わせてプロンプトを更新する
claude-sonnet-4-5-20250929 に更新するtext_editor_20250728、code_execution_20250825)に更新する。レガシーバージョンはサポートされていません(3.x から移行する場合)undo_edit コマンドを使用しているコードをすべて削除する(該当する場合)temperature または top_p のいずれか一方のみを使用し、両方は使用しない(3.x から移行する場合)refusal 停止理由を処理するClaude Haiku 4.5 は、フロンティアに近いパフォーマンスを持つ最速かつ最も知能の高い Haiku モデルであり、インタラクティブアプリケーションや大量処理にプレミアムモデル品質を提供します。
機能の完全な概要については、モデル概要を参照してください。
Haiku 4.5 の価格は、入力トークン 100 万あたり 1 ドル、出力トークン 100 万あたり 5 ドルです。詳細については、Claude の価格を参照してください。
モデル名を更新する:
# Haiku 3.5から
model = "claude-3-5-haiku-20241022" # Before
model = "claude-haiku-4-5-20251001" # After新しいレート制限を確認する: Haiku 4.5 には Haiku 3.5 とは別のレート制限があります。詳細については、レート制限のドキュメントを参照してください。
コーディングおよび推論タスクでの大幅なパフォーマンス向上のために、thinking: {type: "enabled", budget_tokens: N} で拡張思考を有効にすることを検討してください。
拡張思考はプロンプトキャッシングの効率に影響します。
拡張思考は Claude 4.6 モデルで非推奨となり、Claude Opus 4.7 で削除されました。新しいモデルを使用する場合は、代わりに適応型思考を使用してください。
新機能を探索する: コンテキスト認識、出力容量の増加(64k トークン)、より高い知能、速度の向上の詳細については、モデル概要を参照してください。
これらの破壊的変更は、Claude 3.x Haiku モデルから移行する場合に適用されます。
サンプリングパラメータを更新する
これは Claude 3.x モデルから移行する場合の破壊的変更です。
temperature または top_p のいずれか一方のみを使用し、両方は使用しないでください。
ツールバージョンを更新する
これは Claude 3.x モデルから移行する場合の破壊的変更です。
最新のツールバージョン(text_editor_20250728、code_execution_20250825)に更新してください。undo_edit コマンドを使用しているコードをすべて削除してください。
refusal 停止理由を処理する
アプリケーションを更新して refusal 停止理由を処理してください。
動作変更に合わせてプロンプトを更新する
claude-haiku-4-5-20251001 に更新するtext_editor_20250728、code_execution_20250825)に更新する。レガシーバージョンはサポートされていませんundo_edit コマンドを使用しているコードをすべて削除する(該当する場合)temperature または top_p のいずれか一方のみを使用し、両方は使用しないrefusal 停止理由を処理するWas this page helpful?
変更後(Claude Mythos 5):
client.messages.create(
model="claude-mythos-5",
max_tokens=16000,
messages=[{"role": "user", "content": "..."}],
)アシスタントプリフィル: アシスタントメッセージのプリフィルはclaude-mythos-5ではサポートされておらず、Claude Mythos Previewと同様に400エラーが返されます。代わりにシステムプロンプトの指示を使用してください。
思考出力: claude-mythos-5では、生の思考の連鎖は返されませんが、thinking.displayがsummarizedに設定されている場合、思考ブロックには読みやすい要約テキストが含まれます。同じモデルで会話を継続する際は、思考ブロックをそのまま渡してください。Claude Fable 5およびClaude Mythos 5での思考出力を参照してください。
display: "summarized"thinkingおよびredacted_thinkingブロックを削除する。claude-mythos-5の思考ブロックはそれを生成したモデルに紐付けられており、Claude Fable 5およびClaude Mythos 5以外のモデルはこれらを無視します。削除することで、モデル間のリクエストを最小限かつ統一された形に保てます。claude-mythos-previewからの移行では、トークン数はほぼ変わりません。変更後(Claude Fable 5):
client.messages.create(
model="claude-fable-5",
max_tokens=16000,
output_config={"effort": "high"},
messages=[{"role": "user", "content": "..."}],
)拡張思考と思考予算(変更なし): 手動の拡張思考(thinking: {type: "enabled", budget_tokens: N})はclaude-fable-5ではサポートされておらず、Claude Opus 4.8と同様に400エラーが返されます。budget_tokensに直接の代替はありません。思考は適応型であり、effortパラメータは思考予算ではなく、別個の出力レベル制御です。
アシスタントプリフィル(変更なし): アシスタントメッセージのプリフィルはclaude-fable-5ではサポートされておらず、Claude Opus 4.8と同様に400エラーが返されます。代わりにシステムプロンプトの指示を使用してください。
思考出力: claude-fable-5では、生の思考の連鎖は返されませんが、thinking.displayがsummarizedに設定されている場合、思考ブロックには読みやすい要約テキストが含まれます。同じモデルで会話を継続する際は、思考ブロックをそのまま渡してください。Claude Fable 5およびClaude Mythos 5での思考出力を参照してください。
安全性分類器とrefusal停止理由: claude-fable-5は、リクエストに対して、および応答生成中に安全性分類器を実行します。分類器がリクエストを拒否した場合、Messages APIはエラーではなく、成功したHTTP 200応答としてstop_reason: "refusal"を返します。stop_details.categoryフィールドは、どの分類器が作動したかを報告し、"cyber"、"bio"、"reasoning_extraction"などのカテゴリ、または拒否が名前付きカテゴリに対応しない場合はnullを返します。完全なセットについては拒否カテゴリ表を参照してください。
出力が生成される前に拒否されたリクエストの入力トークンには課金されません。分類器がストリーミング途中で作動した場合、入力とすでにストリーミングされた出力には課金されます。部分的な出力は破棄してください。
拒否されたリクエストを別のモデルで自動的に再実行するには、オプトインのfallbacksパラメータを渡します。これはClaude APIおよびClaude Platform on AWSでベータ版として提供されています。このパラメータはMessage Batches API、およびAmazon Bedrock、Vertex AI、Microsoft Foundryでは利用できません。これら3つのプラットフォームでは、クライアント側でリトライを実行するか、SDKの拒否フォールバックミドルウェアを使用してください。停止理由の処理を参照してください。
high effortから開始する: effortパラメータのデフォルトは引き続きhighです。Claude Opus 4.8では、コーディングや高自律性の作業にはxhighを明示的に設定することが推奨されていました。claude-fable-5では、ほとんどのタスクでデフォルトとしてhighを使用し、xhighは最も能力が求められるワークロードに限定してください。claude-fable-5では、低いeffort設定でも良好なパフォーマンスを発揮し、多くの場合、以前のモデルのxhighパフォーマンスを上回ります。タスクは完了するものの必要以上に時間がかかる場合は、effortを下げてください。Claude Fable 5のプロンプト作成を参照してください。
プロンプトキャッシングの最小値が低下: claude-fable-5でキャッシュ可能なプロンプトの最小長は512トークンで、Claude Opus 4.8の1,024トークンより低くなっています。Claude Opus 4.8ではキャッシュするには短すぎたプロンプトも、コード変更なしでキャッシュエントリを作成できるようになりました。Amazon Bedrockでは、claude-fable-5の最小値は1,024トークンです。モデルごとの最小値についてはプロンプトキャッシングを参照してください。
"omitted"display: "summarized"thinkingおよびredacted_thinkingブロックを削除する。claude-fable-5の思考ブロックはそれを生成したモデルに紐付けられており、Claude Fable 5およびClaude Mythos 5以外のモデルはこれらを無視します。削除することで、モデル間のリクエストを最小限かつ統一された形に保てます。例外はフォールバッククレジットの引き換えで、その機能の正確なルールに従ってリクエストボディをエコーする必要があります。stop_reason: "refusal"を処理し、stop_details.categoryフィールドを読み取る。拒否されたリクエストを別のモデルで自動的に再実行するには、オプトインのfallbacksパラメータ(ベータ版)を検討してください。停止理由の処理を参照してください。effort設定を再評価する。Claude Opus 4.8でxhighで実行していたワークロードを含め、ほとんどのタスクでhighから開始してください。claude-opus-4-8からの移行ではトークン数はほぼ変わりませんが、トークンあたりの価格は異なります。role: "system"systemmessagesrole: "system"拒否停止の詳細: 拒否応答のstop_detailsオブジェクト(Claude Opus 4.7から利用可能)が公式にドキュメント化されました。モデルがリクエストを拒否した場合、既存のrefusal停止理由に加えて、拒否のカテゴリを識別します。ベータヘッダーは不要で、オプトアウトもありません。停止理由の処理を参照してください。
プロンプトキャッシングの最小値が低下: Claude Opus 4.8でキャッシュ可能なプロンプトの最小長は1,024トークンで、Claude Opus 4.7より低くなっています。Claude Opus 4.7ではキャッシュするには短すぎたプロンプトも、コード変更なしでキャッシュエントリを作成できるようになりました。モデルごとの最小値についてはプロンプトキャッシングを参照してください。
effortレベルの再調整: Claude Opus 4.8では、Claude Opus 4.7と比較して各effortレベルの背後にあるトークン割り当てが変更されています。mediumはやや多くの思考を許可し、highはやや少なく、xhighは大幅に多くなります。Claude Opus 4.7のコストやレイテンシに対してeffortレベルを調整していた場合は、調整する前に同じレベルで再度ベースライン測定してください。Effortを参照してください。
変更後(Claude Opus 4.7):
client.messages.create(
model="claude-opus-4-7",
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": "high"}, # or "max", "xhigh", "medium", "low"
messages=[{"role": "user", "content": "..."}],
)適応型思考はプロンプトを通じて制御可能です。モデルが過剰または過少に思考する場合の調整方法については、effortと思考の深さの調整を参照してください。
サンプリングパラメータの削除: Claude Opus 4.7でtemperature、top_p、またはtop_kをデフォルト以外の値に設定すると、400エラーが返されます。最も安全な移行方法は、これらのパラメータをリクエストペイロードから完全に省略することです。Claude Opus 4.7でモデルの動作を誘導する推奨方法はプロンプトです。決定性のためにtemperature = 0を使用していた場合、以前のモデルでも同一の出力が保証されていたわけではないことに注意してください。
思考コンテンツがデフォルトで省略: Claude Opus 4.7でも思考ブロックは応答ストリームに表示されますが、明示的にオプトインしない限り、そのthinkingフィールドは空です。これは、デフォルトで要約された思考テキストを返していたClaude Opus 4.6からのサイレントな変更です。Claude Opus 4.7で要約された思考コンテンツを復元するには、thinking.displayを"summarized"に設定してください。
thinking = {
"type": "adaptive",
"display": "summarized",
}Claude Opus 4.7のデフォルトは"omitted"です。プロダクトが推論をユーザーにストリーミングしている場合、新しいデフォルトでは出力が始まる前に長い一時停止として表示されます。思考中の進捗を表示するにはdisplay: "summarized"を設定してください。詳細は拡張思考を参照してください。
トークンカウントの更新: Claude Opus 4.7は新しいトークナイザーを使用しており、これが幅広いタスクでのパフォーマンス向上に貢献しています。新しいトークナイザーは、以前のモデルと比較してテキスト処理時に約1倍から1.35倍のトークンを使用する場合があります(コンテンツによって最大約35%増加)。
/v1/messages/count_tokensは、Claude Opus 4.6とは異なるトークン数をClaude Opus 4.7に対して返します。トークン効率はワークロードの形態によって異なる場合があります。
プロンプトによる介入、task_budget、effortは、コストを制御し適切なトークン使用を確保するのに役立ちます。これらの制御はモデルの知能とトレードオフになる場合があります。コンパクショントリガーを含め、追加の余裕を持たせるためにmax_tokensパラメータを更新してください。Claude Opus 4.7は、ロングコンテキストプレミアムなしの標準API価格で100万コンテキストウィンドウを提供します。
プリフィルの削除(Opus 4.6から継続): アシスタントメッセージのプリフィルは、Claude Opus 4.7で400エラーを返します。代わりに構造化出力、システムプロンプトの指示、またはoutput_config.formatを使用してください。
より厳密なeffort調整: Claude Opus 4.6から大きく変わり、Claude Opus 4.7はeffortレベルを厳密に尊重します。特に低い側で顕著です。lowおよびmediumでは、モデルは求められた以上のことをするのではなく、求められた範囲に作業を限定します。
これはレイテンシとコストには良いことですが、low effortで実行される中程度に複雑なタスクでは、思考不足のリスクがあります。複雑な問題で浅い推論が見られる場合は、プロンプトで回避するのではなく、effortをhighまたはxhighに上げてください。
レイテンシのためにeffortをlowに保つ必要がある場合は、的を絞ったガイダンスを追加してください。「このタスクには多段階の推論が含まれます。応答する前に問題を慎重に考えてください。」Claude Opus 4.7の推奨effortレベルを参照してください。
デフォルトでツール呼び出しが減少: Claude Opus 4.7は、Claude Opus 4.6よりもツールの使用頻度が低く、推論をより多く使用する傾向があります。これはほとんどの場合、より良い結果を生み出します。
ツール使用を増やすには、effort設定を上げてください。highまたはxhighのeffort設定では、エージェント検索やコーディングにおいてツール使用が大幅に増加します。また、ツールをいつ、どのように適切に使用するかをモデルに明示的に指示するようにプロンプトを調整することもできます。
リアルタイムのサイバーセキュリティセーフガード: Claude Opus 4.7で新たに追加され、禁止されているトピックや高リスクのトピックを含むリクエストは拒否される場合があります。ペネトレーションテスト、脆弱性調査、レッドチーミングなどの正当なセキュリティ作業については、Cyber Verification Programに申請して制限の緩和をリクエストしてください。背景についてはセーフガード、警告、異議申し立てを参照してください。
高解像度画像サポート: Claude Opus 4.7は、高解像度画像をサポートする最初のClaudeモデルです。最大画像解像度は長辺2576ピクセルで、以前のモデルの1568ピクセルから向上しています。これにより、ビジョン中心のワークロードでの性能向上が実現し、特にコンピュータ使用、スクリーンショットの理解、ドキュメント分析に有用です。
高解像度サポートは自動的に適用され、ベータヘッダーやクライアント側のオプトインは不要です。計画すべき2つの点:
max_tokensとコスト予測を再設定するか、追加の精度が不要な場合は送信前にダウンサンプリングしてください。詳細はClaude Opus 4.7での高解像度画像サポートを参照してください。
ユースケースに応じて、さまざまなタスクバジェットを試す必要がある場合があります。モデルに与えられたタスクバジェットが制限的すぎる場合、バジェットを制約として参照しながら、タスクをあまり徹底的に完了しない可能性があります。
速度よりも品質が重要なオープンエンドのエージェントタスクでは、タスクバジェットを設定しないでください。タスクバジェットは、モデルがトークン割り当てに合わせて作業範囲を調整する必要があるワークロードに限定してください。タスクバジェットの最小値は 20k トークンです。
タスクバジェットはハードキャップではなく、モデルが認識する提案です。max_tokens とは異なります。
task_budget: エージェントループ全体にわたる助言的な上限です。モデルはこれを認識し、ペース配分に使用します。max_tokens: 生成されるトークンに対するリクエストごとのハード上限です。モデルには渡されないため、モデルはこれを認識しません。モデルに自己調整させたい場合は task_budget を使用し、使用量を制限するハード上限としては max_tokens を使用してください。
max または xhigh の effort では大きな max_tokens を設定する: Claude Opus 4.7 を max または xhigh の effort で実行している場合、モデルがサブエージェントやツール呼び出し全体で思考し行動する余地を持てるように、大きな最大出力トークンバジェットを設定してください。64k トークンから開始し、そこから調整してください。
高解像度が不要な場合は画像をダウンサンプリングする: Claude Opus 4.7 は最大 2576px / 3.75MP の画像をサポートしています。高解像度画像はより多くのトークンを使用します。追加の画像忠実度が不要な場合は、トークン使用量の増加を避けるために、Claude に送信する前に画像をダウンサンプリングしてください。画像とビジョンを参照してください。
xhigh または max の effort を使用する場合、開始点として max_tokens を少なくとも 64k に引き上げる。response = client.beta.messages.create(
model="claude-opus-4-5",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 32000},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)この移行では client.beta.messages.create から client.messages.create への移行も含まれることに注意してください。適応型思考と effort は GA 機能であり、ベータ SDK 名前空間やベータヘッダーは必要ありません。
effort ベータヘッダーを削除する: effort パラメータは現在 GA です。リクエストから betas=["effort-2025-11-24"] を削除してください。
きめ細かいツールストリーミングのベータヘッダーを削除する: きめ細かいツールストリーミングは現在 GA です。リクエストから betas=["fine-grained-tool-streaming-2025-05-14"] を削除してください。
インターリーブ思考のベータヘッダーを削除する: 適応型思考は、Claude Opus 4.7、Opus 4.6、Sonnet 4.6 でインターリーブ思考を自動的に有効にします。リクエストから betas=["interleaved-thinking-2025-05-14"] を削除してください。このヘッダーは、手動拡張思考を使用する Sonnet 4.6 では引き続き機能しますが、手動モードは非推奨です。
output_config.format に移行する: 構造化出力を使用している場合、output_format={...} を output_config={"format": {...}} に更新してください。古いパラメータは引き続き機能しますが、非推奨であり、将来のモデルリリースで削除される予定です。
ツールバージョンを更新する
これは Claude 3.x モデルから移行する場合の破壊的変更です。
最新のツールバージョンに更新してください。undo_edit コマンドを使用しているコードをすべて削除してください。
# 変更前
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
# 変更後
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]text_editor_20250728 と str_replace_based_edit_tool を使用してください。詳細については、テキストエディタツールのドキュメントを参照してください。code_execution_20250825 にアップグレードしてください。移行手順については、コード実行ツールのドキュメントを参照してください。refusal 停止理由を処理する
アプリケーションを更新して refusal 停止理由を処理してください。
response = client.messages.create(...)
if response.stop_reason == "refusal":
# 拒否を適切に処理します
passmodel_context_window_exceeded 停止理由を処理する
Claude 4.5+ モデルは、リクエストされた max_tokens 制限ではなくコンテキストウィンドウ制限に達したために生成が停止した場合、model_context_window_exceeded 停止理由を返します。この新しい停止理由を処理するようにアプリケーションを更新してください。
response = client.messages.create(...)
if response.stop_reason == "model_context_window_exceeded":
# コンテキストウィンドウの上限を適切に処理します
passツールパラメータの処理を確認する(末尾の改行)
Claude 4.5+ モデルは、以前は削除されていたツール呼び出し文字列パラメータの末尾の改行を保持します。ツールがツール呼び出しパラメータに対する厳密な文字列マッチングに依存している場合、ロジックが末尾の改行を正しく処理することを確認してください。
動作変更に合わせてプロンプトを更新する
Claude 4+ モデルは、より簡潔で直接的なコミュニケーションスタイルを持ち、明示的な指示を必要とします。最適化のガイダンスについては、プロンプトのベストプラクティスを確認してください。
interleaved-thinking-2025-05-14 ベータヘッダーを削除する(適応型思考がインターリーブ思考を自動的に有効にする)output_format を output_config.format に移行する(該当する場合)temperature、top_p、top_k を削除する(デフォルト以外の値は Opus 4.7 で 400 を返す)text_editor_20250728、code_execution_20250825)refusal 停止理由を処理するmodel_context_window_exceeded 停止理由を処理するtoken-efficient-tools-2025-02-19、output-128k-2025-02-19)コンテキストハイドレーション / ロールの一貫性(長い会話でのコンテキストのリフレッシュ):以前はプリフィルされたアシスタントのリマインダーだったものを、代わりにユーザーターンに挿入してください。
ツールパラメータの JSON エスケープが異なる場合があります
これは Sonnet 4.5 以前から移行する場合の破壊的変更です。
ツールパラメータの JSON 文字列エスケープは、以前のモデルと異なる場合があります。標準の JSON パーサーはこれを自動的に処理しますが、カスタムの文字列ベースの解析は更新が必要な場合があります。
Claude 4 モデルは、より簡潔で直接的なコミュニケーションスタイルを持っています。最適化のガイダンスについては、プロンプトのベストプラクティスを確認してください。
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
output_config={"effort": "low"},
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"},
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=16384,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "medium"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "low"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)refusalfine-grained-tool-streaming-2025-05-14 ベータヘッダーを削除する(現在 GA)output_format を output_config.format に移行するthinking: {type: "enabled", budget_tokens: N} から effort パラメータを使用した thinking: {type: "adaptive"} に移行する(budget_tokens は非推奨であり、将来のリリースで削除される予定)Claude 4 モデルは、より簡潔で直接的なコミュニケーションスタイルを持っています。最適化のガイダンスについては、プロンプトのベストプラクティスを確認してください。
Claude 4 モデルは、より簡潔で直接的なコミュニケーションスタイルを持っています。最適化のガイダンスについては、プロンプトのベストプラクティスを確認してください。