このガイドでは、Messages APIのコードの移行について説明します。Claude Managed Agentsを使用している場合は、モデル名の更新以外の変更は必要ありません。
Claude APIスキルで移行を自動化しましょう。 Claude Codeで/claude-api migrateを実行すると、バンドルされているClaude APIスキルが呼び出されます。このページに記載されているすべての対象モデルで動作します。
/claude-api migrate this project to claude-opus-4-8このスキルは、モデルIDの置き換えに加え、必要に応じて破壊的なパラメータ変更、プレフィルの置き換え、対象モデル向けのeffortキャリブレーションをコードベース全体に適用し、手動で確認すべき項目のチェックリストを生成します。ファイルを編集する前に、移行範囲(作業ディレクトリ全体、サブディレクトリ、または特定のファイルリスト)の確認を求めます。また、Amazon Bedrock、Vertex AI、Claude Platform on AWS、Microsoft Foundryのクライアントを検出し、各プラットフォームに合わせてモデルID形式と機能変更を調整します。
Claude Mythos 5は、招待制のリサーチプレビューであるClaude Mythos Previewの後継となる、アクセス制限付きモデルです。同等の機能を持つ一般提供モデルについては、Claude Fable 5を参照してください。
移行はほぼドロップインで完了します。Claude Mythos 5は、Claude Mythos Previewと同じMessages APIおよび同じツール使用パターンを使用しており、両モデルが同じトークナイザーを使用しているため、トークン数はほぼ変わりません。確認すべき主な変更点は、利用できなくなった機能(次のセクションに記載)と思考出力です。
Claude Mythos Previewの廃止スケジュールについては、モデルの廃止を参照してください。
model = "claude-mythos-preview" # Before
model = "claude-mythos-5" # After拡張思考と思考トークンバジェット: 手動の拡張思考(thinking: {type: "enabled", budget_tokens: N})はclaude-mythos-5ではサポートされておらず、400エラーが返されます。適応的思考は常に有効です。モデルが各リクエストでいつ、どの程度思考するかを判断するため、thinking設定は不要です。thinking: {type: "disabled"}はエラーを返します。budget_tokensに直接の代替はありません。思考は適応的であり、effortパラメータは思考バジェットではなく、別個の出力レベル制御です。
変更前(Claude Mythos Preview):
client.messages.create(
model="claude-mythos-preview",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 10000},
messages=[{"role": "user", "content": "..."}],
)変更後(Claude Mythos 5):
client.messages.create(
model="claude-mythos-5",
max_tokens=16000,
messages=[{"role": "user", "content": "..."}],
)アシスタントプレフィル: アシスタントメッセージのプレフィルはclaude-mythos-5ではサポートされておらず、Claude Mythos Previewと同様に400エラーが返されます。代わりにシステムプロンプトの指示を使用してください。
思考出力: claude-mythos-5では、生の思考の連鎖は返されませんが、thinking.displayがsummarizedに設定されている場合、思考ブロックには読み取り可能な要約テキストが含まれます。同じモデルで会話を継続する場合は、思考ブロックを変更せずにそのまま渡してください。Claude Fable 5およびClaude Mythos 5での思考出力を参照してください。
claude-mythos-5はclaude-mythos-previewと同じトークナイザー(Claude Opus 4.7で導入されたトークナイザー)を使用しています。claude-mythos-previewからの移行では、トークン数はほぼ変わりません。Claude Opus 4.7より前のモデルと比較すると、同じコンテンツでもトークン数が約30%増加する場合があり、コンテンツやワークロードの形状によって異なります。
/v1/messages/count_tokensは、claude-mythos-previewと比較してclaude-mythos-5でもほぼ同じ値を返します。ご自身のワークロードでコストとレイテンシを再ベースライン化してください。
claude-mythos-previewからclaude-mythos-5に更新します。thinking: {type: "enabled", budget_tokens: N})を削除します。適応的思考は常に有効であり、thinkingフィールドは不要です。thinking: {type: "disabled"}設定があれば削除します。claude-mythos-5では思考を無効にするとエラーが返されます。budget_tokensを削除します。直接の代替はありません。思考は適応的であり、effortパラメータは思考バジェットではなく、別個の出力レベル制御です。thinkingフィールドを解析するコードが、それを表示テキストとしてのみ扱い、同じモデルで継続する際に思考ブロックを変更せずにそのまま渡すことを確認します。thinking.displayはclaude-mythos-5ではデフォルトで"omitted"であり、Claude Mythos Previewと同じです。読み取り可能な要約を受け取るにはdisplay: "summarized"を設定してください。Claude Fable 5およびClaude Mythos 5での思考出力を参照してください。thinkingおよびredacted_thinkingブロックを削除してください。claude-mythos-5の思考ブロックは、それを生成したモデルに紐付けられており、Claude Fable 5およびClaude Mythos 5以外のモデルはそれらを暗黙的に無視します。削除することで、モデル間のリクエストを最小限かつ統一的に保てます。claude-mythos-previewからの移行では、トークン数はほぼ変わりません。Claude Fable 5は、Anthropicが広くリリースしているモデルの中で最も高性能なモデルであり、Claude API、Claude Platform on AWS、Amazon Bedrock、Vertex AI、Microsoft Foundryで一般提供されています。
移行はほぼドロップインで完了します。Claude Fable 5は、Claude Opus 4.8と同じMessages APIおよび同じツール使用パターンを使用しています。デフォルトで同じ100万トークンのコンテキストウィンドウと同じ128kの最大出力トークンをサポートしています。両モデルが同じトークナイザーを使用しているため、トークン数はほぼ変わりません。
確認すべき主な変更点は、常時有効な適応的思考、思考出力、安全性分類器による拒否、および価格設定です。移行前の確認事項では価格設定とデータ保持について、変更点ではその他の項目について説明します。
Claude Fable 5の価格は、入力トークン100万あたり$10、出力トークン100万あたり$50です。これに対し、Claude Opus 4.8は$5および$25です。詳細はClaudeの価格設定を参照してください。
Claude Fable 5は30日間のデータ保持を必要とし、「zero data retention」(ゼロデータ保持)、すなわちZDR契約では利用できません。このモデルは対象モデル(Covered Model)に指定されています。データ保持設定がこの要件を満たさない組織からのリクエストは、400 invalid_request_errorを返します。ZDR契約を結んでいる組織は、データ保持設定についてAnthropicのアカウントチームにお問い合わせください。Claude Opus 4.8は引き続きZDRで利用可能です。または、ワークスペースごとにデータ保持を設定することもできます。モデル固有のデータ保持要件を参照してください。Amazon Bedrock、Vertex AI、Microsoft Foundryでは、データ保持は各プラットフォームによって管理されます。
コードがClaude Opus 4.7以前のものである場合は、まずClaude Opus 4.7からClaude Opus 4.8への移行を適用し、Claude Opus 4.7より前のモデルについてはClaude Opus 4.7への移行手順も適用してください。これらのセクションでは、このセクションで繰り返さない破壊的変更(サンプリングパラメータの拒否、手動の拡張思考の拒否、プレフィルの削除、新しいトークナイザー)について説明しています。
model = "claude-opus-4-8" # Before
model = "claude-fable-5" # Afterこのセクションの項目は、モデルIDを置き換えた後に確認すべきAPIおよび動作の違いについて説明しています。
適応的思考が常に有効: 適応的思考はclaude-fable-5で唯一の思考モードです。モデルが各リクエストでいつ、どの程度思考するかを判断するため、thinking設定は不要です。thinking: {type: "disabled"}はエラーを返します。思考の深さを制御するにはeffortパラメータを使用してください。
確認すべき動作変更:Claude Opus 4.8では、thinkingフィールドのないリクエストは思考なしで実行されますが、claude-fable-5では、同じリクエストが適応的思考付きで実行されます。max_tokensは引き続き、思考とレスポンステキストを合わせた総出力のハードリミットであるため、Claude Opus 4.8で思考なしで実行していたワークロードについては見直してください。コスト管理を参照してください。
変更前(Claude Opus 4.8):
client.messages.create(
model="claude-opus-4-8",
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": "high"},
messages=[{"role": "user", "content": "..."}],
)変更後(Claude Fable 5):
client.messages.create(
model="claude-fable-5",
max_tokens=16000,
output_config={"effort": "high"},
messages=[{"role": "user", "content": "..."}],
)拡張思考と思考バジェット(変更なし): 手動の拡張思考(thinking: {type: "enabled", budget_tokens: N})はclaude-fable-5ではサポートされておらず、Claude Opus 4.8と同様に400エラーが返されます。budget_tokensに直接の代替はありません。思考は適応的であり、effortパラメータは思考バジェットではなく、別個の出力レベル制御です。
アシスタントプレフィル(変更なし): アシスタントメッセージのプレフィルはclaude-fable-5ではサポートされておらず、Claude Opus 4.8と同様に400エラーが返されます。代わりにシステムプロンプトの指示を使用してください。
思考出力: claude-fable-5では、生の思考の連鎖は返されませんが、thinking.displayがsummarizedに設定されている場合、思考ブロックには読み取り可能な要約テキストが含まれます。同じモデルで会話を継続する場合は、思考ブロックを変更せずにそのまま渡してください。Claude Fable 5およびClaude Mythos 5での思考出力を参照してください。
安全性分類器とrefusal停止理由: claude-fable-5は、リクエストおよびレスポンス生成中に安全性分類器を実行します。分類器がリクエストを拒否した場合、Messages APIはエラーではなく、成功したHTTP 200レスポンスとしてstop_reason: "refusal"を返します。stop_details.categoryフィールドは、どの分類器が作動したかを報告し、"cyber"、"bio"、"reasoning_extraction"などのカテゴリ、または拒否が名前付きカテゴリにマッピングされない場合はnullを返します。完全なセットについては、拒否カテゴリ表を参照してください。
出力が生成される前に拒否されたリクエストの入力トークンは課金されません。分類器がストリーミング中に作動した場合、入力とすでにストリーミングされた出力は課金されます。部分的な出力は破棄してください。
拒否されたリクエストを別のモデルで自動的に再実行するには、オプトインのfallbacksパラメータを渡します。これはClaude APIおよびClaude Platform on AWSでベータ版として提供されています。このパラメータは、Message Batches API、Amazon Bedrock、Vertex AI、Microsoft Foundryでは利用できません。これら3つのプラットフォームでは、クライアント側でリトライを実行するか、SDKの拒否フォールバックミドルウェアを使用してください。停止理由の処理を参照してください。
high effortから開始: effortパラメータのデフォルトは引き続きhighです。Claude Opus 4.8では、コーディングや高自律性の作業にはxhighを明示的に設定することが推奨されていました。claude-fable-5では、ほとんどのタスクでhighをデフォルトとして使用し、xhighは最も能力が重視されるワークロードに限定してください。claude-fable-5の低いeffort設定でも良好なパフォーマンスを発揮し、多くの場合、以前のモデルのxhighパフォーマンスを上回ります。タスクが完了するものの必要以上に時間がかかる場合は、effortを下げてください。Claude Fable 5のプロンプティングを参照してください。
プロンプトキャッシングの最小値が低下: claude-fable-5でキャッシュ可能なプロンプトの最小長は512トークンで、Claude Opus 4.8の1,024トークンより低くなっています。Claude Opus 4.8でキャッシュするには短すぎたプロンプトも、コード変更なしでキャッシュエントリを作成できるようになりました。Amazon Bedrockでは、claude-fable-5の最小値は1,024トークンです。モデルごとの最小値については、プロンプトキャッシングを参照してください。
claude-fable-5は30日間のデータ保持を必要とし、それ以外の場合は400 invalid_request_errorを返します。モデル固有のデータ保持要件を参照してください。claude-opus-4-8からclaude-fable-5に更新します。thinking: {type: "disabled"}設定があれば削除します。claude-fable-5では思考を無効にするとエラーが返され、thinkingフィールドのないリクエストは適応的思考付きで実行されます。claude-fable-5では引き続きサポートされていません。thinkingフィールドを解析するコードが、それを表示テキストとしてのみ扱い、同じモデルで継続する際に思考ブロックを変更せずにそのまま渡すことを確認します。thinking.displayはclaude-fable-5ではデフォルトで"omitted"であり、Claude Opus 4.8と同じです。読み取り可能な要約を受け取るにはdisplay: "summarized"を設定してください。Claude Fable 5およびClaude Mythos 5での思考出力を参照してください。thinkingおよびredacted_thinkingブロックを削除してください。claude-fable-5の思考ブロックは、それを生成したモデルに紐付けられており、Claude Fable 5およびClaude Mythos 5以外のモデルはそれらを暗黙的に無視します。削除することで、モデル間のリクエストを最小限かつ統一的に保てます。例外はフォールバッククレジットの引き換えで、その機能の正確なルールに従ってリクエストボディをエコーする必要があります。stop_reason: "refusal"を処理し、stop_details.categoryフィールドを読み取ります。拒否されたリクエストを別のモデルで自動的に再実行するには、オプトインのfallbacksパラメータ(ベータ版)の使用を検討してください。停止理由の処理を参照してください。effort設定を再評価します。Claude Opus 4.8でxhighで実行していたワークロードを含め、ほとんどのタスクでhighから開始してください。claude-opus-4-8からの移行では、トークン数はほぼ変わりませんが、トークンあたりの価格は異なります。Claude Opus 4.8は、AnthropicのOpusティアで最も高性能なモデルです。Claude Opus 4.7をベースに構築されています。
Claude Opus 4.8は、既存のClaude Opus 4.7のプロンプトと評価に対して、そのまま高いパフォーマンスを発揮するはずです。すでにClaude Opus 4.7で動作しているコードに対する破壊的なAPI変更はありません。100万トークンのコンテキストウィンドウ、128kの最大出力トークン、適応的思考、プロンプトキャッシング、バッチ処理、Files API、PDFサポート、ビジョン、およびサーバーサイドとクライアントサイドのツールの完全なセットを含む、Claude Opus 4.7と同じ機能セットをサポートしています。さらに、会話途中のシステムメッセージが追加され、拒否停止の詳細が公式にドキュメント化されています。
コードがClaude Opus 4.6以前のものである場合は、Claude Opus 4.8にアップグレードする前に、以下のClaude Opus 4.7への移行手順も適用してください。これらの手順には、4.8へのアップグレードだけではカバーされない破壊的変更(サンプリングパラメータの拒否、手動の拡張思考の拒否、新しいトークナイザー)が含まれています。
Microsoft Foundryでは、Claude Opus 4.8はローンチ時点で200kトークンのコンテキストウィンドウを持ちます。100万トークンのコンテキストウィンドウは、Claude API、Amazon Bedrock、Vertex AIで適用されます。Microsoft FoundryでのClaudeを参照してください。
# Opus への移行
model = "claude-opus-4-7" # Before
model = "claude-opus-4-8" # Afterこれらは破壊的変更ではありません。Claude Opus 4.7で動作するコードは、Claude Opus 4.8でも変更なしで引き続き動作します。以下の項目は、モデルIDを置き換えた後に確認すべき動作の違いについて説明しています。
サンプリングパラメータ(変更なし): temperature、top_p、またはtop_kをデフォルト以外の値に設定すると、Claude Opus 4.7と同様にClaude Opus 4.8でも400エラーが返されます。SDKのリクエスト型は、以前のモデルとの互換性のためにこれらのフィールドを引き続き定義しているため、これらを設定するコードは型チェックを通過しますが、APIはサーバー側でリクエストを拒否します。Opus 4.7への移行時にこれらのパラメータを削除済みの場合、追加の変更は不要です。
effortのデフォルトはhigh: Claude Opus 4.8のeffortパラメータのデフォルトは、Claude CodeやMessages APIを含むすべてのサーフェスでhighです。すでにeffortを明示的に設定している場合、設定は変更されません。コーディングや高自律性の作業には、xhighを明示的に設定してください。レイテンシとコストの予算に照らしてeffort設定を再評価してください。
100万トークンのコンテキストウィンドウがデフォルト: Claude Opus 4.8は、ベータヘッダーなし、長文コンテキストプレミアムなしで、デフォルトで完全な100万トークンのコンテキストウィンドウを提供します。クライアントが古いモデルとの互換性のためにコンテキストウィンドウのベータヘッダーを渡している場合、Claude Opus 4.8では削除できます。
会話途中のシステムメッセージ: Claude Opus 4.8は、messages配列内のユーザーターンの直後にrole: "system"メッセージを受け付けます(配置ルールに従います)。最初から適用される指示には、トップレベルのsystemフィールドを使用してください。Claude Opus 4.7を含む以前のモデルは、messages内のrole: "system"を400エラーで拒否します。指示を更新するためにメッセージ履歴全体を再構築するコードパスを維持している場合は、それらを簡素化し、以前のターンのプロンプトキャッシュヒットを維持できます。
拒否停止の詳細: 拒否レスポンスのstop_detailsオブジェクト(Claude Opus 4.7以降で利用可能)が公式にドキュメント化されました。モデルがリクエストを拒否した場合、既存のrefusal停止理由に加えて、拒否のカテゴリを識別します。ベータヘッダーは不要で、オプトアウトもありません。停止理由の処理を参照してください。
プロンプトキャッシングの最小値が低下: Claude Opus 4.8でキャッシュ可能なプロンプトの最小長は1,024トークンで、Claude Opus 4.7より低くなっています。Claude Opus 4.7でキャッシュするには短すぎたプロンプトも、コード変更なしでキャッシュエントリを作成できるようになりました。モデルごとの最小値については、プロンプトキャッシングを参照してください。
effortレベルの再キャリブレーション: 各effortレベルの背後にあるトークン割り当ては、Claude Opus 4.7と比較してClaude Opus 4.8で変更されています。mediumはやや多くの思考を許可し、highはやや少なく、xhighは大幅に多くなっています。Claude Opus 4.7のコストまたはレイテンシに対してeffortレベルを調整していた場合は、調整する前に同じレベルで再ベースライン化してください。Effortを参照してください。
claude-opus-4-7からclaude-opus-4-8に更新します(またはエイリアスを更新します)。effort設定を再評価します。デフォルトはすべてのサーフェスでhighです。コーディングや高自律性の作業には、xhighを明示的に設定してください。stop_detailsを読み取ることを確認します(Claude Opus 4.7以降で利用可能、現在は公式にドキュメント化されています)。Claude Opus 4.7は高度に自律的であり、長期的なエージェント作業、ナレッジワーク、ビジョンタスク、メモリタスクで非常に優れたパフォーマンスを発揮します。
Claude Opus 4.7は、同じ$5 / $25/MTokの価格設定で、既存のClaude Opus 4.6のプロンプトと評価に対してそのまま高いパフォーマンスを発揮するはずですが、移行時に知っておくべき動作およびAPIの変更がいくつかあります。以下を含む、Claude Opus 4.6と同じ機能セットをサポートしています。
# Opus への移行
model = "claude-opus-4-6" # Before
model = "claude-opus-4-7" # After拡張思考の削除: thinking: {type: "enabled", budget_tokens: N}はClaude Opus 4.7以降のモデルではサポートされなくなり、400エラーが返されます。適応的思考(thinking: {type: "adaptive"})に切り替え、effortパラメータを使用して思考の深さを制御してください。適応的思考はClaude Opus 4.7ではデフォルトでオフです。thinkingフィールドのないリクエストは思考なしで実行され、Opus 4.6の動作と一致します。有効にするにはthinking: {type: "adaptive"}を明示的に設定してください。
変更前(Claude Opus 4.6):
client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 10000},
messages=[{"role": "user", "content": "..."}],
)変更後(Claude Opus 4.7):
client.messages.create(
model="claude-opus-4-7",
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": "high"}, # or "max", "xhigh", "medium", "low"
messages=[{"role": "user", "content": "..."}],
)適応的思考はプロンプティングによって制御可能です。モデルが過剰または過少に思考する場合の調整ガイダンスについては、effortと思考の深さのキャリブレーションを参照してください。
サンプリングパラメータの削除: Claude Opus 4.7でtemperature、top_p、またはtop_kをデフォルト以外の値に設定すると、400エラーが返されます。最も安全な移行パスは、これらのパラメータをリクエストペイロードから完全に省略することです。Claude Opus 4.7でモデルの動作を誘導する推奨方法はプロンプティングです。決定性のためにtemperature = 0を使用していた場合、以前のモデルでも同一の出力が保証されていたわけではないことに注意してください。
思考コンテンツがデフォルトで省略: Claude Opus 4.7でも思考ブロックはレスポンスストリームに表示されますが、明示的にオプトインしない限り、そのthinkingフィールドは空です。これは、デフォルトで要約された思考テキストを返していたClaude Opus 4.6からの暗黙的な変更です。Claude Opus 4.7で要約された思考コンテンツを復元するには、thinking.displayを"summarized"に設定します。
thinking = {
"type": "adaptive",
"display": "summarized",
}Claude Opus 4.7のデフォルトは"omitted"です。製品が推論をユーザーにストリーミングしている場合、新しいデフォルトでは出力が始まる前に長い一時停止として表示されます。思考中の進捗を可視化するにはdisplay: "summarized"を設定してください。詳細は拡張思考を参照してください。
トークンカウントの更新: Claude Opus 4.7は新しいトークナイザーを使用しており、幅広いタスクでのパフォーマンス向上に貢献しています。新しいトークナイザーは、以前のモデルと比較してテキスト処理時に約1倍から1.35倍のトークンを使用する場合があります(コンテンツによって最大約35%増加)。
/v1/messages/count_tokensは、Claude Opus 4.6とは異なるトークン数をClaude Opus 4.7で返します。トークン効率はワークロードの形状によって異なる場合があります。
プロンプティングによる介入、task_budget、effortは、コストを管理し、適切なトークン使用を確保するのに役立ちます。これらの制御はモデルのインテリジェンスとトレードオフになる場合があります。コンパクショントリガーを含め、追加の余裕を持たせるためにmax_tokensパラメータを更新してください。Claude Opus 4.7は、長文コンテキストプレミアムなしの標準API価格で100万トークンのコンテキストウィンドウを提供します。
プレフィルの削除(Opus 4.6から継続): アシスタントメッセージのプレフィルは、Claude Opus 4.7で400エラーを返します。代わりに構造化出力、システムプロンプトの指示、またはoutput_config.formatを使用してください。
effortパラメータを使用すると、Claudeのインテリジェンスとトークン消費を調整し、能力と引き換えに速度向上とコスト削減を実現できます。コーディングやエージェントのユースケースでは新しいxhigh effortレベルから開始し、ほとんどのインテリジェンス重視のユースケースでは最低でもhigh effortを使用してください。他のeffortレベルも試して、トークン使用量とインテリジェンスをさらに調整してください。
max: 最大effortは一部のユースケースでパフォーマンス向上をもたらす可能性がありますが、トークン使用量の増加に対して収穫逓減を示す場合があります。この設定は過剰思考になりやすい場合もあります。インテリジェンスを要求するタスクで最大effortをテストしてください。xhigh(新規): 超高effortは、ほとんどのコーディングおよびエージェントのユースケースに最適な設定です。high: この設定はトークン使用量とインテリジェンスのバランスを取ります。ほとんどのインテリジェンス重視のユースケースでは、最低でもhigh effortを使用してください。medium: インテリジェンスとのトレードオフでトークン使用量を削減する必要がある、コスト重視のユースケースに適しています。low: インテリジェンスを重視しない、短く範囲が限定されたタスクやレイテンシ重視のワークロードに限定してください。effortは、これまでのどのOpusよりもこのモデルにとって重要です。アップグレード時には積極的に試してください。
Claude Opus 4.7には、Claude Opus 4.6と比較して、APIの破壊的変更ではないものの、プロンプトの更新やスキャフォールディングの削除が必要になる可能性のある動作上の違いがいくつかあります。
ユースケースによって応答の長さが変わる: Claude Opus 4.7は、固定の冗長度をデフォルトとするのではなく、タスクの複雑さをどう判断するかに基づいて応答の長さを調整します。これは通常、単純な検索ではより短い回答を、オープンエンドな分析でははるかに長い回答を意味します。
製品が特定のスタイルや出力の冗長度に依存している場合、プロンプトの調整が必要になることがあります。たとえば、冗長度を下げるには次を追加します:「簡潔で焦点を絞った応答を提供してください。必須でない文脈は省略し、例は最小限にしてください。」特定の種類の過剰な説明が見られる場合は、それを防ぐための的を絞った指示をプロンプトに追加してください。
Claudeが適切な簡潔さでコミュニケーションする方法を示すポジティブな例は、モデルに何をしてはいけないかを伝えるネガティブな例や指示よりも効果的な傾向があります。
より文字通りの指示追従: Claude Opus 4.7は、特に低いエフォートレベルにおいて、Claude Opus 4.6よりもプロンプトをより文字通りかつ明示的に解釈します。ある項目に対する指示を別の項目に暗黙的に一般化することはなく、明示されていないリクエストを推測することもありません。この文字通りの解釈の利点は、精度の向上と無駄な試行錯誤の削減です。慎重に調整されたプロンプト、構造化抽出、予測可能な動作が求められるパイプラインなどのAPIユースケースでは、一般的により良いパフォーマンスを発揮します。Claude Opus 4.7への移行では、プロンプトとハーネスの見直しが特に役立つ場合があります。
より直接的なトーン: 新しいモデルでは常にそうであるように、長文の文章スタイルが変わる可能性があります。Claude Opus 4.7はより直接的で意見がはっきりしており、Claude Opus 4.6の温かみのあるスタイルと比べて、肯定を前面に出した表現や絵文字が少なくなっています。製品が特定のボイスに依存している場合は、新しいベースラインに対してスタイルプロンプトを再評価してください。
エージェントトレースにおける組み込みの進捗更新: Claude Opus 4.7は、長いエージェントトレース全体を通じて、より定期的で高品質な更新をユーザーに提供します。中間ステータスメッセージを強制するスキャフォールディング(「ツール呼び出し3回ごとに進捗を要約する」など)を追加している場合は、削除を試してください。Claude Opus 4.7のユーザー向け更新の長さや内容がユースケースに適していないと感じる場合は、これらの更新がどのようなものであるべきかをプロンプトで明示的に記述し、例を提供してください。
デフォルトで生成されるサブエージェントが減少: Claude Opus 4.7は、デフォルトで生成するサブエージェントが少ない傾向があります。ただし、この動作はプロンプトによって制御可能です。サブエージェントが望ましい場合について、Claude Opus 4.7に明示的なガイダンスを与えてください。
より厳密なエフォート調整: Claude Opus 4.6から大きく変わり、Claude Opus 4.7はエフォートレベルを厳密に尊重します。特に低い側で顕著です。lowおよびmediumでは、モデルは求められた範囲に作業を限定し、それ以上のことは行いません。
これはレイテンシとコストの面では良いことですが、lowエフォートで実行される中程度に複雑なタスクでは、思考不足のリスクがあります。複雑な問題で浅い推論が見られる場合は、プロンプトで回避しようとするのではなく、エフォートをhighまたはxhighに上げてください。
レイテンシのためにエフォートをlowに保つ必要がある場合は、的を絞ったガイダンスを追加してください:「このタスクには多段階の推論が含まれます。応答する前に問題を慎重に考えてください。」Claude Opus 4.7の推奨エフォートレベルを参照してください。
デフォルトでツール呼び出しが減少: Claude Opus 4.7は、Claude Opus 4.6よりもツールを使用する頻度が低く、推論をより多く使用する傾向があります。これはほとんどの場合、より良い結果を生み出します。
ツール使用を増やすには、エフォート設定を上げてください。highまたはxhighのエフォート設定では、エージェント検索やコーディングにおいてツール使用が大幅に増加します。また、プロンプトを調整して、いつどのようにツールを適切に使用すべきかをモデルに明示的に指示することもできます。
リアルタイムのサイバーセキュリティセーフガード: Claude Opus 4.7で新たに追加され、禁止されているトピックや高リスクのトピックを含むリクエストは拒否される可能性があります。ペネトレーションテスト、脆弱性調査、レッドチーミングなどの正当なセキュリティ作業については、Cyber Verification Programに申請して制限の緩和をリクエストしてください。背景についてはセーフガード、警告、および異議申し立てを参照してください。
高解像度画像のサポート: Claude Opus 4.7は、高解像度画像をサポートする最初のClaudeモデルです。最大画像解像度は長辺で2576ピクセルとなり、以前のモデルの1568ピクセルから向上しています。これにより、ビジョン中心のワークロードでの性能向上が実現し、コンピュータ使用、スクリーンショットの理解、ドキュメント分析に特に価値があります。
高解像度サポートは自動的に適用され、ベータヘッダーやクライアント側のオプトインは不要です。計画すべき点が2つあります:
max_tokensとコスト予測を再調整するか、追加の精度が不要な場合は送信前にダウンサンプリングしてください。詳細については、Claude Opus 4.7での高解像度画像サポートを参照してください。
これらは必須ではありませんが、エクスペリエンスを向上させます:
max_tokensを再評価する: 同じテキストでもClaude Opus 4.7ではトークン数が多くなるため、コンパクショントリガーを含め、追加の余裕を持たせるようにmax_tokensパラメータを更新してください。プロンプトによる介入、task_budget、およびeffortは、コストを制御し、適切なトークン使用を確保するのに役立ちます。
トークン数の想定を監査する: クライアント側でトークンを推定するコードパスや、固定のトークン対文字比率を前提とするコードパスは、Claude Opus 4.7に対して再テストする必要があります。トークンカウントエンドポイントを使用して検証してください。
タスクバジェット(ベータ)を採用する: Claude Opus 4.7ではタスクバジェットが導入されています。これらのバジェットにより、思考、ツール呼び出し、ツール結果、最終出力を含む完全なエージェントループに対してClaudeが使用できるトークン数を通知できます。モデルは実行中のカウントダウンを確認し、それを使用して作業の優先順位を付け、バジェットが消費されるにつれてタスクを適切に完了させます。使用するには、ベータヘッダーtask-budgets-2026-03-13を設定し、出力設定に以下を追加してください:
output_config = {
"effort": "high",
"task_budget": {"type": "tokens", "total": 128000},
}ユースケースに応じて、さまざまなタスクバジェットを試す必要があるかもしれません。モデルに与えられたタスクバジェットが制限的すぎる場合、バジェットを制約として言及しながら、タスクをあまり徹底的に完了しない可能性があります。
速度よりも品質が重要なオープンエンドのエージェントタスクでは、タスクバジェットを設定しないでください。タスクバジェットは、モデルにトークン割り当て内で作業範囲を限定させる必要があるワークロードに限定してください。タスクバジェットの最小値は20kトークンです。
タスクバジェットはハードキャップではなく、モデルが認識している提案です。max_tokensとは異なります:
task_budget: 完全なエージェントループ全体に対する助言的な上限です。モデルはこれを認識し、ペース配分に使用します。max_tokens: 生成されるトークンに対するリクエストごとのハード上限です。モデルには渡されないため、モデルはこれを認識しません。モデルに自己調整させたい場合はtask_budgetを使用し、使用量を制限するハード上限としてはmax_tokensを使用してください。
maxまたはxhighエフォートでは大きなmax_tokensを設定する: Claude Opus 4.7をmaxまたはxhighエフォートで実行している場合は、モデルがサブエージェントやツール呼び出し全体で思考し行動する余裕を持てるように、大きな最大出力トークンバジェットを設定してください。64kトークンから始めて、そこから調整してください。
高解像度が不要な場合は画像をダウンサンプリングする: Claude Opus 4.7は最大2576px / 3.75MPの画像をサポートします。高解像度画像はより多くのトークンを使用します。追加の画像精度が不要な場合は、トークン使用量の増加を避けるために、Claudeに送信する前に画像をダウンサンプリングしてください。画像とビジョンを参照してください。
claude-opus-4-6からclaude-opus-4-7に更新する(またはエイリアスを更新する)。temperature、top_p、top_kを削除する。thinking: {type: "enabled", budget_tokens: N}をthinking: {type: "adaptive"}とエフォートパラメータに置き換える。max_tokensを再調整する。xhighまたはmaxエフォートを使用している場合は、開始点としてmax_tokensを少なくとも64kに上げる。Claude Opus 4.5、Opus 4.1(非推奨)、またはそれ以前のモデルから直接Claude Opus 4.7に移行する場合は、上記のOpus 4.7の変更点すべてに加えて、Opus 4.5とOpus 4.7の間で有効になったこのセクションの累積的な変更を適用してください。Opus 4.6から移行する場合は、上記のOpus 4.7セクションのみが必要です。
# Opus への移行
model = "claude-opus-4-5" # Before
model = "claude-opus-4-7" # Afterプリフィルの削除は、上記のOpus 4.7の破壊的変更で説明されています。
ツールパラメータのクォート処理: Claude Opus 4.6以降のモデルでは、ツール呼び出し引数のJSON文字列エスケープがわずかに異なる場合があります(例:Unicodeエスケープやスラッシュエスケープの処理の違い)。ツール呼び出しのinputをJSONパーサーを使用せずに生の文字列として解析している場合は、解析ロジックを確認してください。標準のJSONパーサー(json.loads()やJSON.parse()など)はこれらの違いを自動的に処理します。
これらの変更はOpus 4.7でのエクスペリエンスを向上させます。**(Opus 4.7では必須)**とマークされた項目は、Opus 4.6のリリース時にはオプションの推奨事項でしたが、現在は必須です。それ以外は引き続き推奨事項です。
アダプティブ思考への移行(Opus 4.7では必須): thinking: {type: "enabled", budget_tokens: N}はClaude Opus 4.7で400エラーを返します。thinking: {type: "adaptive"}に切り替え、エフォートパラメータを使用して思考の深さを制御してください。アダプティブ思考を参照してください。
response = client.beta.messages.create(
model="claude-opus-4-5",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 32000},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)この移行ではclient.beta.messages.createからclient.messages.createへの移行も行われることに注意してください。アダプティブ思考とエフォートはGA機能であり、ベータSDK名前空間やベータヘッダーは不要です。
エフォートのベータヘッダーを削除する: エフォートパラメータはGAになりました。リクエストからbetas=["effort-2025-11-24"]を削除してください。
きめ細かいツールストリーミングのベータヘッダーを削除する: きめ細かいツールストリーミングはGAになりました。リクエストからbetas=["fine-grained-tool-streaming-2025-05-14"]を削除してください。
インターリーブ思考のベータヘッダーを削除する: アダプティブ思考は、Claude Opus 4.7、Opus 4.6、Sonnet 4.6でインターリーブ思考を自動的に有効にします。リクエストからbetas=["interleaved-thinking-2025-05-14"]を削除してください。このヘッダーは、手動の拡張思考を使用するSonnet 4.6では引き続き機能しますが、手動モードは非推奨です。
output_config.formatへの移行: 構造化出力を使用している場合は、output_format={...}をoutput_config={"format": {...}}に更新してください。古いパラメータは引き続き機能しますが、非推奨であり、将来のモデルリリースで削除されます。
Opus 4.1(非推奨)またはそれ以前のモデルから直接Claude Opus 4.7に移行する場合は、このガイドの冒頭にあるClaude Opus 4.7の変更点と上記の累積的な変更に加えて、このセクションの追加の変更を適用してください。
# Opus 4.1から
model = "claude-opus-4-1-20250805" # Before
model = "claude-opus-4-7" # After
# Sonnet 3.7から
model = "claude-3-7-sonnet-20250219" # Before
model = "claude-opus-4-7" # Afterサンプリングパラメータを削除する
これはClaude 3.xモデルから移行する場合の破壊的変更です。
Claude Opus 4.7以降、temperature、top_p、またはtop_kをデフォルト以外の値に設定すると400エラーが返されます。最も安全な移行方法は、これらのパラメータをリクエストから完全に省略し、プロンプトを使用してモデルの動作を誘導することです。決定論のためにtemperature = 0を使用していた場合、それが同一の出力を保証したことはなかったことに注意してください。
# 変更前 - Claude 4以降のモデルではエラーになります
response = client.messages.create(
model="claude-3-7-sonnet-20250219",
temperature=0.7,
top_p=0.9, # Non-default sampling params return 400 on Opus 4.7
# ...
)
# 変更後
response = client.messages.create(
model="claude-opus-4-7",
# ...
)ツールバージョンを更新する
これはClaude 3.xモデルから移行する場合の破壊的変更です。
最新のツールバージョンに更新してください。undo_editコマンドを使用しているコードを削除してください。
# 変更前
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
# 変更後
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]text_editor_20250728とstr_replace_based_edit_toolを使用してください。詳細についてはテキストエディタツールのドキュメントを参照してください。code_execution_20250825にアップグレードしてください。移行手順についてはコード実行ツールのドキュメントを参照してください。refusal停止理由を処理する
アプリケーションを更新してrefusal停止理由を処理してください:
response = client.messages.create(...)
if response.stop_reason == "refusal":
# 拒否を適切に処理します
passmodel_context_window_exceeded停止理由を処理する
Claude 4.5以降のモデルは、リクエストされたmax_tokens制限ではなくコンテキストウィンドウの制限に達したために生成が停止した場合、model_context_window_exceeded停止理由を返します。この新しい停止理由を処理するようにアプリケーションを更新してください:
response = client.messages.create(...)
if response.stop_reason == "model_context_window_exceeded":
# コンテキストウィンドウの上限を適切に処理します
passツールパラメータの処理を確認する(末尾の改行)
Claude 4.5以降のモデルは、以前は削除されていたツール呼び出しの文字列パラメータの末尾の改行を保持します。ツールがツール呼び出しパラメータに対する厳密な文字列マッチングに依存している場合は、ロジックが末尾の改行を正しく処理することを確認してください。
動作変更に合わせてプロンプトを更新する
Claude 4以降のモデルは、より簡潔で直接的なコミュニケーションスタイルを持ち、明示的な指示を必要とします。最適化のガイダンスについてはプロンプトのベストプラクティスを確認してください。
token-efficient-tools-2025-02-19とoutput-128k-2025-02-19を削除してください。すべてのClaude 4以降のモデルにはトークン効率の良いツール使用が組み込まれており、これらのヘッダーは効果がありません。claude-opus-4-7に更新するoutput_config.formatを使用するthinking: {type: "enabled", budget_tokens: N}をthinking: {type: "adaptive"}とエフォートパラメータに置き換える(Opus 4.7では400を返す)effort-2025-11-24ベータヘッダーを削除する(エフォートはGAになりました)fine-grained-tool-streaming-2025-05-14ベータヘッダーを削除するinterleaved-thinking-2025-05-14ベータヘッダーを削除する(アダプティブ思考はインターリーブ思考を自動的に有効にします)output_formatをoutput_config.formatに移行する(該当する場合)temperature、top_p、top_kを削除する(デフォルト以外の値はOpus 4.7で400を返す)text_editor_20250728、code_execution_20250825)refusal停止理由を処理するmodel_context_window_exceeded停止理由を処理するtoken-efficient-tools-2025-02-19、output-128k-2025-02-19)を削除するClaude Sonnet 4.6は、強力なインテリジェンスと高速なパフォーマンスを兼ね備え、改善されたエージェント検索機能と、ウェブ検索またはウェブフェッチと併用した場合の無料コード実行を特徴としています。日常的なコーディング、分析、コンテンツタスクに最適です。
機能の完全な概要については、モデルの概要を参照してください。
Sonnet 4.6の価格は、入力トークン100万あたり3ドル、出力トークン100万あたり15ドルです。詳細についてはClaudeの価格を参照してください。
モデル名を更新する:
# Sonnet 4.5以降
model = "claude-sonnet-4-5" # Before
model = "claude-sonnet-4-6" # Afterアシスタントメッセージのプリフィルはサポートされなくなりました
これはSonnet 4.5以前から移行する場合の破壊的変更です。
アシスタントメッセージのプリフィルは、Sonnet 4.6で400エラーを返します。代わりに構造化出力、システムプロンプトの指示、またはoutput_config.formatを使用してください。
一般的なプリフィルのユースケースと移行方法:
出力フォーマットの制御(JSON/YAML出力の強制):分類タスクには構造化出力またはenumフィールドを持つツールを使用してください。
前置きの排除(「こちらが...」などのフレーズの削除):システムプロンプトに直接的な指示を追加してください:「前置きなしで直接応答してください。『こちらが...』『〜に基づいて...』などのフレーズで始めないでください。」
不適切な拒否の回避: Claudeは現在、適切な拒否がはるかに上手になっています。プリフィルなしでユーザーメッセージに明確なプロンプトを記述すれば十分なはずです。
継続(中断された応答の再開):継続をユーザーメッセージに移動してください:「前回の応答は中断され、[previous_response]で終わりました。中断したところから続けてください。」
コンテキストの補充 / ロールの一貫性(長い会話でのコンテキストのリフレッシュ):以前はプリフィルされたアシスタントのリマインダーだったものを、代わりにユーザーターンに挿入してください。
ツールパラメータのJSONエスケープが異なる場合があります
これはSonnet 4.5以前から移行する場合の破壊的変更です。
ツールパラメータのJSON文字列エスケープは、以前のモデルと異なる場合があります。標準のJSONパーサーはこれを自動的に処理しますが、カスタムの文字列ベースの解析は更新が必要な場合があります。
サンプリングパラメータを更新する
これはClaude 3.xモデルから移行する場合の破壊的変更です。
temperatureまたはtop_pのいずれか一方のみを使用し、両方は使用しないでください。
ツールバージョンを更新する
これはClaude 3.xモデルから移行する場合の破壊的変更です。
最新のツールバージョン(text_editor_20250728、code_execution_20250825)に更新してください。undo_editコマンドを使用しているコードを削除してください。
refusal停止理由を処理する
アプリケーションを更新してrefusal停止理由を処理してください。
動作変更に合わせてプロンプトを更新する
Claude 4モデルは、より簡潔で直接的なコミュニケーションスタイルを持っています。最適化のガイダンスについてはプロンプトのベストプラクティスを確認してください。
fine-grained-tool-streaming-2025-05-14ベータヘッダーを削除する: きめ細かいツールストリーミングはSonnet 4.6でGAになり、ベータヘッダーは不要になりました。output_formatをoutput_config.formatに移行する: output_formatパラメータは非推奨です。代わりにoutput_config.formatを使用してください。Sonnet 4.5からSonnet 4.6への移行を検討してください。Sonnet 4.6は同じ価格帯でより高いインテリジェンスを提供します。
Sonnet 4.6は、エフォートパラメータがなかったSonnet 4.5とは対照的に、デフォルトでhighのエフォートレベルになります。Sonnet 4.5からSonnet 4.6に移行する際は、エフォートパラメータの調整を検討してください。明示的に設定しない場合、デフォルトのエフォートレベルではレイテンシが高くなる可能性があります。
Sonnet 4.5で拡張思考を使用していない場合は、Sonnet 4.6でも使用せずに続行できます。ユースケースに適したレベルにエフォートを明示的に設定する必要があります。思考を無効にしたlowエフォートでは、拡張思考なしのSonnet 4.5と比較して同等以上のパフォーマンスが期待できます。
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
output_config={"effort": "low"},
messages=[{"role": "user", "content": "Your prompt here"}],
)Sonnet 4.5でbudget_tokensを使用した拡張思考を使用している場合、Sonnet 4.6でも引き続き機能しますが、非推奨です。エフォートパラメータを使用したアダプティブ思考に移行してください。
アダプティブ思考は、Sonnet 4.6でのbudget_tokensの推奨される代替手段です。特に以下のワークロードパターンに適しています:
highエフォートから始めてください。レイテンシやトークン使用量が懸念される場合は、mediumにスケールダウンしてください。アダプティブ思考を使用する場合は、タスクでmediumとhighのエフォートを評価してください。適切なレベルは、品質、レイテンシ、トークン使用量の間のワークロードのトレードオフによって異なります。
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"},
messages=[{"role": "user", "content": "Your prompt here"}],
)アダプティブ思考で一貫性のない動作や品質の低下が見られる場合は、まずエフォート設定を下げるか、max_tokensをハードリミットとして使用してみてください。budget_tokensを使用した拡張思考はSonnet 4.6でも引き続き機能しますが、非推奨であり、推奨されなくなりました。
移行中に一時的にbudget_tokensを維持する必要がある場合、約16kトークンのバジェットは、トークン使用量の暴走リスクなしに、より難しい問題に対する余裕を提供します。この設定は非推奨であり、将来のモデルリリースで削除されます。
エージェントコーディング、フロントエンドデザイン、ツールを多用するワークフロー、複雑なエンタープライズワークフローでは、mediumエフォートから始めてください。レイテンシが高すぎると感じる場合は、エフォートをlowに下げることを検討してください。より高いインテリジェンスが必要な場合は、エフォートをhighに上げるか、Opus 4.7への移行を検討してください。
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=16384,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "medium"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)チャット、コンテンツ生成、検索、分類、その他の非コーディングタスクでは、拡張思考を使用したlowエフォートから始めてください。より深い処理が必要な場合は、エフォートをmediumに上げてください。
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "low"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)claude-sonnet-4-6に更新するoutput_config.formatを使用するtext_editor_20250728、code_execution_20250825)に更新する。レガシーバージョンはサポートされていません(3.xから移行する場合)undo_editコマンドを使用しているコードを削除する(該当する場合)temperatureまたはtop_pのいずれか一方のみを使用し、両方は使用しない(3.xから移行する場合)refusal停止理由を処理するfine-grained-tool-streaming-2025-05-14ベータヘッダーを削除する(GAになりました)output_formatをoutput_config.formatに移行するthinking: {type: "enabled", budget_tokens: N}からエフォートパラメータを使用したthinking: {type: "adaptive"}に移行する(budget_tokensは非推奨であり、将来のリリースで削除されます)Claude Sonnet 4.5は、強力なインテリジェンスと高速なパフォーマンスを兼ね備えており、日常的なコーディング、分析、コンテンツタスクに最適です。
機能の完全な概要については、モデルの概要を参照してください。
Sonnet 4.5の価格は、入力トークン100万あたり3ドル、出力トークン100万あたり15ドルです。詳細についてはClaudeの価格を参照してください。
モデル名を更新する:
# Sonnet 3.7 から
model = "claude-3-7-sonnet-20250219" # Before
model = "claude-sonnet-4-5-20250929" # Afterこれらの破壊的変更は、Claude 3.x Sonnetモデルから移行する場合に適用されます。
サンプリングパラメータを更新する
これはClaude 3.xモデルから移行する場合の破壊的変更です。
temperatureまたはtop_pのいずれか一方のみを使用し、両方は使用しないでください。
ツールバージョンを更新する
これはClaude 3.xモデルから移行する場合の破壊的変更です。
最新のツールバージョン(text_editor_20250728、code_execution_20250825)に更新してください。undo_editコマンドを使用しているコードを削除してください。
refusal停止理由を処理する
アプリケーションを更新してrefusal停止理由を処理してください。
動作変更に合わせてプロンプトを更新する
Claude 4モデルは、より簡潔で直接的なコミュニケーションスタイルを持っています。最適化のガイダンスについてはプロンプトのベストプラクティスを確認してください。
claude-sonnet-4-5-20250929 に更新するtext_editor_20250728、code_execution_20250825)に更新する。レガシーバージョンはサポートされていません(3.xから移行する場合)undo_edit コマンドを使用しているコードをすべて削除する(該当する場合)temperature または top_p のいずれか一方のみを使用し、両方は使用しないようにする(3.xから移行する場合)refusal 停止理由を処理するClaude Haiku 4.5 は、最速かつ最も高性能な Haiku モデルで、フロンティアに近いパフォーマンスを備えており、インタラクティブなアプリケーションや大量処理にプレミアムモデル品質を提供します。
機能の完全な概要については、モデルの概要を参照してください。
Haiku 4.5 の価格は、入力トークン100万あたり1ドル、出力トークン100万あたり5ドルです。詳細については、Claude の価格を参照してください。
モデル名を更新する:
# Haiku 3.5から
model = "claude-3-5-haiku-20241022" # Before
model = "claude-haiku-4-5-20251001" # After新しいレート制限を確認する: Haiku 4.5 には Haiku 3.5 とは別のレート制限があります。詳細については、レート制限のドキュメントを参照してください。
コーディングや推論タスクでパフォーマンスを大幅に向上させるには、thinking: {type: "enabled", budget_tokens: N} で拡張思考を有効にすることを検討してください。
拡張思考はプロンプトキャッシングの効率に影響します。
拡張思考は Claude 4.6 モデルでは非推奨となり、Claude Opus 4.7 では削除されています。新しいモデルを使用する場合は、代わりに適応的思考を使用してください。
新機能を確認する: コンテキスト認識、出力容量の増加(64kトークン)、より高い知能、速度の向上の詳細については、モデルの概要を参照してください。
これらの破壊的変更は、Claude 3.x Haiku モデルから移行する場合に適用されます。
サンプリングパラメータを更新する
これは Claude 3.x モデルから移行する場合の破壊的変更です。
temperature または top_p のいずれか一方のみを使用し、両方は使用しないでください。
ツールバージョンを更新する
これは Claude 3.x モデルから移行する場合の破壊的変更です。
最新のツールバージョン(text_editor_20250728、code_execution_20250825)に更新してください。undo_edit コマンドを使用しているコードはすべて削除してください。
refusal 停止理由を処理する
アプリケーションを更新して、refusal 停止理由を処理できるようにしてください。
動作の変更に合わせてプロンプトを更新する
Claude 4 モデルは、より簡潔で直接的なコミュニケーションスタイルを持っています。最適化のガイダンスについては、プロンプトのベストプラクティスを確認してください。
claude-haiku-4-5-20251001 に更新するtext_editor_20250728、code_execution_20250825)に更新する。レガシーバージョンはサポートされていませんundo_edit コマンドを使用しているコードをすべて削除する(該当する場合)temperature または top_p のいずれか一方のみを使用し、両方は使用しないようにするrefusal 停止理由を処理するWas this page helpful?