Loading...
  • ビルド
  • 管理
  • モデルと料金
  • クライアントSDK
  • APIリファレンス
Search...
⌘K
モデル
モデル概要モデルの選択Claude Opus 4.7の新機能移行ガイドモデルの廃止モデルカードシステムプロンプト
料金
料金
Log in
移行ガイド
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
モデルと料金/モデル

移行ガイド

Claude Opus 4.7およびClaude 4.6モデルへの移行ガイド(以前のClaudeバージョンから)

Was this page helpful?

  • Claude Opus 4.7への移行
  • Opus 4.5以前からClaude Opus 4.7への移行
  • Claude 4.1以前からの移行
  • 移行チェックリスト(Opus 4.5以前から)
  • Claude Sonnet 4.6への移行
  • Sonnet 4.5からの移行
  • Sonnet 4.6移行チェックリスト
  • Claude Sonnet 4.5への移行
  • Sonnet 4.5移行チェックリスト
  • Claude Haiku 4.5への移行
  • Haiku 4.5移行チェックリスト

このガイドはMessages APIコードの移行をカバーしています。Claude Managed Agentsを使用している場合、モデル名の更新以外の変更は必要ありません。

Claude Opus 4.7への移行

Claude Opus 4.7は、現在利用可能な最も高性能な汎用モデルです。高度に自律的で、長期的なエージェント作業、知識作業、ビジョンタスク、メモリタスクで例外的なパフォーマンスを発揮します。Claude Opus 4.7は、既存のClaude Opus 4.6プロンプトと評価に対して、同じ$5 / $25(MTok当たり)の価格設定で優れた既製パフォーマンスを備えているはずですが、移行時に知っておく価値のある動作とAPI変更がいくつかあります。Claude Opus 4.6と同じ機能セットをサポートしており、1Mトークンコンテキストウィンドウ(長コンテキストプレミアムなしの標準API価格)、128kの最大出力トークン、適応的思考、プロンプトキャッシング、バッチ処理、Files API、PDFサポート、ビジョン、およびサーバー側とクライアント側のツール(bash、コード実行、コンピュータ使用、テキストエディタ、ウェブ検索、ウェブフェッチ、MCPコネクタ、メモリ)の完全なセットが含まれます。

Claude APIスキルでこの移行を自動化します。 Claude Codeで、/claude-api migrateを実行して、バンドルされたClaude APIスキルを呼び出します:

/claude-api migrate this project to claude-opus-4-7

このスキルは、モデルIDスワップ、破壊的なパラメータ変更、プリフィル置換、および以下で説明されている努力キャリブレーションをコードベース全体に適用し、手動で検証するアイテムのチェックリストを生成します。ファイルを編集する前に、移行スコープ(作業ディレクトリ全体、サブディレクトリ、または特定のファイルリスト)を確認するよう求めます。

モデル名を更新する

# Opus移行
model = "claude-opus-4-6"  # 前
model = "claude-opus-4-7"  # 後

破壊的な変更

  1. 拡張思考が削除されました: thinking: {type: "enabled", budget_tokens: N}はClaude Opus 4.7以降のモデルではサポートされなくなり、400エラーが返されます。適応的思考(thinking: {type: "adaptive"})に切り替えて、努力パラメータを使用して思考の深さを制御します。適応的思考はClaude Opus 4.7ではデフォルトでオフです:thinkingフィールドのないリクエストは思考なしで実行され、Opus 4.6の動作と一致します。適応的思考を有効にするには、thinking: {type: "adaptive"}を明示的に設定します。

    前(Claude Opus 4.6):

    client.messages.create(
        model="claude-opus-4-6",
        max_tokens=64000,
        thinking={"type": "enabled", "budget_tokens": 32000},
        messages=[{"role": "user", "content": "..."}],
    )

努力レベルの選択

努力パラメータを使用すると、Claudeのインテリジェンスとトークン支出をチューニングでき、機能をより高速な速度とより低いコストとトレードオフできます。コーディングとエージェント使用ケースの場合は新しいxhigh努力レベルから始め、ほとんどのインテリジェンス感度の高い使用ケースでは最小限のhigh努力を使用します。他の努力レベルを試して、トークン使用とインテリジェンスをさらにチューニングします:

  • max: 最大努力は一部の使用ケースでパフォーマンス向上をもたらすことができますが、トークン使用の増加から収益が減少する可能性があります。この設定は過度な思考の傾向がある場合もあります。インテリジェンスが必要なタスクに対して最大努力をテストすることをお勧めします。
  • xhigh(新規): 超高努力は、ほとんどのコーディングとエージェント使用ケースに最適な設定です。
  • high: この設定はトークン使用とインテリジェンスのバランスを取ります。ほとんどのインテリジェンス感度の高い使用ケースでは、最小限のhigh努力をお勧めします。
  • medium: トークン使用を削減する必要があるコスト感度の高い使用ケースに適しており、インテリジェンスとのトレードオフがあります。
  • low: インテリジェンス感度が低い短い、スコープ付きタスクとレイテンシー感度の高いワークロード用に予約します。

努力がこのモデルでは以前のOpusよりも重要になると予想され、アップグレード時に積極的に実験することをお勧めします。

動作の変更

Claude Opus 4.7はClaude Opus 4.6とは異なる動作をしていますが、APIの破壊的な変更ではありませんが、プロンプト更新またはスキャフォルディング削除が必要な場合があります。

  1. 応答長はユースケースによって異なります: Claude Opus 4.7は、固定の冗長性にデフォルトするのではなく、タスクがどの程度複雑であると判断するかに応じて応答長をキャリブレーションします。これは通常、単純なルックアップではより短い回答を意味し、オープンエンドの分析ではより長い回答を意味します。製品が特定のスタイルまたは出力の冗長性に依存している場合、プロンプトをチューニングする必要があります。例として、冗長性を減らすために、「簡潔で焦点を絞った応答を提供します。非本質的なコンテキストをスキップし、例を最小限に保ちます。」を追加できます。特定の種類の冗長性の例が見られる場合(つまり、過度な説明)、プロンプトに追加の指示を追加してそれらを防ぐことができます。Claudeが適切なレベルの簡潔性で通信できる方法を示す肯定的な例は、否定的な例またはモデルに何をしないかを伝える指示よりも効果的である傾向があります。

  2. より文字通りの指示に従う: Claude Opus 4.7は、特に低い努力レベルでは、Claude Opus 4.6よりもプロンプトをより文字通りに明示的に解釈します。1つのアイテムから別のアイテムへの指示を静かに一般化することはなく、あなたが行わなかったリクエストを推測することもありません。この文字通りの利点は精度と少ないスラッシュです。一般的にAPIの使用ケースではより良いパフォーマンスを発揮し、慎重にチューニングされたプロンプト、構造化抽出、および予測可能な動作が必要なパイプラインがあります。プロンプトとハーネスレビューは、Claude Opus 4.7への移行に特に役立つ場合があります。

  3. より直接的なトーン: 他の新しいモデルと同様に、長形式の執筆の散文スタイルは変わる可能性があります。Claude Opus 4.7はより直接的で独断的であり、検証前向きのフレーズが少なく、Claude Opus 4.6のより温かいスタイルよりも絵文字が少なくなっています。製品が特定の声に依存している場合、新しいベースラインに対してスタイルプロンプトを再評価します。

  4. エージェントトレースに組み込まれた進捗更新: Claude Opus 4.7は、長いエージェントトレース全体を通じて、より定期的で高品質の更新をユーザーに提供します。暫定的なステータスメッセージを強制するためのスキャフォルディングを追加した場合(「3つのツール呼び出しごとに進捗を要約」)、それを削除してみてください。Claude Opus 4.7のユーザー向けの更新の長さまたはコンテンツがユースケースに対して適切にキャリブレーションされていないことに気付いた場合、これらの更新がどのように見えるべきかをプロンプトで明示的に説明し、例を提供します。

  5. デフォルトでスポーンされるサブエージェントが少ない: Claude Opus 4.7はデフォルトでスポーンするサブエージェントが少ない傾向があります。ただし、この動作はプロンプティングを通じて操作可能です。Claude Opus 4.7にサブエージェントが望ましい場合についての明示的なガイダンスを提供します。

推奨される変更

これらは必須ではありませんが、エクスペリエンスを改善します:

  1. max_tokensを再評価する: 同じテキストがClaude Opus 4.7でより高いトークンカウントを生成するため、max_tokensパラメータを更新して追加のヘッドルームを提供することをお勧めします。圧縮トリガーを含めます。プロンプティング介入、task_budget、およびeffortは、コストを制御し、適切なトークン使用を確保するのに役立ちます。

  2. トークンカウント予想を監査する: クライアント側でトークンを推定するか、固定トークン対文字比を想定するコードパスは、Claude Opus 4.7に対して再テストする必要があります。トークンカウントエンドポイントを使用して検証します。

  3. タスク予算(ベータ)を採用する: Claude Opus 4.7はタスク予算を導入します。これらの予算により、思考、ツール呼び出し、ツール結果、および最終出力を含む完全なエージェントループに対してClaudeが持つトークン数を通知できます。モデルは実行中のカウントダウンを見て、予算が消費されるにつれて作業を優先順位付けし、タスクを優雅に完了するために使用します。使用するには、ベータヘッダーtask-budgets-2026-03-13を設定し、出力設定に以下を追加します:

    output_config = {
        "effort": "high",
        "task_budget": {"type": "tokens", "total": 128000},
    }

移行チェックリスト

  • モデル名をclaude-opus-4-6からclaude-opus-4-7に更新します(またはエイリアスを更新します)。
  • リクエストペイロードからtemperature、top_p、およびtop_kを削除します。
  • thinking: {type: "enabled", budget_tokens: N}をthinking: {type: "adaptive"}と努力パラメータに置き換えます。
  • アシスタントメッセージプリフィルを削除します。
  • UIが思考コンテンツを表示する場合、思考要約に明示的にオプトインします。
  • 更新されたトークン化の下で、エンドツーエンドのコストとレイテンシーを再ベンチマークします。
  • 更新されたトークン化を考慮してmax_tokensを再チューニングします。

Opus 4.5以前からClaude Opus 4.7への移行

Claude Opus 4.5、Opus 4.1、またはそれ以前のモデルからClaude Opus 4.7に直接移行する場合、**上記のOpus 4.7の変更すべて**と、Opus 4.5とOpus 4.7の間に有効になったこのセクションの累積変更を適用します。Opus 4.6から移行する場合、上記のOpus 4.7セクションのみが必要です。

モデル名を更新する

# Opus移行
model = "claude-opus-4-5"  # 前
model = "claude-opus-4-7"  # 後

破壊的な変更

  1. プリフィル削除は、上記のOpus 4.7の破壊的な変更でカバーされています。

  2. ツールパラメータクォート: Claude Opus 4.6以降のモデルは、ツール呼び出し引数でわずかに異なるJSONストリングエスケープを生成する可能性があります(Unicodeエスケープまたはフォワードスラッシュエスケープの処理が異なります)。ツール呼び出しinputをJSONパーサーを使用するのではなく生の文字列として解析する場合、解析ロジックを確認します。標準JSONパーサー(json.loads()またはJSON.parse()など)は、これらの違いを自動的に処理します。

推奨される変更

これらの変更はOpus 4.7でのエクスペリエンスを改善します。**(Opus 4.7で必須)**とマークされたアイテムは、Opus 4.6の起動時にはオプションの推奨事項でしたが、現在は必須です。残りは推奨されたままです。

  1. 適応的思考に移行する(Opus 4.7で必須): thinking: {type: "enabled", budget_tokens: N}はClaude Opus 4.7で400エラーを返します。thinking: {type: "adaptive"}に切り替えて、努力パラメータを使用して思考の深さを制御します。適応的思考を参照してください。

Claude 4.1以前からの移行

Opus 4.1、Sonnet 4(非推奨)、またはそれ以前のモデルからClaude Opus 4.7に直接移行する場合、このガイドの上部にあるClaude Opus 4.7の変更と上記の累積変更、およびこのセクションの追加の変更を適用します。

# Opus 4.1から
model = "claude-opus-4-1-20250805"  # 前
model = "claude-opus-4-7"  # 後

# Sonnet 4から
model = "claude-sonnet-4-20250514"  # 前
model = "claude-opus-4-7"  # 後

# Sonnet 3.7から
model = "claude-3-7-sonnet-20250219"  # 前
model = "claude-opus-4-7"  # 後

追加の破壊的な変更

  1. サンプリングパラメータを削除する

    これはClaude 3.xモデルから移行する場合の破壊的な変更です。

    Claude Opus 4.7以降、temperature、top_p、またはtop_kをデフォルト以外の値に設定すると、400エラーが返されます。最も安全な移行パスは、これらのパラメータをリクエストから完全に省略し、プロンプティングを使用してモデルの動作をガイドすることです。決定論のためにtemperature = 0を使用していた場合、同一の出力を保証したことはないことに注意してください。

    Python
    # 前 - これはClaude 4+モデルでエラーになります
    response = client.messages.create(
        model="claude-3-7-sonnet-20250219",
        temperature=0.7,
        top_p=0.9,  # デフォルト以外のサンプリングパラメータはOpus 4.7で400を返します
        # ...
    )
    
    # 後
    response = client.messages.create(
        model="claude-opus-4-7",
        # ...
    )

追加の推奨される変更

  • レガシーベータヘッダーを削除する: token-efficient-tools-2025-02-19とoutput-128k-2025-02-19を削除します。すべてのClaude 4+モデルには組み込みのトークン効率的なツール使用があり、これらのヘッダーは効果がありません。

移行チェックリスト(Opus 4.5以前から)

  • モデルIDをclaude-opus-4-7に更新します
  • すべてのOpus 4.7の破壊的な変更を適用します(拡張思考削除、サンプリングパラメータ削除、思考表示デフォルトで省略、トークン化更新)
  • 破壊的: アシスタントメッセージプリフィルを削除します(400エラーを返します)。代わりに構造化出力またはoutput_config.formatを使用します
  • Opus 4.7で破壊的: thinking: {type: "enabled", budget_tokens: N}をthinking: {type: "adaptive"}と努力パラメータに置き換えます(Opus 4.7で400を返します)
  • ツール呼び出しJSONパーサーが標準JSONパーサーを使用することを確認します
  • effort-2025-11-24ベータヘッダーを削除します(努力はGAになりました)
  • fine-grained-tool-streaming-2025-05-14ベータヘッダーを削除します

Claude Sonnet 4.6への移行

Claude Sonnet 4.6は、強力なインテリジェンスと高速なパフォーマンスを組み合わせており、改善されたエージェント検索機能とウェブ検索またはウェブフェッチで使用する場合の無料コード実行を備えています。日常的なコーディング、分析、およびコンテンツタスクに最適です。

機能の完全な概要については、モデル概要を参照してください。

Sonnet 4.6の価格は、入力トークンあたり100万あたり$3、出力トークンあたり100万あたり$15です。詳細については、Claude価格を参照してください。

モデル名を更新する:

# Sonnet 4.5から
model = "claude-sonnet-4-5"  # 前
model = "claude-sonnet-4-6"  # 後

# Sonnet 4から
model = "claude-sonnet-4-20250514"  # 前
model = "claude-sonnet-4-6"  # 後

破壊的変更

Sonnet 4.5からの移行時

  1. アシスタントメッセージのプリフィリングはサポートされなくなりました

    これはSonnet 4.5以前からの移行時の破壊的変更です。

    Sonnet 4.6でアシスタントメッセージをプリフィルすると、400エラーが返されます。代わりに構造化出力、システムプロンプト指示、またはoutput_config.formatを使用してください。

    一般的なプリフィル使用例と移行方法:

    • 出力フォーマットの制御(JSON/YAML出力の強制):構造化出力またはenumフィールドを持つツールを分類タスクに使用してください。

    • 前置きの削除(「Here is...」というフレーズの削除):システムプロンプトに直接指示を追加してください:「前置きなしで直接応答してください。「Here is...」、「Based on...」などのフレーズで始めないでください。」

    • 不適切な拒否の回避: Claudeは現在、適切な拒否がはるかに得意です。プリフィルなしのユーザーメッセージでの明確なプロンプトで十分です。

    • 継続(中断された応答の再開):継続をユーザーメッセージに移動してください:「前の応答が中断され、[previous_response]で終了しました。中断したところから続けてください。」

Claude 3.xからの移行時

  1. サンプリングパラメータを更新してください

    これはClaude 3.xモデルからの移行時の破壊的変更です。

    temperatureまたはtop_pのいずれか一方のみを使用してください。両方は使用しないでください。

  2. ツールバージョンを更新してください

    これはClaude 3.xモデルからの移行時の破壊的変更です。

    最新のツールバージョン(text_editor_20250728、code_execution_20250825)に更新してください。undo_editコマンドを使用しているコードを削除してください。

  3. refusalストップ理由を処理してください

    アプリケーションを更新して、refusalストップ理由を処理してください。

  4. 動作変更に対応するようプロンプトを更新してください

推奨される変更

  1. fine-grained-tool-streaming-2025-05-14ベータヘッダーを削除してください: きめ細かいツールストリーミングはSonnet 4.6でGAになり、ベータヘッダーは不要になりました。
  2. output_formatをoutput_config.formatに移行してください: output_formatパラメータは非推奨です。代わりにoutput_config.formatを使用してください。

Sonnet 4.5からの移行

Sonnet 4.5からSonnet 4.6への移行を検討してください。Sonnet 4.6は同じ価格ポイントでより高い知能を提供します。

Sonnet 4.6はデフォルトでhighの努力レベルに設定されており、努力パラメータがなかったSonnet 4.5とは対照的です。Sonnet 4.5からSonnet 4.6に移行する際に、努力パラメータの調整を検討してください。明示的に設定されていない場合、デフォルトの努力レベルでより高いレイテンシが発生する可能性があります。

拡張思考を使用していない場合

Sonnet 4.5で拡張思考を使用していない場合、Sonnet 4.6でも使用しなくても構いません。ユースケースに適した努力レベルを明示的に設定する必要があります。思考が無効なlow努力では、拡張思考がないSonnet 4.5と比較して、同等またはより良いパフォーマンスが期待できます。

拡張思考を使用している場合

Sonnet 4.5でbudget_tokensを使用した拡張思考を使用している場合、Sonnet 4.6でも機能していますが非推奨です。適応的思考に努力パラメータで移行してください。

適応的思考への移行

適応的思考はSonnet 4.6のbudget_tokensの推奨される置き換えです。以下のワークロードパターンに特に適しています:

  • 自律的マルチステップエージェント: 要件をワーキングソフトウェアに変えるコーディングエージェント、データ分析パイプライン、モデルが多くのステップにわたって独立して実行されるバグ検出。適応的思考により、モデルはステップごとに推論を調整でき、より長い軌跡にわたってパスを保つことができます。これらのワークロードでは、high努力から開始してください。レイテンシまたはトークン使用量が懸念される場合は、mediumにスケールダウンしてください。
  • コンピュータ使用エージェント: Sonnet 4.6は適応モードを使用してコンピュータ使用評価で業界最高の精度を達成しました。
  • バイモーダルワークロード: 簡単なクエリでは思考をスキップし、複雑なものでは深く推論する、簡単なタスクと難しいタスクの混合。

適応的思考を使用する場合、タスクでmediumとhigh努力を評価してください。適切なレベルはワークロードの品質、レイテンシ、トークン使用量のトレードオフに依存します。

適応的思考で一貫性のない動作または品質の低下が見られる場合は、努力設定を下げるか、最初にmax_tokensをハードリミットとして使用してみてください。budget_tokensを使用した拡張思考はSonnet 4.6でも機能していますが、非推奨であり、推奨されなくなりました。

移行中に budget_tokens を保持する

移行中にbudget_tokensを一時的に保持する必要がある場合、約16kトークンの予算は、実行不可能なトークン使用量のリスクなしに、より難しい問題に対応するための余裕を提供します。この構成は非推奨であり、将来のモデルリリースで削除されます。

コーディングとエージェント的なユースケース

エージェント的なコーディング、フロントエンド設計、ツール集約的なワークフロー、複雑なエンタープライズワークフローの場合、medium努力から開始してください。レイテンシが高すぎる場合は、努力をlowに減らすことを検討してください。より高い知能が必要な場合は、努力をhighに増やすか、Opus 4.7への移行を検討してください。

チャットと非コーディングのユースケース

チャット、コンテンツ生成、検索、分類、その他の非コーディングタスクの場合、拡張思考でlow努力から開始してください。より深い内容が必要な場合は、努力をmediumに増やしてください。

Sonnet 4.6移行チェックリスト

  • モデルIDをclaude-sonnet-4-6に更新してください
  • 破壊的: アシスタントメッセージのプリフィリングを削除してください。代わりに構造化出力またはoutput_config.formatを使用してください
  • 破壊的: ツールパラメータのJSONパース処理がエスケープの違いに対応していることを確認してください
  • 破壊的: ツールバージョンを最新(text_editor_20250728、code_execution_20250825)に更新してください。レガシーバージョンはサポートされていません(3.xから移行する場合)
  • 破壊的: undo_editコマンドを使用しているコードを削除してください(該当する場合)
  • 破壊的: サンプリングパラメータをtemperatureまたはtop_pのいずれか一方のみを使用するように更新してください(3.xから移行する場合)
  • アプリケーションで新しいストップ理由を処理してください

Claude Sonnet 4.5への移行

Claude Sonnet 4.5は強力な知能と高速なパフォーマンスを組み合わせており、日常的なコーディング、分析、コンテンツタスクに理想的です。

機能の完全な概要については、モデル概要を参照してください。

Sonnet 4.5の価格は入力トークンあたり100万トークンあたり3ドル、出力トークンあたり100万トークンあたり15ドルです。詳細についてはClaude価格を参照してください。

モデル名を更新してください:

# Sonnet 4から
model = "claude-sonnet-4-20250514"  # 前
model = "claude-sonnet-4-5-20250929"  # 後

# Sonnet 3.7から
model = "claude-3-7-sonnet-20250219"  # 前
model = "claude-sonnet-4-5-20250929"  # 後

破壊的変更

これらの破壊的変更はClaude 3.x Sonnetモデルからの移行時に適用されます。

  1. サンプリングパラメータを更新してください

    これはClaude 3.xモデルからの移行時の破壊的変更です。

    temperatureまたはtop_pのいずれか一方のみを使用してください。両方は使用しないでください。

  2. ツールバージョンを更新してください

    これはClaude 3.xモデルからの移行時の破壊的変更です。

    最新のツールバージョン(text_editor_20250728、code_execution_20250825)に更新してください。undo_editコマンドを使用しているコードを削除してください。

  3. refusalストップ理由を処理してください

    アプリケーションを更新して、refusalストップ理由を処理してください。

  4. 動作変更に対応するようプロンプトを更新してください

Sonnet 4.5移行チェックリスト

  • モデルIDをclaude-sonnet-4-5-20250929に更新してください
  • 破壊的: ツールバージョンを最新(text_editor_20250728、code_execution_20250825)に更新してください。レガシーバージョンはサポートされていません(3.xから移行する場合)
  • 破壊的: undo_editコマンドを使用しているコードを削除してください(該当する場合)
  • 破壊的: サンプリングパラメータをtemperatureまたはtop_pのいずれか一方のみを使用するように更新してください(3.xから移行する場合)
  • アプリケーションで新しいrefusalストップ理由を処理してください
  • プロンプティングベストプラクティスに従ってプロンプトを確認および更新してください
  • 複雑な推論タスクに対して拡張思考を有効にすることを検討してください

Claude Haiku 4.5への移行

Claude Haiku 4.5は最速で最も知能的なHaikuモデルであり、ほぼフロンティアレベルのパフォーマンスを提供し、インタラクティブアプリケーションと大量処理に対応するプレミアムモデル品質を提供します。

機能の完全な概要については、モデル概要を参照してください。

Haiku 4.5の価格は入力トークンあたり100万トークンあたり1ドル、出力トークンあたり100万トークンあたり5ドルです。詳細についてはClaude価格を参照してください。

モデル名を更新してください:

# Haiku 3.5から
model = "claude-3-5-haiku-20241022"  # 前
model = "claude-haiku-4-5-20251001"  # 後

# Haiku 3から
model = "claude-3-haiku-20240307"  # 前
model = "claude-haiku-4-5-20251001"  # 後

新しいレート制限を確認してください: Haiku 4.5はHaiku 3.5およびHaiku 3とは異なるレート制限があります。詳細についてはレート制限ドキュメントを参照してください。

コーディングと推論タスクのパフォーマンスを大幅に向上させるには、thinking: {type: "enabled", budget_tokens: N}で拡張思考を有効にすることを検討してください。

拡張思考はプロンプトキャッシングの効率に影響します。

拡張思考はClaude 4.6以降のモデルで非推奨です。新しいモデルを使用している場合は、代わりに適応的思考を使用してください。

新しい機能を探索してください: コンテキスト認識、増加した出力容量(64kトークン)、より高い知能、改善されたスピードの詳細については、モデル概要を参照してください。

破壊的変更

これらの破壊的変更はClaude 3.x Haikuモデルからの移行時に適用されます。

  1. サンプリングパラメータを更新してください

    これはClaude 3.xモデルからの移行時の破壊的変更です。

    temperatureまたはtop_pのいずれか一方のみを使用してください。両方は使用しないでください。

  2. ツールバージョンを更新してください

    これはClaude 3.xモデルからの移行時の破壊的変更です。

    最新のツールバージョン(text_editor_20250728、code_execution_20250825)に更新してください。undo_editコマンドを使用しているコードを削除してください。

  3. refusalストップ理由を処理してください

    アプリケーションを更新して、refusalストップ理由を処理してください。

  4. 動作変更に対応するようプロンプトを更新してください

Haiku 4.5移行チェックリスト

  • モデルIDをclaude-haiku-4-5-20251001に更新してください
  • 破壊的: ツールバージョンを最新(text_editor_20250728、code_execution_20250825)に更新してください。レガシーバージョンはサポートされていません
  • 破壊的: undo_editコマンドを使用しているコードを削除してください(該当する場合)
  • 破壊的: サンプリングパラメータをtemperatureまたはtop_pのいずれか一方のみを使用するように更新してください
  • アプリケーションで新しいrefusalストップ理由を処理してください
  • 新しいレート制限を確認して調整してください(Haiku 3.5とは異なります)
  • プロンプティングベストプラクティスに従ってプロンプトを確認および更新してください

ヘルプを得る

  • APIドキュメントで詳細な仕様を確認してください
  • モデル機能でパフォーマンス比較を確認してください
  • APIリリースノートでAPIの更新を確認してください
  • 移行中に問題が発生した場合はサポートに連絡してください

後(Claude Opus 4.7):

client.messages.create(
    model="claude-opus-4-7",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "high"},  # または "max", "xhigh", "medium", "low"
    messages=[{"role": "user", "content": "..."}],
)

適応的思考はプロンプティングを通じて操作可能です。モデルが過度に考えたり、不十分に考えたりする場合のチューニングに関するガイダンスについては、努力と思考の深さのキャリブレーションを参照してください。

  • サンプリングパラメータが削除されました: Claude Opus 4.7でtemperature、top_p、またはtop_kをデフォルト以外の値に設定すると、400エラーが返されます。最も安全な移行パスは、これらのパラメータをリクエストペイロードから完全に省略することです。プロンプティングは、Claude Opus 4.7でモデルの動作をガイドするための推奨される方法です。決定論のためにtemperature = 0を使用していた場合、以前のモデルで同一の出力を保証したことはないことに注意してください。

  • 思考コンテンツはデフォルトで省略されます: 思考ブロックはClaude Opus 4.7のレスポンスストリームに表示されますが、明示的にオプトインしない限り、そのthinkingフィールドは空です。これはClaude Opus 4.6からの静かな変更です。デフォルトは要約された思考テキストを返すことでした。Claude Opus 4.7で要約された思考コンテンツを復元するには、thinking.displayを"summarized"に設定します:

    thinking = {
        "type": "adaptive",
        "display": "summarized",
    }

    Claude Opus 4.7のデフォルトは"omitted"です。製品が推論をユーザーにストリーミングする場合、新しいデフォルトは出力が開始される前の長い一時停止として表示されます。display: "summarized"を設定して、思考中に目に見える進捗を復元します。詳細については、拡張思考を参照してください。

  • 更新されたトークンカウント: Claude Opus 4.7は新しいトークナイザーを使用しており、幅広いタスクでのパフォーマンス向上に貢献しています。この新しいトークナイザーは、テキストを処理する際に、以前のモデルと比較して約1倍から1.35倍のトークンを使用する可能性があります(最大約35%増加、コンテンツによって異なります)。/v1/messages/count_tokensは、Claude Opus 4.7に対してClaude Opus 4.6とは異なるトークン数を返します。Claude Opus 4.7のトークン効率はワークロード形状によって異なります。プロンプティング介入、task_budget、およびeffortは、コストを制御し、適切なトークン使用を確保するのに役立ちます。これらの制御はモデルのインテリジェンスとのトレードオフになる可能性があることに注意してください。max_tokensパラメータを更新して追加のヘッドルームを提供することをお勧めします。圧縮トリガーを含めます。Claude Opus 4.7は、長コンテキストプレミアムなしの標準API価格で1Mコンテキストウィンドウを提供します。

  • プリフィル削除(Opus 4.6から引き継ぎ): Claude Opus 4.7でアシスタントメッセージをプリフィルすると、400エラーが返されます。代わりに構造化出力、システムプロンプト指示、またはoutput_config.formatを使用します。

  • より厳密な努力キャリブレーション: Claude Opus 4.6から大きく変わり、Claude Opus 4.7は努力レベルを厳密に尊重します。特に低い方で。lowおよびmediumでは、モデルはその作業を要求されたものにスコープし、それ以上に行きません。これはレイテンシーとコストに適していますが、low努力で実行される中程度に複雑なタスクでは、不十分な思考のリスクがあります。複雑な問題で浅い推論を観察する場合、プロンプティングの周りではなく、努力をhighまたはxhighに上げます。レイテンシーのために努力をlowに保つ必要がある場合、ターゲットを絞ったガイダンスを追加します:「このタスクは多段階の推論を含みます。応答する前に問題を慎重に考えてください。」Claude Opus 4.7の推奨される努力レベルを参照してください。

  • デフォルトでのツール呼び出しが少ない: Claude Opus 4.7はClaude Opus 4.6よりもツールを使用する傾向が少なく、推論をより多く使用する傾向があります。これはほとんどの場合、より良い結果を生成します。ただし、努力設定を上げることは、ツール使用のレベルを増やすための有用なレバーです。特に知識作業で。highまたはxhigh努力設定は、エージェント検索とコーディングでかなり多くのツール使用を示します。より多くのツール使用が必要なシナリオでは、プロンプトを調整して、モデルにツールをいつどのように適切に使用するかについて明示的に指示することもできます。

  • リアルタイムサイバーセキュリティセーフガード: Claude Opus 4.7で新たに追加された、禁止されたまたは高リスクのトピックに関連するリクエストは拒否につながる可能性があります。ペネトレーションテスト、脆弱性研究、またはレッドチーミングなどの正当なセキュリティ作業の場合、サイバー検証プログラムに申請して、サイバーコンテンツの制限を削減するようにリクエストします。背景については、セーフガード、警告、および異議を参照してください。

  • 高解像度画像サポート: Claude Opus 4.7は、高解像度画像サポートを備えた最初のClaudeモデルであり、長辺の最大画像解像度は2576ピクセルです(以前のモデルの1568ピクセルから増加)。これにより、ビジョンが重いワークロードでの利益が解放され、コンピュータ使用、スクリーンショット理解、およびドキュメント分析に特に価値があります。高解像度サポートは自動であり、ベータヘッダーまたはクライアント側のオプトインは必要ありません。フル解像度画像は、以前のモデルよりも約3倍多くの画像トークンを使用できます(画像あたり最大4,784トークン、以前の上限は約1,600トークン)。したがって、max_tokensとコスト予想を画像が重いワークロードに対して再予算するか、追加の忠実度が必要ない場合は送信前にダウンサンプリングします。モデルによって返されるポインティングおよびバウンディングボックス座標は、Claude Opus 4.7の実際の画像ピクセルと1

    。スケール係数変換は必要ありません。詳細については、Claude Opus 4.7での高解像度画像サポートを参照してください。

  • ユースケースに対して異なるタスク予算を試す必要があります。モデルに特定のタスクに対して制限的すぎるタスク予算が与えられた場合、タスクをあまり徹底的に完了しない可能性があり、予算を制約として参照します。品質が速度よりも重要なオープンエンドのエージェントタスクの場合、タスク予算を設定しないでください。タスク予算をトークン許容量にスコープする必要があるワークロード用にタスク予算を予約します。タスク予算の最小値は20kトークンです。

    これはハードキャップではなく、モデルが認識している提案です。これはmax_tokensとは異なります。max_tokensは生成されたトークンに対するリクエストごとのハードキャップです(max_tokensはモデルに渡されず、モデルはそれを認識していません)。一方、task_budgetは完全なエージェントループ全体にわたるアドバイザリキャップです。モデルが自己調整するようにしたい場合はtask_budgetを使用し、max_tokensをリクエストごとのハードシーリングとして使用して使用をキャップします。

  • maxまたはxhigh努力で大きなmax_tokensを設定する: Claude Opus 4.7をmaxまたはxhigh努力で実行している場合、モデルがサブエージェントとツール呼び出し全体で思考と行動の余地を持つように、大きな最大出力トークン予算を設定します。64kトークンから始めて、そこからチューニングすることをお勧めします。

  • 高解像度が不要な場合は画像をダウンサンプリングする: Claude Opus 4.7は最大2576px / 3.75MPの画像をサポートしています。高解像度画像はより多くのトークンを使用します。追加の画像忠実度が不要な場合、Claudeに送信する前に画像をダウンサンプリングして、トークン使用の増加を避けます。画像とビジョンを参照してください。

  • クライアント側のトークンカウント推定を再テストします。
  • アプリケーションが画像を送信する場合、高解像度画像サポートに対して再予算します(フル解像度画像あたり最大約3倍多くの画像トークン)。追加の忠実度が必要ない場合は送信前にダウンサンプリングします。モデルからポインティングまたはバウンディングボックス座標を消費する場合、スケール係数変換を削除します。座標はClaude Opus 4.7の実際の画像ピクセルと1
    。
  • 上記の動作変更についてプロンプトを確認します(応答長、文字通り、トーン、進捗更新、サブエージェント、努力キャリブレーション、ツールトリガー、サイバーセーフガード、高解像度画像処理)。
  • 既存の長さ制御プロンプトを削除して応答長を再ベースラインし、明示的にチューニングします。
  • xhighまたはmax努力を使用している場合、max_tokensを開始点として少なくとも64kに上げます。
  • エージェントワークフロー用にタスク予算(ベータ)の採用を検討します。
  • 製品が正当なセキュリティ作業を行う場合、サイバー検証プログラムに申請して、サイバーコンテンツの制限を低くするためのアクセスを取得します。
  • response = client.beta.messages.create(
        model="claude-opus-4-5",
        max_tokens=16000,
        thinking={"type": "enabled", "budget_tokens": 32000},
        betas=["interleaved-thinking-2025-05-14"],
        messages=[...],
    )

    移行はclient.beta.messages.createからclient.messages.createへの移行も行うことに注意してください。適応的思考と努力はGA機能であり、ベータSDK名前空間またはベータヘッダーは必要ありません。

  • 努力ベータヘッダーを削除する: 努力パラメータはGAになりました。リクエストからbetas=["effort-2025-11-24"]を削除します。

  • 細粒度ツールストリーミングベータヘッダーを削除する: 細粒度ツールストリーミングはGAになりました。リクエストからbetas=["fine-grained-tool-streaming-2025-05-14"]を削除します。

  • インターリーブされた思考ベータヘッダーを削除する: 適応的思考は、Claude Opus 4.7、Opus 4.6、およびSonnet 4.6でインターリーブされた思考を自動的に有効にします。リクエストからbetas=["interleaved-thinking-2025-05-14"]を削除します。ヘッダーはSonnet 4.6で手動拡張思考でも機能しますが、手動モードは非推奨です。

  • output_config.formatに移行する: 構造化出力を使用している場合、output_format={...}をoutput_config={"format": {...}}に更新します。古いパラメータは機能したままですが、非推奨であり、将来のモデルリリースで削除されます。

  • ツールバージョンを更新する

    これはClaude 3.xモデルから移行する場合の破壊的な変更です。

    最新のツールバージョンに更新します。undo_editコマンドを使用するコードを削除します。

    # 前
    tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
    
    # 後
    tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]
    • テキストエディタ: text_editor_20250728とstr_replace_based_edit_toolを使用します。詳細については、テキストエディタツールドキュメントを参照してください。
    • コード実行: code_execution_20250825にアップグレードします。移行手順については、コード実行ツールドキュメントを参照してください。
  • refusal停止理由を処理する

    アプリケーションを更新して、refusal停止理由を処理します:

    Python
    response = client.messages.create(...)
    
    if response.stop_reason == "refusal":
        # 拒否を適切に処理します
        pass
  • model_context_window_exceeded停止理由を処理する

    Claude 4.5+モデルは、要求されたmax_tokens制限ではなく、コンテキストウィンドウ制限に達したために生成が停止した場合、model_context_window_exceeded停止理由を返します。アプリケーションを更新して、この新しい停止理由を処理します:

    Python
    response = client.messages.create(...)
    
    if response.stop_reason == "model_context_window_exceeded":
        # コンテキストウィンドウ制限を適切に処理します
        pass
  • ツールパラメータ処理を確認する(末尾の改行)

    Claude 4.5+モデルは、以前に削除されたツール呼び出し文字列パラメータの末尾の改行を保持します。ツールがツール呼び出しパラメータに対する正確な文字列マッチングに依存している場合、ロジックが末尾の改行を正しく処理することを確認します。

  • 動作の変更についてプロンプトを更新する

    Claude 4+モデルはより簡潔で直接的なコミュニケーションスタイルを持ち、明示的な方向が必要です。最適化ガイダンスについては、プロンプティングベストプラクティスを確認してください。

  • interleaved-thinking-2025-05-14ベータヘッダーを削除します(適応的思考はインターリーブされた思考を自動的に有効にします)
  • output_formatをoutput_config.formatに移行します(該当する場合)
  • Claude 4.1以前から移行する場合:temperature、top_p、およびtop_kを削除します(デフォルト以外の値はOpus 4.7で400を返します)
  • Claude 4.1以前から移行する場合:ツールバージョンを更新します(text_editor_20250728、code_execution_20250825)
  • Claude 4.1以前から移行する場合:refusal停止理由を処理します
  • Claude 4.1以前から移行する場合:model_context_window_exceeded停止理由を処理します
  • Claude 4.1以前から移行する場合:末尾の改行のツール文字列パラメータ処理を確認します
  • Claude 4.1以前から移行する場合:レガシーベータヘッダーを削除します(token-efficient-tools-2025-02-19、output-128k-2025-02-19)
  • プロンプティングベストプラクティスに従ってプロンプトを確認および更新します
  • 本番環境への展開前に開発環境でテストします
  • コンテキストハイドレーション/ロール一貫性(長い会話でのコンテキストの更新):以前プリフィルされたアシスタントのリマインダーをユーザーターンに注入してください。

  • ツールパラメータのJSONエスケープが異なる場合があります

    これはSonnet 4.5以前からの移行時の破壊的変更です。

    ツールパラメータのJSON文字列エスケープは、以前のモデルと異なる場合があります。標準的なJSONパーサーはこれを自動的に処理しますが、カスタム文字列ベースの解析は更新が必要な場合があります。

  • Claude 4モデルはより簡潔で直接的なコミュニケーションスタイルを持っています。最適化ガイダンスについてはプロンプティングベストプラクティスを確認してください。

    response = client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=8192,
        output_config={"effort": "low"},
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
    response = client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=64000,
        thinking={"type": "adaptive"},
        output_config={"effort": "medium"},
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
    response = client.beta.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=16384,
        thinking={"type": "enabled", "budget_tokens": 16384},
        output_config={"effort": "medium"},
        betas=["interleaved-thinking-2025-05-14"],
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
    response = client.beta.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=8192,
        thinking={"type": "enabled", "budget_tokens": 16384},
        output_config={"effort": "low"},
        betas=["interleaved-thinking-2025-05-14"],
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
    refusal
  • fine-grained-tool-streaming-2025-05-14ベータヘッダーを削除してください(現在GA)
  • output_formatをoutput_config.formatに移行してください
  • プロンプティングベストプラクティスに従ってプロンプトを確認および更新してください
  • 推奨: thinking: {type: "enabled", budget_tokens: N}からthinking: {type: "adaptive"}に努力パラメータで移行してください(budget_tokensは非推奨であり、将来のリリースで削除されます)
  • 本番環境へのデプロイ前に開発環境でテストしてください
  • Claude 4モデルはより簡潔で直接的なコミュニケーションスタイルを持っています。最適化ガイダンスについてはプロンプティングベストプラクティスを確認してください。

  • 本番環境へのデプロイ前に開発環境でテストしてください
  • Claude 4モデルはより簡潔で直接的なコミュニケーションスタイルを持っています。最適化ガイダンスについてはプロンプティングベストプラクティスを確認してください。

  • 複雑な推論タスクに対して拡張思考を有効にすることを検討してください
  • 本番環境へのデプロイ前に開発環境でテストしてください