Claude Opus 4.8は、AnthropicのOpusティアで最も高性能なモデルです。Claude Opus 4.7をベースに構築されています。このページでは、「fast mode」(高速モード、Claude APIでのリサーチプレビュー)や、キャッシュ可能なプロンプトの最小長が1,024トークンに引き下げられたことなど、リリース時点でのすべての新機能をまとめています。
| モデル | APIモデルID | 説明 |
|---|---|---|
| Claude Opus 4.8 | claude-opus-4-8 | 複雑な推論、長期的なエージェント型コーディング、高い自律性を要する作業に対応する、Anthropicで最も高性能なOpusティアモデル |
Claude Opus 4.8は、Claude API、Amazon Bedrock、Vertex AIでデフォルトで100万トークンのコンテキストウィンドウ(Microsoft Foundryでは20万)、最大128kの出力トークン、adaptive thinking(適応的思考)、およびClaude Opus 4.7と同じツールセットとプラットフォーム機能をサポートしています。
価格と仕様の詳細については、モデルの概要を参照してください。
Claude Opus 4.8は、messages配列内でユーザーターンの直後にrole: "system"メッセージを受け付けます(配置ルールに従います)。これにより、長時間実行される会話の後半で、システムプロンプト全体を再記述することなく更新された指示を追加でき、それ以前のターンに対するプロンプトキャッシュのヒットが維持され、エージェント型ループでの入力コストが削減されます。ベータヘッダーは不要です。使用方法の詳細については、会話途中のシステムメッセージを参照してください。
拒否レスポンスに含まれるstop_detailsオブジェクト(Claude Opus 4.7以降で利用可能)が、公式にドキュメント化されました。Claudeがリクエストの完了を拒否した場合、このオブジェクトは既存のrefusal停止理由に加えて拒否のカテゴリを記述します。これにより、アプリケーションが拒否されたリクエストの種類を区別し、ユーザーを適切な次のステップに誘導しやすくなります。ベータヘッダーは不要です。カテゴリの一覧と処理方法については、停止理由の処理を参照してください。
Claude Opus 4.8におけるeffortパラメータのデフォルト値は、Claude APIおよびClaude Codeを含むすべてのサーフェスでhighです。現在effortを明示的に設定している場合、その設定は変更されません。レベルごとのガイダンスについては、Effortを参照してください。
高速モードが、Claude APIでのリサーチプレビューとしてClaude Opus 4.8で利用可能になりました。speed: "fast"を設定すると、プレミアム価格で同じモデルから最大2.5倍の秒あたり出力トークン数を得られます。アクセス方法、対応モデル、価格については、高速モードを参照してください。
Claude Opus 4.8でキャッシュ可能なプロンプトの最小長は1,024トークンで、Claude Opus 4.7よりも短くなっています。Claude Opus 4.7ではキャッシュするには短すぎたプロンプトでも、コードを変更することなくキャッシュエントリを作成できるようになりました。モデルごとの最小値については、プロンプトキャッシングを参照してください。
これらの制約はClaude Opus 4.7から変更されていないため、すでにClaude Opus 4.7で動作しているコードは変更不要です。これらはMessages APIにのみ適用され、Claude Managed Agentsには影響しません。
temperature、top_p、またはtop_kをデフォルト以外の値に設定すると、Claude Opus 4.7と同様にClaude Opus 4.8でも400エラーが返されます。これらのパラメータは省略し、プロンプトによってモデルの動作を誘導してください。
Claude Opus 4.7と同様に、Claude Opus 4.8は拡張思考のバジェットをサポートしていません。thinking: {"type": "enabled", "budget_tokens": N}を設定すると400エラーが返されます。思考の深さを制御するには、適応的思考とeffortパラメータを使用してください。
# 変更前(Opus 4.6以前)
thinking = {"type": "enabled", "budget_tokens": 32000}
# 変更後(Opus 4.7以降)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}Claude Opus 4.7と比較して、Claude Opus 4.8は以下の領域での動作改善を目指しています。
適応的思考を有効にすると、Claude Opus 4.8はそのターンに推論が必要だと判断した場合にのみ推論をトリガーします。単純な検索や短いエージェント型ステップでは直接応答し、複雑な複数ステップの問題では回答前に推論を行います。これにより、同じeffortレベルのClaude Opus 4.7と比較して、二峰性のワークロードにおける無駄な思考トークンが削減されます。Claude Opus 4.7と同様に、リクエストで明示的にthinking: {type: "adaptive"}を設定しない限り、思考はオフになっています。
これらはAPIの破壊的変更ではありませんが、プロンプトの更新が必要になる場合があります。詳細なガイダンスについては、Claude Opus 4.8への移行を参照してください。
ステップバイステップの移行手順と完全な移行チェックリストについては、Claude Opus 4.8への移行を参照してください。Claude CodeまたはAgent SDKを使用している場合、Claude APIスキルがこれらの移行ステップをコードベースに自動的に適用できます。
Claude Opus 4.7からのステップバイステップのアップグレード手順。
新しいデフォルト値を含む、レベルごとのeffortガイダンス。
Claude Opus 4.8でサポートされる唯一の思考オンモード。
会話途中のシステムメッセージがキャッシュヒットを維持する仕組み。
拒否時の停止詳細とその処理方法。
プレミアム価格でより高速な出力。
Was this page helpful?