Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claudeは堅牢な多言語機能を備えており、特に言語をまたいだ「zero-shot」(ゼロショット)タスクで優れたパフォーマンスを発揮します。このモデルは、広く話されている言語とリソースの少ない言語の両方で一貫した相対的パフォーマンスを維持しており、多言語アプリケーションにとって信頼できる選択肢となっています。
なお、Claudeは以下でベンチマークされている言語以外にも多くの言語に対応しています。特定のユースケースに関連する言語でテストすることをご検討ください。
以下は、さまざまな言語におけるClaudeモデルのゼロショット「chain-of-thought」(思考の連鎖)評価スコアで、英語のパフォーマンス(100%)に対する相対的なパーセンテージとして示されています。
| 言語 | Claude Opus 4.1(非推奨)1 | Claude Opus 4(非推奨)1 | Claude Sonnet 4.51 | Claude Sonnet 4(非推奨)1 | Claude Haiku 4.51 |
|---|---|---|---|---|---|
| 英語(基準、100%に固定) | 100% | 100% | 100% | 100% | 100% |
| スペイン語 | 98.1% | 98.0% | 98.2% | 97.5% | 96.4% |
| ポルトガル語(ブラジル) | 97.8% | 97.3% | 97.8% | 97.2% | 96.1% |
| イタリア語 | 97.7% | 97.5% | 97.9% | 97.3% | 96.0% |
| フランス語 | 97.9% | 97.7% | 97.5% | 97.1% | 95.7% |
| インドネシア語 | 97.3% | 97.2% | 97.3% | 96.2% | 94.2% |
| ドイツ語 | 97.7% | 97.1% | 97.0% | 94.7% | 94.3% |
| アラビア語 | 97.1% | 96.9% | 97.2% | 96.1% | 92.5% |
| 中国語(簡体字) | 97.1% | 96.7% | 96.9% | 95.9% | 94.2% |
| 韓国語 | 96.6% | 96.4% | 96.7% | 95.9% | 93.3% |
| 日本語 | 96.9% | 96.2% | 96.8% | 95.6% | 93.5% |
| ヒンディー語 | 96.8% | 96.7% | 96.7% | 95.8% | 92.4% |
| ベンガル語 | 95.7% | 95.2% | 95.4% | 94.4% | 90.4% |
| スワヒリ語 | 89.8% | 89.5% | 91.1% | 87.1% | 78.3% |
| ヨルバ語 | 80.3% | 78.9% | 79.7% | 76.4% | 52.7% |
1 拡張思考を使用。
これらの指標は、OpenAIのsimple-evalsリポジトリに記載されているように、プロの人間翻訳者によって14の追加言語に翻訳されたMMLU(Massive Multitask Language Understanding)の英語テストセットに基づいています。この評価に人間翻訳者を使用することで、高品質な翻訳が保証されます。これは、デジタルリソースが少ない言語にとって特に重要です。
多言語コンテンツを扱う際は、以下の点にご注意ください。
また、Claudeのパフォーマンスをさらに向上させるために、一般的なプロンプトエンジニアリングガイドラインにも従ってください。
Was this page helpful?