Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claudeは堅牢な多言語機能を実証しており、特にゼロショットタスク全体で言語間で強いパフォーマンスを発揮しています。このモデルは、広く話されている言語と低リソース言語の両方にわたって一貫した相対的なパフォーマンスを維持しており、多言語アプリケーションの信頼できる選択肢となっています。
Claudeは以下でベンチマークされた言語を超えて多くの言語に対応していることに注意してください。特定のユースケースに関連する言語でのテストをお勧めします。
以下は、異なる言語にわたるClaude 4、Claude 3.7 Sonnet、Claude 3.5モデルのゼロショットチェーンオブソートの評価スコアであり、英語のパフォーマンス(100%)に対する相対的なパーセンテージで表示されています:
| 言語 | Claude Opus 41 | Claude Sonnet 41 | Claude Sonnet 3.7 (deprecated)1 | Claude Haiku 3.5 |
|---|---|---|---|---|
| 英語(ベースライン、100%に固定) | 100% | 100% | 100% | 100% |
| スペイン語 | 98.0% | 97.5% | 97.6% | 94.6% |
| ポルトガル語(ブラジル) | 97.3% | 97.2% | 97.3% | 94.6% |
| イタリア語 | 97.5% | 97.3% | 97.2% | 95.0% |
| フランス語 | 97.7% | 97.1% | 96.9% | 95.3% |
| インドネシア語 | 97.2% | 96.2% | 96.3% | 91.2% |
| ドイツ語 | 97.1% | 94.7% | 96.2% | 92.5% |
| アラビア語 | 96.9% | 96.1% | 95.4% | 84.7% |
| 中国語(簡体字) | 96.7% | 95.9% | 95.3% | 90.9% |
| 韓国語 | 96.4% | 95.9% | 95.2% | 89.1% |
| 日本語 | 96.2% | 95.6% | 95.0% | 90.8% |
| ヒンディー語 | 96.7% | 95.8% | 94.2% | 80.1% |
| ベンガル語 | 95.2% | 94.4% | 92.4% | 72.9% |
| スワヒリ語 | 89.5% | 87.1% | 89.2% | 64.7% |
| ヨルバ語 | 78.9% | 76.4% | 76.7% | 46.1% |
1 拡張思考を使用。
これらのメトリクスは、MMLU(Massive Multitask Language Understanding)英語テストセットに基づいており、OpenAIのsimple-evalsリポジトリに記載されているように、プロの人間翻訳者によって14の追加言語に翻訳されています。この評価に人間翻訳者を使用することで、特にデジタルリソースが少ない言語にとって重要な高品質の翻訳が保証されます。
多言語コンテンツを扱う場合:
また、Claudeのパフォーマンスをより向上させるために、一般的なプロンプトエンジニアリングガイドラインに従うことをお勧めします。