Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claudeは堅牢な多言語機能を備えており、特に言語全体のゼロショットタスクで強いパフォーマンスを発揮します。このモデルは、広く話されている言語と低リソース言語の両方にわたって一貫した相対的なパフォーマンスを維持しており、多言語アプリケーションの信頼できる選択肢となります。
Claudeは以下でベンチマークされた言語を超えて、多くの言語で対応可能であることに注意してください。特定のユースケースに関連する言語でのテストをお勧めします。
以下は、異なる言語にわたるClaudeモデルのゼロショットチェーンオブソート評価スコアであり、英語のパフォーマンス(100%)に対する相対的なパーセンテージで表示されています。
| 言語 | Claude Opus 4.11 | Claude Opus 41 | Claude Sonnet 4.51 | Claude Sonnet 41 | Claude Haiku 4.51 |
|---|---|---|---|---|---|
| 英語(ベースライン、100%に固定) | 100% | 100% | 100% | 100% | 100% |
| スペイン語 | 98.1% | 98.0% | 98.2% | 97.5% | 96.4% |
| ポルトガル語(ブラジル) | 97.8% | 97.3% | 97.8% | 97.2% | 96.1% |
| イタリア語 | 97.7% | 97.5% | 97.9% | 97.3% | 96.0% |
| フランス語 | 97.9% | 97.7% | 97.5% | 97.1% | 95.7% |
| インドネシア語 | 97.3% | 97.2% | 97.3% | 96.2% | 94.2% |
| ドイツ語 | 97.7% | 97.1% | 97.0% | 94.7% | 94.3% |
| アラビア語 | 97.1% | 96.9% | 97.2% | 96.1% | 92.5% |
| 中国語(簡体字) | 97.1% | 96.7% | 96.9% | 95.9% | 94.2% |
| 韓国語 | 96.6% | 96.4% | 96.7% | 95.9% | 93.3% |
| 日本語 | 96.9% | 96.2% | 96.8% | 95.6% | 93.5% |
| ヒンディー語 | 96.8% | 96.7% | 96.7% | 95.8% | 92.4% |
| ベンガル語 | 95.7% | 95.2% | 95.4% | 94.4% | 90.4% |
| スワヒリ語 | 89.8% | 89.5% | 91.1% | 87.1% | 78.3% |
| ヨルバ語 | 80.3% | 78.9% | 79.7% | 76.4% | 52.7% |
1 拡張思考を使用。
これらのメトリクスは、MMLU(Massive Multitask Language Understanding)英語テストセットに基づいており、OpenAIのsimple-evalsリポジトリに記載されているように、専門の人間翻訳者によって14の追加言語に翻訳されました。この評価に人間翻訳者を使用することで、特にデジタルリソースが少ない言語にとって重要な、高品質の翻訳が保証されます。
多言語コンテンツを扱う場合:
また、Claudeのパフォーマンスをさらに向上させるために、一般的なプロンプトエンジニアリングガイドラインに従うことをお勧めします。