Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claude 展現出強大的多語言能力,特別是在跨語言的零樣本任務中表現出色。該模型在廣泛使用的語言和低資源語言中都保持一致的相對性能,使其成為多語言應用的可靠選擇。
請注意,Claude 能夠使用許多超出下面基準測試範圍的語言。我們鼓勵您使用與您特定用例相關的任何語言進行測試。
以下是 Claude 模型在不同語言中的零樣本思維鏈評估分數,顯示為相對於英文性能的百分比(100%):
| 語言 | Claude Opus 4.11 | Claude Opus 41 | Claude Sonnet 4.51 | Claude Sonnet 41 | Claude Haiku 4.51 |
|---|---|---|---|---|---|
| 英文(基準,固定為 100%) | 100% | 100% | 100% | 100% | 100% |
| 西班牙文 | 98.1% | 98.0% | 98.2% | 97.5% | 96.4% |
| 葡萄牙文(巴西) | 97.8% | 97.3% | 97.8% | 97.2% | 96.1% |
| 義大利文 | 97.7% | 97.5% | 97.9% | 97.3% | 96.0% |
| 法文 | 97.9% | 97.7% | 97.5% | 97.1% | 95.7% |
| 印尼文 | 97.3% | 97.2% | 97.3% | 96.2% | 94.2% |
| 德文 | 97.7% | 97.1% | 97.0% | 94.7% | 94.3% |
| 阿拉伯文 | 97.1% | 96.9% | 97.2% | 96.1% | 92.5% |
| 中文(簡體) | 97.1% | 96.7% | 96.9% | 95.9% | 94.2% |
| 韓文 | 96.6% | 96.4% | 96.7% | 95.9% | 93.3% |
| 日文 | 96.9% | 96.2% | 96.8% | 95.6% | 93.5% |
| 印地文 | 96.8% | 96.7% | 96.7% | 95.8% | 92.4% |
| 孟加拉文 | 95.7% | 95.2% | 95.4% | 94.4% | 90.4% |
| 史瓦希里文 | 89.8% | 89.5% | 91.1% | 87.1% | 78.3% |
| 約魯巴文 | 80.3% | 78.9% | 79.7% | 76.4% | 52.7% |
1 使用擴展思維。
這些指標基於 MMLU(大規模多任務語言理解)英文測試集,該測試集由專業人工翻譯人員翻譯成 14 種額外語言,如 OpenAI 的 simple-evals 儲存庫所記錄。使用人工翻譯人員進行此評估可確保高品質的翻譯,這對於數位資源較少的語言尤其重要。
使用多語言內容時:
我們也建議遵循我們的一般提示工程指南以更好地改進 Claude 的性能。