Was this page helpful?
Claude menunjukkan kemampuan multibahasa yang kuat, dengan kinerja yang sangat baik dalam tugas zero-shot di berbagai bahasa. Model mempertahankan kinerja relatif yang konsisten di seluruh bahasa yang banyak digunakan dan bahasa dengan sumber daya terbatas, menjadikannya pilihan yang dapat diandalkan untuk aplikasi multibahasa.
Perhatikan bahwa Claude mampu dalam banyak bahasa di luar yang diukur di bawah. Pertimbangkan untuk menguji dengan bahasa apa pun yang relevan dengan kasus penggunaan spesifik Anda.
Di bawah ini adalah skor evaluasi chain-of-thought zero-shot untuk model Claude di berbagai bahasa, ditampilkan sebagai persentase relatif terhadap kinerja bahasa Inggris (100%):
| Bahasa | Claude Opus 4.11 | Claude Opus 4 (deprecated)1 | Claude Sonnet 4.51 | Claude Sonnet 4 (deprecated)1 | Claude Haiku 4.51 |
|---|---|---|---|---|---|
| Bahasa Inggris (baseline, tetap 100%) | 100% | 100% | 100% | 100% | 100% |
| Spanyol | 98.1% | 98.0% | 98.2% | 97.5% | 96.4% |
| Portugis (Brasil) | 97.8% | 97.3% | 97.8% | 97.2% | 96.1% |
| Italia | 97.7% | 97.5% | 97.9% | 97.3% | 96.0% |
| Prancis | 97.9% | 97.7% | 97.5% | 97.1% | 95.7% |
| Indonesia | 97.3% | 97.2% | 97.3% | 96.2% | 94.2% |
| Jerman | 97.7% | 97.1% | 97.0% | 94.7% | 94.3% |
| Arab | 97.1% | 96.9% | 97.2% | 96.1% | 92.5% |
| Cina (Sederhana) | 97.1% | 96.7% | 96.9% | 95.9% | 94.2% |
| Korea | 96.6% | 96.4% | 96.7% | 95.9% | 93.3% |
| Jepang | 96.9% | 96.2% | 96.8% | 95.6% | 93.5% |
| Hindi | 96.8% | 96.7% | 96.7% | 95.8% | 92.4% |
| Bengali | 95.7% | 95.2% | 95.4% | 94.4% | 90.4% |
| Swahili | 89.8% | 89.5% | 91.1% | 87.1% | 78.3% |
| Yoruba | 80.3% | 78.9% | 79.7% | 76.4% | 52.7% |
1 Dengan extended thinking.
Metrik ini didasarkan pada set tes bahasa Inggris MMLU (Massive Multitask Language Understanding) yang diterjemahkan ke 14 bahasa tambahan oleh penerjemah manusia profesional, seperti yang didokumentasikan dalam repositori simple-evals OpenAI. Penggunaan penerjemah manusia untuk evaluasi ini memastikan terjemahan berkualitas tinggi, sangat penting untuk bahasa dengan sumber daya digital yang lebih sedikit.
Saat bekerja dengan konten multibahasa:
Juga ikuti panduan rekayasa prompt umum untuk lebih meningkatkan kinerja Claude.