Claude menunjukkan kemampuan multibahasa yang tangguh, dengan performa yang sangat kuat dalam tugas-tugas "zero-shot" (tanpa contoh) di berbagai bahasa. Model ini mempertahankan performa relatif yang konsisten baik pada bahasa yang banyak digunakan maupun bahasa dengan sumber daya lebih sedikit, menjadikannya pilihan yang andal untuk aplikasi multibahasa.
Claude mampu menangani banyak bahasa di luar yang diukur dalam tabel berikut. Lakukan pengujian dengan bahasa apa pun yang relevan dengan kasus penggunaan spesifik Anda.
Tabel berikut menunjukkan skor evaluasi "zero-shot chain-of-thought" (rantai pemikiran tanpa contoh) untuk model Claude di berbagai bahasa, dinyatakan sebagai persentase relatif terhadap performa bahasa Inggris (100%):
| Bahasa | Claude Opus 4.1 (tidak digunakan lagi)1 | Claude Sonnet 4.51 | Claude Haiku 4.51 |
|---|---|---|---|
| Inggris (baseline, ditetapkan pada 100%) | 100% | 100% | 100% |
| Spanyol | 98,1% | 98,2% | 96,4% |
| Portugis (Brasil) | 97,8% | 97,8% | 96,1% |
| Italia | 97,7% | 97,9% | 96,0% |
| Prancis | 97,9% | 97,5% | 95,7% |
| Indonesia | 97,3% | 97,3% | 94,2% |
| Jerman | 97,7% | 97,0% | 94,3% |
| Arab | 97,1% | 97,2% | 92,5% |
| Mandarin (Sederhana) | 97,1% | 96,9% | 94,2% |
| Korea | 96,6% | 96,7% | 93,3% |
| Jepang | 96,9% | 96,8% | 93,5% |
| Hindi | 96,8% | 96,7% | 92,4% |
| Bengali | 95,7% | 95,4% | 90,4% |
| Swahili | 89,8% | 91,1% | 78,3% |
| Yoruba | 80,3% | 79,7% | 52,7% |
1 Dengan pemikiran diperpanjang.
Metrik ini didasarkan pada set pengujian bahasa Inggris MMLU (Massive Multitask Language Understanding) yang diterjemahkan ke dalam 14 bahasa tambahan oleh penerjemah manusia profesional, sebagaimana didokumentasikan dalam repositori simple-evals OpenAI. Penggunaan penerjemah manusia untuk evaluasi ini memastikan terjemahan berkualitas tinggi, yang sangat penting untuk bahasa dengan sumber daya digital yang lebih sedikit.
Claude menyimpulkan bahasa respons dari percakapan, tetapi untuk aplikasi produksi Anda sebaiknya menyatakan bahasa target secara eksplisit. Tempat paling andal untuk melakukan ini adalah prompt sistem, yang menjaga instruksi tetap stabil di setiap giliran percakapan.
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
system="Always respond in French, regardless of the language the user writes in.",
messages=[{"role": "user", "content": "How do I reset my password?"}],
)
print(message.content)Jika aplikasi Anda memungkinkan pengguna memilih bahasa saat runtime, interpolasikan pilihan tersebut ke dalam prompt sistem alih-alih mengandalkan Claude untuk menyimpulkannya dari pesan pengguna. Untuk menerjemahkan antara dua bahasa tertentu, sebutkan keduanya: Translate the user's message from German to Korean. Respond with only the translation.
Saat bekerja dengan konten multibahasa:
Ikuti juga panduan umum dalam Ikhtisar rekayasa prompt untuk lebih meningkatkan kualitas output.
Terapkan teknik prompting umum untuk meningkatkan kualitas output multibahasa.
Bangun chatbot dukungan yang dilokalkan menggunakan prompt sistem dengan batasan bahasa.
Bandingkan tingkatan model untuk menyeimbangkan kualitas multibahasa dengan biaya dan latensi.
Evaluasi kualitas terjemahan dan lokalisasi sebelum Anda merilisnya.
Was this page helpful?