Claudeは堅牢な多言語機能を備えており、特に言語をまたいだゼロショットタスクで優れたパフォーマンスを発揮します。このモデルは、広く話されている言語とリソースの少ない言語の両方で一貫した相対的パフォーマンスを維持しており、多言語アプリケーションにとって信頼できる選択肢となっています。
Claudeは、以下の表でベンチマークされている言語以外にも多くの言語に対応しています。特定のユースケースに関連する言語でテストしてください。
以下の表は、各言語におけるClaudeモデルのゼロショット「chain-of-thought」(思考の連鎖)評価スコアを、英語のパフォーマンス(100%)に対する相対的なパーセンテージで示しています。
| 言語 | Claude Opus 4.1(非推奨)1 | Claude Sonnet 4.51 | Claude Haiku 4.51 |
|---|---|---|---|
| 英語(基準、100%に固定) | 100% | 100% | 100% |
| スペイン語 | 98.1% | 98.2% | 96.4% |
| ポルトガル語(ブラジル) | 97.8% | 97.8% | 96.1% |
| イタリア語 | 97.7% | 97.9% | 96.0% |
| フランス語 | 97.9% | 97.5% | 95.7% |
| インドネシア語 | 97.3% | 97.3% | 94.2% |
| ドイツ語 | 97.7% | 97.0% | 94.3% |
| アラビア語 | 97.1% | 97.2% | 92.5% |
| 中国語(簡体字) | 97.1% | 96.9% | 94.2% |
| 韓国語 | 96.6% | 96.7% | 93.3% |
| 日本語 | 96.9% | 96.8% | 93.5% |
| ヒンディー語 | 96.8% | 96.7% | 92.4% |
| ベンガル語 | 95.7% | 95.4% | 90.4% |
| スワヒリ語 | 89.8% | 91.1% | 78.3% |
| ヨルバ語 | 80.3% | 79.7% | 52.7% |
1 拡張思考を使用。
これらの指標は、OpenAIのsimple-evalsリポジトリに記載されているように、プロの人間翻訳者によって14の追加言語に翻訳されたMMLU(Massive Multitask Language Understanding)の英語テストセットに基づいています。この評価に人間の翻訳者を使用することで、特にデジタルリソースが少ない言語において重要な、高品質な翻訳が保証されます。
Claudeは会話から応答言語を推測しますが、本番アプリケーションではターゲット言語を明示的に指定する必要があります。これを行う最も信頼性の高い場所はシステムプロンプトであり、会話のすべてのターンにわたって指示を安定させることができます。
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
system="Always respond in French, regardless of the language the user writes in.",
messages=[{"role": "user", "content": "How do I reset my password?"}],
)
print(message.content)アプリケーションでユーザーが実行時に言語を選択できる場合は、Claudeがユーザーのメッセージから推測することに頼るのではなく、その選択をシステムプロンプトに補間してください。2つの特定の言語間で翻訳するには、両方の言語を指定します:Translate the user's message from German to Korean. Respond with only the translation.
多言語コンテンツを扱う際は、以下の点に注意してください。
出力品質をさらに向上させるには、プロンプトエンジニアリングの概要の一般的なガイダンスにも従ってください。
一般的なプロンプト技術を適用して、多言語出力の品質を向上させます。
言語を制約したシステムプロンプトを使用して、ローカライズされたサポートチャットボットを構築します。
モデルティアを比較して、多言語品質とコストおよびレイテンシのバランスを取ります。
リリース前に翻訳とローカライゼーションの品質を評価します。
Was this page helpful?