Claude demonstriert robuste mehrsprachige Fähigkeiten mit besonders starker Leistung bei Zero-Shot-Aufgaben über Sprachen hinweg. Das Modell behält eine konsistente relative Leistung sowohl bei weit verbreiteten als auch bei Sprachen mit weniger Ressourcen bei, was es zu einer zuverlässigen Wahl für mehrsprachige Anwendungen macht.
Beachten Sie, dass Claude in vielen Sprachen über die unten aufgeführten Benchmarks hinaus fähig ist. Erwägen Sie, mit allen Sprachen zu testen, die für Ihre spezifischen Anwendungsfälle relevant sind.
Nachfolgend finden Sie die Zero-Shot-Chain-of-Thought-Evaluierungsergebnisse für Claude-Modelle in verschiedenen Sprachen, dargestellt als Prozentsatz relativ zur englischen Leistung (100%):
| Sprache | Claude Opus 4.11 | Claude Opus 4 (veraltet)1 | Claude Sonnet 4.51 | Claude Sonnet 4 (veraltet)1 | Claude Haiku 4.51 |
|---|---|---|---|---|---|
| Englisch (Baseline, auf 100% festgelegt) | 100% | 100% | 100% | 100% | 100% |
| Spanisch | 98.1% | 98.0% | 98.2% | 97.5% | 96.4% |
| Portugiesisch (Brasilien) | 97.8% | 97.3% | 97.8% | 97.2% | 96.1% |
| Italienisch | 97.7% | 97.5% | 97.9% | 97.3% | 96.0% |
| Französisch | 97.9% | 97.7% | 97.5% | 97.1% | 95.7% |
| Indonesisch | 97.3% | 97.2% | 97.3% | 96.2% | 94.2% |
| Deutsch | 97.7% | 97.1% | 97.0% | 94.7% | 94.3% |
| Arabisch | 97.1% | 96.9% | 97.2% | 96.1% | 92.5% |
| Chinesisch (Vereinfacht) | 97.1% | 96.7% | 96.9% | 95.9% | 94.2% |
| Koreanisch | 96.6% | 96.4% | 96.7% | 95.9% | 93.3% |
| Japanisch | 96.9% | 96.2% | 96.8% | 95.6% | 93.5% |
| Hindi | 96.8% | 96.7% | 96.7% | 95.8% | 92.4% |
| Bengalisch | 95.7% | 95.2% | 95.4% | 94.4% | 90.4% |
| Suaheli | 89.8% | 89.5% | 91.1% | 87.1% | 78.3% |
| Yoruba | 80.3% | 78.9% | 79.7% | 76.4% | 52.7% |
1 Mit erweitertem Denken.
Diese Metriken basieren auf MMLU (Massive Multitask Language Understanding) englischen Testsätzen, die von professionellen menschlichen Übersetzern in 14 zusätzliche Sprachen übersetzt wurden, wie in OpenAIs simple-evals Repository dokumentiert. Die Verwendung von menschlichen Übersetzern für diese Evaluierung gewährleistet hochwertige Übersetzungen, besonders wichtig für Sprachen mit weniger digitalen Ressourcen.
Bei der Arbeit mit mehrsprachigen Inhalten:
Befolgen Sie auch die allgemeinen Richtlinien zur Prompt-Entwicklung, um die Leistung von Claude weiter zu verbessern.
Was this page helpful?