Claude demonstriert robuste mehrsprachige Fähigkeiten mit besonders starker Leistung bei Zero-Shot-Aufgaben über Sprachen hinweg. Das Modell behält eine konsistente relative Leistung über weit verbreitete und ressourcenärmere Sprachen hinweg bei, was es zu einer zuverlässigen Wahl für mehrsprachige Anwendungen macht.
Beachten Sie, dass Claude in vielen Sprachen über die unten benchmarkten hinaus fähig ist. Wir ermutigen Sie, mit allen Sprachen zu testen, die für Ihre spezifischen Anwendungsfälle relevant sind.
Nachfolgend sind die Zero-Shot-Chain-of-Thought-Bewertungsergebnisse für Claude-Modelle über verschiedene Sprachen hinweg aufgeführt, dargestellt als Prozentsatz relativ zur englischen Leistung (100%):
| Sprache | Claude Opus 4.11 | Claude Opus 41 | Claude Sonnet 4.51 | Claude Sonnet 41 | Claude Haiku 4.51 |
|---|---|---|---|---|---|
| Englisch (Baseline, auf 100% festgelegt) | 100% | 100% | 100% | 100% | 100% |
| Spanisch | 98.1% | 98.0% | 98.2% | 97.5% | 96.4% |
| Portugiesisch (Brasilien) | 97.8% | 97.3% | 97.8% | 97.2% | 96.1% |
| Italienisch | 97.7% | 97.5% | 97.9% | 97.3% | 96.0% |
| Französisch | 97.9% | 97.7% | 97.5% | 97.1% | 95.7% |
| Indonesisch | 97.3% | 97.2% | 97.3% | 96.2% | 94.2% |
| Deutsch | 97.7% | 97.1% | 97.0% | 94.7% | 94.3% |
| Arabisch | 97.1% | 96.9% | 97.2% | 96.1% | 92.5% |
| Chinesisch (Vereinfacht) | 97.1% | 96.7% | 96.9% | 95.9% | 94.2% |
| Koreanisch | 96.6% | 96.4% | 96.7% | 95.9% | 93.3% |
| Japanisch | 96.9% | 96.2% | 96.8% | 95.6% | 93.5% |
| Hindi | 96.8% | 96.7% | 96.7% | 95.8% | 92.4% |
| Bengalisch | 95.7% | 95.2% | 95.4% | 94.4% | 90.4% |
| Suaheli | 89.8% | 89.5% | 91.1% | 87.1% | 78.3% |
| Yoruba | 80.3% | 78.9% | 79.7% | 76.4% | 52.7% |
1 Mit erweitertem Denken.
Diese Metriken basieren auf MMLU (Massive Multitask Language Understanding) englischen Testsätzen, die von professionellen menschlichen Übersetzern in 14 zusätzliche Sprachen übersetzt wurden, wie in OpenAIs simple-evals Repository dokumentiert. Die Verwendung von menschlichen Übersetzern für diese Bewertung gewährleistet hochwertige Übersetzungen, besonders wichtig für Sprachen mit weniger digitalen Ressourcen.
Bei der Arbeit mit mehrsprachigen Inhalten:
Wir empfehlen auch, unsere allgemeinen Richtlinien zur Prompt-Entwicklung zu befolgen, um Claudes Leistung besser zu verbessern.