Claude демонстрирует надёжные многоязычные возможности, особенно высокую производительность в задачах «zero-shot» (без примеров) на разных языках. Модель сохраняет стабильную относительную производительность как для широко распространённых языков, так и для языков с ограниченными ресурсами, что делает её надёжным выбором для многоязычных приложений.
Обратите внимание, что Claude способен работать на многих языках помимо тех, что представлены в бенчмарках ниже. Рекомендуем протестировать модель на любых языках, актуальных для ваших конкретных сценариев использования.
Ниже приведены оценки «zero-shot chain-of-thought» (цепочка рассуждений без примеров) для моделей Claude на разных языках, выраженные в процентах относительно производительности на английском языке (100%):
| Язык | Claude Opus 4.1 (устаревшая)1 | Claude Opus 4 (устаревшая)1 | Claude Sonnet 4.51 | Claude Sonnet 4 (устаревшая)1 | Claude Haiku 4.51 |
|---|---|---|---|---|---|
| Английский (базовый уровень, зафиксирован на 100%) | 100% | 100% | 100% | 100% | 100% |
| Испанский | 98,1% | 98,0% | 98,2% | 97,5% | 96,4% |
| Португальский (Бразилия) | 97,8% | 97,3% | 97,8% | 97,2% | 96,1% |
| Итальянский | 97,7% | 97,5% | 97,9% | 97,3% | 96,0% |
| Французский | 97,9% | 97,7% | 97,5% | 97,1% | 95,7% |
| Индонезийский | 97,3% | 97,2% | 97,3% | 96,2% | 94,2% |
| Немецкий | 97,7% | 97,1% | 97,0% | 94,7% | 94,3% |
| Арабский | 97,1% | 96,9% | 97,2% | 96,1% | 92,5% |
| Китайский (упрощённый) | 97,1% | 96,7% | 96,9% | 95,9% | 94,2% |
| Корейский | 96,6% | 96,4% | 96,7% | 95,9% | 93,3% |
| Японский | 96,9% | 96,2% | 96,8% | 95,6% | 93,5% |
| Хинди | 96,8% | 96,7% | 96,7% | 95,8% | 92,4% |
| Бенгальский | 95,7% | 95,2% | 95,4% | 94,4% | 90,4% |
| Суахили | 89,8% | 89,5% | 91,1% | 87,1% | 78,3% |
| Йоруба | 80,3% | 78,9% | 79,7% | 76,4% | 52,7% |
1 С использованием расширенного мышления.
Эти метрики основаны на тестовых наборах MMLU (Massive Multitask Language Understanding) на английском языке, которые были переведены на 14 дополнительных языков профессиональными переводчиками, как описано в репозитории simple-evals от OpenAI. Использование профессиональных переводчиков для этой оценки обеспечивает высокое качество переводов, что особенно важно для языков с меньшим количеством цифровых ресурсов.
При работе с многоязычным контентом:
Также следуйте общим рекомендациям по инженерии подсказок, чтобы дополнительно улучшить производительность Claude.
Was this page helpful?