Claude demuestra capacidades multilingües robustas, con un desempeño particularmente fuerte en tareas de cero disparos en múltiples idiomas. El modelo mantiene un desempeño relativo consistente en idiomas ampliamente hablados y de recursos limitados, lo que lo convierte en una opción confiable para aplicaciones multilingües.
Tenga en cuenta que Claude es capaz en muchos idiomas más allá de los evaluados a continuación. Le recomendamos que pruebe con cualquier idioma relevante para sus casos de uso específicos.
A continuación se muestran las puntuaciones de evaluación de cadena de pensamiento de cero disparos para Claude 4, Claude 3.7 Sonnet y modelos Claude 3.5 en diferentes idiomas, mostrados como un porcentaje relativo al desempeño en inglés (100%):
| Idioma | Claude Opus 41 | Claude Sonnet 41 | Claude Sonnet 3.7 (deprecated)1 | Claude Haiku 3.5 |
|---|---|---|---|---|
| Inglés (línea base, fijo al 100%) | 100% | 100% | 100% | 100% |
| Español | 98.0% | 97.5% | 97.6% | 94.6% |
| Portugués (Brasil) | 97.3% | 97.2% | 97.3% | 94.6% |
| Italiano | 97.5% | 97.3% | 97.2% | 95.0% |
| Francés | 97.7% | 97.1% | 96.9% | 95.3% |
| Indonesio | 97.2% | 96.2% | 96.3% | 91.2% |
| Alemán | 97.1% | 94.7% | 96.2% | 92.5% |
| Árabe | 96.9% | 96.1% | 95.4% | 84.7% |
| Chino (Simplificado) | 96.7% | 95.9% | 95.3% | 90.9% |
| Coreano | 96.4% | 95.9% | 95.2% | 89.1% |
| Japonés | 96.2% | 95.6% | 95.0% | 90.8% |
| Hindi | 96.7% | 95.8% | 94.2% | 80.1% |
| Bengalí | 95.2% | 94.4% | 92.4% | 72.9% |
| Suajili | 89.5% | 87.1% | 89.2% | 64.7% |
| Yoruba | 78.9% | 76.4% | 76.7% | 46.1% |
1 Con pensamiento extendido.
Estas métricas se basan en conjuntos de pruebas en inglés de MMLU (Massive Multitask Language Understanding) que fueron traducidos a 14 idiomas adicionales por traductores humanos profesionales, como se documenta en el repositorio simple-evals de OpenAI. El uso de traductores humanos para esta evaluación garantiza traducciones de alta calidad, particularmente importante para idiomas con menos recursos digitales.
Al trabajar con contenido multilingüe:
También le sugerimos que siga nuestras directrices generales de ingeniería de indicaciones para mejorar mejor el desempeño de Claude.