Claude demuestra capacidades multilingües robustas, con un desempeño particularmente fuerte en tareas de cero disparos en múltiples idiomas. El modelo mantiene un desempeño relativo consistente en idiomas tanto ampliamente hablados como de recursos limitados, lo que lo convierte en una opción confiable para aplicaciones multilingües.
Tenga en cuenta que Claude es capaz en muchos idiomas más allá de los evaluados a continuación. Le recomendamos que pruebe con cualquier idioma relevante para sus casos de uso específicos.
A continuación se muestran las puntuaciones de evaluación de cadena de pensamiento de cero disparos para modelos Claude en diferentes idiomas, mostradas como un porcentaje relativo al desempeño en inglés (100%):
| Idioma | Claude Opus 4.11 | Claude Opus 41 | Claude Sonnet 4.51 | Claude Sonnet 41 | Claude Haiku 4.51 |
|---|---|---|---|---|---|
| Inglés (línea base, fijo al 100%) | 100% | 100% | 100% | 100% | 100% |
| Español | 98.1% | 98.0% | 98.2% | 97.5% | 96.4% |
| Portugués (Brasil) | 97.8% | 97.3% | 97.8% | 97.2% | 96.1% |
| Italiano | 97.7% | 97.5% | 97.9% | 97.3% | 96.0% |
| Francés | 97.9% | 97.7% | 97.5% | 97.1% | 95.7% |
| Indonesio | 97.3% | 97.2% | 97.3% | 96.2% | 94.2% |
| Alemán | 97.7% | 97.1% | 97.0% | 94.7% | 94.3% |
| Árabe | 97.1% | 96.9% | 97.2% | 96.1% | 92.5% |
| Chino (Simplificado) | 97.1% | 96.7% | 96.9% | 95.9% | 94.2% |
| Coreano | 96.6% | 96.4% | 96.7% | 95.9% | 93.3% |
| Japonés | 96.9% | 96.2% | 96.8% | 95.6% | 93.5% |
| Hindi | 96.8% | 96.7% | 96.7% | 95.8% | 92.4% |
| Bengalí | 95.7% | 95.2% | 95.4% | 94.4% | 90.4% |
| Suajili | 89.8% | 89.5% | 91.1% | 87.1% | 78.3% |
| Yoruba | 80.3% | 78.9% | 79.7% | 76.4% | 52.7% |
1 Con pensamiento extendido.
Estas métricas se basan en conjuntos de pruebas en inglés de MMLU (Comprensión del Lenguaje Multitarea Masiva) que fueron traducidos a 14 idiomas adicionales por traductores humanos profesionales, como se documenta en el repositorio simple-evals de OpenAI. El uso de traductores humanos para esta evaluación garantiza traducciones de alta calidad, particularmente importante para idiomas con menos recursos digitales.
Al trabajar con contenido multilingüe:
También le sugerimos que siga nuestras directrices generales de ingeniería de indicaciones para mejorar mejor el desempeño de Claude.