Claude demonstra capacidades multilíngues robustas, com desempenho particularmente forte em tarefas zero-shot em vários idiomas. O modelo mantém desempenho relativo consistente em idiomas amplamente falados e de recursos limitados, tornando-o uma escolha confiável para aplicações multilíngues.
Observe que Claude é capaz em muitos idiomas além dos avaliados abaixo. Encorajamos testes com quaisquer idiomas relevantes para seus casos de uso específicos.
Abaixo estão os scores de avaliação zero-shot chain-of-thought para modelos Claude em diferentes idiomas, mostrados como um percentual relativo ao desempenho em inglês (100%):
| Idioma | Claude Opus 4.11 | Claude Opus 41 | Claude Sonnet 4.51 | Claude Sonnet 41 | Claude Haiku 4.51 |
|---|---|---|---|---|---|
| Inglês (linha de base, fixado em 100%) | 100% | 100% | 100% | 100% | 100% |
| Espanhol | 98.1% | 98.0% | 98.2% | 97.5% | 96.4% |
| Português (Brasil) | 97.8% | 97.3% | 97.8% | 97.2% | 96.1% |
| Italiano | 97.7% | 97.5% | 97.9% | 97.3% | 96.0% |
| Francês | 97.9% | 97.7% | 97.5% | 97.1% | 95.7% |
| Indonésio | 97.3% | 97.2% | 97.3% | 96.2% | 94.2% |
| Alemão | 97.7% | 97.1% | 97.0% | 94.7% | 94.3% |
| Árabe | 97.1% | 96.9% | 97.2% | 96.1% | 92.5% |
| Chinês (Simplificado) | 97.1% | 96.7% | 96.9% | 95.9% | 94.2% |
| Coreano | 96.6% | 96.4% | 96.7% | 95.9% | 93.3% |
| Japonês | 96.9% | 96.2% | 96.8% | 95.6% | 93.5% |
| Hindi | 96.8% | 96.7% | 96.7% | 95.8% | 92.4% |
| Bengali | 95.7% | 95.2% | 95.4% | 94.4% | 90.4% |
| Suaíli | 89.8% | 89.5% | 91.1% | 87.1% | 78.3% |
| Iorubá | 80.3% | 78.9% | 79.7% | 76.4% | 52.7% |
1 Com pensamento estendido.
Essas métricas são baseadas em conjuntos de testes em inglês MMLU (Massive Multitask Language Understanding) que foram traduzidos para 14 idiomas adicionais por tradutores humanos profissionais, conforme documentado no repositório simple-evals do OpenAI. O uso de tradutores humanos para esta avaliação garante traduções de alta qualidade, particularmente importante para idiomas com menos recursos digitais.
Ao trabalhar com conteúdo multilíngue:
Também sugerimos seguir nossas diretrizes gerais de engenharia de prompts para melhorar melhor o desempenho do Claude.