Claude démontre de solides capacités multilingues, avec des performances particulièrement remarquables dans les tâches « zero-shot » (sans exemple préalable) dans de nombreuses langues. Le modèle maintient des performances relatives constantes, tant pour les langues largement parlées que pour celles disposant de moins de ressources, ce qui en fait un choix fiable pour les applications multilingues.
Claude est compétent dans de nombreuses langues au-delà de celles évaluées dans le tableau suivant. Testez-le avec toutes les langues pertinentes pour vos cas d'usage spécifiques.
Le tableau suivant présente les scores d'évaluation « zero-shot chain-of-thought » (chaîne de raisonnement sans exemple préalable) pour les modèles Claude dans différentes langues, exprimés en pourcentage par rapport aux performances en anglais (100 %) :
| Langue | Claude Opus 4.1 (obsolète)1 | Claude Sonnet 4.51 | Claude Haiku 4.51 |
|---|---|---|---|
| Anglais (référence, fixée à 100 %) | 100 % | 100 % | 100 % |
| Espagnol | 98,1 % | 98,2 % | 96,4 % |
| Portugais (Brésil) | 97,8 % | 97,8 % | 96,1 % |
| Italien | 97,7 % | 97,9 % | 96,0 % |
| Français | 97,9 % | 97,5 % | 95,7 % |
| Indonésien | 97,3 % | 97,3 % | 94,2 % |
| Allemand | 97,7 % | 97,0 % | 94,3 % |
| Arabe | 97,1 % | 97,2 % | 92,5 % |
| Chinois (simplifié) | 97,1 % | 96,9 % | 94,2 % |
| Coréen | 96,6 % | 96,7 % | 93,3 % |
| Japonais | 96,9 % | 96,8 % | 93,5 % |
| Hindi | 96,8 % | 96,7 % | 92,4 % |
| Bengali | 95,7 % | 95,4 % | 90,4 % |
| Swahili | 89,8 % | 91,1 % | 78,3 % |
| Yoruba | 80,3 % | 79,7 % | 52,7 % |
1 Avec la réflexion étendue.
Ces métriques sont basées sur les ensembles de tests anglais MMLU (Massive Multitask Language Understanding) qui ont été traduits dans 14 langues supplémentaires par des traducteurs humains professionnels, comme documenté dans le dépôt simple-evals d'OpenAI. Le recours à des traducteurs humains pour cette évaluation garantit des traductions de haute qualité, ce qui est particulièrement important pour les langues disposant de moins de ressources numériques.
Claude déduit la langue de réponse à partir de la conversation, mais pour les applications en production, vous devriez indiquer explicitement la langue cible. L'endroit le plus fiable pour le faire est l'invite système, qui maintient l'instruction stable à chaque tour d'une conversation.
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
system="Always respond in French, regardless of the language the user writes in.",
messages=[{"role": "user", "content": "How do I reset my password?"}],
)
print(message.content)Si votre application permet aux utilisateurs de choisir une langue au moment de l'exécution, interpolez ce choix dans l'invite système plutôt que de compter sur Claude pour la déduire du message de l'utilisateur. Pour traduire entre deux langues spécifiques, nommez les deux : Translate the user's message from German to Korean. Respond with only the translation.
Lorsque vous travaillez avec du contenu multilingue :
Suivez également les recommandations générales de la page Vue d'ensemble de l'ingénierie de prompts pour améliorer davantage la qualité des résultats.
Appliquez des techniques générales de prompting pour améliorer la qualité des résultats multilingues.
Créez un chatbot de support localisé en utilisant une invite système contrainte à une langue.
Comparez les niveaux de modèles pour équilibrer la qualité multilingue avec le coût et la latence.
Évaluez la qualité de la traduction et de la localisation avant de déployer.
Was this page helpful?