Claude demuestra capacidades multilingües robustas, con un rendimiento particularmente sólido en tareas "zero-shot" (sin ejemplos previos) en distintos idiomas. El modelo mantiene un rendimiento relativo consistente tanto en idiomas ampliamente hablados como en idiomas con menos recursos, lo que lo convierte en una opción confiable para aplicaciones multilingües.
Claude es competente en muchos idiomas más allá de los evaluados en la siguiente tabla. Haz pruebas con cualquier idioma relevante para tus casos de uso específicos.
La siguiente tabla muestra las puntuaciones de evaluación zero-shot con "chain-of-thought" (cadena de pensamiento) para los modelos de Claude en distintos idiomas, expresadas como un porcentaje relativo al rendimiento en inglés (100%):
| Idioma | Claude Opus 4.1 (obsoleto)1 | Claude Sonnet 4.51 | Claude Haiku 4.51 |
|---|---|---|---|
| Inglés (referencia, fijado en 100%) | 100% | 100% | 100% |
| Español | 98.1% | 98.2% | 96.4% |
| Portugués (Brasil) | 97.8% | 97.8% | 96.1% |
| Italiano | 97.7% | 97.9% | 96.0% |
| Francés | 97.9% | 97.5% | 95.7% |
| Indonesio | 97.3% | 97.3% | 94.2% |
| Alemán | 97.7% | 97.0% | 94.3% |
| Árabe | 97.1% | 97.2% | 92.5% |
| Chino (simplificado) | 97.1% | 96.9% | 94.2% |
| Coreano | 96.6% | 96.7% | 93.3% |
| Japonés | 96.9% | 96.8% | 93.5% |
| Hindi | 96.8% | 96.7% | 92.4% |
| Bengalí | 95.7% | 95.4% | 90.4% |
| Suajili | 89.8% | 91.1% | 78.3% |
| Yoruba | 80.3% | 79.7% | 52.7% |
1 Con pensamiento extendido.
Estas métricas se basan en conjuntos de pruebas en inglés de MMLU (Massive Multitask Language Understanding) que fueron traducidos a 14 idiomas adicionales por traductores humanos profesionales, como se documenta en el repositorio simple-evals de OpenAI. El uso de traductores humanos para esta evaluación garantiza traducciones de alta calidad, algo particularmente importante para idiomas con menos recursos digitales.
Claude infiere el idioma de respuesta a partir de la conversación, pero para aplicaciones de producción deberías indicar el idioma objetivo de forma explícita. El lugar más confiable para hacerlo es la indicación del sistema, que mantiene la instrucción estable en cada turno de una conversación.
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
system="Always respond in French, regardless of the language the user writes in.",
messages=[{"role": "user", "content": "How do I reset my password?"}],
)
print(message.content)Si tu aplicación permite a los usuarios elegir un idioma en tiempo de ejecución, interpola esa elección en la indicación del sistema en lugar de depender de que Claude lo infiera del mensaje del usuario. Para traducir entre dos idiomas específicos, nombra ambos: Translate the user's message from German to Korean. Respond with only the translation.
Al trabajar con contenido multilingüe:
Sigue también las pautas generales en Descripción general de la ingeniería de prompts para mejorar aún más la calidad de la salida.
Aplica técnicas generales de prompting para mejorar la calidad de la salida multilingüe.
Crea un chatbot de soporte localizado usando una indicación del sistema con restricción de idioma.
Compara los niveles de modelos para equilibrar la calidad multilingüe con el costo y la latencia.
Evalúa la calidad de la traducción y la localización antes de lanzar.
Was this page helpful?