Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claude는 강력한 다국어 기능을 보여주며, 특히 언어 전반에 걸친 제로샷 작업에서 뛰어난 성능을 발휘합니다. 이 모델은 널리 사용되는 언어와 저자원 언어 모두에서 일관된 상대적 성능을 유지하므로 다국어 애플리케이션을 위한 신뢰할 수 있는 선택입니다.
Claude는 아래에서 벤치마크된 언어 이외의 많은 언어에서도 능숙합니다. 특정 사용 사례와 관련된 모든 언어로 테스트해 보시기를 권장합니다.
다음은 Claude 4, Claude 3.7 Sonnet 및 Claude 3.5 모델의 다양한 언어에 걸친 제로샷 사고의 연쇄 평가 점수로, 영어 성능(100%)에 대한 백분율로 표시됩니다:
| 언어 | Claude Opus 41 | Claude Sonnet 41 | Claude Sonnet 3.7 (deprecated)1 | Claude Haiku 3.5 |
|---|---|---|---|---|
| 영어 (기준, 100%로 고정) | 100% | 100% | 100% | 100% |
| 스페인어 | 98.0% | 97.5% | 97.6% | 94.6% |
| 포르투갈어 (브라질) | 97.3% | 97.2% | 97.3% | 94.6% |
| 이탈리아어 | 97.5% | 97.3% | 97.2% | 95.0% |
| 프랑스어 | 97.7% | 97.1% | 96.9% | 95.3% |
| 인도네시아어 | 97.2% | 96.2% | 96.3% | 91.2% |
| 독일어 | 97.1% | 94.7% | 96.2% | 92.5% |
| 아랍어 | 96.9% | 96.1% | 95.4% | 84.7% |
| 중국어 (간체) | 96.7% | 95.9% | 95.3% | 90.9% |
| 한국어 | 96.4% | 95.9% | 95.2% | 89.1% |
| 일본어 | 96.2% | 95.6% | 95.0% | 90.8% |
| 힌디어 | 96.7% | 95.8% | 94.2% | 80.1% |
| 벵골어 | 95.2% | 94.4% | 92.4% | 72.9% |
| 스와힐리어 | 89.5% | 87.1% | 89.2% | 64.7% |
| 요루바어 | 78.9% | 76.4% | 76.7% | 46.1% |
1 확장 사고를 포함합니다.
이 지표는 전문 인간 번역가가 14개의 추가 언어로 번역한 MMLU (Massive Multitask Language Understanding) 영어 테스트 세트를 기반으로 하며, OpenAI의 simple-evals 저장소에 문서화되어 있습니다. 이 평가에 인간 번역가를 사용하면 고품질 번역을 보장하며, 이는 디지털 리소스가 적은 언어에 특히 중요합니다.
다국어 콘텐츠로 작업할 때:
또한 Claude의 성능을 더 잘 향상시키기 위해 일반적인 프롬프트 엔지니어링 가이드라인을 따르시기를 권장합니다.