Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claude는 강력한 다국어 기능을 보여주며, 특히 언어 전반에 걸친 제로샷 작업에서 뛰어난 성능을 발휘합니다. 이 모델은 널리 사용되는 언어와 저자원 언어 모두에서 일관된 상대적 성능을 유지하므로 다국어 애플리케이션을 위한 신뢰할 수 있는 선택입니다.
Claude는 아래에 벤치마크된 언어 이상으로 많은 언어에 능숙합니다. 특정 사용 사례와 관련된 모든 언어로 테스트하기를 권장합니다.
다음은 다양한 언어에 걸친 Claude 모델의 제로샷 사고의 연쇄 평가 점수이며, 영어 성능(100%)에 대한 백분율로 표시됩니다:
| 언어 | Claude Opus 4.11 | Claude Opus 41 | Claude Sonnet 4.51 | Claude Sonnet 41 | Claude Haiku 4.51 |
|---|---|---|---|---|---|
| 영어 (기준, 100%로 고정) | 100% | 100% | 100% | 100% | 100% |
| 스페인어 | 98.1% | 98.0% | 98.2% | 97.5% | 96.4% |
| 포르투갈어 (브라질) | 97.8% | 97.3% | 97.8% | 97.2% | 96.1% |
| 이탈리아어 | 97.7% | 97.5% | 97.9% | 97.3% | 96.0% |
| 프랑스어 | 97.9% | 97.7% | 97.5% | 97.1% | 95.7% |
| 인도네시아어 | 97.3% | 97.2% | 97.3% | 96.2% | 94.2% |
| 독일어 | 97.7% | 97.1% | 97.0% | 94.7% | 94.3% |
| 아랍어 | 97.1% | 96.9% | 97.2% | 96.1% | 92.5% |
| 중국어 (간체) | 97.1% | 96.7% | 96.9% | 95.9% | 94.2% |
| 한국어 | 96.6% | 96.4% | 96.7% | 95.9% | 93.3% |
| 일본어 | 96.9% | 96.2% | 96.8% | 95.6% | 93.5% |
| 힌디어 | 96.8% | 96.7% | 96.7% | 95.8% | 92.4% |
| 벵골어 | 95.7% | 95.2% | 95.4% | 94.4% | 90.4% |
| 스와힐리어 | 89.8% | 89.5% | 91.1% | 87.1% | 78.3% |
| 요루바어 | 80.3% | 78.9% | 79.7% | 76.4% | 52.7% |
1 확장 사고 포함.
이 지표는 MMLU (대규모 다중 작업 언어 이해) 영어 테스트 세트를 기반으로 하며, 전문 인간 번역가에 의해 14개의 추가 언어로 번역되었으며, OpenAI의 simple-evals 저장소에 문서화되어 있습니다. 이 평가에 인간 번역가를 사용하면 고품질 번역을 보장하며, 이는 디지털 자원이 적은 언어의 경우 특히 중요합니다.
다국어 콘텐츠로 작업할 때:
또한 Claude의 성능을 더 잘 향상시키기 위해 일반적인 프롬프트 엔지니어링 지침을 따르기를 제안합니다.