본문 바로가기
AI#AI#Benchmark조회 20

MMLU란?Massive Multitask Language Understanding

정의

57개 분야 시험 문제로 LLM을 평가. AI의 학문적 지식 측정 표준.

MMLU란?

수학·법·의학·역사 등 57개 분야 객관식 문제로 LLM의 학문 지식을 평가한다.

2026 상태

대부분 최신 모델이 90%+ → MMLU-Pro 같은 더 어려운 벤치가 대체.

🔗 함께 보면 좋은 용어

AI 전체 →