GSM8K란?OpenAI가 공개한 8500개 수학 서술형 문제. CoT가 효과를 증명한 벤치.현재 대부분 최신 모델이 90%+ 달성. MATH·AIME 같은 더 어려운 벤치로 이동.