Cross-Entropy란?예측 확률 p와 실제 분포 q의 정보 차이를 측정한다.활용분류 모델 훈련LLM 훈련 (next-token prediction)KL Divergence와 관련