추론 시 더 오래 생각해 성능 향상. Scaling Law의 새 축.
학습 compute가 아닌 추론 compute를 늘려 성능 향상. o1·R1이 대표. Best-of-N·MCTS·긴 CoT가 구현 기법.