o1 후속 reasoning 모델. ARC-AGI·SWE-bench 돌파.
ARC-AGI에서 87% (이전 최고 55%). SWE-bench Verified 71%. 2025년 공개.