Diffusion Model이란?
데이터에 점차 노이즈를 추가하는 과정을 학습한 후, 역방향으로 노이즈를 제거해 새 데이터를 생성하는 모델이다.
이미지 생성 흐름
- 랜덤 노이즈로 시작
- 수십 단계에 걸쳐 노이즈 제거 (denoising)
- 텍스트 조건(CLIP 임베딩)으로 방향 유도
- 최종 이미지 출력
대표 구현
Stable Diffusion, DALL-E 3, Imagen, Midjourney. 비디오 확장으로 Sora, Runway Gen 시리즈.