GRU란?
2014년 제안. LSTM의 3개 게이트를 reset·update 2개로 간소화했다.
파라미터 수 감소, 학습 속도 향상. LSTM과 유사한 성능. Transformer 시대엔 둘 다 역할 축소.
LSTM을 단순화한 변형. 게이트 수를 줄여 학습 빠르고 성능은 유사.
2014년 제안. LSTM의 3개 게이트를 reset·update 2개로 간소화했다.
파라미터 수 감소, 학습 속도 향상. LSTM과 유사한 성능. Transformer 시대엔 둘 다 역할 축소.