Decoder-only란?
Transformer는 원래 Encoder-Decoder 구조지만, GPT 계열은 Decoder만 사용해 자기회귀로 생성한다.
Encoder-only
BERT는 Encoder만 사용 — 이해·분류·임베딩에 강점.
GPT·Llama 같은 생성 LLM의 기반 아키텍처. 인코더 없이 디코더만 사용.
Transformer는 원래 Encoder-Decoder 구조지만, GPT 계열은 Decoder만 사용해 자기회귀로 생성한다.
BERT는 Encoder만 사용 — 이해·분류·임베딩에 강점.