본문 바로가기

AI#AI#NLP조회 39

Transformer란?트랜스포머

정의

2017년 Google이 발표한 "Attention is All You Need" 논문의 신경망 아키텍처. 현대 LLM의 기반.

다른 표현트랜스포머Transformer 아키텍처

트랜스포머란?

Transformer는 2017년 Google "Attention is All You Need" 논문에서 제안된 신경망 아키텍처다. Self-Attention 메커니즘으로 시퀀스 전체를 병렬 처리해 RNN의 한계를 뛰어넘었다.

핵심 아이디어

Self-Attention: 문장 내 토큰들이 서로를 참조하며 가중치 계산
Positional Encoding: 순서 정보를 별도 벡터로 주입
병렬화: RNN과 달리 시퀀스 전체를 동시에 처리 — GPU 활용 극대화

파생 모델

GPT(디코더 전용), BERT(인코더 전용), T5(인코더-디코더) 등 현대 주요 NLP 모델이 전부 Transformer 기반이다.

📘 관련 기술노트

전체 보기 →

AIHugging Face Transformers 파이프라인 실전 활용

🔗 함께 보면 좋은 용어

멀티 에이전트 오케스트레이션

Supervisor·Hierarchy·Network 패턴으로 여러 에이전트 조율.

청킹 전략 상세

고정·문장·계층·의미론적·Agentic 청킹. RAG 품질의 결정.

추론 지연 최적화

TTFT·TPS·Batching·KV Cache·Speculative·Quantization 조합.

Agent-to-Agent Protocol

에이전트 간 통신 표준. Google이 제안. MCP와 상호 보완.

전체 예측 중 맞춘 비율. 클래스 불균형 시 오해를 유발할 수 있음.

Activation Function

신경망 뉴런의 비선형 변환. ReLU·GELU·Sigmoid·Tanh.