파인튜닝이란?
범용 LLM에 자체 데이터로 추가 학습을 입혀 특정 작업·도메인에 특화시키는 기법이다. LoRA·QLoRA 같은 경량 기법이 일반적이다.
언제 쓰나
- 응답 스타일/톤을 일정하게 강제해야 할 때
- 특정 출력 형식(JSON 스키마, 표 등)을 안정적으로 뽑아야 할 때
- 자주 쓰는 프롬프트가 너무 길어 비용이 문제일 때
파인튜닝 vs RAG
- 지식 주입 → RAG가 저렴·빠름
- 스타일/형식 → 파인튜닝이 유리
- 대부분의 실무는 RAG 먼저, 필요 시 병행