임베딩이란?
임베딩은 단어·문장·이미지 같은 데이터를 고정 차원의 실수 벡터로 매핑하는 표현이다. 의미가 유사한 데이터는 벡터 공간에서 서로 가까이 위치한다.
활용
- 의미 검색: 키워드가 아닌 의미 기반 문서 탐색
- RAG: LLM 프롬프트용 관련 문서 탐색
- 추천: 비슷한 아이템 찾기
- 클러스터링: 유사 그룹 묶기
주요 모델
- OpenAI text-embedding-3-large (3072차원)
- Cohere embed-v3 (1024차원)
- BGE-M3 (다국어 오픈소스, 한국어 강함)