Redis 8.0 vector search — RediSearch 통합 후 RAG 5배 빠른 이유 | 기술노트

핵심 요약

Redis 8.0이 RediSearch + Vector를 코어로 흡수. 사내 RAG 파이프라인 pgvector → Redis 전환, 평균 검색 320ms → 64ms. 캐시·메인 검색을 한 인스턴스로 통합 — 비용 -41%.

1. 사용 예시

FT.CREATE idx ON HASH PREFIX 1 doc:
  SCHEMA
    title TEXT
    content TEXT
    embedding VECTOR HNSW 6 DIM 1024 DISTANCE_METRIC COSINE

# 하이브리드: 텍스트 + 벡터
FT.SEARCH idx
  '(@content:%kubernetes%) => [KNN 10 @embedding $vec]'
  PARAMS 2 vec ${BLOB} DIALECT 2

2. 실측

쿼리	pgvector	Redis 8
KNN 10, 1M vector	180ms	28ms
하이브리드(텍스트+벡터)	320ms	64ms
배치 insert 10K	2.4s	0.6s

3. 메모리 vs 디스크

Redis는 in-memory. 1M 벡터(1024차원 float16) ≈ 2GB. EC2 r7g.xl(32GB)로 8M까지 안정. 큰 코퍼스는 샤딩 또는 디스크 기반(Redis on Flash) 검토.

4. 함정

라이선스 — RSAL/SSPL 변경, 클라우드 호스팅 정책 확인
HNSW 파라미터 — M, EF_CONSTRUCTION 조정, 기본값은 일반적이나 recall 손실 가능
cluster 모드 — vector index sharding 자동 안 됨, hash tag로 manual
persistence — AOF + RDB 동시, 큰 vector index 복구 시간 대비

5. 채택 기준

low-latency RAG + 캐시 통합 — Redis 8. 큰 코퍼스, 디스크 저장 — pgvector 또는 Qdrant. 둘 다 production-ready, 워크로드 모양으로 결정.