핵심 요약
Redis 8.0이 RediSearch + Vector를 코어로 흡수. 사내 RAG 파이프라인 pgvector → Redis 전환, 평균 검색 320ms → 64ms. 캐시·메인 검색을 한 인스턴스로 통합 — 비용 -41%.
1. 사용 예시
FT.CREATE idx ON HASH PREFIX 1 doc:
SCHEMA
title TEXT
content TEXT
embedding VECTOR HNSW 6 DIM 1024 DISTANCE_METRIC COSINE
# 하이브리드: 텍스트 + 벡터
FT.SEARCH idx
'(@content:%kubernetes%) => [KNN 10 @embedding $vec]'
PARAMS 2 vec ${BLOB} DIALECT 2
2. 실측
| 쿼리 | pgvector | Redis 8 |
|---|---|---|
| KNN 10, 1M vector | 180ms | 28ms |
| 하이브리드(텍스트+벡터) | 320ms | 64ms |
| 배치 insert 10K | 2.4s | 0.6s |
3. 메모리 vs 디스크
Redis는 in-memory. 1M 벡터(1024차원 float16) ≈ 2GB. EC2 r7g.xl(32GB)로 8M까지 안정. 큰 코퍼스는 샤딩 또는 디스크 기반(Redis on Flash) 검토.
4. 함정
- 라이선스 — RSAL/SSPL 변경, 클라우드 호스팅 정책 확인
- HNSW 파라미터 — M, EF_CONSTRUCTION 조정, 기본값은 일반적이나 recall 손실 가능
- cluster 모드 — vector index sharding 자동 안 됨, hash tag로 manual
- persistence — AOF + RDB 동시, 큰 vector index 복구 시간 대비
5. 채택 기준
low-latency RAG + 캐시 통합 — Redis 8. 큰 코퍼스, 디스크 저장 — pgvector 또는 Qdrant. 둘 다 production-ready, 워크로드 모양으로 결정.

댓글 0