핵심 요약
Snowflake Cortex Search GA. 같은 코퍼스 1.2M 문서로 Pinecone과 12주 동시 운영 후 비교. NDCG@10 정확도 동일(0.78 vs 0.79), 비용 월 $1,820 → $580, 운영 인력 0.5 FTE → 0.1. 데이터 이미 Snowflake에 있으면 Cortex가 압도적.
1. Cortex Search 구조
CREATE OR REPLACE CORTEX SEARCH SERVICE docs_search
ON content
ATTRIBUTES title, tags, lang
WAREHOUSE = analyst_wh
TARGET_LAG = '1 minute'
AS (
SELECT content, title, tags, lang FROM docs
);
SQL 한 줄. 임베딩 자동 생성, semantic + keyword 하이브리드 자동. 1분 lag로 최신 데이터 반영.
2. 검색 API
-- SQL
SELECT PARSE_JSON(
SNOWFLAKE.CORTEX.SEARCH_PREVIEW(
'docs_search',
'{"query": "kubernetes 1.34", "columns": ["content", "title"], "limit": 10}'
)
);
// Node SDK 도 동일
3. 비교 — 동일 트래픽
| 지표 | Pinecone | Cortex Search |
|---|---|---|
| NDCG@10 | 0.79 | 0.78 |
| p99 검색 지연 | 142ms | 180ms |
| 월 비용 | $1,820 (s2.x1) | $580 |
| 운영 부담 | 0.5 FTE | 0.1 FTE |
| 데이터 sync | ETL 별도 | 자동(같은 DB) |
4. 채택 기준
- 데이터 이미 Snowflake — Cortex가 답
- Multi-cloud 데이터 origins — Pinecone
- Sub-50ms 검색 필수 — Pinecone (지연 작음)
- 사내 RAG, 운영 인력 부족 — Cortex
5. 함정
- Warehouse 비용 — 검색 트래픽이 Snowflake 컴퓨트 소비. 전용 warehouse 분리, autoscale 정책 명확
- TARGET_LAG — 1분 미만 설정 시 비용 폭증. 5분 권장
- ATTRIBUTES 필터 — 정의 후 변경하면 재인덱싱 필요
- Multi-region — Cortex는 single region 제약, cross-region 검색은 데이터 이동 비용

댓글 0