본문 바로가기
Y
S
영삼넷
youngsam.net
프로그램
기술노트
뉴스
사전
자료실
커뮤니티
소개
홈
/
기술 용어 사전
/
BM25
Data
#Data
#Search
조회 1
BM25란?
정의
전통 키워드 검색 점수 알고리즘. Elasticsearch·OpenSearch 기본.
BM25
TF-IDF 개선.
단어 빈도·문서 길이 정규화
. 하이브리드 검색에서 벡터와 결합.
🔗 함께 보면 좋은 용어
Data 전체 →
데이터 관측성 플랫폼
Monte Carlo·Bigeye·Soda·Datafold·Elementary.
데이터 레이크 파일 포맷
Parquet·ORC·Avro·Arrow. 사용 시나리오별 선택.
임베딩 모델 선택
OpenAI·Cohere·BGE·ko-sroberta 등.
데이터 품질 프레임워크
Great Expectations·Soda·dbt tests·Elementary.
벡터 검색 벤치마크
ANN Benchmarks·VectorDBBench·BEIR.
모던 데이터 스택 2026
Snowflake·Databricks·Fabric·BigQuery 중심의 2026년 현황.