📊
Data — 348개 용어
ML·데이터 파이프라인·ETL·Warehouse·MLOps·분석 엔진
Looker👁 55
Google이 인수한 엔터프라이즈 BI. LookML로 데이터 모델링. Semantic Layer 선구자.
데이터 Product Thinking👁 55
데이터를 제품처럼. SLA·소비자·버저닝·문서.
Apache Pinot👁 54
LinkedIn의 실시간 OLAP. 저지연·고처리량.
Apache Polaris👁 54
Snowflake가 오픈소스화한 Iceberg 카탈로그.
Databricks Genie👁 54
Databricks의 자연어 → SQL·분석 챗봇.
DuckDB Extensions👁 54
DuckDB 확장 시스템. httpfs·parquet·vss·spatial·delta.
Feast Architecture👁 54
오픈소스 Feature Store. Registry·Online·Offline·Serving.
Master Data👁 54
조직의 핵심 엔티티(고객·상품·직원) 정보. 여러 시스템 간 일관성 필요.
Milvus👁 54
대규모 벡터 DB. GPU 가속·수십억 벡터.
MLflow👁 54
오픈소스 ML 수명 주기 관리 도구. 실험 추적·모델 레지스트리·배포.
Operational Analytics👁 54
분석 결과를 운영 시스템으로 되돌려 자동 행동 유도. Activation 철학.
ORC👁 54
Optimized Row Columnar
Hive 최적화 컬럼 포맷. Parquet과 경쟁.
Pinecone Serverless👁 54
Pinecone 서버리스 벡터 DB. 사용량 과금.
Reciprocal Rank Fusion (RRF)👁 54
여러 검색 순위를 통합하는 방법. 하이브리드 검색의 표준.
Redpanda👁 54
C++로 작성된 Kafka API 호환 스트리밍 플랫폼. JVM 없음, 10배 빠름.
Semantic Layer + AI👁 54
LLM이 의미 레이어를 기반으로 정확한 쿼리 생성.
Spark DataFrame👁 54
Spark의 분산 DataFrame API. SQL처럼 편리·Catalyst 최적화.
Starburst / Trino Galaxy👁 54
Trino 상용 매니지드. 연합 쿼리 플랫폼.
Stitch👁 54
Talend가 인수한 간단한 ELT SaaS. Fivetran보다 저렴하고 작은 팀용.
Superset vs Metabase👁 54
OSS BI 비교. Superset은 복잡·강력, Metabase는 단순.
Synthetic Data👁 54
실제 데이터 통계 속성을 유지하며 인공 생성한 데이터. 프라이버시·편향 문제 대응.
Text-to-SQL (NL2SQL)👁 54
자연어 질문을 SQL로 변환. BI·분석의 민주화.
Watermark👁 54
스트리밍에서 시점 T까지 이벤트 수신 완료 마커.
Apache Druid👁 53
실시간·시계열 OLAP. 이벤트 분석 특화.
Arrow Flight SQL👁 53
Arrow Flight 위의 SQL 프로토콜. JDBC/ODBC를 대체.
BI👁 53
Business Intelligence
비즈니스 데이터 분석·시각화로 의사결정을 돕는 플랫폼. Tableau·Power BI·Looker.
Data App👁 53
Streamlit·Gradio·Retool·Hex로 데이터 기반 내부 앱 개발.
Databricks Model Serving👁 53
관리형 모델 서빙. 내장 메트릭·A/B.
DataHub👁 53
LinkedIn이 오픈소스화한 데이터 카탈로그·거버넌스. Metadata graph.
dbt Packages👁 53
dbt-utils·dbt-expectations 등 공식·커뮤니티 패키지.
dbt Semantic Layer👁 53
dbt의 메트릭 중앙 정의. MetricFlow.
Delta Live Tables👁 53
Databricks의 선언적 파이프라인. 의존성·품질·모니터링 자동.
Event Schema👁 53
제품 분석 이벤트 명명·속성 스키마. 일관성이 분석 품질.
Evidence👁 53
Markdown + SQL로 데이터 앱·리포트 제작. BI의 Next-gen.
Funnel Drop-off👁 53
퍼널 각 단계의 이탈률 분석. 가장 큰 드롭 지점이 개선 우선순위.
Grafana Mimir👁 53
Prometheus 대규모 확장. Cortex 후속.
Great Expectations👁 53
오픈소스 데이터 품질 테스트 프레임워크. 데이터에 "기대치"를 코드로 표현.
Inmon 방법론👁 53
Corporate Information Factory. 3NF 기반 중앙 Warehouse.
Kafka Offset👁 53
파티션 내 메시지 위치. 컨슈머가 자신의 진행 상태로 커밋.
Kappa Architecture👁 53
스트리밍 단일 레이어 아키텍처. Lambda 대안.
lakeFS👁 53
데이터 레이크의 Git. 브랜치·커밋·머지로 데이터 관리.
Metabase Embedding👁 53
Metabase 대시보드를 앱에 임베드. SaaS 분석 제공.
Metric Tree👁 53
비즈니스 메트릭의 계층·의존성 모델링. North Star 분해.
Mixpanel👁 53
제품 분석 SaaS의 대표. 이벤트 기반 퍼널·리텐션·코호트.
MTEB👁 53
Massive Text Embedding Benchmark
임베딩 모델 종합 벤치마크. Hugging Face 리더보드.
Neural Network👁 53
인간 뇌의 뉴런을 모방한 연산 모델. 층 구조로 입력→출력 매핑을 학습.
OpenMetadata👁 53
오픈소스 데이터 카탈로그·거버넌스. DataHub 경쟁.
Photon👁 53
Databricks의 C++ 벡터화 쿼리 엔진. Spark SQL 10배+ 빠름.
Ray👁 53
분산 Python 프레임워크. ML·강화학습·배치 병렬화. Anyscale 상용화.
Ray Train👁 53
Ray의 분산 훈련 라이브러리. PyTorch DDP·FSDP 추상화.