📊
Data — 348개 용어
ML·데이터 파이프라인·ETL·Warehouse·MLOps·분석 엔진
Star Schema👁 52
Warehouse의 고전적 설계. 중앙 팩트 테이블 + 여러 디멘션 테이블.
Windowing👁 52
무한 스트림을 유한 창으로 분할. Tumbling·Sliding·Session.
Customer 360 / CDP Profile👁 51
고객을 중심으로 행동·거래·서포트를 통합한 레코드.
dbt Mesh👁 51
여러 dbt 프로젝트를 조직 단위로 연결. 데이터 메시 구현.
Delta Liquid Clustering👁 51
Databricks Delta의 동적 파티셔닝. Z-Ordering 후속.
Hudi vs Iceberg vs Delta👁 51
오픈 lakehouse 포맷 3대장 비교.
Kestra👁 51
선언적 YAML 오케스트레이터. 이벤트·스케줄·UI 강력.
Kubeflow Trainer👁 51
K8s 분산 ML 훈련. PyTorch·TF·XGBoost 오퍼레이터.
Pulsar Functions👁 51
Pulsar 내장 스트림 처리. 메시지→함수→토픽.
Qdrant👁 51
Rust 기반 오픈소스 벡터 DB. Payload filter 강점.
Soda👁 51
SQL 기반 데이터 품질 검사 도구. SodaCL DSL로 선언적 체크.
StarRocks👁 51
MPP 분석 DB. Apache Doris 포크. Iceberg 네이티브.
Unity Catalog👁 51
Databricks의 데이터 거버넌스 계층. 2024년 OSS.
Unity Catalog Lineage👁 51
테이블·컬럼 수준 데이터 계보 자동 추적.
Weaviate👁 51
모듈형 OSS 벡터 DB. Hybrid 검색·임베딩 자동 생성.
Windmill👁 51
오픈소스 개발자 플랫폼. 스크립트·워크플로·UI 통합.
Analytics API👁 50
제품에 분석 API 임베드. GoodData·Cube·Hightouch Events.
ClickHouse Cloud👁 50
ClickHouse의 매니지드 서비스. 서버리스 분석.
dbt Snapshot👁 50
SCD Type 2 자동 구현. 변경 이력 자동 추적.
dbt Test👁 50
스키마 테스트·커스텀 SQL 테스트. 데이터 품질 게이트.
Iceberg Partition Evolution👁 50
Iceberg의 파티션 스키마 변경 안전성. 과거 데이터 재처리 불필요.
Kafka Partition👁 50
Kafka 토픽의 분산 단위. 병렬 처리·순서 보장·확장성의 기본.
MLflow Tracking·Registry👁 50
실험 추적·모델 버전 관리. Databricks 오픈 표준.
Real-time OLAP👁 50
Druid·Pinot·ClickHouse. 실시간 집계·이벤트 분석.
Snowflake Openflow👁 50
Apache NiFi 기반 Snowflake 공식 인제스트.
Apache DataFusion👁 49
Rust 기반 임베디드 SQL 쿼리 엔진. Arrow·Iceberg 네이티브.
Arrow Flight👁 49
Arrow 기반 고성능 데이터 전송 프로토콜. ODBC/JDBC 대체.
BigQuery ML👁 49
BigQuery에서 SQL로 ML 모델 학습·추론.
Bufstream👁 49
Buf의 Kafka 호환 + 스키마 거버넌스. Protobuf 기반.
ClickHouse MV👁 49
ClickHouse의 실시간 사전 집계. INSERT 시 자동 갱신.
Data Fabric👁 49
메타데이터·AI 기반 통합 데이터 아키텍처. Data Mesh 대안.
dbt Seeds👁 49
CSV 파일을 Warehouse 테이블로 로드. 기준 데이터용.
Deep Learning👁 49
DL
다층 신경망을 사용하는 ML의 하위 분야. 이미지·음성·NLP에 혁명적 성능.
Delta Sharing👁 49
회사 간 데이터를 복사 없이 공유하는 오픈 프로토콜.
Hightouch👁 49
Warehouse → SaaS 동기화 Reverse ETL 선두. Data Activation.
Kafka Consumer Group👁 49
같은 그룹 내 컨슈머가 파티션을 나눠 병렬 소비.
LlamaIndex for Data👁 49
LlamaIndex의 구조화 데이터 지원. SQL·Pandas·NL Query.
Log Compaction👁 49
같은 키의 오래된 메시지를 제거해 최신 값만 유지.
Snowflake Copilot👁 49
Snowflake의 AI 어시스턴트. Cortex 기반 자연어 SQL.
ByteHouse👁 48
ByteDance의 ClickHouse 포크 상용화.
Feast (Feature Store)👁 48
오픈소스 Feature Store. Online·Offline·Streaming feature.
Feature Store Online/Offline👁 48
훈련·추론 간 피처 일관성을 위한 dual store.
MongoDB Atlas👁 48
MongoDB 매니지드 클라우드. 자동 샤딩·백업·검색·벡터.
pgvector 튜닝👁 48
IVFFlat·HNSW 선택. lists·ef_search.
Ray Serve👁 48
Ray 기반 모델 서빙. 복잡 pipeline·multi-model.
BigQuery + Gemini👁 47
BigQuery의 Gemini AI 통합. 자연어 쿼리·데이터 준비 자동화.
Dagster Software-Defined Assets👁 47
Dagster의 자산 중심 오케스트레이션. 데이터 객체가 1급.
Flink State👁 46
Flink 스트림의 상태 관리. KeyedState·OperatorState·Checkpointing.
← 이전7 / 7