본문 바로가기

📊

Data — 348개 용어

ML·데이터 파이프라인·ETL·Warehouse·MLOps·분석 엔진

Databricks Model Serving👁 90

관리형 모델 서빙. 내장 메트릭·A/B.

Data Fabric👁 90

메타데이터·AI 기반 통합 데이터 아키텍처. Data Mesh 대안.

dbt Source Freshness👁 90

원본 테이블의 신선도 감사. 지연 알람.

Evidence👁 90

Markdown + SQL로 데이터 앱·리포트 제작. BI의 Next-gen.

Great Expectations👁 90

오픈소스 데이터 품질 테스트 프레임워크. 데이터에 "기대치"를 코드로 표현.

Iceberg REST Catalog 채택👁 90

2024년부터 Snowflake·Databricks·Glue 모두 REST Catalog 지원.

Machine Learning👁 90

데이터로부터 패턴을 학습해 예측·분류하는 AI의 하위 분야. 지도·비지도·강화학습으로 나뉨.

Looker 창시자들의 새 BI. AI·Semantic Layer.

Apache Druid👁 89

실시간·시계열 OLAP. 이벤트 분석 특화.

CDP vs Warehouse👁 89

Segment·mParticle 같은 CDP와 Snowflake 직접 사용 비교.

Grafana Mimir👁 89

Prometheus 대규모 확장. Cortex 후속.

SQL·Python 노트북 협업 플랫폼. AI 통합 강점.

Hightouch👁 89

Warehouse → SaaS 동기화 Reverse ETL 선두. Data Activation.

Iceberg v3 Spec👁 89

2024 Iceberg v3. Deletion Vectors·Row Lineage·Variant.

Kafka Consumer Group👁 89

같은 그룹 내 컨슈머가 파티션을 나눠 병렬 소비.

선언적 YAML 오케스트레이터. 이벤트·스케줄·UI 강력.

Kimball 방법론👁 89

Dimensional Modeling 선구자. Star Schema 중심.

Parquet 상세👁 89

컬럼 저장·압축·encoding·row group·page 구조.

Rust 기반 오픈소스 벡터 DB. Payload filter 강점.

Ray Serve👁 89

Ray 기반 모델 서빙. 복잡 pipeline·multi-model.

Analytics API👁 88

제품에 분석 API 임베드. GoodData·Cube·Hightouch Events.

dbt Snapshot👁 88

SCD Type 2 자동 구현. 변경 이력 자동 추적.

Deep Learning👁 88

다층 신경망을 사용하는 ML의 하위 분야. 이미지·음성·NLP에 혁명적 성능.

Delta Sharing👁 88

회사 간 데이터를 복사 없이 공유하는 오픈 프로토콜.

Data Lake 위의 SQL 엔진. Iceberg 네이티브.

Feature Store Online/Offline👁 88

훈련·추론 간 피처 일관성을 위한 dual store.

Kafka Tiered Storage👁 88

오래된 세그먼트를 S3로 이동. 디스크 비용 절감.

Kappa Architecture👁 88

스트리밍 단일 레이어 아키텍처. Lambda 대안.

Metric Tree👁 88

비즈니스 메트릭의 계층·의존성 모델링. North Star 분해.

pgvector 튜닝👁 88

IVFFlat·HNSW 선택. lists·ef_search.

SQL·시계열 특화 고성능 DB. 금융·IoT.

BigQuery ML👁 87

BigQuery에서 SQL로 ML 모델 학습·추론.

Bufstream👁 87

Buf의 Kafka 호환 + 스키마 거버넌스. Protobuf 기반.

ByteHouse👁 87

ByteDance의 ClickHouse 포크 상용화.

ClickHouse Cloud👁 87

ClickHouse의 매니지드 서비스. 서버리스 분석.

Feast (Feature Store)👁 87

오픈소스 Feature Store. Online·Offline·Streaming feature.

Google Cloud Dataflow👁 87

GCP 관리형 Beam. 오토스케일·streaming engine.

Hudi vs Iceberg vs Delta👁 87

오픈 lakehouse 포맷 3대장 비교.

Iceberg Partition Evolution👁 87

Iceberg의 파티션 스키마 변경 안전성. 과거 데이터 재처리 불필요.

Kafka KRaft👁 87

Kafka 3.3+ ZooKeeper 제거 모드. 운영 단순화.

Kafka Partition👁 87

Kafka 토픽의 분산 단위. 병렬 처리·순서 보장·확장성의 기본.

LlamaIndex for Data👁 87

LlamaIndex의 구조화 데이터 지원. SQL·Pandas·NL Query.

MongoDB Atlas👁 87

MongoDB 매니지드 클라우드. 자동 샤딩·백업·검색·벡터.

Log Compaction👁 86

같은 키의 오래된 메시지를 제거해 최신 값만 유지.

Project Nessie👁 86

Iceberg용 Git-like 카탈로그. 브랜치·머지.

Apache DataFusion👁 84

Rust 기반 임베디드 SQL 쿼리 엔진. Arrow·Iceberg 네이티브.

Flink State👁 84

Flink 스트림의 상태 관리. KeyedState·OperatorState·Checkpointing.

Dagster Software-Defined Assets👁 82

Dagster의 자산 중심 오케스트레이션. 데이터 객체가 1급.

← 이전7 / 7