본문 바로가기
📊

Data 348개 용어

ML·데이터 파이프라인·ETL·Warehouse·MLOps·분석 엔진

Retention Curve👁 54
사용자가 시간에 따라 얼마나 남아있는지 그리는 곡선. 평평해지는 지점이 PMF 시그널.
SCD👁 54
Slowly Changing Dimension
디멘션 테이블의 변경 이력 처리 방식. Type 1·2·3·6 등.
Vanna.ai👁 54
Text-to-SQL 오픈소스. RAG 기반으로 스키마 이해.
Vector Search 알고리즘👁 54
HNSW·IVF·PQ·ScaNN. ANN 알고리즘.
Apache NiFi👁 53
GUI 기반 데이터 플로우. IoT·통합·라우팅에 강점.
Dremio👁 53
Data Lake 위의 SQL 엔진. Iceberg 네이티브.
Iceberg REST Catalog👁 53
Iceberg 카탈로그 표준 API. Glue·Polaris·Tabular 호환.
Inmon 방법론👁 53
Corporate Information Factory. 3NF 기반 중앙 Warehouse.
Kafka KRaft👁 53
Kafka 3.3+ ZooKeeper 제거 모드. 운영 단순화.
Mode👁 53
SQL + Python 분석 협업 플랫폼. ThoughtSpot 인수.
Reinforcement Learning👁 53
RL
에이전트가 환경과 상호작용하며 보상을 최대화하는 방향으로 학습. AlphaGo·로봇 제어에 활용.
RisingWave👁 53
Apache 2.0 스트리밍 DB. Materialize 오픈소스 경쟁.
Snowflake Iceberg Tables👁 53
Snowflake가 외부 Iceberg 테이블 네이티브 지원. 벤더 락 감소.
Spark Structured Streaming👁 53
Spark의 스트리밍 API. 배치처럼 작성·실시간 실행.
Streaming-first Architecture👁 53
배치 대신 스트림을 기본으로. Kappa Architecture.
Streamlit 대시보드👁 53
Python 스크립트로 인터랙티브 웹 앱. 데이터 팀 프로토타입.
Streamlit in Snowflake👁 53
Streamlit 앱을 Snowflake 데이터에 안전하게 배포.
Thoughtspot👁 53
검색·자연어 BI. "Search-driven Analytics".
VictoriaMetrics👁 53
Prometheus 호환 TSDB. 장기 저장·메모리 효율.
Weights & Biases 심화👁 53
실험·모델·데이터·LLM 프롬프트 관리.
Advanced RAG 패턴👁 52
Self-RAG·CRAG·HyDE·Query Expansion·ReRanker.
Airflow TaskFlow API👁 52
@task 데코레이터로 함수 기반 DAG. XCom 자동.
Apache Airflow 3👁 52
2024 Airflow 3. DAG 버저닝·UI 재작성·데이터 자산.
Apache Doris👁 52
Real-time MPP DB. 중국에서 개발, 글로벌 확산.
Apache Kafka👁 52
분산 스트리밍 플랫폼. 대용량 이벤트 처리의 사실상 표준. LinkedIn이 오픈소스화.
Auto Loader👁 52
Databricks의 점진적 파일 인제스트. 스키마 추론·진화.
Databricks LakeFlow👁 52
2024 발표 통합 데이터 엔지니어링. ingest·transform·orchestrate.
Data Mart👁 52
특정 부서·주제에 특화된 작은 Warehouse. 분석 속도·보안 분리.
DuckDB UI👁 52
DuckDB 내장 웹 UI. 2024년 출시, 로컬 분석 편의.
Google Cloud Dataflow👁 52
GCP 관리형 Beam. 오토스케일·streaming engine.
Hex👁 52
SQL·Python 노트북 협업 플랫폼. AI 통합 강점.
Iceberg REST Catalog 채택👁 52
2024년부터 Snowflake·Databricks·Glue 모두 REST Catalog 지원.
Iceberg v3 Spec👁 52
2024 Iceberg v3. Deletion Vectors·Row Lineage·Variant.
Kafka Exactly-Once👁 52
프로듀서 idempotence + 트랜잭션으로 정확히 한 번 처리 보장.
Kafka Tiered Storage👁 52
오래된 세그먼트를 S3로 이동. 디스크 비용 절감.
Kimball 방법론👁 52
Dimensional Modeling 선구자. Star Schema 중심.
Omni👁 52
Looker 창시자들의 새 BI. AI·Semantic Layer.
Open Table Format👁 52
Iceberg·Delta·Hudi 비교. Lake에 ACID·Schema·Time Travel 추가.
Parquet 상세👁 52
컬럼 저장·압축·encoding·row group·page 구조.
Polaris Catalog👁 52
Snowflake가 Apache Foundation에 기증한 Iceberg REST 카탈로그.
Project Nessie👁 52
Iceberg용 Git-like 카탈로그. 브랜치·머지.
Schema Change Management👁 52
DB·Warehouse 스키마 변경 안전 배포. Liquibase·Flyway·schemachange.
Spark Connect👁 52
Spark 클라이언트-서버 프로토콜. 원격 실행·다국어 클라이언트.
CDP vs Warehouse👁 51
Segment·mParticle 같은 CDP와 Snowflake 직접 사용 비교.
Data Contracts 실무👁 51
Protobuf·JSON Schema로 데이터 스키마 계약. 배포 전 검증.
dbt Exposures👁 51
dbt 모델을 사용하는 downstream(대시보드·앱) 정의.
dbt Source Freshness👁 51
원본 테이블의 신선도 감사. 지연 알람.
Delta Liquid Clustering👁 51
Databricks Delta의 동적 파티셔닝. Z-Ordering 후속.
Hudi vs Iceberg vs Delta👁 51
오픈 lakehouse 포맷 3대장 비교.
Kestra👁 51
선언적 YAML 오케스트레이터. 이벤트·스케줄·UI 강력.