본문 바로가기

📊

Data — 348개 용어

ML·데이터 파이프라인·ETL·Warehouse·MLOps·분석 엔진

Weaviate👁 97

모듈형 OSS 벡터 DB. Hybrid 검색·임베딩 자동 생성.

개발자 친화 OSS 벡터 DB. Python 우선.

Dagster Pipes👁 96

외부 프로세스(Spark·Databricks·Kubernetes) 통합 프로토콜.

Data Mesh Governance👁 96

분산 소유 + 연방 거버넌스. 공통 표준·상호 운용성.

Data Vault 2.0👁 96

감사·변경 추적·확장성에 최적화된 Warehouse 모델링. Hub-Link-Satellite.

dbt Packages👁 96

dbt-utils·dbt-expectations 등 공식·커뮤니티 패키지.

dbt Sources👁 96

원본 raw 테이블을 dbt 프로젝트에서 명명·테스트.

Delta Live Tables👁 96

Databricks의 선언적 파이프라인. 의존성·품질·모니터링 자동.

Google이 인수한 엔터프라이즈 BI. LookML로 데이터 모델링. Semantic Layer 선구자.

SQL + Python 분석 협업 플랫폼. ThoughtSpot 인수.

OLAP 엔진 비교👁 96

OLAP 엔진 종류: ROLAP·MOLAP·HOLAP. 현대는 대부분 ROLAP(Snowflake·BigQuery).

RAG 평가 프레임워크👁 96

RAGAS·TruLens·DeepEval·Phoenix.

Reciprocal Rank Fusion (RRF)👁 96

여러 검색 순위를 통합하는 방법. 하이브리드 검색의 표준.

Redshift ML👁 96

AWS Redshift에서 SQL로 SageMaker 모델 학습·추론.

Semantic Layer + AI👁 96

LLM이 의미 레이어를 기반으로 정확한 쿼리 생성.

Snowflake Iceberg Tables👁 96

Snowflake가 외부 Iceberg 테이블 네이티브 지원. 벤더 락 감소.

Snowflake Openflow👁 96

Apache NiFi 기반 Snowflake 공식 인제스트.

Streamlit in Snowflake👁 96

Streamlit 앱을 Snowflake 데이터에 안전하게 배포.

Vanna.ai👁 96

Text-to-SQL 오픈소스. RAG 기반으로 스키마 이해.

Apache Pinot👁 95

LinkedIn의 실시간 OLAP. 저지연·고처리량.

Apache Polaris👁 95

Snowflake가 오픈소스화한 Iceberg 카탈로그.

Arrow Flight SQL👁 95

Arrow Flight 위의 SQL 프로토콜. JDBC/ODBC를 대체.

Data Activation👁 95

분석 인사이트를 실제 운영에 반영. Hightouch·Census의 핵심 메시지.

LinkedIn이 오픈소스화한 데이터 카탈로그·거버넌스. Metadata graph.

dbt Model 유형👁 95

View·Table·Incremental·Ephemeral 등 dbt materialization.

Kafka 스트림에 SQL로 쿼리하는 엔진. Confluent 제공.

Late Chunking👁 95

긴 문서를 먼저 임베딩 후 청크 경계에서 자르기.

Neural Network👁 95

인간 뇌의 뉴런을 모방한 연산 모델. 층 구조로 입력→출력 매핑을 학습.

데이터 Product Thinking👁 95

데이터를 제품처럼. SLA·소비자·버저닝·문서.

Reinforcement Learning👁 95

에이전트가 환경과 상호작용하며 보상을 최대화하는 방향으로 학습. AlphaGo·로봇 제어에 활용.

Weights & Biases 심화👁 95

실험·모델·데이터·LLM 프롬프트 관리.

Apache NiFi👁 94

GUI 기반 데이터 플로우. IoT·통합·라우팅에 강점.

Arrow Flight👁 94

Arrow 기반 고성능 데이터 전송 프로토콜. ODBC/JDBC 대체.

Auto Loader👁 94

Databricks의 점진적 파일 인제스트. 스키마 추론·진화.

Change Data Capture👁 94

DB의 INSERT/UPDATE/DELETE를 실시간으로 캡처해 다른 시스템에 전파하는 기법.

Cube.dev👁 94

Headless BI·Semantic Layer. SQL·REST·GraphQL 노출.

Data Warehouse👁 94

분석용 대규모 구조화 데이터 저장소. OLAP 최적화. Snowflake, BigQuery, Redshift.

dbt Incremental Model👁 94

증분 업데이트 전략. 전체 재빌드 대신 신규 데이터만.

dbt Semantic Layer👁 94

dbt의 메트릭 중앙 정의. MetricFlow.

Embedding Dimension👁 94

임베딩 벡터 차원. 품질·저장·속도 트레이드오프.

Funnel Drop-off👁 94

퍼널 각 단계의 이탈률 분석. 가장 큰 드롭 지점이 개선 우선순위.

Kubeflow Trainer👁 94

K8s 분산 ML 훈련. PyTorch·TF·XGBoost 오퍼레이터.

대규모 벡터 DB. GPU 가속·수십억 벡터.

MLflow Tracking·Registry👁 94

실험 추적·모델 버전 관리. Databricks 오픈 표준.

OpenMetadata👁 94

오픈소스 데이터 카탈로그·거버넌스. DataHub 경쟁.

Databricks의 C++ 벡터화 쿼리 엔진. Spark SQL 10배+ 빠름.

Polaris Catalog👁 94

Snowflake가 Apache Foundation에 기증한 Iceberg REST 카탈로그.

분산 Python 프레임워크. ML·강화학습·배치 병렬화. Anyscale 상용화.

Real-time OLAP👁 94

Druid·Pinot·ClickHouse. 실시간 집계·이벤트 분석.

RisingWave👁 94

Apache 2.0 스트리밍 DB. Materialize 오픈소스 경쟁.

← 이전5 / 7다음 →