📊
Data — 147개 용어
ML·데이터 파이프라인·ETL·Warehouse·MLOps·분석 엔진
NATS👁 2
클라우드 네이티브 메시징. 초저지연·간단함 강조. Go·Rust 작성.
NDCG👁 2
Normalized Discounted Cumulative Gain
검색·추천의 순위 품질 지표. 상위 순위 가중치.
Neural Network👁 2
인간 뇌의 뉴런을 모방한 연산 모델. 층 구조로 입력→출력 매핑을 학습.
North Star Metric👁 2
조직의 유일한 핵심 지표. 모든 팀이 이것에 정렬.
NumPy👁 2
Python 수치 계산의 기반 라이브러리. 배열·행렬·벡터 연산.
OLAP👁 2
Online Analytical Processing
분석·집계 최적화 DB 워크로드. OLTP(트랜잭션)와 대비. 컬럼 저장이 특징.
OLAP 엔진 비교👁 2
OLAP 엔진 종류: ROLAP·MOLAP·HOLAP. 현대는 대부분 ROLAP(Snowflake·BigQuery).
OLAP Cube👁 2
차원·측정값으로 미리 집계된 다차원 데이터 구조. 전통 BI의 기반.
OLTP👁 2
Online Transaction Processing
실시간 트랜잭션 처리 DB 워크로드. 작은 CRUD가 많은 운영 DB.
OpenMetadata👁 2
통합 메타데이터 플랫폼. 카탈로그·lineage·품질·거버넌스 한 번에.
Operational Analytics👁 2
분석 결과를 운영 시스템으로 되돌려 자동 행동 유도. Activation 철학.
Pandas👁 2
Python의 데이터프레임 라이브러리. 분석·전처리의 사실상 표준.
Parquet👁 2
컬럼 지향 파일 포맷. Lake·Warehouse 표준. 압축·쿼리 효율 탁월.
PLG👁 2
Product-Led Growth
제품 자체를 마케팅·성장 엔진으로 삼는 전략. 무료 → 유료 전환.
PostHog👁 2
오픈소스 제품 분석 플랫폼. 이벤트·퍼널·리텐션·Feature Flag 통합.
Power BI👁 2
Microsoft의 BI 도구. Office 365 통합. 엔터프라이즈·Tableau 대안.
Prefect👁 2
현대적 워크플로 오케스트레이터. Airflow의 Python 네이티브 대안.
Presto/Trino👁 2
분산 SQL 쿼리 엔진. Facebook이 시작(Presto), 창시자들이 포크한 Trino가 주류.
PyTorch👁 2
Meta(Facebook)의 딥러닝 프레임워크. 연구 커뮤니티 주류. 동적 그래프.
Ray👁 2
분산 Python 프레임워크. ML·강화학습·배치 병렬화. Anyscale 상용화.
Ray Data👁 2
Ray의 데이터 처리 라이브러리. Spark 대안, Python 네이티브 경험.
Recall@K👁 2
상위 K개 결과에 관련 아이템이 포함된 비율. 추천·검색 기본 지표.
Redpanda👁 2
C++로 작성된 Kafka API 호환 스트리밍 플랫폼. JVM 없음, 10배 빠름.
Redshift👁 2
AWS의 Data Warehouse. PostgreSQL 포크 기반. Snowflake·BigQuery와 경쟁.
Reinforcement Learning👁 2
RL
에이전트가 환경과 상호작용하며 보상을 최대화하는 방향으로 학습. AlphaGo·로봇 제어에 활용.
Retention Curve👁 2
사용자가 시간에 따라 얼마나 남아있는지 그리는 곡선. 평평해지는 지점이 PMF 시그널.
Reverse ETL👁 2
Warehouse의 정제된 데이터를 다시 SaaS(Salesforce·Mailchimp)로 동기화.
Reverse ETL Use Cases👁 2
Warehouse 데이터를 SaaS(Salesforce·Mailchimp)로 동기화해 실행 가능하게 만듦.
RudderStack👁 2
Segment의 오픈소스 대안. Warehouse-first 접근.
SCD👁 2
Slowly Changing Dimension
디멘션 테이블의 변경 이력 처리 방식. Type 1·2·3·6 등.
Schema Change Management👁 2
DB·Warehouse 스키마 변경 안전 배포. Liquibase·Flyway·schemachange.
scikit-learn👁 2
Python의 전통 ML 라이브러리. 분류·회귀·클러스터링·전처리 포괄.
Segment👁 2
이벤트 추적·전달 플랫폼. 하나의 SDK로 여러 destination에 분배.
Semantic Layer👁 2
비즈니스 지표를 중앙 정의해 여러 BI·앱에서 재사용하는 추상화 계층. Cube·dbt Semantic Layer.
Snowflake👁 2
클라우드 네이티브 Data Warehouse. 스토리지와 컴퓨트 분리, 자동 확장으로 업계 선두.
Soda👁 2
SQL 기반 데이터 품질 검사 도구. SodaCL DSL로 선언적 체크.
Star Schema👁 2
Warehouse의 고전적 설계. 중앙 팩트 테이블 + 여러 디멘션 테이블.
Stitch👁 2
Talend가 인수한 간단한 ELT SaaS. Fivetran보다 저렴하고 작은 팀용.
Supervised Learning👁 2
입력과 정답(레이블)이 쌍으로 주어진 데이터로 학습하는 ML. 분류·회귀가 대표.
Synthetic Data👁 2
실제 데이터 통계 속성을 유지하며 인공 생성한 데이터. 프라이버시·편향 문제 대응.
Tableau👁 2
Salesforce가 인수한 BI의 거인. 드래그앤드롭 시각화 선구자.
Tabular Data👁 2
행·열로 구성된 구조화 데이터. DB 테이블·CSV·Excel. 전통 ML의 주 대상.
TensorFlow👁 2
Google이 개발한 딥러닝 프레임워크. 프로덕션·모바일 배포에 강점.
Train/Val/Test Split👁 2
데이터를 학습·검증·테스트로 나눔. 보통 70/15/15. Data leakage 주의.
Unstructured Data👁 2
정형 스키마 없는 데이터. 텍스트·이미지·음성·비디오. 전체 기업 데이터의 80%+.
Unsupervised Learning👁 2
레이블 없이 데이터의 구조·패턴을 학습. 클러스터링·차원 축소가 대표.
Weights & Biases👁 2
W&B
ML 실험 추적·시각화 SaaS. 대시보드·보고서·하이퍼파라미터 스윕 강력.
← 이전3 / 3