본문 바로가기
Y
S
영삼넷
youngsam.net
프로그램
기술노트
뉴스
사전
자료실
커뮤니티
소개
홈
/
기술 용어 사전
/
Ray Train
Data
#Data
#MLOps
조회 1
Ray Train란?
정의
Ray의 분산 훈련 라이브러리. PyTorch DDP·FSDP 추상화.
Ray Train
수백 GPU에 걸친
DDP·FSDP를 단일 API
. Ray Tune·Serve와 통합.
🔗 함께 보면 좋은 용어
Data 전체 →
데이터 관측성 플랫폼
Monte Carlo·Bigeye·Soda·Datafold·Elementary.
데이터 레이크 파일 포맷
Parquet·ORC·Avro·Arrow. 사용 시나리오별 선택.
임베딩 모델 선택
OpenAI·Cohere·BGE·ko-sroberta 등.
데이터 품질 프레임워크
Great Expectations·Soda·dbt tests·Elementary.
벡터 검색 벤치마크
ANN Benchmarks·VectorDBBench·BEIR.
모던 데이터 스택 2026
Snowflake·Databricks·Fabric·BigQuery 중심의 2026년 현황.