본문 바로가기
Data#Data#Privacy조회 21

Synthetic Data란?

정의

실제 데이터 통계 속성을 유지하며 인공 생성한 데이터. 프라이버시·편향 문제 대응.

Synthetic Data란?

실데이터 유출 리스크·양 부족·클래스 불균형을 해결하기 위해 통계적으로 유사한 가짜 데이터를 생성한다.

생성

  • GAN·Diffusion — 이미지
  • LLM — 텍스트·대화
  • Mostly AI, Gretel — 테이블 데이터 전문

🔗 함께 보면 좋은 용어

Data 전체 →