합성 데이터 생성(Synthetic Data Generation)은 실제 데이터의 통계적 특성·관계·분포를 유지하면서 새로운 인공 데이터를 만드는 기술입니다. GAN, 확산 모델, VAE, 시뮬레이션, 통계적 샘플링이 활용되며, 프라이버시 보호, 데이터 증강, 레어 케이스 생성, 규제 준수 환경에서 AI 학습 데이터 확보에 사용됩니다. 품질 평가는 충실도(통계적 유사성)와 프라이버시 보호 수준의 균형이 관건입니다.
합성 데이터 생성(Synthetic Data Generation)은 실제 데이터의 통계적 특성·관계·분포를 유지하면서 새로운 인공 데이터를 만드는 기술입니다. GAN, 확산 모델, VAE, 시뮬레이션, 통계적 샘플링이 활용되며, 프라이버시 보호, 데이터 증강, 레어 케이스 생성, 규제 준수 환경에서 AI 학습 데이터 확보에 사용됩니다. 품질 평가는 충실도(통계적 유사성)와 프라이버시 보호 수준의 균형이 관건입니다.