Data Augmentation란?

데이터 증강(Data Augmentation)은 기존 학습 데이터에 변형(회전, 크롭, 색상 변조, 노이즈 추가 등)을 가해 다양성을 늘리는 기법으로, 모델의 일반화 성능을 높이고 과적합을 방지합니다. 이미지, 텍스트, 오디오, 시계열 등 다양한 도메인에서 활용되며, 최근에는 생성형 AI를 활용한 합성 데이터 증강도 널리 쓰입니다. 레이블이 부족하거나 클래스 불균형이 있는 상황에서 특히 효과적입니다.