Data cleansing란?

데이터 정제(Data Cleansing)는 데이터셋의 오류, 중복, 누락, 불일치를 식별·수정·제거해 품질을 높이는 과정입니다. 표준화, 결측값 처리, 중복 제거, 형식 변환, 이상치 처리 등이 포함되며, 분석·AI 프로젝트 시간의 상당 부분을 차지합니다. 자동화 도구(OpenRefine, Trifacta)와 AI 기반 정제 기술이 발전하고 있습니다.