원시 데이터(Raw Data)는 수집된 후 처리·정제·변환되지 않은 상태의 데이터를 의미합니다. 센서 측정값, 로그, 스캔한 문서, 원시 텍스트·이미지 등이 해당하며, 분석·AI에 사용되기 전 전처리 과정을 거쳐야 합니다. 원본의 완전한 정보를 보존한다는 장점과 노이즈·중복·일관성 부족이라는 단점을 함께 가지며, 데이터 레이크에 대량 저장됩니다.
원시 데이터(Raw Data)는 수집된 후 처리·정제·변환되지 않은 상태의 데이터를 의미합니다. 센서 측정값, 로그, 스캔한 문서, 원시 텍스트·이미지 등이 해당하며, 분석·AI에 사용되기 전 전처리 과정을 거쳐야 합니다. 원본의 완전한 정보를 보존한다는 장점과 노이즈·중복·일관성 부족이라는 단점을 함께 가지며, 데이터 레이크에 대량 저장됩니다.