[iMOD(2)] Data Cleaning 부터
당시 나는 eda의 e자도 모르는 사람이었기에 일단데이콘, 캐글, 그리고 기타 책들을 참고하여 아주 기본적인 EDA process를 따라해보기로 했다. EDA의 첫 번째 과정은 Data Cleaning이다. 이 이후에 여러 가지 데이터 분석 프로젝트를 해보고 나서 돌이켜 보니, 정말 내가 만난 데이터 중에서 제일 힘든? 총체적 난국?인 data cleaning 작업이었던 것 같다. 약 360만건의 요청이력(rows)와 26개의 features (columns)가 주어졌다. " Data cleaning이 쉽지 않았던 이유 " [배차상태]에만 배차불가/시뮬레이션취소/시스템취소/탑승취소/하차완료 5가지 종류가 있었으며,이는 또 다시 [배차상태상세]로 나누어졌다. 예를 들어, 배차불가 - 운행가..
2023.07.20