[데이터 분석] Data Preprocessing (Pandas)
·
AI Research/Data Analysis
Kaggle의 'Adult Census Income' 데이터를 이용하였습니다. ▶ 결측치 찾기(자세한 내용은 링크를 참조해주세요) -결측치가 있는 행을 찾아주는 코드는 아래와 같습니다. train[train.apply(lambda x: "?" in list(x), axis=1)] ## 물음표 있는 row만 찾아줍니다. - 'age'가 30이상이고 'workclass'가 '?'인 행을 찾아 workclass의 값을 'No'로 바꿔줍니다. train.loc[(train.age >= 30)&(train.workclass=='?'), 'workclass'] = 'No' train.workclass.value_counts() ▶ 이상치 처리 -이상치 확인해보기 train.describe() desc..