[데이터 분석] Feature Engineering (Sklearn)
·
AI Research/Data Analysis
Kaggle의 'Adult Census Income' 데이터를 이용하였습니다. ▶ 인코딩(Encoding) 모델이 이해하기 힘든 형태의 feature 혹은 애매하게 잘못 학습될 가능성이 있는 feature들을 의미적인 관점에서 변화시켜줍니다. 인코딩의 결과에 의해서 알고리즘이 보는 feature의 의미적인 특징이 드러나게 됩니다. one-hot encoding과 label encoding, Mean encoding 에 대해 설명하겠습니다. from sklearn.preprocessing import OneHotEncoder, LabelEncoder 1. one-hot encoding categorical encoding이라고도 하며, 범주형 변수에 대해 각 클래스별 독립적인 feature를 생성합니다..