범주화된 데이터를 숫자로 바꾸는데 또 다른 방법은 원핫인코딩이다. 전 글에 쓴 라벨인코딩은 해당 column에서 값을 바꾸는거였다면, 원핫인코딩은 아예 column을 새로 만들어버린다.
예를 들면, 성별에 (남, 여)가 있었다면 성별_남 column , 성별_여 column 이런식으로 column을 2개로 만들어버린다.
이번 파트는 공부하면서 이해안되는 명령문이 많은데 나중에 이해해야겠다..
encoded가 array인데 DataFrame으로 바꿔준다
'파이썬. 머신러닝 > sklearn' 카테고리의 다른 글
나도코딩_머신러닝 1 : 선형 회귀, 데이터 세트 분리 (0) | 2024.07.30 |
---|---|
sklearn : 분류분석모델링 - 펭귄 종 맞추기 vs 성별 맞추기 (0) | 2022.10.19 |
sklearn : 분류분석모델링(Logistic Regreesion, K-Neighbors, Decision Tree, SVC) (0) | 2022.10.19 |
sklearn : 전처리 스케일링(Scaling) - 표준화(Standardization) (0) | 2022.10.12 |
sklearn : 전처리 스케일링(Scaling) - 정규화(Normalization) (0) | 2022.10.10 |