본문 바로가기
파이썬. 머신러닝/sklearn

sklearn : 전처리 - 원핫 인코딩(One Hot Encoding)

by 한국수달보호협회장 2022. 10. 13.

범주화된 데이터를 숫자로 바꾸는데 또 다른 방법은 원핫인코딩이다. 전 글에 쓴 라벨인코딩은 해당 column에서 값을 바꾸는거였다면, 원핫인코딩은 아예 column을 새로 만들어버린다. 

 

예를 들면, 성별에 (남, 여)가 있었다면 성별_남 column , 성별_여 column 이런식으로 column을 2개로 만들어버린다.

 

이번 파트는 공부하면서 이해안되는 명령문이 많은데 나중에 이해해야겠다..

 

 

 

 

 

 

 

 

encoded가 array인데 DataFrame으로 바꿔준다