본문 바로가기
카테고리 없음

sklearn : 전처리 - 라벨인코딩

by 한국수달보호협회장 2022. 10. 13.

머신러닝에서는 범주화된 데이터를 이해하지 못해서 숫자로 바꿔줘야 된다고 한다.

남자, 여자라는 데이터를 -> 1, 2 이렇게 각각 바꿔줘야하는데 이거를 라벨인코딩이라고 한다.

 

 

이전 글에서 표준화할때 썼던건데 이어서 쓰면, (그리고 개체명을 penguins_scaled => penguins_stand로 바꿨습니다)

 

 

라벨인코딩을 해줘야 할 애들

 

맨 마지막행이 표준화,정규화할때 문법과 좀 다르다

 

 

라벨인코딩이 잘 됐는지 encoded를 확인해보면 값이 숫자로 바뀌어져있다.

 

값을 기존 데이터프레임에 집어넣으면 끝