본문 바로가기
파이썬. 데이터분석/데이터분석 실습

2019 한국통계자료 분석 3 : 직업별 월급차이

by 한국수달보호협회장 2022. 8. 23.

merge, seaborn palette, sort_values,barplot,xticks, xlim

 

메인 데이터프레임이 welfare

welfare에 list_job을 merge하고

 

welfare에 merge가 잘 됐는지 확인.

실제데이터라 결측치가 많아서 dropna, subset을 계속 써줘야된다

당연히 직업이랑 소득이 있으면 직업별 평균소득이 궁금해진다.

 

평균소득을 구했으면 당연히 줄세우기를 하고싶어진다.

 

 

barplot으로 바로 그려봤더니 x축이 이렇다

 

xticks를 rotation시킨다. 이러면 좀 낫긴한데 예쁘지가않다

 

그냥 그래프 자체를 가로로 놓아보자.

barplot도 axes-level이라 matplotlib 메서드 적용이 된다.

 

그래프를 보면 항상 예쁘게 꾸미고싶어진다.

 

줄세우기라 sequential 컬러를 썼다.

근데 문제가 금액이 큰게 진하고, 작은게 옅어야되는데 내림차순으로 정렬해서 반대로됐다.

 

검색해보니까 해결책이 심플하다. 대부분 sequential palette색상이 연하게 -> 진하게 순으로 정렬되어있는데

색상이름 다음에 '_r'을 넣어주면 순서가 역으로 바뀐다

 

matplotlib 공식사이트에 있는 색도 사용해봤는데 seaborn에서 문제없이 잘된다.

 

최하위 10개 직업도 골랐다. 위에 그래프와 x축을 맞춰야 될것같아서 xlim=(0,800)으로했다