본문 바로가기
파이썬. 데이터분석/데이터분석 실습

2019 한국통계자료 분석 6 : 지역별 연령대 비율

by 한국수달보호협회장 2022. 8. 27.

replace, df.pivot, sns.barplot

지역코드에 실제지명대신 숫자로 표현되어있다.

 

코드로된걸 실제 지명으로 바꾸어준다 replace

 

 

첫번째. 지역 / 연령대 / 비율

전반적으로 old인 사람이 많고 대구/경북은 반이 old

 

두번째. 연령대 / 지역 / 비율로 하면 느낌이 다르다

ageg를 기준으로 내림차순 되어있어 수도권에 middle,young인 사람들이 많이산다는 점을 한눈에 볼 수 있다.

 

첫번째로 가서 백분율로 만들어준다

 

그래프로 시각화하고 legend가 작아서 크게 키워줬다. 

주의할 점이 plt.legend를 sns.barplot 위에다 하니까 안되더라. plt.legend를 plotting 하는곳 밑에다가 써줘야 된다.

이건 좀 이해가 안간다.

 

그냥 matplotlib 할 때는 plt.legend를 하고 밑에 plt.show()를 해서 plotting했는데 복잡..

 

 

 

이런식으로 표현하면 지역별 연령대분포를 한 눈에 볼 수 있다.

 

좀 더 깔끔하게 보기위해 old기준 오름차순(default가 ascending=True라 생략)