replace, df.pivot, sns.barplot
지역코드에 실제지명대신 숫자로 표현되어있다.
코드로된걸 실제 지명으로 바꾸어준다 replace
첫번째. 지역 / 연령대 / 비율
전반적으로 old인 사람이 많고 대구/경북은 반이 old
두번째. 연령대 / 지역 / 비율로 하면 느낌이 다르다
ageg를 기준으로 내림차순 되어있어 수도권에 middle,young인 사람들이 많이산다는 점을 한눈에 볼 수 있다.
첫번째로 가서 백분율로 만들어준다
그래프로 시각화하고 legend가 작아서 크게 키워줬다.
주의할 점이 plt.legend를 sns.barplot 위에다 하니까 안되더라. plt.legend를 plotting 하는곳 밑에다가 써줘야 된다.
이건 좀 이해가 안간다.
그냥 matplotlib 할 때는 plt.legend를 하고 밑에 plt.show()를 해서 plotting했는데 복잡..
이런식으로 표현하면 지역별 연령대분포를 한 눈에 볼 수 있다.
좀 더 깔끔하게 보기위해 old기준 오름차순(default가 ascending=True라 생략)
'파이썬. 데이터분석 > 데이터분석 실습' 카테고리의 다른 글
페캠 데이터실습.Ch1 : 센서데이터 이상진단및예측 / subplot for순환문.iloc (0) | 2022.10.30 |
---|---|
2019 한국통계자료 분석 5 : 종교와 이혼율 (0) | 2022.08.27 |
2019 한국통계자료 분석 4 : 성별과 직업 (0) | 2022.08.23 |
2019 한국통계자료 분석 3 : 직업별 월급차이 (0) | 2022.08.23 |
2019 한국통계자료 분석 2 : 성별, 연령대에 따른 소득차이 (추가) (0) | 2022.08.22 |