query and조건, value_counts(normalize=True), groupby(['ageg', 'marriage'], as_index = False)['religion']
1 = 결혼, 3 = 이혼, 나머지 = etc
위에는 relpace를 이용했지만 아래처럼 np.where로 이중 if문처럼 사용도 가능
데이터프레임으로 수치표현
※여기부터가 중요
종교 여부, 결혼 여부, 비율 이렇게 나오게하기
책에서는 소수점으로 나오는 숫자를 백분율%로 바꿀려고 저런식으로 썼지만 사실 그냥
연령대, 종교유무에따른 이혼율
보면 young한 사람들의 marriage, divorce 데이터 수치 자체가 거의 없어서 제외시켜야 될듯.
위랑 같은 내용, 다르게 표현
연령대, 종교, 결혼여부 비율 순
연령대, 결혼여부, 종교 비율 순
이렇게보니까 middle 중년층에서는 종교가 없으면 이혼율에 영향을 좀 주는걸로 보인다.
책에서는 무종교의 이혼율이 높다고 나오는데 그닥 영향력있는것 같진 않다.
'파이썬. 데이터분석 > 데이터분석 실습' 카테고리의 다른 글
페캠 데이터실습.Ch1 : 센서데이터 이상진단및예측 / subplot for순환문.iloc (0) | 2022.10.30 |
---|---|
2019 한국통계자료 분석 6 : 지역별 연령대 비율 (0) | 2022.08.27 |
2019 한국통계자료 분석 4 : 성별과 직업 (0) | 2022.08.23 |
2019 한국통계자료 분석 3 : 직업별 월급차이 (0) | 2022.08.23 |
2019 한국통계자료 분석 2 : 성별, 연령대에 따른 소득차이 (추가) (0) | 2022.08.22 |