본문 바로가기

파이썬. 데이터분석/데이터분석 실습12

새 함수 정의하기 : def hdta (head & tail) 갑자기 든 생각 : df.head(3), df.tail(5) 하는거를 한번에 하면 어떨까? 보통 그냥 df를 출력하면 위에 n개 아래 n개 이런식으로 뜨는데 위에 3개, 아래 5개 보고싶을때도 있으니까. 상상 : 데이터프레임, head수, tail수를 입력하면 head수와 tail수를 concat으로 합쳐서 한번에 보여주는 함수를 만들기 별거없긴하지만 뭔가 이렇게 조그마한 거라도 계속 만들어야 실력이 늘기때문에 한번 시도해봤다. 실험할 DataFrame hdta(데이터프레임, 보고싶은 head수, 보고싶은 tail 수) 이게 .. SW특기가 비어보이는것 처럼 보이지만 셀이 밀려서 그렇다. 생각외로 한번도 오류가 안나고 깔끔하게됐다 2022. 7. 4.
타이타닉 분석 : 어떤 사람들이 탑승했을까? 어떤 사람들이 많이 죽었을까? titanic 데이터 survived 열에서 0은 사망 1은 생존으로 바꿔준다. 히트맵을 만들어봤고 parch과 alone , sibsp과 alone이 연관성이 있다. sibsp : 함께 탑승한 형제 또는 배우자 수 prach : 함께 탑승한 부모 또는 아이의 수 뜻을 알고보니까 당연히 연관성이 있을수밖에 없다. alone인 사람이 당연히 혼자왔으니 가족과 함께 온 수가 적은것이다. 인사이트를 얻기에는 좀 그렇다. 그리고 히트맵 파렛트입히는거는 좀 공부를 해야 될 것 같다. 타이타닉 영화도 그렇고 보통 재난영화나 재난상황을 가정하면, 1.어린아이들은 많이 살거같고 (아이먼저 구출해주니까) 2. 남자들이 보통 많이 죽는거같다. 3. 혼자인 사람이 많이죽었을까? 4. 가난한 사람들이 많이 죽을 것 같다 라는.. 2022. 7. 2.
Pandas 날짜에서 요일 추출하는법 df df['Date of Birth']는 object였는데 pd.to_datetime(df['Date of Birth']) 로 재선언하니까 datetime형식이 됨 df['column'].dt.dayofweek을하면 column의 날짜에서 요일을 추출함 이제 여기서 df['day of the week']의 숫자를 텍스트로 바꿔주면된다 2022. 6. 19.
sns. scatterplot : 몸무게 - 키 상관관계 일단 아는 라이브러리는 다 import 해준다. 바로 산점도를 그려본다 경향성이 바로 보이나, Weight가 0, Height가 0으로 기입된 부분들이 보인다. 제거하면 더욱 깔끔해질듯 몸무게와 키의 상관관계는 0.647 여기서 hue를 넣어서 성별에 따라 어떤 분포를 보이는지 보면 더 인상적일것 같다. 2022. 6. 18.