본문 바로가기

파이썬. 데이터분석119

Pandas DataFrame : reset_index df.reset_index() reset_index : DataFrame에서 정수로 된 default index를 만들어준다 매개변수 drop은 defalut값이 False 2022. 6. 19.
Pandas DataFrame : set_index set_index의 매개변수인 drop. append 공부 drop drop은 default값 자체가 True. Korean Name이라는 column이 index로가면서 기존 DataFrame에서 Korean Name은 없어졌다 set_index(drop=True)한번 더하니까 또 없어짐.. 계속 set_index하면 이렇게 기존 DataFrame이 없어진다 drop=False로하면 기존 DataFrame이 유지된다. append append는 default값이 false append=True일때, 기존 인덱스에 또 인덱스가 추가된다. append가 잘 이해가 안되면, append=True로 놓고 계속 추가해보면 인덱스가 1,2,3,4,5개.. 계속 많아진다 append = False일때, 기존Inde.. 2022. 6. 19.
Pandas DataFrame : Index 갖고놀기 https://gooopy.tistory.com/92 Pandas-데이터 프레임 Index 가지고 놀기 이전 포스트에서 DataFrame의 생김새와 부위별 이름에 대해 알아보았다. DataFrame의 가장 큰 특징은 index가 존재한다는 것이고, 이 index를 얼마나 잘 가지고 노느냐에 따라 DataFrame을 얼마나 효율적 gooopy.tistory.com 2022. 6. 19.
Pandas DataFrame : dropna 결측치 제거 https://yeko90.tistory.com/entry/%ED%8C%90%EB%8B%A4%EC%8A%A4-%EA%B8%B0%EC%B4%88-dropna%EB%A5%BC-%ED%86%B5%ED%95%B4-%EA%B2%B0%EC%B8%A1%EC%B9%98%EA%B0%80-%EC%9E%88%EB%8A%94-%ED%96%89%EC%97%B4-%EC%A0%9C%EA%B1%B0 [판다스 기초] dropna를 통해 결측치가 있는 행|열 제거 데이터를 수집하다보면 다양한 결측치들이 포함되어 우리를 힘들게 할때가 많은데요. 이번 포스팅에서는 dropna를 통해 우리가 원하는 방식으로 결측값을 처리하는 방법에 대해 배워 보도록 하 yeko90.tistory.com -예시와 함께 설명해준다 -dropna(axis, ho.. 2022. 6. 18.
Pandas DataFrame : sort_values 정렬 O_df df 8행 11열 index기준으로 정렬 특정 column의 값을 기준으로 정렬 df.sort_values ★각 column별 정렬방법을 따로따로 할 수 있다. 밑에 예시를 보면 Height는 오름차순, Weight내림차순 2022. 6. 18.
sns. scatterplot : 몸무게 - 키 상관관계 일단 아는 라이브러리는 다 import 해준다. 바로 산점도를 그려본다 경향성이 바로 보이나, Weight가 0, Height가 0으로 기입된 부분들이 보인다. 제거하면 더욱 깔끔해질듯 몸무게와 키의 상관관계는 0.647 여기서 hue를 넣어서 성별에 따라 어떤 분포를 보이는지 보면 더 인상적일것 같다. 2022. 6. 18.
Pandas DataFrame : slicing, index, difference, isin 기존 df column indexing -> 괄호를 또 만들어줘야 된다 slicing -> 괄호 없어도된다. ▶column을 통째로 가져와서 번호로 되어있는 인덱스에 갈아끼운다. ▶해당 열을 제외하고 출력 첫번째 방법. 두번째 방법. isin : Group이 SNSD or 2NE1인 명단을 출력하고 싶을때 두가지 방법 2022. 6. 18.
Pandas df.copy() 복사에도 두 종류가 있다. https://mizykk.tistory.com/63 [Python] df.copy() :: 복사본 만들기 / 얕은복사 & 깊은 복사 판다스에는 데이터프레임의 복사본을 만들어주는 pandas.DataFrame.copy가 있다. 이는 a = b와는 다른 방식의 복사이다. a = b는 원본 데이터가 변하면 똑같이 변하는 얕은 복사인 반면, pandas.DataFrame.copy mizykk.tistory.com 여기서는 얇은복사 / 깊은복사라고 한다. 깊게 들어가지 않고 간단하게 개념만 설명해주는 거라 좋다. 기존 데이터프레임을 df just_copy = df pandas_copy = df.copy() 여기서 just_copy는 df가 바뀌는거에따라 영향을 받는데(같이 바뀜), p.. 2022. 6. 17.