본문 바로가기

파이썬. 데이터분석/Pandas61

for 순환문 : 텍스트 + 숫자에서 숫자부분만 순환시키기(subplot) 위에 같은 명령문을 보면 순환문으로 만들고 싶다는 생각이 되게 많이 든다. 다른건 쉬운데 저 df_merge['S1'], df_merge['S2']... 부분이 어렵다. 딱 저 부분의 숫자만 순환문으로 쓰고 싶은데 어떻게 못하나? 참고로 위에 작성한것처럼 VBA같이 작성 하면 에러가 나온다. 정답은 str을 이용하면 된다. 2022. 10. 30.
소숫점 표시 : 전체 변경, 특정 열만 변경 (apply,lambda) pd.set_option('display.float_format', '{:,.1f}'.format) → 주피터노트북 전체 cell에서 float은 다 소숫점 첫째자리만 나옴. df['column'] = df['column'].apply(lambda x: "{:,.2f}".format(float(x))) → 특정 df의 특정 column만 소숫점 둘째자리로 나옴. 2022. 10. 4.
자료형 변환 : 전체, 특정 column / astype, applymap, apply 해당 링크 타고가면 자료형변환에 관해 댓글에 많은 글들이 있다. https://stackoverflow.com/questions/21291259/convert-floats-to-ints-in-pandas Convert floats to ints in Pandas? I've been working with data imported from a CSV. Pandas changed some columns to float, so now the numbers in these columns get displayed as floating points! However, I need them to be displayed as stackoverflow.com https://www.geeksforgeeks.org/how-t.. 2022. 10. 3.
결측치 채우기 https://ko.code-paper.com/python/examples-how-to-replace-nan-values-with-0-in-pandas 팬더에서 nan 값을 0 으로 바꾸는 방법 - Python 샘플 코드 이 카테고리에서 인기 카테고리에 예제가 포함 된 인기있는 페이지 ko.code-paper.com 번역기 돌려서 글이 좀 이상한데 내용은 좋다 2022. 10. 3.
pivot(데이터프레임 어긋났을때 index변경) 전 글 참조 https://beneagain.tistory.com/172 데이터프레임 어긋나게 나오는것(?)의 이해 피벗돌리거나 뭔갈 하고나서 데이터프레임을 보면 이런식으로 행 높이가 안맞는 경우가 보입니다. 저렇게만 보이는거고 xlsx 내보내기해서 보면 행 높이가 맞습니다. ※ 주의사항 그러나 저 pivot beneagain.tistory.com merge를 하려면 column, index 명칭을 통일시켜야만 되는데 pivot은 이렇게 어긋나있어서 좀 까다롭다. 고객사명 -> 착지수, 고객사 -> 코드 명칭변경을 하려면, 1. column 변경 : 고객사명 → 착지수 column은 쉽다. 이렇게 '고객사명' 이라고 나오니까 rename하면 그만이다 착지수세기_피벗.rename(columns={'고객사명.. 2022. 10. 2.
Pandas : pivot 다중 aggfunc (sum,count 같이) 배송주기_피벗 = pd.pivot_table(배송주기, index=['코드','고객사명'], values = ['고객그룹','배송일수'], aggfunc={'고객그룹':'count','배송일수':'sum'}) 이렇게 하면 매장수는 count, 배송일수는 sum 출처 : https://stackoverflow.com/questions/20119414/define-aggfunc-for-each-values-column-in-pandas-pivot-table define aggfunc for each values column in pandas pivot table Was trying to generate a pivot table with multiple "values" columns. I know I can .. 2022. 9. 28.
데이터프레임 어긋나게 나오는것(?)의 이해 피벗돌리거나 뭔갈 하고나서 데이터프레임을 보면 이런식으로 행 높이가 안맞는 경우가 보입니다. 저렇게만 보이는거고 xlsx 내보내기해서 보면 행 높이가 맞습니다. ※ 주의사항 그러나 저 pivot의 dateframe에서 column을 조회하면 '순매출' 만 나옵니다 코드와 고객사명은 index다. 다음 글에서는 pivot에서 저 index의 이름을 바꾸는 방법을 찾아보겠습니다. 회사내용이라 모자이크 했습니다 내보내기 하는법 https://beneagain.tistory.com/25 to_excel : dataframe 을 excel로 내보내기 tips.to_excel('C:/Users/Pang rim/Desktop/Python/Python_practice/data9.xlsx', sheet_name='She.. 2022. 9. 27.
피벗테이블 pd.pivot_table https://jimmy-ai.tistory.com/220 [Pandas] 파이썬 피벗테이블 생성 : pd.pivot_table 함수 사용법 정리 파이썬 판다스 pivot_table 함수 사용 예제 파이썬 pandas 모듈의 pd.pivot_table 함수로 피벗테이블을 원하는대로 생성하는 방법을 values, index, columns, fill_value 및 aggfunc 인자의 기능을 위주로 정리해.. jimmy-ai.tistory.com table1 = pd.pivot_table(df, values='국어', index=['반'], columns=['전공'], aggfunc=np.mean) table1 pd.pivot과 pd.pivot_table의 차이 설명. pd.pivot_table이 더 사용.. 2022. 8. 30.