본문 바로가기

분류 전체보기273

pivot(데이터프레임 어긋났을때 index변경) 전 글 참조 https://beneagain.tistory.com/172 데이터프레임 어긋나게 나오는것(?)의 이해 피벗돌리거나 뭔갈 하고나서 데이터프레임을 보면 이런식으로 행 높이가 안맞는 경우가 보입니다. 저렇게만 보이는거고 xlsx 내보내기해서 보면 행 높이가 맞습니다. ※ 주의사항 그러나 저 pivot beneagain.tistory.com merge를 하려면 column, index 명칭을 통일시켜야만 되는데 pivot은 이렇게 어긋나있어서 좀 까다롭다. 고객사명 -> 착지수, 고객사 -> 코드 명칭변경을 하려면, 1. column 변경 : 고객사명 → 착지수 column은 쉽다. 이렇게 '고객사명' 이라고 나오니까 rename하면 그만이다 착지수세기_피벗.rename(columns={'고객사명.. 2022. 10. 2.
Pandas : pivot 다중 aggfunc (sum,count 같이) 배송주기_피벗 = pd.pivot_table(배송주기, index=['코드','고객사명'], values = ['고객그룹','배송일수'], aggfunc={'고객그룹':'count','배송일수':'sum'}) 이렇게 하면 매장수는 count, 배송일수는 sum 출처 : https://stackoverflow.com/questions/20119414/define-aggfunc-for-each-values-column-in-pandas-pivot-table define aggfunc for each values column in pandas pivot table Was trying to generate a pivot table with multiple "values" columns. I know I can .. 2022. 9. 28.
데이터프레임 어긋나게 나오는것(?)의 이해 피벗돌리거나 뭔갈 하고나서 데이터프레임을 보면 이런식으로 행 높이가 안맞는 경우가 보입니다. 저렇게만 보이는거고 xlsx 내보내기해서 보면 행 높이가 맞습니다. ※ 주의사항 그러나 저 pivot의 dateframe에서 column을 조회하면 '순매출' 만 나옵니다 코드와 고객사명은 index다. 다음 글에서는 pivot에서 저 index의 이름을 바꾸는 방법을 찾아보겠습니다. 회사내용이라 모자이크 했습니다 내보내기 하는법 https://beneagain.tistory.com/25 to_excel : dataframe 을 excel로 내보내기 tips.to_excel('C:/Users/Pang rim/Desktop/Python/Python_practice/data9.xlsx', sheet_name='She.. 2022. 9. 27.
9/20 방문자 1,000명 달성 9/20일 블로그 들어가서 깜짝놀랐습니다. ㅎ 9/20일날 Today 접속자수가 84명인것도 놀랐고 1,000명 뚫은거에 놀랐네요. 이직준비도하고 회사 관련된 코딩공부 하느라 여기에 올릴 수도 없어서 오랫동안 사이트 운영을 쉬었는데 다시 열심히 해야겠습니다. 2022. 9. 27.
피벗테이블 pd.pivot_table https://jimmy-ai.tistory.com/220 [Pandas] 파이썬 피벗테이블 생성 : pd.pivot_table 함수 사용법 정리 파이썬 판다스 pivot_table 함수 사용 예제 파이썬 pandas 모듈의 pd.pivot_table 함수로 피벗테이블을 원하는대로 생성하는 방법을 values, index, columns, fill_value 및 aggfunc 인자의 기능을 위주로 정리해.. jimmy-ai.tistory.com table1 = pd.pivot_table(df, values='국어', index=['반'], columns=['전공'], aggfunc=np.mean) table1 pd.pivot과 pd.pivot_table의 차이 설명. pd.pivot_table이 더 사용.. 2022. 8. 30.
22.08.30 Do it 끝. 실무 시작 책을 완전 다본건 아니고, 데이터분석 부분 다 봄. 뒷 부분은 데이터마이닝등 필요없는 부분 회사고객사 기준분석 시작. 목표 : 기존에 엑셀로했던 작업들을 파이썬이 자동으로 할수있게끔 하는것 RAW데이터를 갈아끼운뒤 Run All -> 데이터 전처리 -> 데이터 분석 -> 그래프 그리기 2022. 8. 30.
돌아갈 수 없는 날들 - 붉은돼지OST https://www.youtube.com/watch?v=I7KNbFPUxys&t=2s 쉬운곡 치고 그 다음에 인생의회전목마 마저칠지 이거 칠지 고민해봐야겠다. 밑에 곡 조표2개 https://www.mapianist.com/sheet/73662?_escaped_fragment_=&category=ost&query=%EB%8F%8C%EC%95%84%EA%B0%88%20%EC%88%98%20%EC%97%86%EB%8A%94%20%EB%82%A0%EB%93%A4&sortType=relevant&page=1 마음만은 피아니스트 www.mapianist.com https://www.youtube.com/watch?v=Tu1Y1FGHcDA 2022. 8. 29.
2019 한국통계자료 분석 6 : 지역별 연령대 비율 replace, df.pivot, sns.barplot 지역코드에 실제지명대신 숫자로 표현되어있다. 코드로된걸 실제 지명으로 바꾸어준다 replace 첫번째. 지역 / 연령대 / 비율 전반적으로 old인 사람이 많고 대구/경북은 반이 old 두번째. 연령대 / 지역 / 비율로 하면 느낌이 다르다 ageg를 기준으로 내림차순 되어있어 수도권에 middle,young인 사람들이 많이산다는 점을 한눈에 볼 수 있다. 첫번째로 가서 백분율로 만들어준다 그래프로 시각화하고 legend가 작아서 크게 키워줬다. 주의할 점이 plt.legend를 sns.barplot 위에다 하니까 안되더라. plt.legend를 plotting 하는곳 밑에다가 써줘야 된다. 이건 좀 이해가 안간다. 그냥 matplotlib 할 때는.. 2022. 8. 27.