본문 바로가기

파이썬. 데이터분석/Pandas61

Pandas DataFrame : df.columns = [ ] 와 rename 열 이름 바꾸기. 열이름 바꾸는 방법이 2가지가 있는데   1. df.columns = [  ] 구문을 이용하는것.기존에 column이 8개였으면 순서를 바뀔때도 column 8개를 입력해야됨. 8개에서 7개로 바꾸고 이런건 안된다 2. rename 딕셔너리를 이용한 방법.보통 여러개 바꾸는것보다 1,2개 바꾸는 일이 많아서 주로 1번을 쓴다. -'국어' 열 이름을 '도덕'으로 바꿔보기- df.columns 를 치면 column 목록이 쫙 뜨는데 위에 list를 복사해서 'df.columns =' 옆에 붙여넣기하고 바꿔치기하고 싶은 이름을 바꿔넣으면 된다.  코딩좀 하신분들 강의보면 대부분 이런식으로 갈아끼워넣길래 정리   df.rename(columns = {'영어' : 'English', '수학' : 'Math'})아.. 2022. 7. 12.
Pandas DataFrame : 셀 수정 df.loc df.loc 떨어져 있는 셀 동시에 2개수정 2022. 7. 6.
Pandas DataFrame : str, lower, isin, contains 나도코딩 공부요약 str.startswith -> 시작 str.contains -> 포함 str.lower() -> 소문자로 싹 바꿔버림 df[df['SW특기'].str.contains('Java')] 평범한데 왜 에러가 나올까? 4,5보면 True도 False도 아닌 NaN이 떠서 그렇다. na=False 로 처리하면 문제해결 2022. 7. 6.
물결표시(~) : 반대되는 데이터 2022. 7. 6.
txt, csv 파일 불러오기 / 저장하기 그냥 encoding ='utf-8' 해도 encoding error발생하는데, encoding='utf-8-sig' 라고 입력해주니 깔끔하게 한글이 나온다 df.to_csv('score.txt', sep='\t') sep으로 나눠주니까 깔끔하게나온다 sep조건이 없으면 이렇게나온다 파일 열때도 sep조건은 중요하다. score파일은 애초에 저장될때도 tap으로 나눠져있어서 그런지 열때도 tap으로 나눠줘야 되나봄. 2022. 7. 4.
xlsx(excel) 파일로 저장 / 불러오기 : skiprows, nrows, usecols A1부터 시작되는 게 아닌 특정 셀부터 시작되는 데이터는 어떻게 가져올까? 사실 회사에서 만지는 대부분의 엑셀파일은 A1부터 시작하지않는다. 예전부터 이게 너무 궁금했는데 오늘 stackoverflow 검색하다 찾게됐다. 이렇게 생긴 xlsx,excel 엑셀파일 어떻게 불러와야될까? 그냥 불러오면 이렇게된다 df = pd.read_excel('score.xlsx', skiprows=2, usecols = 'B:K') skiprows로 행을 잘라내고 usecols로 필요한 열을 고르면된다. 팁 : usecols = 'B:AB' 이런식으로해도 딱 필요한 열만큼만 가져온다 ++추가) usecols='B,E:Y' 이런식으로 B열 + E~Y열을 고를 수있다 range를 이용할 수도 있다. df = pd.read_.. 2022. 7. 4.
Pandas DataFrame : 데이터 행,열 바꾸는 방법들 https://www.delftstack.com/ko/howto/python-pandas/how-to-change-the-order-of-dataframe-columns/ Pandas DataFrame 열의 순서를 변경하는 방법이 자습서에서는 insert, re_index 및 new list를 사용하여 DataFrame 열의 순서를 변경하는 방법을 보여줍니다.www.delftstack.com  df = df.reindex(columns=['a','f','d','b','c','e'])1번 방식 가장 간단df = df[['가','라','나','다']] 2번 reindex 사용df = df.reindex(columns=['가','라','나','다'] 이건 행에도 가능하다 df = df.reindex(index.. 2022. 7. 2.
Pandas DataFrame : 특정 행 index만 바꾸기. https://firedino.tistory.com/72 Pandas DataFrame Index 판다스 데이터프레임 인덱스 수정 안녕하세요 파이어(F.I.R.E.)를 꿈꾸는 공룡 '파공' 입니다. 오늘은 Pandas DataFrame(판다스 데이터프레임)의 인덱스 수정 방법에 대해서 다양하게 보여드리겠습니다! ● 샘플 데이터 프레임 생성하 firedino.tistory.com 여기서 맨 마지막 부분을 보면 중간에 있는 특정행의 index를 바꾸는 방법이 나온다. 일단 기존의 인덱스를 새로운 column으로 만들고 거기서 수정을 한 뒤에 index로 바꾸는 방법이다. 2022. 6. 25.