본문 바로가기

전체 글273

pandas 인덱싱, 슬라이싱 (계속누적예정) 판다스 인덱스 슬라이싱 토나온다  import pandas as pd data = {     '이름' : ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'],     '학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '능남고', '능남고', '능남고'],     '키' : [197, 184, 168, 187, 188, 202, 188, 190],     '국어' : [90, 40, 80, 40, 15, 80, 55, 100],     '영어' : [85, 35, 75, 60, 20, 100, 65, 85],     '수학' : [100, 50, 70, 70, 10, 95, 45, 90],     '과학' : [95, 55, 80.. 2024. 5. 6.
pandas drop 슬라이싱 열 이름으로 하는법, 특정 열이 숫자로 몇번째인지 확인하는법 데이터프레임이 이런식일때 ISBN ~ 주제분류번호 열을 삭제하고싶을때ns_df[:,'ISBN':'주제분류번호']도 안되고.. 어떻게 고르지? ISBN이랑 주제분류번호가 몇번째인지도 모르겠다. 일일이 세는방법 말고 좀 더 스마트하게 index번호를 알면 삭제하기 쉬울텐데 예를들어 5번째랑 7번째라고하면ns_df.drop(ns_df.columns[5:7], axis=1)이런식으로 할텐데 2024. 5. 6.
따옴표 하나로 결정되는 dict와 str의 차이 JSON 배우면서 dict와 str의 차이가 매우 중요하는 점을 느꼈다.  또 저렇게 중괄호 옆에 '을 찍느냐마냐로 데이터 형식이 바뀌어지는 걸 알게됐다 2024. 5. 5.
XML 문자열 파이썬 객체로 변환하기 (findall, 순환문) x2_str = """      혼자 공부하는 데이터 분석    박해선    2022        혼자 공부하는 머신러닝-딥러닝    박해선    2020  """     1. 2. 왜 2개의 결과가 서로 다를까?  심지어 왜 2번은 머신러닝-딥러닝 이게 두번 나온건지 모르겠다. 뒤에있는건데? 2024. 5. 4.
print함수 매개변수 end print함수는 자동으로 줄바꿈문자 (\n)을 출력한다 보기싫으면 end='') 2024. 5. 4.
readline() 순환문 궁금증 readline()은 첫번째줄을 출력하는 함수라고 배웠는데 with open('ns_202104.csv') as f:    print(f.readline())    print(f.readline()) 이러면  ,번호,도서명,저자,출판사,발행년도,ISBN,세트 ISBN,부가기호,권,주제분류번호,도서권수,대출건수,등록일자,Unnamed: 13 ,번호,도서명,저자,출판사,발행년도,ISBN,세트 ISBN,부가기호,권,주제분류번호,도서권수,대출건수,등록일자,Unnamed: 13 이렇게 첫번째줄,첫번째줄이 나와야되는데  ,번호,도서명,저자,출판사,발행년도,ISBN,세트 ISBN,부가기호,권,주제분류번호,도서권수,대출건수,등록일자,Unnamed:  13 0,1,인공지능과 흙,김동훈 지음,민음사,2021,9788937.. 2024. 5. 4.