본문 바로가기

파이썬. 데이터분석119

df[df.str.contain] 다중(여러개) 문자열 포함시키기 + 에러 해결책 [python] 여러 문자열 포함하는 모든 행 검색 - pandas — 향식이의 군침 싹 도는 개발일기 [python] 여러 문자열 포함하는 모든 행 검색 - pandas여러 문자열을 포함하는 모든 행 검색하기 어떤 문자열을 포함하는 행을 찾기 위해선 contains라는 함수를 사용해야 한다. 만약 여러 문자열을 포함하는 모든 행을 찾고 싶다면 어떻게 해야할까?hyang2data.tistory.com     df.str.contains 사용 시 발생 에러 - ValueError: Cannot mask with non-boolean array containing NA / NaN values — 코딩 뿌시기 df.str.contains 사용 시 발생 에러 - ValueError: Cannot mask wit.. 2024. 10. 25.
df['column'].value_counts() 와 plot(kind=' ') 간단하게 그래프 그리기 2024. 10. 5.
df['칼럼명'].map('매핑 정보') - 값 치환, 대체 하나의 칼럼인 Series형으로만 적용 가능 map_info = {'M' : '남자', 'F' : '여자'}df['Gender'] = df['Gender'].map(map_info)df 2024. 10. 3.
datetime 날짜형으로 변환 pd.to_datetime, pd.to_timedelta df['Date of Birth'] = pd.to_datetime(df['Date of Birth'])df['Year of Birth'] = df['Date of Birth'].dt.yeardf['Month of Birth'] = df['Date of Birth'].dt.monthdf['Day of Birth'] = df['Date of Birth'].dt.day    날짜끼리 연산하려면 이런식으로 timedelta로 바꿔줘야된다.df['Day of Birth_2'] = pd.to_timedelta(df['Day of Birth'], unit='day')  month 단위는 아예 다른 라이브러리에서 가능한 듯 2024. 9. 28.
[정리] Pandas 전처리 기본 df = df.dropna(subset='Date of Birth')   astypeint, float, strdf['Height'] = df['Height'].astype(str)df['Height'] = df['Height'].astype('str') 2024. 9. 28.
SettingWithCopyWarning 알람 원인, 끄기 py:1: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame.Try using .loc[row_indexer,col_indexer] = value insteadSee the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy  https://blog.naver.com/PostView.nhn?blogId=wideeyed&logNo=221817400937 [Pandas] SettingWithCopy Warning or .. 2024. 9. 28.
numeric, categorical 나누는 순환문 코드 numeric_list=[]categoical_list=[]for i in df.columns : if df[i].dtypes == 'O' : categoical_list.append(i) else : numeric_list.append(i)print("categoical_list :", categoical_list)print("numeric_list :", numeric_list) 2024. 9. 21.
컬럼 값에 따라 조건 변경 if문 없이 https://wooono.tistory.com/293 [Python] Pandas DataFrame 컬럼 값 조건 변경DataFrame 생성 import pandas as pd data = {'name':['michael','louis','jack','jasmine'], 'grades':[90,80,70,60], 'result':['N/A','N/A','N/A','N/A']} df = pd.DataFrame(data,columns=['name','grades','result']) # name grades result #0 michael 90 N/A #1 louiswooono.tistory.com    np.where로 쓰는 방법도 있다. 2024. 9. 16.