분류 전체보기259 Overfitting(과적합) 쉬운 설명 영상 https://www.youtube.com/watch?v=qohRgKSi0Xs feature가 너무 많은 경우 overfitting 발생. 적당히 줄여줘야 된다 2024. 11. 30. Decision Tree, Random Forest 쉬운설명 영상 https://www.youtube.com/watch?v=n0p0120Gxqk 랜덤 포레스트 : 나무 여러개한테 물어보고 voting을 받아서 결 https://www.youtube.com/watch?v=nZB37IBCiSA 2024. 11. 30. 분류 모델 성능 평가 지표 링크 https://white-joy.tistory.com/9 분류 모델 성능 평가 지표(Accuracy, Precision, Recall, F1 score 등)분류 모델(classifier)을 평가할 때 주로 Confusion Matrix를 기반으로 Accuracy, Precision, Recall, F1 score를 측정한다. Confusion Matrix(혼동 행렬, 오차 행렬) 분류 모델(classifier)의 성능을 측정하는 데 자주 사용white-joy.tistory.com 2024. 11. 29. df[df.str.contain] 다중(여러개) 문자열 포함시키기 + 에러 해결책 [python] 여러 문자열 포함하는 모든 행 검색 - pandas — 향식이의 군침 싹 도는 개발일기 [python] 여러 문자열 포함하는 모든 행 검색 - pandas여러 문자열을 포함하는 모든 행 검색하기 어떤 문자열을 포함하는 행을 찾기 위해선 contains라는 함수를 사용해야 한다. 만약 여러 문자열을 포함하는 모든 행을 찾고 싶다면 어떻게 해야할까?hyang2data.tistory.com df.str.contains 사용 시 발생 에러 - ValueError: Cannot mask with non-boolean array containing NA / NaN values — 코딩 뿌시기 df.str.contains 사용 시 발생 에러 - ValueError: Cannot mask wit.. 2024. 10. 25. ppt 파워포인트 vba 파워포인트와 엑셀을 연결시켜 텍스트가 순서대로 들어가는 매크로가 있을까요? : 지식iN 파워포인트와 엑셀을 연결시켜 텍스트가 순서대로 들어가는 매크로가 있을...제목 그대로 엑셀이 이런식으로 있으면 이름 나이 연락처 홍길동45010-1234-5678 김철수12 010-1234-5678 ppt의 텍스트 상자에 이름, 나이, 연락처가 순서대로...kin.naver.com 2024. 10. 23. 로지스틱 회귀, K-최근접 이웃 분류기 요약 # 로지스틱 회귀# 1. 선언from sklearn.linear_model import LogisticRegressionlr_model = LogisticRegression(verbose=2)# 2. 학습lr_model.fit(X_train, Y_train)# 3. 예측 (수컷 1, 암컷 0)predictions = lr_model.predict(X_test)# 4. 성능 평가 ( 실제값 : Y_test, 예측값 : predictions )from sklearn.metrics import accuracy_scorelr_acc = accuracy_score(Y_test, predictions)lr_acc # K-최근접 이웃 분류기# 1. 선언from sklearn.neighbors import KN.. 2024. 10. 13. 로지스틱 회귀 설명 영상 https://www.youtube.com/watch?v=14eTDPJLkis 로지스틱 회귀는 2진 분류 방법 펭귄이 수컷이다 or 암컷이다 처럼 두개중에 맞추는 것.해당 데이터가 어떤 범주에 속할 확률을 0 ~ 1사이로 예측한다.수컷일 확률 0.8이면 수컷으로 분류하는 것. 어려운 개념이지만 영상을 보면 대략 감이 온다. 2024. 10. 12. 분류 분석 모델링 (MinMaxScaler, LabelEncoder, train_test_split) import matplotlib.pylab as pltimport seaborn as snsimport numpy as npimport pandas as pdpenguins = sns.load_dataset('penguins')penguins penguins = penguins.dropna().reset_index(drop=True)penguins MinMaxScaler로 정규화수치들을 0 ~ 1로 바꿔준다. 정규화 참고https://beneagain.tistory.com/183 sklearn : 전처리 스케일링(Scaling) - 정규화(Normalization)본격적인 머신러닝을 배우다보니 새로운 단어를 많이 접했는데, 일반적으로도 사용되는 통계용어다. 수치를 분석할 때 단위나 스케일 차이가 .. 2024. 10. 12. 이전 1 2 3 4 ··· 33 다음