나도코딩_머신러닝 1 : 선형 회귀, 데이터 세트 분리

보통 코딩하는거보면 X =독립변수 , y = 종속변수

X = dataset['hour'].values.reshape(-1,1)

이렇게 코드 작성해도 됨

reg.fit(X,y) 코드를 입력하면 학습을 시작함

y_pred는 X값을 기반으로 예측한 y값인데 참고로 2차원 데이터만 넣을수있다. [[]] 처럼 대괄호가 2개인것

예를들어

0.5시간 공부 -> 5.003만큼 점수

1.2시간 공부 -> 12.313만큼 점수

그래프로 그려보면

scatter로 표현한건 실제 X값과 y값들

plot(막대기)로 표현한건 실제 X값과 X값을 기반으로 예측한 y

기울기, 절편도 구할 수 있음

이런식으로 2차원 배열의 자료로 나눠준

scatter는 X와 y모두 train값

plot은 X_train값과 이걸 기반으로 한 예측

실제 잘 맞는지 보기 위해 테스트 세트로 시험을 보면

이런 결과가 나온다 scatter는 X,y 모두 test값이다.

중요한건, plot은 훈련세트의 데이터를 사용한다. 훈련세트의 누적된 데이터를 기반으로 예측하는거라서

train_test_split에서 stratify 역할 (0)	2024.09.21
R2_score (0)	2024.08.16
sklearn : 분류분석모델링 - 펭귄 종 맞추기 vs 성별 맞추기 (0)	2022.10.19
sklearn : 분류분석모델링(Logistic Regreesion, K-Neighbors, Decision Tree, SVC) (0)	2022.10.19
sklearn : 전처리 - 원핫 인코딩(One Hot Encoding) (0)	2022.10.13

직장인코딩독학