본문 바로가기
파이썬. 머신러닝/sklearn

나도코딩_머신러닝 1 : 선형 회귀, 데이터 세트 분리

by 한국수달보호협회장 2024. 7. 30.

 

 

 

https://www.youtube.com/watch?v=TNcfJHajqJY

 

 

 

 

보통 코딩하는거보면 X =독립변수 , y = 종속변수

X = dataset['hour'].values.reshape(-1,1)

 

이렇게 코드 작성해도 됨

 

reg.fit(X,y) 코드를 입력하면  학습을 시작함

 

 

 

y_pred는 X값을 기반으로 예측한 y값인데 참고로 2차원 데이터만 넣을수있다. [[]] 처럼 대괄호가 2개인것

예를들어

0.5시간 공부 -> 5.003만큼 점수

1.2시간 공부 -> 12.313만큼 점수 

 

 

그래프로 그려보면

 

scatter로 표현한건 실제 X값과 y값들

plot(막대기)로 표현한건 실제 X값과 X값을 기반으로 예측한 y

 

 

기울기, 절편도 구할 수 있음

 

 

 

데이터 분리하기

 

 

 

이런식으로 2차원 배열의 자료로 나눠준

 

 

 

scatter는 X와 y모두 train값

plot은 X_train값과 이걸 기반으로 한 예측

 

 

 

실제 잘 맞는지 보기 위해 테스트 세트로 시험을 보면

 

이런 결과가 나온다 scatter는 X,y 모두 test값이다.

중요한건, plot은 훈련세트의 데이터를 사용한다. 훈련세트의 누적된 데이터를 기반으로 예측하는거라서