https://www.youtube.com/watch?v=TNcfJHajqJY
보통 코딩하는거보면 X =독립변수 , y = 종속변수
X = dataset['hour'].values.reshape(-1,1)
이렇게 코드 작성해도 됨
reg.fit(X,y) 코드를 입력하면 학습을 시작함
y_pred는 X값을 기반으로 예측한 y값인데 참고로 2차원 데이터만 넣을수있다. [[]] 처럼 대괄호가 2개인것
예를들어
0.5시간 공부 -> 5.003만큼 점수
1.2시간 공부 -> 12.313만큼 점수
그래프로 그려보면
scatter로 표현한건 실제 X값과 y값들
plot(막대기)로 표현한건 실제 X값과 X값을 기반으로 예측한 y
기울기, 절편도 구할 수 있음
데이터 분리하기
이런식으로 2차원 배열의 자료로 나눠준
scatter는 X와 y모두 train값
plot은 X_train값과 이걸 기반으로 한 예측
실제 잘 맞는지 보기 위해 테스트 세트로 시험을 보면
이런 결과가 나온다 scatter는 X,y 모두 test값이다.
중요한건, plot은 훈련세트의 데이터를 사용한다. 훈련세트의 누적된 데이터를 기반으로 예측하는거라서
'파이썬. 머신러닝 > sklearn' 카테고리의 다른 글
train_test_split에서 stratify 역할 (0) | 2024.09.21 |
---|---|
R2_score (0) | 2024.08.16 |
sklearn : 분류분석모델링 - 펭귄 종 맞추기 vs 성별 맞추기 (0) | 2022.10.19 |
sklearn : 분류분석모델링(Logistic Regreesion, K-Neighbors, Decision Tree, SVC) (0) | 2022.10.19 |
sklearn : 전처리 - 원핫 인코딩(One Hot Encoding) (0) | 2022.10.13 |