우당탕탕 개발일지
[혼공머신] 3-1 K-최근접 이웃 회귀, 회귀분석, 결정계수(R^2), 데이터 준비 본문
K-최근접 이웃 회귀
k-최근접 이웃 알고리즘을 통해 회귀 문제를 푼다.
가장 가까운 이웃 샘플 n개를 찾고, 이 샘플들의 평균으로 예측한다.
회귀란?
두 변수 사이의 상관관계를 분석하는 방법
종류: 선형 회귀, 다중 회귀, 로지스틱 회귀 등
예: 가장 단순한 선형모델 y = a*x + b(x: 길이, y: 무게), 이는 무게와 길이 사이의 상관관계를 분석하는 모델
결정계수(R^2)
회귀모델을 평가하는 지표로, 두 변수 사이의 상관계수 r의 제곱이다.
여기서 SSE는 (실제값 - 모델이 예측한 값)^2의 합을 뜻하므로, 모델이 예측을 잘 할수록 SSE가 작아지고, R^2이 커진다.
결정계수 외에도 모델을 평가할 수 있는 여러 지표들이 있다.
데이터 준비
'인공지능' 카테고리의 다른 글
[대기오염 예측모델 개발] 연도별 자치구별 대기오염물질 농도 히트맵 그리기 (1) | 2024.10.03 |
---|---|
[혼공머신] 4-1. 로지스틱 회귀 (0) | 2024.07.21 |
[혼공머신] 3-3 다중 회귀, 특성 공학, 사이킷런의 변환기 클래스 PolynomialFeatures (0) | 2024.07.14 |
[혼공머신] 3-2 K-최근접 이웃의 한계, 선형 회귀, 모델 파라미터, 다항 회귀 (0) | 2024.07.13 |
[혼공머신] 3-1 과대적합과 과소적합의 차이, 과소적합 해결 방법, 확인문제 (0) | 2024.07.13 |