우당탕탕 개발일지

[혼공머신] 3-1 K-최근접 이웃 회귀, 회귀분석, 결정계수(R^2), 데이터 준비 본문

인공지능

[혼공머신] 3-1 K-최근접 이웃 회귀, 회귀분석, 결정계수(R^2), 데이터 준비

민아당긴아 2024. 7. 13. 11:26

K-최근접 이웃 회귀

k-최근접 이웃 알고리즘을 통해 회귀 문제를 푼다.

가장 가까운 이웃 샘플 n개를 찾고, 이 샘플들의 평균으로 예측한다.

ⓒ https://www.google.com/url?sa=i&url=https%3A%2F%2Fsysout.tistory.com%2F74&psig=AOvVaw3NwJquf5HCgRjFppDtw4Vb&ust=1720923896733000&source=images&cd=vfe&opi=89978449&ved=0CBQQjRxqFwoTCNCiqZ77oocDFQAAAAAdAAAAABAI

 

회귀란?

두 변수 사이의 상관관계를 분석하는 방법

ⓒ https://ko.wikipedia.org/wiki/%EC%84%A0%ED%98%95_%ED%9A%8C%EA%B7%80

종류:  선형 회귀, 다중 회귀, 로지스틱 회귀 등

예: 가장 단순한 선형모델 y = a*x + b(x: 길이, y: 무게), 이는 무게와 길이 사이의 상관관계를 분석하는 모델

 

결정계수(R^2)

회귀모델을 평가하는 지표로, 두 변수 사이의 상관계수 r의 제곱이다.

ⓒ https://namu.wiki/w/결정계수

여기서 SSE는 (실제값 - 모델이 예측한 값)^2의 합을 뜻하므로, 모델이 예측을 잘 할수록 SSE가 작아지고, R^2이 커진다.

결정계수 외에도 모델을 평가할 수 있는 여러 지표들이 있다.

 

데이터 준비