[혼공머신] 3-1 과대적합과 과소적합의 차이, 과소적합 해결 방법, 확인문제

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

우당탕탕 개발일지

[혼공머신] 3-1 과대적합과 과소적합의 차이, 과소적합 해결 방법, 확인문제 본문

인공지능

[혼공머신] 3-1 과대적합과 과소적합의 차이, 과소적합 해결 방법, 확인문제

민아당긴아 2024. 7. 13. 13:39

과대적합 vs 과소적합

과대적합(Overfitting): 훈련 세트의 점수 > 테스트 세트의 점수
과소적합(Underfitting): 훈련 세트의 점수 < 테스트 세트의 점수
과대적합 = 훈련 세트에서만 잘 맞는 모델 = 실제 상황에서는 예측 정확도가 떨어짐
과소적합 = 모델이 너무 단순해서 or 훈련 세트의 크기가 너무 작아서 훈련 제대로 못함

과소적합을 해결하는 방법

: k-최근접 이웃 회귀 모델에서 이웃의 개수 k를 줄여서 모델을 더 복잡하게 만든다.

이웃의 개수를 줄이면 훈련 세트에 있는 국지적인 패턴에 민감해져서 모델이 복잡해진다.

사이킷런의 k-최근접 이웃 알고리즘의 기본 k값은 5이기 때문에, 아래의 코드를 통해 바꿔주면 된다.

knr.n_neighbors = 3

결과를 보면 훈련 세트의 점수가 높아지고, 테스트 세트의 점수가 낮아졌다.

즉, 과소적합을 해소했다고 볼 수 있다.

확인문제

# k-최근접 이웃 회귀 객체 만들기
knr = KNeighborsRegressor()
# 5에서 45까지의 x 좌표 만들기
x = np.arange(5, 45).reshape(-1, 1)
# n = 1, 5, 10일 때 예측 결과를 그래프로 나타내기
for n in [1, 5, 10]:
    # 모델을 훈련하기
    knr.n_neighbors = n
    knr.fit(train_input, train_target)
    # 지정한 범위 x에 대한 예측을 구하기
    prediction = knr.predict(x)
    # 훈련 세트와 예측 결과를 그래프로 나타내기
    plt.scatter(train_input, train_target)
    plt.plot(x, prediction, color = "red")
    plt.title('n_neighbors = {}'.format(n))
    plt.xlabel('length')
    plt.ylabel('weight')
    plt.show()

과대적합과 과소적합에 대한 이해를 돕기 위해 k-최근접 이웃 회귀 모델의 k값을 각각 1, 5, 10으로 바꿔가며 훈련한다.

n의 값이 커질수록 선이 단순해지고, n의 값이 작을수록 촘촘한 그래프가 그려진다.

n이 작으면 오버슈팅(과대적합), n이 크면 언더슈팅(과소적합)이 발생함을 확인할 수 있다.

'인공지능' 카테고리의 다른 글

[데이터 분석 경진대회] 대기오염 데이터 분석을 통한 예측모델 개발 및 대기질 지수 산정예측 (1)	2024.09.28
[혼공머신] 4-1. 로지스틱 회귀 (0)	2024.07.21
[혼공머신] 3-3 다중 회귀, 특성 공학, 사이킷런의 변환기 클래스 PolynomialFeatures (0)	2024.07.14
[혼공머신] 3-2 K-최근접 이웃의 한계, 선형 회귀, 모델 파라미터, 다항 회귀 (0)	2024.07.13
[혼공머신] 3-1 K-최근접 이웃 회귀, 회귀분석, 결정계수(R^2), 데이터 준비 (1)	2024.07.13

'인공지능' Related Articles

우당탕탕 개발일지

[혼공머신] 3-1 과대적합과 과소적합의 차이, 과소적합 해결 방법, 확인문제 본문

[혼공머신] 3-1 과대적합과 과소적합의 차이, 과소적합 해결 방법, 확인문제

과대적합 vs 과소적합

과소적합을 해결하는 방법

확인문제

'인공지능' 카테고리의 다른 글

티스토리툴바