목록2025/01/02 (2)
우당탕탕 개발일지
💡 지도 학습과 비지도 학습쉽게 말하자면, 학습데이터에 정답까지 포함되어 있는 경우 지도 학습, 정답 없이 특성 데이터만 있는 경우 비지도 학습이라고 한다. 💡 학습 데이터의 구성입력 데이터와 타겟 데이터훈련하기 위해 사용하는 데이터는 입력 데이터와 타겟 데이터로 이루어져있다.입력 데이터는 특성들(Features)로 이루어져 있고, 타겟 데이터(Target)는 정답데이터이다.보통 지도학습에서 학습 데이터로 사용하는 데이터는 다음과 같이 테이블 형태로 되어 있다.특성을 나타내는 열들과 정답을 나타내는 하나의 열로 이루어져 있다. 훈련 세트와 테스트 세트훈련 세트는 훈련에 사용되고, 테스트 세트는 모델의 성능을 평가하는 데에 사용된다. 💡 샘플링 편향훈련 세트와 테스트 세트에 샘플이 골고루 섞여있지..
💡 K-최근접 이웃 알고리즘분류 알고리즘으로, 근처에 있는 K개의 데이터를 바탕으로 분류하는 알고리즘K의 값은 매개변수로 직접 설정 가능하다.이 사진의 경우 K = 3으로 설정한 K-최근접 이웃 알고리즘으로, 새로운 값의 가장 근처에 있는 3개의 데이터를 활용한다.3개의 데이터 중 2개는 삼각형, 1개는 사각형이므로 삼각형으로 분류하게 된다.단순한 알고리즘으로, 구현하는 큰 틀만 기억하고 넘어가야겠다. 💡 K-최근접 이웃 알고리즘 라이브러리KNeighborsClassifier 라이브러리를 사용한다.from sklearn.neighbors import KNeighborsClassifier분류기 객체(모델)를 만든 뒤, 데이터를 이용해서 모델을 학습(훈련)하고, 정확도를 계산한다.# 사이킷런 패키지에서..