목록인공지능 (38)
내가 하고싶은 건 다 하는 공간

이전 글에 이어서 진행.장소 데이터에 대한 문제각 데이터에서 장소를 나타내는 방식이 다 제각각이다.데이터명설명train_data월별/장소별 대기오염 정도를 나타내는 데이터test_data월별/장소별 대기오염 정도를 나타내는 데이터aux_data_DailyPopulation월별 행정동 단위 서울 생활인구 정보(성별 및 연령대별 인구수)aux_data_DailyRain일별 자치구 단위 강수량 정보aux_data_MonthlyBike월별 행정동 단위 대여소 단위 자전거 이용정보aux_data_MonthlyCar월별 행정동 단위 자동차 등록정보aux_data_YearlyMountainFire연도별 자치구 단위 임야화재 발생 면적, 건수aux_data_StationLocation행정동 단위 대기 관측소 위도/경도..

학과에서 주관하는 데이터 분석 경진대회를 참가하여 대기오염 예측모델을 개발하고있다.머신러닝 분류모델 - 결정 트리머신러닝 분류모델로 가장 유명한 거는 아무래도 결정 트리(DecisionTree)이다.특성공학 없이, 단순히 6가지의 대기오염물질 농도로 결정 트리 모델을 만들어보았을 때 다음과 같았다.결정 트리 모델에 하이퍼파라미터 튜닝을 진행해서 모델 성능을 높일 수도 있겠다.그래서 일단 DecionTree 라이브러리를 사용해서 모델을 돌려보았다.decision_tree = DecisionTreeClassifier(random_state=42) # 모델 생성decision_tree.fit(X_train, y_train) # 모델 학습y_pred = decision_tree.predict(X_test) # ..

통계학과에서 주관하는 데이터 분석 경진대회에 나가게 되었다.주제는 대기오염 데이터 분석을 통한 예측모델 개발 및 대기질 지수 산정예측 그런데 "데이터 분석" 경진대회의 탈을 쓴 "인공지능" 경진대회, 자세히 말하면 예측모델을 개발하는 공모전이었다.그래서 요즘 강제로 인공지능 공부하는중제공되는 데이터일단 주어진 데이터는 다음과 같다.데이터명설명train_data 월별/장소별 대기오염 정도를 나타내는 데이터 test_data 월별/장소별 대기오염 정도를 나타내는 데이터 aux_data_DailyPopulation 월별 행정동 단위 서울 생활인구 정보(성별 및 연령대별 인구수) aux_data_DailyRain 일별 자치구 단위 강수량 정보 aux_data_MonthlyBike 월별 행정동 단위 대여소..

이진분류다중분류0 또는 1(2개의 클래스)여러 개의 클래스시그모이드 함수 사용소프트맥스 함수 사용0.5 이상이면 클래스1, 미만이면 클래스0이라고 판단클래스마다 z값을 하나씩 계산따라서 로지스틱 회귀가 이진 분류에서 확률을 출력하기 위해 사용하는 함수는 '시그모이드 함수'이다.

💡 다중 회귀여러 개의 특성을 사용한 선형 회귀를 다중 회귀라고 한다.종속변수가 2개, 독립변수가 1개, 총 3개의 변수를 표현하다보니 3차원에 그려지게 되고,특성이 2개면 1) 평면을 학습한다.2) 회귀 방정식은 다음과 같다. 💡 다중 회귀 vs 다항 회귀 목적:다중회귀: 여러 독립 변수가 종속 변수에 미치는 영향을 분석.다항회귀: 하나의 독립 변수와 종속 변수 간의 비선형 관계를 설명.변수 형태:다중회귀: 여러 개의 독립 변수다항회귀: 하나의 독립 변수의 여러 거듭제곱 항수식:다중회귀: 선형 조합 다항회귀: 비선형 조합 💡 특성 공학기존의 특성을 사용해 새로운 특성을 뽑아내는 작업파이썬에서는 사이킷런의 변환기 PolynomialFeatures 클래스를 이용해서 변환기를 만들고,변환기로 특..

💡 K-최근접 이웃의 한계 K-최근접 이웃 모델은 근처에 있는 샘플값의 평균으로 예측하는 모델인데,새로운 샘플이 훈련 세트의 범위를 벗어나면 엉뚱한 값을 예측할 수 있다는 한계점이 있다.예를 들어 길이가 50cm인 농어의 무게를 예측했을 때, from sklearn.neighbors import KNeighborsRegressorknr = KNeighborsRegressor(n_neighbors = 3)# K-최근접 이웃 회귀 모델 훈련knr.fit(train_input, train_target)# 위 모델을 이용하여 길이기 50cm인 농어의 무게 예측print(knr.predict([[50]]))예측값이 1033.333으로 실제값과 매우 차이가 났다.import matplotlib.pyplot as ..