목록2024/10/04 (2)
우당탕탕 개발일지
ㄹㄹ
fe 오늘의 할 일1. xgboost에서 merge_data에서 id넣고 모델 돌려보기(민아) -> id 뺀 거랑 넣은 거랑 별반 차이가 없음 -> 결론: ID를 넣고 돌리자2. 기본 train_data에서 xgboost 돌려보기(화원)-> 아직 못함.3. 데이터 분석 공모전 흐름 파악한 거 공유하기(민아)-> 영상 링크 보냄4. 내일 뭐 질문할지 정하기-> 안하기로함5. shap을 이용해서 xgboost 모델에서 각 특성의 상호작용효과 파악(merge 전의 train_data, test_data 사용)->train_data에서 xgboost모델의 상호작용효과 파6. 특성중요도 시각화7
인공지능
2024. 10. 4. 17:13
[대기오염 예측모델 개발] XGBoost 모델을 사용하여 다중 클래스 분류 문제를 해결
XGBoost 모델이란?위 영상이 그라디언트 부스팅에 대해 이해하기 쉬워서 좋았다.- 각 이터레이션(반복)에서 맞추지 못한 데이터에 가중치를 부여해서 모델을 학습- 부스팅(Boosting) 계열의 트리 모델- 그라디언트 부스팅 모델에 비해 빠른 속도- 과적합을 막고, 자체 교차 검증 알고리즘과 결측치 처리 기능 보유 XGBoost의 대표적인 파라미터n_estimators (int) : 내부에서 생성할 결정 트리의 개수max_depth (int) : 생성할 결정 트리의 높이learning_rate (float) : 훈련량, 학습 시 모델을 얼마나 업데이트할지 결정하는 값colsample_bytree (float) : 열 샘플링에 사용하는 비율subsample (float) : 행 샘플링에 사용하는 비율re..
인공지능
2024. 10. 4. 13:45