목록2024/09/28 (7)
우당탕탕 개발일지
💡문제 링크 프로그래머스코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.programmers.co.kr 💡문제 분석 요약연산 operations 리스트가 매개변수로 주어진다.operations에 나온대로 큐에 연산을 수행한다.1. "I 숫자" : 큐에 숫자 삽입2. "D 1" : 큐에서 최댓값 삭제3. "D -1" 큐에서 최솟값 삭제이 연산을 모두 마치고 난 뒤 큐에 남은 최댓값과 최솟값을 출력한다.큐에 남은 게 없다면 [0, 0]을 출력한다. 💡알고리즘 설계1. if문을 사용해서 연산에 대한 코드를 구현한다.1. "I 숫자" : 큐에 숫자 삽입 -> append2. "D 1" : 큐에서 최댓값 ..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/MS50d/btsJReTkJS3/Fw4DpJ4jiqe1N99tbVqGv1/img.png)
데이터 탐색(EDA) - aux_data_MonthlyCara_d_classification 열이 뭘 나타내고 있는지 잘 모르겠다. 데이터 전처리 - aux_data_MonthlyCar불필요한 address 열만 제거했다. 데이터 합치기 - aux_data_DailyRain행정동 단위로 합치고, 겹치는 location 열은 하나 제거해줬다. 다른 데이터에 비해서 결측치도 거의 없고, 깔끔한 데이터라서 편했다!
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/bpNyQq/btsJPpI7R7q/dVFqUvZZCxiUTfbwH5K2b0/img.png)
데이터 탐색(EDA) - aux_data_MonthlyBike월별 대여소 단위 자전거 이용정보 데이터이다. 1. 자치구 단위의 장소 정보장소정보가 자치구 단위로 되어있다고 생각했지만, 아닌 경우도 있었다.자치구 단위: ['강남구', '강동구', '강북구', '강서구', '관악구', '광진구', '구로구', '금천구', '노원구', '도봉구', '동대문구', '동작구', '마포구', '서대문구', '서초구', '성동구', '성북구', '송파구', '양천구', '영등포구', '용산구', '은평구', '종로구', '중구', '중랑구'] - 25개aux_data_MonthlyBike의 location열의 카테고리: ['강남구', '강동구', '강북구', '강서구', '관악구', '광진구', '구로구', '금천구..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/dLCYop/btsJQzDHkjw/h8o0mgx1CTd2D3KZgmNFzk/img.png)
데이터 탐색(EDA) - aux_data_DailyRain1. train_data는 월별인데, aux_data_DailyRain는 일별이다. 따라서 aux_data_DailyRain를 전처리할 필요가 있다.2. rain_gauge, rain_day, date는 월별 데이터를 구하는 데에 있어서 불필요한 열이다. 데이터 전처리 - aux_data_DailyRaingroupby 함수를 사용해서 연도와 월로 묶은 다음에, rain_month의 최댓값을 나타내도록 바꿔야겠다.df_dailyrain.drop(columns = ['rain_gauge', 'rain_day', 'date']) # 불필요한 열 삭제df_dailyrain = df_dailyrain.groupby(['gu', 'year', 'month']..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/cqLECs/btsJQi3bTZ8/Gl6OY9SnteCisxPF93WIWK/img.jpg)
이전 글에 이어서 진행.장소 데이터에 대한 문제각 데이터에서 장소를 나타내는 방식이 다 제각각이다.데이터명설명train_data월별/장소별 대기오염 정도를 나타내는 데이터test_data월별/장소별 대기오염 정도를 나타내는 데이터aux_data_DailyPopulation월별 행정동 단위 서울 생활인구 정보(성별 및 연령대별 인구수)aux_data_DailyRain일별 자치구 단위 강수량 정보aux_data_MonthlyBike월별 행정동 단위 대여소 단위 자전거 이용정보aux_data_MonthlyCar월별 행정동 단위 자동차 등록정보aux_data_YearlyMountainFire연도별 자치구 단위 임야화재 발생 면적, 건수aux_data_StationLocation행정동 단위 대기 관측소 위도/경도..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/b4iGwH/btsJPC9eb5h/ryRYG5Vfv9Ww9kL1iC8GMK/img.jpg)
학과에서 주관하는 데이터 분석 경진대회를 참가하여 대기오염 예측모델을 개발하고있다.머신러닝 분류모델 - 결정 트리머신러닝 분류모델로 가장 유명한 거는 아무래도 결정 트리(DecisionTree)이다.특성공학 없이, 단순히 6가지의 대기오염물질 농도로 결정 트리 모델을 만들어보았을 때 다음과 같았다.결정 트리 모델에 하이퍼파라미터 튜닝을 진행해서 모델 성능을 높일 수도 있겠다.그래서 일단 DecionTree 라이브러리를 사용해서 모델을 돌려보았다.decision_tree = DecisionTreeClassifier(random_state=42) # 모델 생성decision_tree.fit(X_train, y_train) # 모델 학습y_pred = decision_tree.predict(X_test) # ..