머신러닝(LSTM, Random Forest)을 활용한 실시간 캠퍼스 와이파이 네트워크 혼잡도 예측 시스템
- 과목: 컴퓨팅사고와 데이터분석기초
- 학번: 12223815
- 이름: 정예원
- 기간: 2025년 1학기 (3월~6월, 16주)
대학 캠퍼스 내 5개 주요 건물의 와이파이 사용 패턴을 분석하고, LSTM 및 Random Forest 모델을 활용하여 시간대별 혼잡도를 예측하는 시스템 개발
├── 1_data_generation.py # 시뮬레이션 데이터 생성 및 EDA
├── 2_ml_modeling.py # Random Forest 모델 학습
├── 3_lstm_modeling.py # LSTM 모델 학습
├── requirements.txt # 필요한 라이브러리
└── README.md # 프로젝트 설명
데이터 규모:
- 16주 × 7일 × 24시간 × 4회(15분) × 5건물 = 53,760개 데이터 포인트
대상 건물:
- 중앙도서관 (정석학술정보관)
- 5호관
- 학생회관
- 하이테크센터
- 60주년기념관
특징:
- 15분 간격 시계열 데이터
- 건물별 특성 반영 (운영시간, 수업시간, 점심시간 등)
- sin/cos 함수로 자연스러운 패턴 표현
- 정규분포 노이즈 추가 (현실감)
- RMSE: 6.32
- MAE: 4.87
- R² Score: 0.923 (92.3% 설명력)
- RMSE: 14.16
- MAE: 9.65
- R² Score: 0.819 (81.9% 설명력)
pip install -r requirements.txtpython 1_data_generation.py출력:
wifi_data.csv(53,760 rows)summary_stats.csvhourly_pattern.pngweekday_pattern.pngexam_comparison.png
python 2_ml_modeling.py출력:
model_results.csvmodel_comparison.pngfeature_importance.png
python 3_lstm_modeling.py출력:
- LSTM 모델 학습 과정 및 성능 평가
-
건물별 패턴
- 하이테크센터: 평균 34.7% (24시간 운영)
- 중앙도서관: 평균 29.4% (16시 피크)
- 학생회관: 13시 급증 (87.6%)
-
시간 패턴
- 평일 > 주말 (약 2.5배)
- 화목요일이 15% 더 높음
- 시험기간 1.5배 증가
-
특성 중요도
- lag_1 (15분 전): 85.4%
- lag_96 (24시간 전): 8.7%
- 시간 정보: 6.9%
- 언어: Python 3.8+
- 데이터 처리: pandas, numpy
- 시각화: matplotlib
- 머신러닝: scikit-learn
- 딥러닝: TensorFlow, Keras
- Hochreiter, S., & Schmidhuber, J. (1997). Long short-term memory. Neural computation.
- Breiman, L. (2001). Random forests. Machine learning.
- Kim, J., & Lee, S. (2022). WiFi-based indoor positioning and crowd density estimation.
- 학번: 12223815
- 이름: 정예원
- 소속: 인하대학교 컴퓨터공학과
이 프로젝트는 학술 목적으로 작성되었습니다.