Skip to content

검색어 빈도 데이터를 반영한 코로나19 확진자 수 예측 딥러닝 모델

Notifications You must be signed in to change notification settings

bleuxsy/Prediction-model_Covid19

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 

Repository files navigation

검색어 빈도 데이터를 반영한 코로나19 확진자 수 예측 딥러닝 모델

구글 트렌드를 확용해서 딥러닝 모델(DNN & LSTM) 을 사용한 탐색적 데이터 분석 실시 검색어 빈도 데이터 (‘코로나 증상’) + 과거 코로나 19 확진자 수 데이터 -> 미래 코로나 확진자 수 예측

확진자수 예측을 위한 입력 데이터

긴 기간의 시계열 데이터를 사용할수록 변동성 파악 용이 ( 전염병에 대처하고 관리하기 위해 1년정도의 시계열 데이터만 사용) -> 서울을 포함한 6개의 도시에서 2020년 1월 30일 ~ 2021년 2월 28일의 입력 데이터 입력 데이터 : 확진자 수( 특정일 기준으로 특정일 포함 과거 7일 데이터 사용-> 5일 후 예측), 검색어 빈도수 - 훈련 데이터 : 2020년 1월 30일 ~ 2021년 1월 20일 - 테스트 데이터 : 2021년 1월 21일 ~ 2021년 2월 28일 배치 사이즈( batch size ) : 데이터를 묶음 단위로 나눔

  • 미니 배치 (Mini- batch) : 8X7=56 데이터를 하나의 묶음으로 10개씩 묶은 데이터 하나가 미니 배치
  • 독립변수 : 8개 ( 더미 변수 (6개) 포함)
  • 타입스텝 : 7일
  • 배치 사이즈가 클 경우 : 학습 속도 상승 , 정확도 하락
  • 배치 사이즈가 작을 경우 : 학습 속도 하락, 정확도 상승
  • 너무 많은 데이터에 배치 사이즈를 작게 설정하면 과적합 발생 , 정확도 하락

-> “ 본 연구에서는 배치사이즈를 2에서 2씩 증가해 18까지 튜닝 “

확진자수 예측 모델 구성

DNN(심층신경망): 입력층과 출력층 사이에 많은 은닉층을 포함해 비선형적 관계 학습 RNN(순환 신경망) : 시계열 데이터 처리에 적합

https://howdy1227.tistory.com/58

About

검색어 빈도 데이터를 반영한 코로나19 확진자 수 예측 딥러닝 모델

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages