Skip to content
This repository has been archived by the owner on Apr 18, 2020. It is now read-only.

Datos de la pandemia del COVID19 en Mexico

License

Notifications You must be signed in to change notification settings

coronamex/Mexico-datos

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

87 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Datos para el monitoreo del COVID-19 en México

Los datos sobre el número de casos confirmados, sospechosos y negativos de SARS-COV-2 (COVID-19) en México son publicados por el gobierno a través de la Secretaría de Salud (SSa). Sin embargo, estos datos se publican de manera fragmentada, con errores y omisiones, y por lo general en un formato que no es fácil de manejar en computadora. Tampoco se ha hecho público archivo de datos, y por lo tanto no es posible seguir la evolución a través del tiempo.

Este repositorio funge como una base de datos (no-oficial) para toda la información que publica la SSa. Archivamos, normalizamos y convertimos los datos a formatos que son fáciles de manipular en computadora (CSV, JSON, etc).

Este repositorio es actualizado a diario, y trabajamos mucho para mejorarlo. Si tienes algún comentario, queja o sugerencia, por favor escríbenos al correo mexicovid19contacto@gmail.com, abre un issue o realiza un pull request.

Si estás interesado/a en una visualización de los datos que aquí se encuentran, puedes visitar nuestra página para el monitoreo del coronavirus en México (y el repositorio con su respectivo código fuente).

Datos

  1. Los datos publicados por la Secretaría de Salud (SSa) en encuentran en los siguientes directorios. Datos oficiales:

    • datos/reportes_oficiales_ssa: se archivan las dos tablas en formato PDF de casos confirmados y sospechosos que se publican junto con el Comunicado Técnico Diario (CDT), así como las tablas en formato CSV. Para más información sobre la normalización, referirse a este README.
    • datos/sinave: se archivan los datos en formato JSON que se obtienen a diario a partir del mapa de SINAVE.
    • datos/datos_abiertos: a partir del lunes 13 de abril, la SSa publica tablas en formato CSV con todos los casos relacionados (confimados o no). Para facilitar su procesamiento, estos archivos se han incorporado a una base de datos sqlite.
  2. Procesamos los datos de Salud a diario para obtener el historial de los casos a nivel nacional y desglosados por estado, así como un resumen con el que construimos una pirámide poblacional según el sexo del paciente y el rango de edad. Datos procesados:

Fuentes para los datos del COVID-19

Otras fuentes que no se incluyen aquí

Otros repositorios con datos similares:

Un repositorio con datos para otros países de América Latina:

Un repositorio con datos del Reino Unido que nos ha servido de inspiración en algunas cosas:

Otros datos

Herramientas

Para convertir las tablas PDF de casos confirmados y sospechosos a formato CSV utilizamos primero Python y luego Julia (por el tiempo reducido para correr el código)

  • codigo/scrap.py: (Deprecado) python scrapy.py; Requerimientos: pip install -r requirements.txt
  • codigo/scrap.jl: julia scrap.jl Tabla.pdf [-o output.csv]; Requerimientos: TODO (Esta función fue tomada de @carranco-sga y extendida para nuestros propósitos)

Para descargar de forma autómatica los datos del mapa de SINAVE utilizamos un script en JS que corre en node.js.

Workflow diario

node download_sinave.js
python update_from_json.py 20200415.json true

julia scrap.jl Tabla_casos_positivos_2020.04.15.pdf -o covid19_mex_confirmados_20200415.csv
julia scrap.jl Tabla_casos_sospechosos_2020.04.15.pdf -o covid19_mex_sospechosos_20200415.csv
mv covid19_mex* ../datos/reportes_oficiales_ssa
python update_pyramid.py

About

Datos de la pandemia del COVID19 en Mexico

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 56.0%
  • Julia 37.5%
  • JavaScript 6.5%