-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathsiedu_procesar.R
43 lines (34 loc) · 1.39 KB
/
siedu_procesar.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
# Sistema de Indicadores y Estándares de Desarrollo Urbano
library(tidyverse)
library(readxl)
library(janitor)
source("funciones.R")
# el archivo funciona con macros, pero internamente son hojas
matriz_siedu = "datos/datos_originales/matriz-siedu-publicacion.xlsm"
# cargar todos los datos, un objeto por hoja
siedu_2018 <- siedu_cargar(matriz_siedu, 2)
siedu_2019 <- siedu_cargar(matriz_siedu, 3)
siedu_2020 <- siedu_cargar(matriz_siedu, 4)
siedu_2021 <- siedu_cargar(matriz_siedu, 5)
siedu_2022 <- siedu_cargar(matriz_siedu, 6)
# limpiar todas las hojas cargadas
siedu_2018_2 <- siedu_limpiar(siedu_2018, 2018)
siedu_2019_2 <- siedu_limpiar(siedu_2019, 2019)
siedu_2020_2 <- siedu_limpiar(siedu_2020, 2020)
siedu_2021_2 <- siedu_limpiar(siedu_2021, 2021)
siedu_2022_2 <- siedu_limpiar(siedu_2022, 2022)
# unir todos los datos existentes en un solo dataframe
siedu <- bind_rows(siedu_2018_2,
siedu_2019_2,
siedu_2020_2,
siedu_2021_2,
siedu_2022_2)
# datos de todas las variables disponibles, del año mas reciente que se tenga
siedu_2 <- siedu |>
arrange(comuna, variable, desc(año)) |>
group_by(comuna, variable) |>
slice_max(año) |>
ungroup()
# guardar ----
readr::write_csv2(siedu_2, "datos/siedu_indicadores_desarrollo_urbano.csv")
arrow::write_parquet(siedu_2, "datos/siedu_indicadores_desarrollo_urbano.parquet")