Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Acordar formatos y vocabulario con otros grupos de Open Data en España #26

Open
fesja opened this issue May 4, 2016 · 3 comments
Open

Comments

@fesja
Copy link
Contributor

fesja commented May 4, 2016

De mis conversaciones con responsables públicos y otras organizaciones, he sacado bastante interés en que se unan esfuerzos de cara a acordar formatos y vocabularios. Asi que antes de seguir debatiendo sobre formatos, que no es el objetivo principal de Code for Spain, creo que tiene sentido tener nuestros primeros 10 datasets en un formato no perfecto.

Organizamos un grupo de trabajo junto a otras organizaciones, responsables públicos y empresas; vemos lo que hemos hecho cada uno, y nos ponemos de acuerdo. Y con ese acuerdo, ya terminamos los datasets con el formato acordado.

Si no, veo que vamos a estar debatiendo sobre si un campo si o no, uno o varios repos, cuando luego lo volveremos a debatir con otros. Como ya está sucediendo... ¿cómo lo veis?

¿Quién se apuntaría a ese grupo de trabajo? Podemos ver quiénes son los candidatos más idóneos en base a la experiencia y motivación.

@fesja
Copy link
Contributor Author

fesja commented May 8, 2016

Estos son los datasets del Ayuntamiento de Alcobendas que tienen normalizados según la Norma UNE 178301 Ciudades Inteligentes. Datos abiertos (Open data):

cc @inigoflores @jalbertoroman @jpaulet @calonso

@inigoflores
Copy link
Member

No consigo encontrarle sentido a esta norma. He accedido a los catálogos de algunos ayuntamientos que han obtenido la certificación UNE 178301, y me encuentro que los datasets no usan una nomenclatura común, no presentan los datos en un formato unificado, y en algunos casos hasta omiten la foreign key.

Ejemplos:

  • http://www.bilbao.net/opendata/es/catalogo/dato-portales

    TTRE_COD_BARRIO TPOR_COD_CALLE TCAL_DES_CALLE_A TCAL_COD_TIPVIA TTVI_DES_TIPVIA_A TPOR_IDE_CLPORT TPOR_DIR_PORTAL TPOR_DIR_BIS TCAL_COD_MUNICI TMUN_DES_MUNICI_A TCOG_IDE_COORDX_CG TCOG_IDE_COORDY_CG TPOR_IDE_CLPORT TTRE_DIR_DISPOS TDIS_DES_DISEST_A TBAR_DES_BARRIO_A TTRE_COD_DISEST TTRE_NUM_SECEST TCOG_IDE_COORDX_UT TCOG_IDE_COORDY_UT TTRE_COD_BARRIO
    101 9573 ZARANDOA AV AVENIDA 64802000020903 23 20 BILBAO 0.000000 0.000000 64802000020903 48015 DEUSTU SAN IGNACIO 1 7 503006.59 4791977.76 101
    101 2990 AGUIRRE LEHENDAKARI AV AVENIDA 64802000035137 144 20 BILBAO 0.000000 0.000000 64802000035137 48015 DEUSTU SAN IGNACIO 1 12 503325.94 4791829.06 101
    101 2990 AGUIRRE LEHENDAKARI AV AVENIDA 64802000035145 145 20 BILBAO 0.000000 0.000000 64802000035145 48015 DEUSTU SAN IGNACIO 1 11 503287.76 4791816.01 101
    101 2990 AGUIRRE LEHENDAKARI AV AVENIDA 64802000035153 146 20 BILBAO 0.000000 0.000000 64802000035153 48015 DEUSTU SAN IGNACIO 1 12 503317.97 4791848.50 101
    101 2990 AGUIRRE LEHENDAKARI AV AVENIDA 64802000035161 146 A 20 BILBAO 0.000000 0.000000 64802000035161 48015 DEUSTU SAN IGNACIO 1 12 503311.74 4791838.78 101
  • http://www.bilbao.net/opendata/es/catalogo/dato-habitantes-distrito-barrio-estudios

    DISTRITO NOMBRE_DISTRITO BARRIO NOMBRE_BARRIO CODIGO_TITULO NIVEL_ESTUDIOS TOTALES
    1 DEUSTU 101 SAN IGNACIO 0 NO APLICABLE (MENOR 10 A�OS) 1829
    1 DEUSTU 101 SAN IGNACIO 11 NO SABE LEER NI ESCRIBIR 41
    1 DEUSTU 101 SAN IGNACIO 20 INFERIOR A GRAD. ESCOLAR 4
  • http://www.bilbao.net/opendata/es/catalogo/dato-barrios

    TBAR_COD_BARRIO TBAR_DES_BARRIO
    101 SAN IGNACIO
    102 ELORRIETA
    103 IBARREKOLANDA
    104 SAN PEDRO DE DEUSTU
    105 LA RIBERA
    106 ARANGOITI
  • http://www.bilbao.net/opendata/es/catalogo/dato-habitantes-barrio-sexo

    NOMBRE_BARRIO SEXO TOTALES
    ABANDO Hombre 10924
    ABANDO Mujer 13145
    ALTAMIRA Hombre 817
    ALTAMIRA Mujer 912
    AMETZOLA Hombre 5526
    AMETZOLA Mujer 6859

Tres nombres distintos para la columna de código de barrio (TTRE_COD_BARRIO, BARRIO, TBAR_COD_BARRIO), y en la última tabla no está ni siquiera incluido.

¿Esto lo permite la norma? Lo de las tres primeras tablas pasa (incluido que se haya duplicado la columna TTRE_COD_BARRIO en la primera), pero lo de la última tabla me parece inaceptable.

Otro ejemplo: http://datos.alcobendas.org/dataset/aparcamientos-en-alcobendas/resource/a74aa5d5-7b78-42b7-a5cf-f8eb2fc1ffa2

No entiendo por qué se utilizan nombres de columna que incluyen espacios y acentos, que no pueden ser tratados por una máquina. Así mismo, no sé qué sentido tiene incluir campos para nombre de país, provincia y municipio, y sin embargo se omite el código INE del municipio.

@fesja
Copy link
Contributor Author

fesja commented May 10, 2016

@inigoflores he estado leyendo la norma, y no me ha aclarado mucho la verdad. Asi que esa puede ser el culpable de las diferencias de ejecución, no llega a definir nada concreto. Estoy de acuerdo contigo en que deberían llevar el código INE del municipio por ejemplo.

A ver si mañana o pasado hablo más con un par de personas y os comparto cómo podemos ayudar.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants