Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

¿Abandonamos JSON? #25

Closed
inigoflores opened this issue May 4, 2016 · 2 comments
Closed

¿Abandonamos JSON? #25

inigoflores opened this issue May 4, 2016 · 2 comments

Comments

@inigoflores
Copy link
Member

A lo mejor hay que plantearse abandonar los archivos .json en favor de .csv.

Motivos:

  • Tamaño: JSON multiplica por 5 el tamaño de CSV (lo que crea problemas con GitHub si se superan los 100 megas).

  • Simplicidad: Los perfiles no técnicos van a preferir CSV en vez de JSON.

  • Facilidad de proceso: Los CSV son más fáciles de procesar por herramientas como csvkit.

  • Son el estándar: Casi todos los datasets que he visto están en CSV o GeoJSON. No se encuentra casi nada en JSON. CSV tiene hasta una conferencia propia!

  • Redundancia y ruido: Los JSON no proporcionan más que información que ya existe en los CSV, y que se puede convertir a JSON mediante un simple comando (e.j. csvjson data.csv > data.json), al alcance de cualquier desarrollador.

    El propio Data Package Viewer te permite convertir y descargar los datos en cualquiera de los formatos, aunque el recurso esté solo en uno. Un ejemplo: European NUTS boundaries as GeoJSON at 1:60m. El recurso está únicamente en GeoJson, pero el visualizador incluye enlaces para descargar el CSV y JSON de una copia local (que me imagino estará previamente convertida y guardada en la cache).

¿Qué opináis?

@dansmachina
Copy link

dansmachina commented May 4, 2016

Aprovecho para dejar por aquí un breve resumen de formatos: http://opendatahandbook.org/guide/en/appendices/file-formats/

En cuanto al CSV, me quedo con esta reflexión: "a single omission of a field may disturb the reading of all remaining data in the file without any real opportunity to rectify it, because it cannot be determined how the remaining data should be interpreted." Aunque pueda tener ventajas, se hace difícil de manejar en algunos casos, por no hablar de que perdemos la estructura jerárquica que podemos encontrar en formatos como JSON, XML o derivados y que, desde mi punto de vista, puede resultar util.

@fesja
Copy link
Contributor

fesja commented May 4, 2016

Ver #26, propongo una pausa en estos debates

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants