Guía para la publicación de datos tabulares en archivos CSV

viernes, 17 abril 2020

Hoy en día disponemos cada vez de más fuentes de datos a nuestro alcance.

Los potenciales usuarios de datos tienen que hacer frente muchas veces a múltiples barreras que dificultan su acceso y su uso: metadatos escasamente descriptivos y estandarizados, elección de licencia, la elección del formato, el uso inadecuado de los formatos o deficiencias en los propios datos.

Estos problemas potenciales pueden ser atajados dado que, en buena medida, se observó que son debidos a que el publicador desconoce como expresar los datos de forma correcta en el formato elegido.

Por todo ello, y con el objetivo de contribuir a la mejora de la calidad de los datos abiertos, en datos.gob.es decidieron crear una colección de guías dirigidas a orientar a los publicadores en el uso adecuado de los formatos y los medios de acceso a datos abiertos más utilizados en el ámbito de los datos abiertos.

La colección de guías se inicia poniendo el foco en el formato CSV

La elección de este formateo se basa en su popularidad en el ámbito de los datos abiertos, en su sencillez y en lo ligero que resulta a la hora de expresar datos en forma de tabla. Es el formato más común en los catálogos de datos abiertos; concretamente, en datos.gob.es representa el 20% de las distribuciones conviviendo con otros formatos como XLS o XLSX que podrían expresarse también como CSV.

Además, es un formato que podemos denominar híbrido porque combina la facilidad de su procesamiento automatizado con la posibilidad de ser explorado directamente por personas con un simple editor de texto.

Esta guía comprende las características básicas de este tipo de formato y un compendio de pautas para publicar correctamente en datos tabulares, especialmente en CSV.

Más información en esta web

Xunta

Xunta de Galicia, Información mantenida y publicada en internet por Xunta de Galicia

Atención a la ciudadanía - Accesibilidad - Aviso legal - Mapa del portal