LIMPIAR DATOS vs ENTENDER DATOS

Hace unos días leí un post en Linkedin que decía: We should re-title “data cleaning” as “understanding the data”. Why?

Hablaba de como para poder limpiar los datos debemos comprender sus matices. Y estoy totalmente de acuerdo.

Sobre comprender los mátices, estaba revisando la estadística experimental del Instituto Nacional de Estadística (INE) sobre movilidad, en los mapas de "Población de día y de noche", me encuentro con que sale Cheste, como el municipio con una mayor variación de población día/noche de Valencia.

Da la casualidad que "es mi pueblo", por lo que los conozco muy bien.

Aparecía un 137% de porcentaje de móviles a las 10:00 de la mañana respecto de los que hay a las 20:00, siendo el valor más alto del área de Valencia; lo que me sorprendió.

Mi conclusión es que podría ser que la presencia de la antigua Universidad Laboral (http://cecheste.com), con la presencia de los alumnos por la mañana, y su volumen comparado con el del municipio hacía que esa variación de población fuera muy grande.

Se me ocurrió comparar con Almussafes, del mismo tamaño de población que Cheste (entre 8.000 y 9.000 habitantes), pero con la fábrica de Ford y toda la industria auxiliar a esta en su término.

Pues la variación era menor en Almussafes que en cheste, pese al enorme volumen de trabajadores que lleva a ese municipio la industria automovilística.

Seguramente esto se deba a que se compara con los datos de las 20:00, y a esa hora siguen trabajando turnos de tarde en ese polígono industrial, por lo que la variación no es tan significante comparado con los estudiantes que abandonan el centro de Cheste por la tarde.

Siempre hay que preguntarse "¿Por qué?". Para entender los datos, hay valorar los criterios utilizados, como en este caso las fechas y la hora de comparación, y tener una visión holística de los territorios sobre los que estamos analizando.

Comentarios

Entradas populares de este blog

VISUALIZACIÓN: EDAD DE LOS EDIFICIOS DE VALENCIA

Isocronas en Google Maps. A buenas horas!!

La determinación del Potencial Económico de la Zona (1ª Etapa).