11
abril

Fomentando el periodismo de datos: Nuestra presencia en ‘Blogs y Medios XI’

Hace algunas semanas recibí el encargo por parte de los organizadores de las Jornadas de Blogs y Medios, que celebran su XI edición en estos días, de coordinar un hackatón que ayudara a introducir la idea de apostar por el periodismo de datos como herramienta para crear historias interesantes. Comprenderán que un convencido como yo del periodismo de datos, no podía faltar a la cita, junto al magnífico elenco de profesionales que forman los miembros de la Oficina de Software Libre de la Universidad de Granada, con JJ Merelo a la cabeza. Todo un lujo de equipo para emprender este viaje.

Por si no lo saben, un hackatón viene a ser, en nuestro caso, una actividad de liberación masiva de datos, que aunque muchas veces son públicos, suelen ser poco accesibles a la población en general. En este caso, y ante la proximidad de las elecciones al parlamento europeo, decidimos que un buen ejercicio sería el de liberar precisamente los datos correspondientes a los 3.817.339 granadinos que sumados han tenido derecho al voto en las  elecciones europeas celebradas en España, desde las primeras en 1987, hasta las últimas en 2009: Tipo de voto, abstenciones, votos que recibieron cada candidatura y decenas de variables más, que aplicadas no solo a cada municipio, sino a cada mesa electoral y en cada año por separado de forma que se puedan establecer comparaciones, configuran una base de datos con cientos de miles de cifras.

Decían mis compañeros informáticos mientras celebrábamos el hackatón que aún así no debíamos hablar de big data, ya que es este un concepto técnico que posiblemente debería ser reservado a procesos mucho más grandes. Y no seré yó quien les quite la razón, aunque el contenido tenía un volumen de información considerable. Al menos lo suficientemente importante como para procesarlos mediante herramientas gráficas que nos ayudaran a que todo el mundo entienda (especialmente periodistas), la utilidad del periodismo de datos.

Inicialmente nos marcamos el reto de geolocalizar el voto granadino en las elecciones europeas. No obstante, y debido al poco tiempo del que dispusimos (el taller estaba previsto para realizarlo en un día y medio escaso), no pudimos completar el proceso proyectado. A pesar de los problemas encontrados, parte del resultado está ahí. El procesado de datos obtenidos en crudo de las fuentes de datos del Ministerio del Interior y su posterior traslación a herramientas de geolocalización como google maps, nos permite analizar datos complejos de forma amigable.

maphackaton

Si pinchan sobre la imagen, el enlace les llevará a la fuente de los datos y podrán navegar sobre el mapa. Pero para llegar a este resultado, ha hecho falta realizar un trabajo coordinado por parte del equipo que ha estado colaborando en el proceso. Limpiar datos, procesarlos adecuadamente y llevarlos a un entorno en los que puedan ser visibilizados, nos ha ocasionado muchos problemas, algunos de los cuales hemos podido resolver, y otros que no, pero que nos han quedado como reto para futuros compromisos. Este también era parte de ejercicio… experimentar los límites en el tiempo con el que contábamos y aprender a trabajar en equipos multidisciplinares a los que los medios de comunicación no están acostumbrados normalmente. Y esa es la propuesta que lanzamos.

Pero por el camino hemos encontrado otros beneficios, más allá de lo que ya conocemos y practicamos sobre el conocimiento compartido. Viendo la estructura de la base de datos que teníamos como fuente y que el Ministerio del Interior tiene publicados, nos dimos cuenta de que el formato en el que están almacenados los datos de todos los procesos electorales celebrados desde la instauración de la democracia, vienen diferenciados por unos códigos que caracterizan el tipo de elección a la que se refieren. Y claro, alguien dijo:

-Pues este script que estamos creando podría servir para obtener los datos de cualquier provincia, para cualquier mesa electoral de España, para cualquier elección que se haya celebrado…

Para los menos iniciados, les diré que un script es un trozo de código en algún lenguaje informático que permite automatizar una serie de rutinas, para evitar el tedioso trabajo de realizarlas manualmente. Y se nos encendió la luz. ¿Por qué no llevar ese código a un repositorio que pueda aprovechar la comunidad o para hacer una versión más evolucionada más adelante? Dicho y hecho. Fue creado y hecho público el repositorio,  en el que pueden consultar todos los archivos que hemos trabajado.

Les seguiría detallando el proceso realizado, aunque creo que lo importante es resaltar la necesidad de crear espacios colaborativos como el que hemos experimentado esta semana en el marco de las Jornadas de Blogs y Medios y profundizar en ellos. Allí presentamos los resultados, de los que hemos hecho también un comentario en el blog de las jornadas.

hackaton

Desde aquí solo me queda agradecer a Javier Barrera y a JJ Merelo, organizadores del evento, que hayan depositado su confianza en mí para participar en el programa de las jornadas y su apuesta por el periodismo de datos. Nos hace falta mucha gente como ellos.

Incho Cordero
Avatar de Incho Cordero

Incho Cordero, apasionado del periodismo de datos, al que recurro para contar historias, más allá de los fríos números y las tristes cifras. Buscando una salida a tantos datos que muchas veces no dicen nada, o tienen demasiadas interpretaciones y a las estadísticas que confunden, cuentan realidades parciales y sesgan la percepción de la realidad que nos rodea.

Comentarios en este artículo

  1. Gracias a ti, Incho, por el gran trabajo de coordinación y resumen realizado. Y a ver si seguimos así.

    JJ

¡Danos tu opinión!

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *