Lo que cuentan los datos sobre la historia de Eurovisión

Lo que cuentan los datos sobre la historia de Eurovisión

22 de noviembre de 2024

Más allá del chanelazo, quizás te sorprenda leer que Suecia es el país que más votos ha acumulado en toda la historia de Eurovisión o te quedes con la boca abierta al enterarte de que Irlanda es el país que más veces ha ganado el concurso. Puede que no supieras que Israel fue el primer país no europeo en participar, en 1973, o que en el 69 hubo hasta cuatro ganadores. Aunque seguramente sí que sepas que en 2020 fue la primera vez en 64 años que el concurso se canceló.

Todas estas afirmaciones y muchas otras son el resultado de haber entendido los datos y, para ello, haberlos extraído previamente y poder visualizarlos con claridad después. Esto se logra haciendo una buena labor de Visualización de Datos, con las técnicas y las herramientas adecuadas. Porque como bien dice Chanel, «y si aún no me creen, pues me toca mostrárselo». Y lo hemos hecho a través de un dashboard.

Haz clic en la imagen para acceder al dashboard

La Visualización de Datos es la capacidad de transformar los datos en historias, de extraer conclusiones para interpretar la realidad. Porque no es lo mismo decir que Portugal y España siempre se votan mutuamente en Eurovisión que dilucidarlo a través del análisis y la comprobación de los datos para saber si esto no es solo una leyenda urbana.

Patricia Pinar, especialista en data analyst y data visualization, e Isabel Searle, data analyst del equipo de Data & Artificial Intelligence de Sngular, han estado trabajando en un dashboard que analiza los datos de Eurovisión desde la edición de Frankfurt, en 1957, hasta la de Turín, en 2022.

Ellas lo llaman Data Storytelling, y navegando por él se pueden encontrar diferentes formas de visualizar los datos interactuando con los mapas, filtros y con todos los gráficos. El objetivo es descubrir los resultados del festival con un dashboard de fácil interpretación que conecte puntuaciones, ganadores, países y su interacción a lo largo de los años. Se trata de una forma atractiva de mostrar los datos, que es parte de lo que podemos hacer en el equipo de Data Visualization para ayudar a los usuarios a comprender la realidad.

De las fuentes a las gráficas

Pero vamos por pasos y comencemos desde el principio, allá donde habitan los datos, sus fuentes originales desde donde las extraemos para acabar creando valor, como ya hicimos con los resultados de los Juegos Olímpicos hace unos meses. Sin embargo, no se crea valor a partir de cualquier fuente, y aquí es donde arrancaba el trabajo de nuestras especialistas.

Antes de ponernos manos a la obra, el equipo hizo una investigación escrutando Tableau Public, buscando inspiración y comprobando carencias en otros dashboards. La intención no era otra que la de hacer un storytelling completo.

Para elaborar el dashboard se utilizó un dataset de Kaggle y todo pareció ir sobre ruedas hasta que se construyó y nos dimos cuenta de que había diferencias entre los datos que teníamos y los que se presentan como oficiales en la web de Eurovisión. Una búsqueda exhaustiva por la web nos hizo ver que ninguno de los datasets coincidían con los datos que se publican en la web oficial. Comenzaban los problemas.

Decidimos hacer web scraping a la web del concurso y descubrimos que es una auténtica carrera de obstáculos para cualquier web scraper. Por supuesto, nada que no se pueda solucionar con un equipo cohesionado y con ganas de llegar hasta el final. Para ejecutar esta tarea se utilizó Python con las librerías de Selenium y Beautiful Soup.

«Lo más importante, como muchas veces decimos, es transformar datos en historias»

Una vez obtenidos los datos correctos, los cruzamos con un fichero de coordenadas de Github. Como se quiso realizar un network map para mostrar las relaciones entre los países mediante las puntuaciones entre estos, se necesitaron las coordenadas geográficas. ¿Qué hicimos entonces? Llevamos a cabo un proceso de limpieza y normalización con Python para después cruzarlo con las coordenadas de cada país, pero…

No iba a ser todo coser y cantar, ¿no? La cambiante realidad geopolítica no siempre se manifiesta de forma tan evidente en los datos. Países como Serbia y Montenegro o Yugoslavia no disponían de coordenadas en el listado adquirido en Github, por lo que tuvimos que añadirlas a mano. Mucho coser datos, pero quienes cantaban venían de Eurovisión.

Un storytelling completo de la historia de Eurovisión

Para crear una narración consistente y redonda construimos un dashboard con todo tipo de gráficos: cada tipo de información tiene requisitos específicos que nos ayudan a que la visualización sea más clara para el público objetivo. Encontramos desde KPI agregados, tablas ordenadas, gráficos de barras a los que se les han ido añadiendo anotaciones y, sobre todo, mapas.

Los mapas son los grandes protagonistas en este dashboard, como no podía ser de otra forma. Hay tanto mapas de calor como de burbujas para representar las relaciones entre los países mediante las puntuaciones entre estos. Además, muchos de estos gráficos son interactivos, lo que permite filtrar la visualización a gusto del usuario.

─ ¿Y qué es eso que decís que se descubre usando este tipo de herramientas de visualización de datos?

Por ejemplo, que en 1969 ganaron hasta cuatro países, ¡entre ellos, España! O poder responder a la clásica pregunta de si es verdad que Portugal y España siempre se votan mutuamente, como hablábamos antes.

Bueno… esta última es una verdad a medias si atendemos al mapa. Los países favoritos para España son, más bien, Italia o Alemania. Suecia también recibe más puntos que Portugal por parte de nuestro país. Para Portugal, en cambio, sí somos los favoritos a lo largo de los años. Parece que la correspondencia no es del todo equitativa.

Y un último aporte antes de dejarte jugar con los filtros de cada gráfica: SloMo, de Chanel, ha obtenido el récord de puntos para España en toda la historia de Eurovisión, después de 65 ediciones. Ya lo dice ella misma: «Voy siempre primera, nunca secondary».