Durante estos días he estado probando nuevos workflows de KNIME para recoger información sobre las conversaciones y los hashtags asociados sobre el El Camino de Santiago Twitter.
El objetivo sería identificar las hashtags que aparecen junto a las principales de este tipo de tweets: #CaminodeSantiago, #TheWayofStJames, #Jakobsweg, #ChemindeCompostelle, #CaminhoSantiago, …
Camino de Santiago en Twitter: estadísticas
Una vez que se han capturado los tweets, se identifican las hashtags de forma individual para poder hacer un seguimiento temporal y ver su evolución. Mediante otro workflow se actualizan los datos en Data Studio. En la siguiente gráfica interactiva podéis jugar con los filtros para poder hacer vuestros propios análisis.
Cómo es proceso para recoger los tweets con KNIME
El proceso sería el siguiente: día veces al día se recogen los tweets del día utilizando la API de Twitter, nos aseguramos que no hay tweets repetidos y que son originales, es decir, que no son re-tweets. También se eliminan los detalles de los usuarios para mantener la privacidad.
Las hashtags más repetidas junto con #CaminodeSantiago en febrero de 2021 son: #jakobsweg, #camino, #xacobeo2021, #buencamino y #peregrino.
Como podéis observar, lo primero sería eliminar la etiqueta principal para poder estudiar el detalle del resto de las etiquetas relevantes. También sería interesante unificar algunas de ellas que son muy parecidas, por ejemplo, #peregrino y #peregrinos, #camino y #caminos, #xacobeo, #xacobeo21 y #xacobeo2021, …
¿Hay alguna que os resulte curiosa? Por ejemplo, aparece #3Caminos haciendo referencia a la última serie en Amazon Prime sobre el Camino de Santiago o #cruzdeferro por la polémica sobre los planes de modificación de su entorno pero también multitud de ellas difundiendo las localidades por donde pasan los diferentes Caminos.
¿Os gustaría que hiciera algún otro tipo de análisis? Listado de Tweets, Usuarios más citados, … podéis indicarlo en los comentarios.