Desigualdad en la participación

Los gráficos que usamos en esta página muestran el número tweets que mencionan a cada partido o candidato. No obstante, es razonable pensar que esta es una medida que refleja muy parcialmente el grado en el que existe un debate político en Internet. Al fin y al cabo, los mensajes que puede enviar un usuario en Twitter no se ven limitados por nada más que por las muy holgadas condiciones que impone la página web. Por tanto, podría darse un escenario en el que existiesen participantes muy motivados que estuviesen inundando el canal de comunicación, sin que eso tenga una traducción en una discusión activa. Esto es, más menciones no tienen por qué reflejar una mayor popularidad de un candidato o partido. Esta es la idea que exploramos en esta entrada.

En el siguiente gráfico, se muestra la contribución de cada usuario a la conversación y refleja el número de usuarios (en logaritmo) que han generado un determinado número de tweets (en logaritmo, también) en el que se mencione bien a Rajoy, bien a Rubalcaba. Por ejemplo, en la esquina inferior derecha, se muestra que en la base hay muchos usuarios (e elevado a cerca de 11) que han enviado un único mensaje (e elevado a 0, que es igual a 1) mencionando a alguno de los dos candidatos. Los puntos de la esquina superior izquierda representan a los participantes más activos, con más de 148 mensajes cada uno en este mes y medio. Lo que este gráfico refleja es, pues, que existe una larga cola de participantes que han hecho menos de diez menciones (110.982, que son un 90% del total), mientras que hay un pequeño núcleo hiperactivo que supera los 1000 tweets cada uno (9 usuarios, que suponen el 0.0001% del total). Visto de otro modo, entre el 10 de septiembre y el 3 de noviembre, un 0.1% de los usuarios ha generado el 10% de todos los tweets que hemos recopilado. Esta es, a nuestro juicio, la indicación más clara de que la cantidad de tweets es una medida pobre para acercarse a la actividad y participación de la discusión.

Más interesante todavía es el comportamiento de esta desigualdad a lo largo del tiempo cuando dividimos la base de datos entre los dos principales candidatos. En el segundo gráfico, usamos una medida resumen de desigualdad, el coeficiente Gini, para comprobar en qué grado la producción de mensajes está concentrada a lo largo de la ventana de observación. Mayores valores en este índice son una señal de que los tweets son generados por pocos usuarios o, dicho de otro modo, de que pocos usuarios concentran un gran porcentaje de los mensajes que hemos capturado –en el caso extremo de que el índice tomase el valor 1, toda la base de datos habría sido generada por un único usuario. Tal y como puede verse, los tweets que mencionan a Rajoy están menos homogéneamente distribuidos (están más concentrados) entre los usuarios que los que mencionan a Rubalcaba. El que esta observación se repita consistentemente durante la casi totalidad de los 42 días que hemos analizado señala con claridad que no se trata de un accidente fruto del azar: los usuarios que hablan de Rajoy están más concentrados que los que hablan de Rubalcaba, lo cual es una forma de decir que la comunidad que menciona al candidato del PP es más activa que la que habla del candidato del PSOE. Es interesante comprobar que durante eventos anómalos, como las respectivas conferencias políticas de PP (cerrada el 8 de octubre) y PSOE (cerrada el 2 de octubre), observamos una democratización del mensaje, con significativas caídas en el grado de desigualdad de las menciones.

1 comentario en Desigualdad en la participación