¿Cantidad o calidad?

El diario Público presentó ayer, en su página web, una nueva herramienta para seguir la evolución del número de tweets que mencionan a cada uno de los partidos y candidatos que concurren en las elecciones del 20N. Estos gráficos interactivos permiten conocer prácticamente al segundo qué formación política está recibiendo una mayor atención en Twitter.

Aplaudimos esta iniciativa, ya que creemos que extender el análisis que nosotros llevamos realizando desde hace más de un mes al resto de formaciones políticas es necesario. Este tipo de gráficos nos permitirá tener una visión más amplia de cuáles son los partidos y candidatos que consiguen generar un mayor nivel de discusión en las redes sociales. Sin embargo, los datos que Público ofrece también son un ejemplo de las complejidades que presenta el estudio de datos provenientes de Twitter.

Por ejemplo, una dificultad importante a superar es ser capaz de clasificar, de entre los millones de tweets que se publican diariamente en español, cuántos hacen referencia a cada partido o candidato. Se trata de un verdadero reto por dos motivos. En primer lugar, los nombres de los partidos son ambiguos. No hay más que hacer una búsqueda en Twitter de los términos pp, iu o antigüedad (como, por ejemplo, hace Público para preparar sus gráficos) para darse cuenta que los datos que ofrece el periódico sobre estos tres partidos están claramente sobreestimados, limitando la validez de cualquier comparación entre partidos. Esto explica que el PP doble en tweets al PSOE, o que Amaiur obtenga casi 10 veces más tweets que PNV, ambos resultados claramente sospechosos.

Nuestra decisión de guardar el texto completo de cada tweet nos ha permitido esquivar este problema mediante la implementación de filtro. De esta manera, limitamos la clasificación errónea de mensajes de contenido no político, y aseguramos que nuestra estimación del número de tweets sea más realista. En nuestros resultados, comprobamos que el PP generalmente supera en menciones al PSOE, aunque la magnitud de esta diferencia es mucho menor. De igual manera, al diferenciar entre partido y candidato, nuestros gráficos permiten diferenciar hasta qué punto es uno u otro quien genera conversación en Twitter. Además, que los apellidos de los dos candidatos sean poco comunes refuerza nuestra confianza en que nuestra clasificación es válida.

Una cuestión diferente es el interés práctico de una comparación cruda en el número de menciones. En Twitter, como cualquier usuario sabe, no es lo mismo cantidad que calidad. El número de tweets sobre un tema y las preferencias públicas son variables que no siempre están asociadas . Es precisamente esta idea la que nos llevó en un origen a intentar analizar el contenido de los mensajes.

Además, como analizamos en nuestra próxima entrada, los usuarios de Twitter de cada partido tienen un comportamiento muy diferenciado. De hecho, encontramos que, partiendo de la misma base de usuarios para PP y PSOE, los populares obtienen un mayor número de menciones sencillamente porque la media de mensajes que hacen referencia a ellos es superior. En conclusión, no es posible distinguir si un mayor número de menciones equivale a una mayor “popularidad” de un determinado partido o candidato, o sencillamente que sus bases están mucho más movilizadas y organizadas en Twitter.

En cualquier caso, de nuevo damos la bienvenida a esta herramienta que, con sus virtudes y defectos, complementa el análisis que nosotros llevamos realizando ya varias semanas, y que nos permitirá seguir la campaña desde una nueva perspectiva. Es difícil determinar si Twitter cambiará o no la manera en que se entiende y se practica la política. Pero sin duda se trata de una excelente – y aún muy inexplorada – fuente de datos sobre opinión pública.

2 comentarios en ¿Cantidad o calidad?