Matemáticas y redes sociales: observando quién publica en Twitter.

Una pregunta que interesará a muchos es ¿quién publica en las redes sociales? Hay varios estudios empleados para responder a esta pregunta. Luke Sloan, Jeffrey Morgan, Pete Birnap y Matthew Williams publicaron el artículo “Who Tweets? Deriving the Demographic Characteristics of Age, Occupation and Social Class from Twitter User Meta-Data” en el que analizaban los datos de Twitter para contestar a esta duda. Concretamente querían averiguar qué edad tiene la gente que publica en Twitter y cuál es su nivel socioeconómico en Gran Bretaña.

Para ello desarrollaron herramientas de análisis y las pusieron a prueba. Y bueno, fueron bien y mal. O mejor dicho, muy bien y “bien” pero “con pinzas”.

Por un lado el análisis de la edad a la que la gente publicaba fue simple y bastante exacta. Se dieron cuenta de que sus herramientas recogían bien la información de los perfiles de usuario en lo que a edad se refiere. Empleaban buscadores que buscaban palabras como “year” o “age” en el perfil de los usuarios y luego extraían la información del número que venía después. Como tal, esta parte demuestra ser sencilla. En este sentido, hubo pocos errores y se pudo determinar que la edad que más gente publicaba estaba entre los 16 y 22 años.

Fuente: Pixabay

El análisis para averiguar su nivel socioeconómico fue un poco más complejo. Para poder averiguar este dato, recurrieron a buscar la información acerca de a qué se dedicaba la gente. Uno de los problemas que encontraron fue que tenían varios casos en los que los hobbys se mezclaban con la ocupación. No sólo eso, en ocasiones encontraban que algunas descripciones sobre uno mismo que publicaba la gente, el programa los confundía con su ocupación (un ejemplo que dan es “I am a team player”, es decir, “Soy alguien que trabaja en equipo”). También tuvieron otras complicaciones. Por ejemplo, mientras que al buscar la edad, bastaba con analizar una palabra o un número tras buscar una palabra concreta, en este caso, las ocupaciones pueden estar formadas por varias palabras. La cantidad de errores y falsos positivos (casos en los que el programa identificaba un empleo que en realidad la persona no tenía) fue, por tanto, bastante alta. Identificando en qué casos ocurría cada cosa, pudieron ajustar las búsquedas y su precisión. Al final concluyeron que la gente publicaba que tenía un nivel socioeconómico relativamente alto, pero que ello podía estar sujeto a la necesidad de ser valorados más que realmente ser parte de ese grupo, o bien por estar en grupos altamente creativos que no indican necesariamente su nivel socioeconómico (pero entran igual en esas categorías) o errores derivados de confundir hobby con empleo.

En definitiva, las herramientas fueron precisas por un lado pero no tanto por el otro y por lo tanto, sólo podemos estar seguros que quien publica en Twitter es mayormente gente joven.


Enlace al artículo: Enlace

Article Source: Who Tweets? Deriving the Demographic Characteristics of Age, Occupation and Social Class from Twitter User Meta-Data

Sloan L, Morgan J, Burnap P, Williams M (2015) Who Tweets? Deriving the Demographic Characteristics of Age, Occupation and Social Class from Twitter User Meta-Data. PLOS ONE 10(3): e0115545. https://doi.org/10.1371/journal.pone.0115545


Comentarios

Entradas populares de este blog

Cultura Científica en base a tres definiciones

Límites al Algoritmo A* (A-Estrella)

"No mires arriba", el análisis del análisis