Independencia de Cataluña en Ibereval@SEPLN 2017

La semana pasada presentábamos en Murcia la tarea Stance and Gender Detection in Tweets on Catalan Elections en el taller Evaluation of Human Language Technologies for Iberian Languages (Ibereval) de la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN). La introducción de la tarea fue a cargo de la compañera Viviana Patti, de la Università degli Studi di Torino, quien de una manera clara y concisa remarcó las principales diferencias entre análisis de sentimiento y análisis de posicionamiento (stance). Concretamente, podemos definir la detección de posicionamiento (stance detection) como: “Dado un texto y una entidad objetivo (persona, organización, movimiento, política, etcétera), determinar si dicho texto está a favor, en contra o le es...

Author Profiling task en PAN’17

La semana pasada presentamos en el CLEF la tarea de Author Profiling del laboratorio PAN. El objetivo de este año ha sido ambicioso: abordar la identificación de sexo y de variedad del lenguaje de usuarios de Twitter. Debido al foco multilingüe del CLEF, se ha abordado la tarea en los siguientes cuatro idiomas (con sus correspondientes variedades): Algunos de los hallazgos más importantes han sido los siguientes: Las aproximaciones de deep learning, aunque han funcionado bien, no han conseguido superar a las aproximaciones clásicas basadas en n-gramas y algoritmos de aprendizaje como logistic regression o support vector machines. Los mejores resultados se han obtenido para el portugués, tanto en identificación de variedad, donde había que decidir entre dos...

Emograph de mi tesis doctoral

El viernes 3 de junio defendí por fin mi tesis doctoral. Tres años y medio de duro esfuerzo que culminaron en una defensa que quise terminar con un toque de humor sobre un aspecto curioso de Emograph, la representación basada en grafos que pretende capturar la forma en la que expresamos nuestras emociones en el marco de nuestro discurso. Concretamente, mostré una diapositiva que representaba el Emograph de mi propia tesis doctoral, y a partir del cual se deberían determinar rasgos de la persona que la ha escrito, como por ejemplo que he sido yo. Pero lo curioso es el Emograph en sí, del que pudimos ver algunas cosas interesantes como mostramos a continuación.   Lo primero que llama la atención es un nodo de tamaño considerable llamado factotum; y es que en...

www.authorprofiling.com

Noticias y eventos sobre author profiling: http://www.authorprofiling.com/

Author Profiling en Social Media – UPV Televisión

Entrevista en UPV Televisión a partir de la publicación “On the Impact of Emotions on Author Profiling” en la revista Information Processing and Management (IP&M 2016) http://moneres.upv.es/vod/upvrtv/tv/actualidad-en-la-upv/2015-11-10-actualidad-en-la-upv-55599.mp4 Fuente...

Author Profiling y La Vanguardia

El otro día en unas charlas de doctorado un colega me comentó que un amigo suyo había hecho una entrevista para científico de datos en La Vanguardia y que una de las preguntas que le habían hecho tenía que ver con author profiling, concretamente, que cómo abordaría él el problema de identificar si el autor de un comentario es mujer u hombre. Interesante cuestión, y más interesante su respuesta pues dijo que tomando la última letra del nick (wtf!?!?!?). Bueno, lo primero de todo decir que ser (o querer ser) científico de datos no implica saber de todo, y menos de algo concreto como es el author profiling, y más concretamente de cómo identificar el sexo. Ser científico de datos implica más bien ser capaz de hacer ciencia con los datos, y eso implica muchas horas de...