Author Profiling en textos rusos en RusProfiling (PAN@FIRE 2017)

La semana pasada presentamos la tarea RusProfiling en la conferencia FIRE en Bangalore, India, internacionalizando aún más el laboratorio PAN. El objeto de la tarea ha sido identificar el sexo de escritores anónimos, pero desde una perspectiva cross-medio (cross-genre). Es decir, dados textos de entrenamiento obtenidos de un medio como Twitter, se debía proceder a identificar el sexo de autores anónimos de Facebook, ensayos, revisiones,  Twitter, y como novedad con respecto a cualquier otra tarea, textos donde el autor imitaba entre otras cosas el estilo del sexo contrario. En la siguiente tabla se detalla cada uno de estos corpus: Hemos tenido 5 participantes que han enviado hasta un total de 93 ejecuciones. Algunos de los principales hallazgos han sido los...

Identificación automática de variedad de Árabe

Se entiende por variedad del lenguaje a la forma específica que toma una determinada lengua cuando es compartida por un grupo de personas, dependiendo de su situación regional, social o contextual. En este sentido, podemos hablar de variedades del inglés, del español, o como aquí nos interesa, del árabe. Por lo general, el marco regional de una variedad se suele enmarcar geográficamente en las fronteras políticas de los países. Así por ejemplo, en el caso del español tenemos la variedad de España, la de México o la de Argentina, por poner algunos ejemplos. No así sucede en el caso del árabe donde las regiones en las que se habla una determinada variedad transcienden las fronteras políticas de los países. En este sentido, aunque son varias las demarcaciones...

Independencia de Cataluña en Ibereval@SEPLN 2017

La semana pasada presentábamos en Murcia la tarea Stance and Gender Detection in Tweets on Catalan Elections en el taller Evaluation of Human Language Technologies for Iberian Languages (Ibereval) de la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN). La introducción de la tarea fue a cargo de la compañera Viviana Patti, de la Università degli Studi di Torino, quien de una manera clara y concisa remarcó las principales diferencias entre análisis de sentimiento y análisis de posicionamiento (stance). Concretamente, podemos definir la detección de posicionamiento (stance detection) como: “Dado un texto y una entidad objetivo (persona, organización, movimiento, política, etcétera), determinar si dicho texto está a favor, en contra o le es...

Author Profiling task en PAN’17

La semana pasada presentamos en el CLEF la tarea de Author Profiling del laboratorio PAN. El objetivo de este año ha sido ambicioso: abordar la identificación de sexo y de variedad del lenguaje de usuarios de Twitter. Debido al foco multilingüe del CLEF, se ha abordado la tarea en los siguientes cuatro idiomas (con sus correspondientes variedades): Algunos de los hallazgos más importantes han sido los siguientes: Las aproximaciones de deep learning, aunque han funcionado bien, no han conseguido superar a las aproximaciones clásicas basadas en n-gramas y algoritmos de aprendizaje como logistic regression o support vector machines. Los mejores resultados se han obtenido para el portugués, tanto en identificación de variedad, donde había que decidir entre dos...

Emograph de mi tesis doctoral

El viernes 3 de junio defendí por fin mi tesis doctoral. Tres años y medio de duro esfuerzo que culminaron en una defensa que quise terminar con un toque de humor sobre un aspecto curioso de Emograph, la representación basada en grafos que pretende capturar la forma en la que expresamos nuestras emociones en el marco de nuestro discurso. Concretamente, mostré una diapositiva que representaba el Emograph de mi propia tesis doctoral, y a partir del cual se deberían determinar rasgos de la persona que la ha escrito, como por ejemplo que he sido yo. Pero lo curioso es el Emograph en sí, del que pudimos ver algunas cosas interesantes como mostramos a continuación.   Lo primero que llama la atención es un nodo de tamaño considerable llamado factotum; y es que en...

www.authorprofiling.com

Noticias y eventos sobre author profiling: http://www.authorprofiling.com/