Author Profiling en textos rusos en RusProfiling (PAN@FIRE 2017)

La semana pasada presentamos la tarea RusProfiling en la conferencia FIRE en Bangalore, India, internacionalizando aún más el laboratorio PAN. El objeto de la tarea ha sido identificar el sexo de escritores anónimos, pero desde una perspectiva cross-medio (cross-genre). Es decir, dados textos de entrenamiento obtenidos de un medio como Twitter, se debía proceder a identificar el sexo de autores anónimos de Facebook, ensayos, revisiones,  Twitter, y como novedad con respecto a cualquier otra tarea, textos donde el autor imitaba entre otras cosas el estilo del sexo contrario. En la siguiente tabla se detalla cada uno de estos corpus: Hemos tenido 5 participantes que han enviado hasta un total de 93 ejecuciones. Algunos de los principales hallazgos han sido los...

Identificación automática de variedad de Árabe

Se entiende por variedad del lenguaje a la forma específica que toma una determinada lengua cuando es compartida por un grupo de personas, dependiendo de su situación regional, social o contextual. En este sentido, podemos hablar de variedades del inglés, del español, o como aquí nos interesa, del árabe. Por lo general, el marco regional de una variedad se suele enmarcar geográficamente en las fronteras políticas de los países. Así por ejemplo, en el caso del español tenemos la variedad de España, la de México o la de Argentina, por poner algunos ejemplos. No así sucede en el caso del árabe donde las regiones en las que se habla una determinada variedad transcienden las fronteras políticas de los países. En este sentido, aunque son varias las demarcaciones...

Independencia de Cataluña en Ibereval@SEPLN 2017

La semana pasada presentábamos en Murcia la tarea Stance and Gender Detection in Tweets on Catalan Elections en el taller Evaluation of Human Language Technologies for Iberian Languages (Ibereval) de la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN). La introducción de la tarea fue a cargo de la compañera Viviana Patti, de la Università degli Studi di Torino, quien de una manera clara y concisa remarcó las principales diferencias entre análisis de sentimiento y análisis de posicionamiento (stance). Concretamente, podemos definir la detección de posicionamiento (stance detection) como: “Dado un texto y una entidad objetivo (persona, organización, movimiento, política, etcétera), determinar si dicho texto está a favor, en contra o le es...

Author Profiling task en PAN’17

La semana pasada presentamos en el CLEF la tarea de Author Profiling del laboratorio PAN. El objetivo de este año ha sido ambicioso: abordar la identificación de sexo y de variedad del lenguaje de usuarios de Twitter. Debido al foco multilingüe del CLEF, se ha abordado la tarea en los siguientes cuatro idiomas (con sus correspondientes variedades): Algunos de los hallazgos más importantes han sido los siguientes: Las aproximaciones de deep learning, aunque han funcionado bien, no han conseguido superar a las aproximaciones clásicas basadas en n-gramas y algoritmos de aprendizaje como logistic regression o support vector machines. Los mejores resultados se han obtenido para el portugués, tanto en identificación de variedad, donde había que decidir entre dos...

Inteligencia Artificial: Percibir, Pensar, Actuar

Mucho se habla últimamente de inteligencia artificial y no siempre por quien sabe de lo que habla. De hecho, cuando un tema se pone de moda (léase cloud computing, big data, transformación digital, … o inteligencia artificial), y los profanos comienzan a hablar de él para, por ejemplo, posturear un poco, el concepto en sí mismo se suele distorsionar y llevar a confusión. Dice el principio de Rumpelstiltskin que “Once you can name something, you get power over it”, y los hay que se lo toman a pies juntillas… El problema es que cuando oímos hablar de inteligencia artificial, solemos pensar en una estructura computerizada, e incluso robotizada, capaz de hacer cualquier cosa (hablar, pensar, ¿matar?), y es entonces cuando surgen las filias y...

¿Quién domina el panorama de la colaboración musical?

Hace unos días escribía sobre una pregunta que me venía haciendo en los últimos meses: ¿Es la colaboración entre cantantes la fórmula del éxito? Mi intuición me decía que cada vez más los cantantes colaboran entre sí, y que cada vez más estas colaboraciones les llevaban a sacar temas de éxito. Para comprobarlo, descargué y analicé mediante un script en R las listas de Los 40 Principales de siete países desde 2014 hasta mitad de agosto del 2017. Los resultados parece que apoyan mi intuición y que ciertamente la tendencia de las colaboraciones musicales de éxito va al alza (al menos como indico siempre, según Los 40 Principales). En este artículo muestro quienes son los actores principales en esta colaboración entre cantantes, según su posición en la red y su...