Author Profiling en el mundo real

Author Profiling (¿podríamos decir perfilar autores?) es un campo de investigación transversal a diferentes disciplinas como la lingüística (computacional), procesamiento del lenguaje natural, aprendizaje automático, recuperación de información, neurología, marketing… que básicamente trata de averiguar la máxima información personal posible de un autor o usuario a partir de lo que anónimamente escribe: edad, género, idioma nativo, perfil emocional, rasgos de personalidad… Es una disciplina que está adquiriendo gran importancia día a día y ya empiezan a aparecer resultados realmente sorprendentes en tareas como la detección de edad o de género, sorprendentes porque en muchos casos superan el 90% de precisión (ojo, su término correcto en inglés es...

Author Profiling en PAN@CLEF-2013

Esta semana ha sido el CLEF-2013 (Conference and Labs of the Evaluation Forum), una de las conferencias más renombradas y concurridas en el sector, este año con un récord histórico de 204 asistentes. En él he presentado el overview de la tarea de Author Profiling que organizamos dentro del PAN (Uncovering Plagiarism, Authorship and Social Software Misuse), todo un éxito por la cantidad de registrados (66 personas) y de participantes (21 equipos). Las propuestas presentadas, los resultados obtenidos y las ideas discutidas prometen un gran futuro a esta bastante nueva área (¡es el primer año que se monta una tarea similar en todo el mundo!). Entre otras, el interés demostrado por la comunidad “reputacional” representada en el laboratorio Replab acerca...

International Workshop on Emotion and Sentiment in Social and Expressive Media

We extended the deadline to September 25th and we added the new information about a forthcoming special issue on the workshop topics: the Information Processing & Management journal (Elsevier, http://www.journals.elsevier.com/information-processing-and-management/) has just accepted to publish a special issue containing extended versions of the best papers at ESSEM 2013 (plus additional papers selected through an open CFP). For your convenience, the new deadlines are the following: – September 25th, 2013: Paper submission deadline (extended) – October 21st, 2013: Notification of acceptance – October, 31st, 2013: Early registration – November 4th, 2013: Final manuscripts due – December 3rd, 2013: Workshop date   FINAL CALL...

Author Profiling in Social Media: Identifying Information about Gender, Age, Emotions and beyond…

Information is a must for social animals that we are the people, the information needs are evolving and the Information Retrieval has to evolve with them. Traditionally, Information Retrieval tried to answer the question “WHAT” with some kind relevance. We try to answer the question “WHO”. El anterior es el abstract del trabajo que presenté la pasada semana en FDIA (Future Directions in Information Access) en ESSIR 2013 (European Summer School in Information Retrieval) y que me gustaría compartir aquí. Os dejo la presentación del artículo: [iframe http://www.slideshare.net/slideshow/embed_code/26035321 500 400] El artículo: Paper Author Profiling in Social Media Y el poster: Poster Author Profiling in Social...

Tiempo Real vs. Tiempo Asumible

Muchos son los términos técnicos que se están incorporando en el vocabulario del día a día de los no-técnicos, como en este caso el del Tiempo Real. Este concepto se oye cada vez más en el mundo del análisis del Social Media y el BigData (otro vocablo ampliamente utilizado y que ya traté en ¿Cosmos es Big Data?). Grandes consultores vaticinan a boca llena que al igual que la Web ha evolucionado hacia redes sociales en Tiempo Real como Twitter, el análisis de las mismas se acerca cada vez más a ello. Pero, ¿qué es en realidad el Tiempo Real? Cuando la mayoría de la gente oye el término Tiempo Real piensa en enterarse al momento de algo sucediendo en este preciso momento, por ejemplo, considera Tiempo Real una noticia que se está narrando en el mismo momento que se...

Data for the task of Author Profiling #pan2013

Number of users crawled: 30,043,934 Number of documents: 2,910,874 -> Not all users have a blog Number of words:...