(Español) Author Profiling en textos rusos en RusProfiling (PAN@FIRE 2017)

Sorry, this entry is only available in European Spanish. For the sake of viewer convenience, the content is shown below in the alternative language. You may click the link to switch the active language.

rusprofilingLa semana pasada presentamos la tarea RusProfiling en la conferencia FIRE en Bangalore, India, internacionalizando aún más el laboratorio PAN. El objeto de la tarea ha sido identificar el sexo de escritores anónimos, pero desde una perspectiva cross-medio (cross-genre). Es decir, dados textos de entrenamiento obtenidos de un medio como Twitter, se debía proceder a identificar el sexo de autores anónimos de Facebook, ensayos, revisiones,  Twitter, y como novedad con respecto a cualquier otra tarea, textos donde el autor imitaba entre otras cosas el estilo del sexo contrario. En la siguiente tabla se detalla cada uno de estos corpus:

rusprofiling-corpora

Hemos tenido 5 participantes que han enviado hasta un total de 93 ejecuciones. Algunos de los principales hallazgos han sido los siguientes:

  • A diferencia de otras tareas de author profiling, en este caso las técnicas de deep learning han obtenido prácticamente los mejores resultados, especialmente en los corpus de ensayos y textos imitados.
  • Los mejores resultados no se han obtenido en Twitter, sino en Facebook.
  • Los peores resultados se han obtenido en revisiones.

En la siguiente tabla se resume el estado del arte de la tarea RusProfiling para cada uno de los corpus. En ella, se muestra el mejor resultado obtenido por los participantes, así como una segunda línea con nuestro método LDR, recientemente rebautizado como LDSE (Low Dimensionality Statistical Embedding), utilizado como baseline “dura” en todas las tareas que organizamos.

rusprofiling-stateoftheart

Para más información sobre la tarea y los resultados, se recomienda consultar:

Submit a Comment

Your email address will not be published. Required fields are marked *