Cómo predecir la personalidad de los internautas (II)

En el anterior artículo dedicado a este tema hablamos de los Big Five como modelo psicológico base para definir los rasgos de personalidad, pero nos quedó pendiente enlazar cómo pueden detectarse estos rasgos a partir de lo que los usuarios escriben.

El trabajo realizado en textos escritos se ha basado principalmente en estos Big Five (en ocasiones mezclado o no con el modelo de Egogramas que describiremos en otro artículo), empleando diferentes tipos de características para recopilar la información para la construcción del modelo.

Algunos de los más usados son:

  • Function words
  • Systemic Functional Grammar Analysis
  • Características derivadas de LIWC

Function Words

Las palabras de función (function words) son palabras con muy poco significado léxico o con un significado ambiguo, pero que por contra sirven para expresar relaciones gramaticales con otras palabras dentro de una misma oración.

Las palabras de función le permiten de manera explícita expresar actitud o humor al hablante, pero también son usadas de manera inconsciente según los rasgos de personalidad de quién las utiliza en su discurso.

La clase de palabras que se consideran palabras de función son los artículos, pronombres, conjunciones, verbos auxiliares, interjecciones y otras partículas como si, entonces, sin embargo, mas, pero…

Uno de los autores que más intensamente ha investigado y divulgado sobre este tipo de palabras es James W. Pennebaker, escritor de The Secret Life of Pronouns, y uno de los desarrolladores de LIWC, explicado en próximos párrafos.

Systemic Functional Grammar Analysis

Systemic Functional Grammar se basa en la lingüística sistémica funcional propuesta por [1] y tiene en cuenta gran cantidad de problemas básicos relacionados con las gramáticas y el análisis de oraciones que no pueden ser solucionadas por una gramática tradicional, presentando un modo muy sistemático de analizar oraciones y entender sus constituyentes.

El término sistemático se refiere a la visión del lenguaje como una red de sistemas o de conjuntos interelacionados de opciones para generar significado.

Características derivadas de LIWC

Linguistic Inquiry and Word Count (LIWC) es un software de análisis de texto desarrollado por [2].

LIWC calcula el grado en que los individuos utilizan las diferentes categorías de las palabras a lo largo de grandes cantidades de texto, incluyendo emails, discursos, poemas o transcripciones de discursos orales del día a día…

De manera sencilla permite determinar el grado en que un texto utiliza emociones positivas o negativas, autoreferencias, palabras causales y hasta otras 70 dimensiones del lenguaje.

 

Si bien es cierto que todavía no abundan los trabajos en este área, y aún menos en lenguas diferentes al inglés, se deja entrever el interés de la comunidad científica y las grandes posibilidades que se brindan a empresas e instituciones.

En próximos artículos hablaremos de los Egogramas y de cómo se relacionan con los Big Five, relataremos algunos ejemplos del estado del arte, presentaremos resultados de estudios como los de [3], y cómo no os contaremos qué estamos haciendo en Autoritas y Cosmos en este apasionante campo 🙂

 

Referencias

[1] HALLIDAY, Michael A.K. “Estructura y función del lenguaje”, en John Lyons (ed.), Nuevos horizontes de la lingüística, pp. 145-173, Alianza Editorial, Madrid, 1975

[2] Pennebaker, J.W., Booth, R.J., & Francis, M.E. (2007). Linguistic Inquiry and Word Count: LIWC 2007. Austin, TX: LIWC (www.liwc.net)

[3] Argamon, S., Moshe, K., Pennebaker, J.W., Schler, J. Automatically Profiling the Author of an Anonymous Text. Communications of the ACM – Inspiring Women in Computing. Volume 52 Issue 2, February 2009 Pages 119-123

Submit a Comment

Your email address will not be published. Required fields are marked *