Cómo conocer a tus influencers en redes sociales con Análisis de Redes – Socialancer

Webinar en Socialancer para el lanzamiento del curso de Análisis de Redes con Gephi.

What can (theoretical) linguistics do for NLP research?

Esta es la pregunta con la que se abría la mesa redonda en la que tuve el placer de participar junto con investigadores de la talla del Dr. Carlos Periñán de la Universidad Politècnica de València y fundador y director de FunGramKB, el Dr. Brian Nolan director del Departamento de Informática y Creative Digital Media en el instituto de Tecnología de Blanchardstown en Dublín y la Dra. Elke Diedichsen del Instituto Tecnológico de Blanchardstown y que fue directora de proyectos de habla en Google. El anfitrión de la sesión ha sido Gianluca Pontrandolfo de la Universidad de Trieste. Aquí dejo la transcripción de mi intervención que, aunque ha generado un poco de controversia, parece que ha dado en la espinita que muchos tenemos clavada dentro. La falta de cooperación...

Mentiras, malditas mentiras y estadística!!

Mark Twain nos dejó muchas cita célebres entre las que me gusta destacar la que da título al artículo, “Hay tres clases de mentiras: las mentiras, las malditas mentiras y las estadísticas”. Y es que ya en otros traté de los efectos de las trampas estadísticas, sobre el sesgo de la muestra y de la trampa de la muestra estadística. Hoy le toca el turno a la correlación. La correlación de dos variables nos proporciona un índice de cuán lejos está de lo aleatorio la evolución lineal de ambas variables, es decir, si dos variables están muy correlacionadas (en positivo o en negativo), indicará que la variación de una de ellas se producirá en una proporción lineal semejante (o contraria) en la otra. Por poner un ejemplo sencillo, una alta correlación en el...

La trampa de la muestra estadística

Los estudios estadísticos suelen centrarse generalmente en datos muestrales, esto es, a diferencia de los datos censales que en principio incorporan al total de la población de estudio, los datos muestrales seleccionan una parte o muestra de dicha población. Los estudios realizados sobre datos abiertos obtenidos de Internet y las redes sociales, como la escucha activa, son estudios muestrales por tanto y cuanto los datos se obtienen como muestras representadas por unas claves de búsqueda. Es decir, si tenemos interés en analizar un tema, seleccionamos las palabras clave que pueden ser representativas de ese tema y recuperamos el máximo posible (en algunos casos todo) lo relativo a esas palabras clave en los canales que nos interesan, por ejemplo, Twitter. Pero la...

Análisis de Sentimiento – Academia vs. Industria

No es secreto que el análisis de sentimiento no es santo de mi devoción, considero que es una simplificación en exceso de algo tan complejo como la reputación, especialmente cuando se trata de identidades digitales asociadas a personas u organizaciones. No hace mucho presenté en un congreso de procesamiento afectivo y me gustó mucho la ponencia de un colega que con la siguiente diapositiva ponía de manifiesto, de nuevo, la gran distancia entre academia e industria: Y es que es así de triste, en la academia se busca conseguir mejorar un poquito más los resultados en una determinada área, lo que se dice contribuir al estado de la cuestión. En la industria se debería perseguir aumentar el valor, pero no siempre es así, como por ejemplo sucede cuando se intenta...

Dualidad onda-partícula del científico de datos en la empresa

“Los retos a los que se enfrenta un científico de datos en la era del Big Data son múltiples: recuperación de información, procesamiento del lenguaje natural, aprendizaje automático, programación distribuída, bases de datos no-sql, y un largo etcétera. Cuando el científico de datos además trabaja en la empresa tiene que orientar todos los resultados de sus investigaciones hacia la consecución de los objetivos empresariales, esto es, incrementar el valor económico. Las decisiones y los plazos por lo tanto van ligados a incrementar una función económica y no sólo a empujar el estado de la cuestión. Por otro lado, la evaluación de los resultados se efectua de manera totalmente subjetiva en base a la percepción de usuarios no siempre doctos en la materia. El...