De los datos a la inteligencia

Mucho oímos hablar y cada vez más del Big Data, como si el Big Data fuera la solución a todos nuestros problemas. El Big Data no sólo no es la solución, sino que puede ser fuente de muchos de nuestros problemas, ya que si el dicho “la información es poder” puede ponerse en duda precisamente en la era de la información, aunque aceptásemos su vigencia, con el Big Data en realidad estamos cayendo en un exceso de información tal, cuya existencia no sólo no nos otorgaría sino que nos restaría dicho poder. En este punto me gustaría aclarar el ciclo de conversión desde el dato hasta la inteligencia, cuya generación y posesión sí que es poder para todo tipo de organizaciones. Véase la siguiente figura: En ella se esquematiza lo siguiente: Los datos son el...

What can (theoretical) linguistics do for NLP research?

Esta es la pregunta con la que se abría la mesa redonda en la que tuve el placer de participar junto con investigadores de la talla del Dr. Carlos Periñán de la Universidad Politècnica de València y fundador y director de FunGramKB, el Dr. Brian Nolan director del Departamento de Informática y Creative Digital Media en el instituto de Tecnología de Blanchardstown en Dublín y la Dra. Elke Diedichsen del Instituto Tecnológico de Blanchardstown y que fue directora de proyectos de habla en Google. El anfitrión de la sesión ha sido Gianluca Pontrandolfo de la Universidad de Trieste. Aquí dejo la transcripción de mi intervención que, aunque ha generado un poco de controversia, parece que ha dado en la espinita que muchos tenemos clavada dentro. La falta de cooperación...

Mentiras, malditas mentiras y estadística!!

Mark Twain nos dejó muchas cita célebres entre las que me gusta destacar la que da título al artículo, “Hay tres clases de mentiras: las mentiras, las malditas mentiras y las estadísticas”. Y es que ya en otros traté de los efectos de las trampas estadísticas, sobre el sesgo de la muestra y de la trampa de la muestra estadística. Hoy le toca el turno a la correlación. La correlación de dos variables nos proporciona un índice de cuán lejos está de lo aleatorio la evolución lineal de ambas variables, es decir, si dos variables están muy correlacionadas (en positivo o en negativo), indicará que la variación de una de ellas se producirá en una proporción lineal semejante (o contraria) en la otra. Por poner un ejemplo sencillo, una alta correlación en el...

La trampa de la muestra estadística

Los estudios estadísticos suelen centrarse generalmente en datos muestrales, esto es, a diferencia de los datos censales que en principio incorporan al total de la población de estudio, los datos muestrales seleccionan una parte o muestra de dicha población. Los estudios realizados sobre datos abiertos obtenidos de Internet y las redes sociales, como la escucha activa, son estudios muestrales por tanto y cuanto los datos se obtienen como muestras representadas por unas claves de búsqueda. Es decir, si tenemos interés en analizar un tema, seleccionamos las palabras clave que pueden ser representativas de ese tema y recuperamos el máximo posible (en algunos casos todo) lo relativo a esas palabras clave en los canales que nos interesan, por ejemplo, Twitter. Pero la...

¿Es Internet un Cerebro? – TVE

Aparición de Autoritas en el programa Informe Semanal de TVE hablando sobre las capacidades de generación de inteligencia a partir de los medios sociales.

¿Cosmos nos da el significado?

Hace tiempo hablé de “Sentido y Sensibilidad” en la Escucha Activa, donde ponía de manifiesto lo complejo de eso que llamamos semántica. Y es que saber el significado de las conversaciones es complicado hasta el punto de necesitar saber qué significado es el que queremos conocer, a saber: Significado léxico, que corresponde al qué de la aprehensión del mundo exterior. Por ejemplo: golpe, golpear, golpeteo. Significado categorial, o cómo se aprehende el mundo exterior. Por ejemplo: dorso -> sustantivo; detrás -> adverbio; ¡atrás! -> interjección. Significado instrumental, que se corresponde con el sintáctico. Por ejemplo: genérico -> El niño es un ser delicado; específico actualizado -> El niño se durmió en su regazo. Significado...