La Escucha Inteligente y el Big Data: Cantidad vs. Calidad

Continuamente asociamos el término Big Data con tamaño o volumen de los datos, como si de competir por quien lo tiene más grande se tratara. Continuamente olvidamos el resto de dimensiones que hacen que el término Big Data se pueda aplicar a un conjunto de datos. Estas dimensiones vienen definidas por las 4 Vs (ó 5 Vs, dependiendo de la teoría). Estas son, además del volumen, la velociad con la que la información debe ser procesada (pensemos en un sistema de monitorización de constantes vitales), la variedad de esta información o cuan heterogénea es (qué mejor ejemplo que pensar en conversaciones en lenguaje natural), y sobre todo la más olvidada, el valor, el valor que tiene la información para el análisis que se está realizando, para los objetivos que se están...

Are you interested in knowing how people see you on Twitter?

Are you interested in knowing how people see you on Twitter? Just follow the instructions for a very short test at: http://your-personality-test.com/ Btw, if you are intrigued by this other demographic dimension of author profiling, you could be interested in participating at PAN lab @ CLEF-2015 More info soon at http://pan.webis.de/ on the author profiling task on age, gender and personality in Twitter! Best regards Paolo & Kico

Adicción a Facebook

Leyendo el artículo del MuyInteresante “¿Se puede escapar de las redes sociales?” he recordado un paper que revisé hace algún tiempo y que finalmente ha sido publicado en ECIS 2014, “Developing a Facebook Withdrawal Scale: Results of a Controlled Field Experiment“, investigación que analizaba los sítomas de una retirada de Facebook construyendo una escala similar a las utilizadas en investigaciones médicas y psicológicas. Mediante el análisis de una muestra poblacional de 26 individuos, 11 de los cuales se diagnosticaron como adictos a Facebook según la escala Bergen [1], se obtienen algunos resultados muy interesantes. Tras dejar de usar Facebook, el 100% de los adictos sufren ansiedad por utilizarlo, con síntomas de impaciencia,...

Inviolabilidad de las comunicaciones

“Se garantiza el secreto de las comunicaciones y, en especial, de las postales, telegráficas y telefónicas, salvo resolución judicial.”; “La ley limitará el uso de la informática para garantizar el honor y la intimidad personal y familiar de los ciudadanos y el pleno ejercicio de sus derechos.” Artículos 18.3 y 18.4 de la Constitución, enmarcados en el Título Primero de Derechos y Deberes Fundamentales. Ya sabíamos que Google leía nuestros correos para ofrecernos publicidad contextual, ahora sabemos que depende de lo que digamos irá a parar más allá de su algoritmo de recomendación. Recuerdo una conversación inócua que tuve por email y la publicidad contextual me sugería “abogados especializados en homicidios”. Lo que en su...

Figurative language

Looking at Dr. Sheldon Cooper one could figure out the difficulty for a machine of dealing with figurative language, even more whether we work with emotive language. This is the main aim of SemEval-2015 Task 11: Sentiment Analysis of Figurative Language in Twitter. http://alt.qcri.org/semeval2015/task11/ We have helped Dr. Paolo Rosso to collect a large Twitter dataset and Dr. Tony Veale’s team annotated tweets using CrowdFlower with 7 annotations each. The sentiment score for each is a weighted mean of annotator scores, where the weights are calculated as a function of annotator reliability (which in turn is a measure of how well an annotator does on the gold-standard tweets that are interlaced into the task). Training data for this task (8000 figurative...

De los datos a la inteligencia

Mucho oímos hablar y cada vez más del Big Data, como si el Big Data fuera la solución a todos nuestros problemas. El Big Data no sólo no es la solución, sino que puede ser fuente de muchos de nuestros problemas, ya que si el dicho “la información es poder” puede ponerse en duda precisamente en la era de la información, aunque aceptásemos su vigencia, con el Big Data en realidad estamos cayendo en un exceso de información tal, cuya existencia no sólo no nos otorgaría sino que nos restaría dicho poder. En este punto me gustaría aclarar el ciclo de conversión desde el dato hasta la inteligencia, cuya generación y posesión sí que es poder para todo tipo de organizaciones. Véase la siguiente figura: En ella se esquematiza lo siguiente: Los datos son el...