Pasar al contenido principal

Se encuentra usted aquí

Noticias

LiMoSINe: agregación semántica para mejorar el análisis de la reputación online

11/05/2014 06:16
Read in
El Proyecto LiMoSINe es una iniciativa destinada a encontrar nuevas formas de filtrar la reputación de una marca en las redes sociales mediante agregación semántica.
0
Votar
0 Comentarios


Si cualquiera de nosotros se encontrase con un tuit con el texto "¿Yo? Si soy el fan número 1 de Vicente. ¿No se me nota? :P", primero se encontraría con una duda: ¿De qué Vicente está hablando? No tendríamos mucho problema en saberlo si identificamos el contexto (por ejemplo, en el marco de un debate sobre el estilo de juego de la Selección Española de fútbol, probablemente se trate de una referencia a Del Bosque). Con el sentido del tuit en sí habría menos dudas: el tono irónico es evidente.


Sin embargo... ¿un buscador como Google ofrecería este tuit como resultado en una búsqueda sobre Vicente del Bosque? Y una aplicación cualquiera de análisis de la reputación online... ¿identificaría como negativo este tuit? Al fin y al cabo el texto "Soy el fan número 1 de Vicente" posee para cualquier software una apariencia engañosamente positiva.


Y es que uno de los grandes problemas a la hora de analizar el contenido de Internet es su ambigüedad semántica.

Proyecto LiMoSINe
Conscientes de este problema, a finales del año 2011 se unieron cinco universidades (la Universidad de Amsterdam, la de Glasgow, la de Trento, la Universidad Nacional de Educación a Distancia y la Universidad Pompeu Fabra a través de su fundación Barcelona Media) y dos empresas (Yahoo! Barcelona Media Research Center y Llorente&Cuenca) para poner en marcha el Proyecto LiMoSINe (siglas en inglés de “Motores de agregación semántica por motivación linguística”), una iniciativa destinada a encontrar nuevas formas de filtrar la reputación de una marca en las redes sociales mediante la agregación semántica.


Concretamente, son tres los objetivos de Limosine:

  • Ser capaces de entender qué dicen los textos, a quién se está haciendo referencia y qué clase de relaciones se establecen entre las personas y las organizaciones mencionadas.
  • Encontrar y entender información implícita, lo que implica estar analizando millones de textos de manera constante: como hemos visto, en el caso de la reputación online, esta información implícita es algo que no se desprende de un solo texto y sí de un conjunto enorme de información (conversaciones, enlaces, etc.).
  • Poder utilizar toda esa información para crear nuevos sistemas de búsqueda de datos, llegando a donde los buscadores tradicionales no han conseguido llegar hasta el momento.

LiMoSINe está financiado por la Unión Europea (concretamente por el por el Séptimo Programa Marco de la Comunidad Europea) y participan en él investigadores destacados como el especialista en recuperación de información y estructuras de datos Ricardo Baeza-Yates, quien además ocupa en Yahoo! el cargo de vicepresidente de Investigación para Europa y Latinoamérica.

Iniciativa RepLab

Dentro de este proyecto se encuadra la iniciativa RepLab (promovida por la UNED, la UvA y Llorente & Cuenca) encargada específicamente de elaborar un software basado en la agregación semántica que sea capaz de procesar el lenguaje natural y, así, poder comprender así los textos de la WWW, incluyendo aquellos comentarios e información que los usuarios suben a las redes sociales. Éste es un paso fundamental para poder aplicar la minería de datos que sirva para establecer la reputación del producto / empresa / individuo.


Este año se organizará un evento RepLab 2014 como actividad de la Conferencia CLEF 2014, un congreso anual dedicado a promover el I+D+i en torno a sistemas de acceso a la información multilingüe y multimodal. En 2012 y 2013, el evento RepLab se centró en aspectos como la vigilancia de la reputación corporativa en Twitter y abordó asuntos como la desambiguación de nombres, la polaridad de la reputación y la categorización de los temas de los mensajes, y de la relevancia de los mismos. Por contra, en 2014 se centrará en categorizar los tuits en base al modelo TREC Microblog Track, así como en detectar la profesión y el grado de influencia de los autores de los mensajes.


Infografía de Limosine