Un modelo predictivo interpretable de fake news en Twitter que busca predecir una noticia falsa, pero además identificar las variables más importantes que permiten dicha predicción, se encuentran desarrollando Eduardo Godoy y Eduardo Puraivan, estudiantes del doctorado en Ingeniería Informática Aplicada de la Universidad de Valparaíso.
Tal como explican, “el modelo desarrollado logró una precisión sobre el 99%, con 95% de confianza. Los resultados entregan valiosos antecedentes para caracterizar una noticia falsa, así como también para comprender la relevancia de las métricas lingüísticas para el modelo predictivo”.
Los investigadores comentan que el trabajo “aborda el estudio de las noticias falsas o fake news considerando que los resultados reportados corresponden a un estudio de caso, sobre noticias de Twitter con características lingüísticas y de red”.
“En la investigación realizamos análisis de sentimiento sobre el texto de la noticia para identificar la asociación entre el tipo de noticia real y falsa, y de sentimientos de polaridad y subjetividad. Posteriormente estudiamos la separabilidad lineal o no lineal según el tipo de noticia, es decir, explorando la forma de separar las noticias reales de las falsas”, explican.
Godoy y Puraivan comentan que “el estudio de las fake news es un hot topic que presenta diversos problemas abiertos y desafíos tecnológicos abordados desde diferentes disciplinas científicas, por lo que exponer nuestra investigación es un hito que nos hemos propuesto durante nuestro primer año de doctorado”.
“A la fecha ya tenemos nuevos resultados, y durante el año esperamos consolidar otros resultados parciales. De este modo, pretendemos iniciar nuestra tesis con avances sólidos. Nuestro objetivo es lograr transferir la tecnología que estamos desarrollando a la industria”, explican.
En cuanto sus próximos desafíos, los estudiantes del doctorado señalan están “desarrollando investigación orientada a estudiar la sensibilidad de los modelos que hemos desarrollado para predecir las noticias falsas. Nos interesa observar el desempeño de los modelos en distintos contextos. Esto es fundamental para pensar en transferir a la industria, lo cual es justamente nuestro desafío”.
Los investigadores expusieron parte de la investigación “Detección de noticias falsas en Twitter utilizando minería de datos basada en técnicas explicables de aprendizaje automático”, en el reciente Congreso Internacional de Reconocimiento de Patrones.