Descripción del proyecto
Por qué:La generación y difusión de desinformación forma parte de un fenómeno generalizado que afecta a la compartición y difusión de contenidos en las redes sociales. Los problemas que genera este fenómeno son bien conocidos, desde la amplificación de la falta de confianza generalizada por parte de la sociedad hasta la exacerbación de los mecanismos de polarización social o estigmatización de grupos vulnerables. Esta situación ha superado el ámbito puramente profesional, tanto de los investigadores como de los profesionales del periodismo, y la amenaza de la generación y difusión de contenidos y noticias falsas es un fenómeno ya interiorizado por una gran mayoría de la sociedad. Reducir y comprender la generación y difusión de noticias falsas es esencial para desarrollar políticas y acciones bien fundamentadas para su detección y reducción de la difusión. Qué / Cómo El proyecto REMISS propone desarrollar una nueva metodología que permita otorgar una puntuación de confianza y credibilidad tanto a las cuentas de los medios sociales como a los mensajes que puedan no ser veraces. Para ello, propone la combinación de varias técnicas que, hasta ahora, se han desarrollado en silos independientes, produciendo resultados potentes en términos de detección, aunque poco interpretables. El proyecto propone una metodología basada en modelos de propagación desarrollados con técnicas de Deep Learning, entrando en profundidad en la caracterización del mensaje. Para ello, se aborda un enfoque de análisis multimodal que permite representar el mensaje como un embedding que recoge una representación del texto y de la imagen simultáneamente. La metodología se complementa con una caracterización del texto derivada de las métricas obtenidas a través de un estudio de laboratorio realizado mediante sensórica y un diseño específico de exposición a diversos mensajes a una muestra poblacional. Este análisis nos permitirá comprender las motivaciones que hay detrás de la difusión de información (y desinformación) y el tipo de características que hacen que un texto sea creíble y susceptible de ser propagado. Quién:El proyecto será desarrollado por un consorcio compuesto por seis socios cuidadosamente seleccionados para producir el equilibrio óptimo en los resultados del proyecto. El consorcio combina socios con experiencia en informática social y ciencias del comportamiento, procesamiento de lenguaje e imágenes y análisis de datos psicológicos. Además, el consorcio se completa con dos de las principales organizaciones en el ámbito del periodismo y la producción y publicación de noticias. Todas ellas tienen la investigación como eje central de sus actividades: Dos entidades expertas en la generación y publicación de noticias y contenidos. Tanto la CCMA como la Agencia EFE aportan colecciones de alta calidad de datos verificados y no verificados, así como protocolos profesionales de comprobación de hechos. ESADE tiene una amplia experiencia en ciencias sociales computacionales y en análisis del comportamiento. CVC y UVEG tienen un nivel extremo de experiencia en ambas áreas de procesamiento de imágenes, análisis de texto y técnicas de Procesamiento del Lenguaje Natural. EURECAT es un centro de investigación multidisciplinar que combina múltiples campos de experiencia. En particular, el área digital se ha centrado recientemente en la Ciencia de Datos Centrada en el Ser Humano y en la Inteligencia Artificial Cognitiva, habiendo adquirido un alto nivel de experiencia para generar métricas cognitivas que se incluyan en algoritmos de decisión automática que tengan en cuenta la situación emocional del sujeto con el que interactúan. Todavía no se ha conseguido:Las publicaciones y trabajos actuales han demostrado el potencial para detectar y reducir la difusión de noticias falsas. Sin embargo, la tecnología aún está inmadura.