Descripción del proyecto
EL SUBPROYECTO CONSENSO TIENE COMO OBJETIVO EL ANALISIS DE CONTENIDO DE LAS COMUNICACIONES DIGITALES, DONDE SE PRODUCE LA INTERACCION SOCIAL, PROPONIENDO SISTEMAS DE INFERENCIA FIABLES Y JUSTOS MEDIANTE MODELOS LINGUISTICOS. HOY EN DIA, LOS MODELOS PREENTRENADOS SE COMPARTEN ABIERTAMENTE, CON UN NUMERO CRECIENTE DE REPOSITORIOS Y VARIANTES. EL PARADIGMA IMPULSADO POR LOS DATOS ES PROLIFICO EN LA GENERACION DE UN CONJUNTO DE MODELOS LINGUISTICOS PARA DIFERENTES TAREAS EN EL PROCESAMIENTO DEL LENGUAJE NATURAL (PLN). CON UN ENFOQUE AMBICIOSO, ESTOS MODELOS SERAN COMPILADOS, COMBINADOS, EVALUADOS Y ADAPTADOS, PRESTANDO ESPECIAL ATENCION A LOS MODELOS PARA EL ESPAÑOL. DADO QUE ESTOS MODELOS PUEDEN DIFERIR EN LA FORMA DE PREPARAR LOS DATOS DE ENTRADA Y DE GENERAR PREDICCIONES (CLASIFICACION DE TOKENS Y ORACIONES, INFERENCIA CAUSAL, SECUENCIA A SECUENCIA...), PUEDE SER NECESARIO DISEÑAR ARQUITECTURAS NOVEDOSAS Y VALIDARLAS EMPIRICAMENTE. LA FORMA DE INTEGRAR LOS DATOS HETEROGENEOS SIGUE SIENDO UN RETO IMPORTANTE EN LA COMBINACION DE LOS ENFOQUES DE APRENDIZAJE PROFUNDO CON OTROS MODELOS DE APRENDIZAJE AUTOMATICO.EN CUANTO A LA INFERENCIA/CLASIFICACION, EL ANALISIS DEL CONTENIDO SE REALIZA A DIFERENTES NIVELES: COMPORTAMIENTO E INTENCION DEL EMISOR, VALORACION DEL RECEPTOR, ESTRUCTURA DE LA COMUNIDAD, CONTEXTOS CULTURALES Y TEMPORALES Y, POR SUPUESTO, SEMANTICA DEL MENSAJE. TODOS ESTOS ELEMENTOS CONTRIBUYEN AL EFECTO FINAL QUE EL CONTENIDO PRODUCE EN LAS INTERACCIONES SOCIALES: DESINFORMACION, OFENSIVIDAD, APOYO, ESTIMULO, CREDIBILIDAD, REPRODUCIBILIDAD, ACEPTACION, REPUDIO, ETC. LA CANTIDAD DE ASPECTOS ES GRANDE, POR LO QUE LA CAPACIDAD DE UN SISTEMA PARA FUSIONAR Y COMBINAR METODOS SIMILARES Y ORTOGONALES CONTRIBUIRA A UNA SOLUCION MAS ROBUSTA Y EFICAZ PARA CARACTERIZAR LA RELEVANCIA DEL CONTENIDO. SIN EMBARGO, DEBIDO A LA SENSIBILIDAD RECONOCIDA EN LA COMUNICACION HUMANA, LOS SISTEMAS DE INFERENCIA AUTOMATICA DEBEN ESTAR RESPALDADOS POR MECANISMOS SOLIDOS PARA COMPROBAR SU VALIDEZ Y PARA COMPRENDER LAS RAZONES QUE HAY DETRAS DE CADA DECISION TOMADA DURANTE EL PROCESO DE INFERENCIA. LA EXPLICABILIDAD ES UNA CUESTION IMPORTANTE QUE ABORDAREMOS EN EL SUBPROYECTO. EL PLN DEBE BUSCAR METODOS Y TECNICAS QUE PUEDAN GENERAR UNA IA FIABLE. ESTO TIENE QUE VER NO SOLO CON LA TRANSPARENCIA EN LA FORMA DE COMPUTAR, SINO TAMBIEN CON MODELOS EN LOS QUE PODAMOS CONFIAR, LEJOS DE SESGOS COMO LOS QUE SE ENCUENTRAN EN LOS DATOS CON LOS QUE SE GENERAN, ESTEREOTIPOS EN CUANTO A GENERO, ETNIA, RELIGION Y MUCHAS OTRAS FORMAS DE DISCRIMINACION GRUPAL. PARA ELLO, DEBEMOS APORTAR SOLUCIONES PARA LA DETECCION DE UN POSIBLE SESGO, UNA FORMA DE EVALUAR HASTA QUE PUNTO ESTA PRESENTE EN UN MODELO Y ESTRATEGIAS PARA MITIGARLO.PARA DESARROLLAR EL PROYECTO, EL EQUIPO UJA TIENE EXPERIENCIA EN LA DETECCION DE DISCURSO DE ODIO, PRESTANDO ATENCION A LA INTEGRACION DE VARIAS CARACTERISTICAS EXTRAIDAS DE LA INFORMACION TEXTUAL COMO LAS EMOCIONES, LA OFENSIVIDAD, LA CONSTRUCTIVIDAD
OTRO DE LOS PUNTOS FUERTES DEL EQUIPO ES EL TRATAMIENTO DE INFORMACION BIOMEDICA, CON ESPECIAL INTERES EN EL AMBITO RADIOLOGICO. ADEMAS ABORDAN RETOS DEL PLN COMO EL TRATAMIENTO DE LA NEGACION O LA MULTIMODALIDAD. EN RESUMEN, EL SUBPROYECTO TRABAJARA EN LA PRODUCCION DE MODELOS PARA TAREAS DE INFERENCIA RELACIONADAS CON EL LENGUAJE, ASEGURANDO QUE ESTOS MODELOS SEAN CAPACES DE INTEGRAR UN RICO CONJUNTO DE CARACTERISTICAS Y, AL MISMO TIEMPO, DENTRO DE LAS RESTRICCIONES DE RESPONSABILIDAD Y EQUID ROCESAMIENTO DEL LENGUAJE NATURAL\APRENDIZAJE AUTOMATICO\MODELADO DEL LENGUAJE\TECNOLOGIAS DEL LENGUAJE HUMANO\ANALISIS DE SENTIMIENTOS Y EMOCIONES\PLN