Descripción del proyecto
HOY EN DIA LOS DOCUMENTOS WEB ESTANDAR ESTAN FORMADOS TANTO POR IMAGENES COMO TEXTO, SIN EMBARGO, AUNQUE LAS HERRAMIENTAS DE BUSQUEDA Y RECUPERACION DE TEXTO SON EFICACES PARA PROCESAR EL CONTENIDO TEXTUAL, NO ESTAN PREPARADAS PARA PROCESAR DATOS QUE MEZCLAN IMAGENES Y TEXTO, ESTE TIPO DE CONTENIDO HETEROGENEO REQUIERE EL DESARROLLO DE NUEVAS HERRAMIENTAS SOFTWARE,EL PROYECTO VISUAL SENSE TIENE COMO OBJETIVO EXPLORAR EL CONTENIDO SEMANTICO DE DATOS VISUALES PARA PERMITIR LA LECTURA AUTOMATICA DE IMAGENES, RECIENTEMENTE, HA HABIDO AVANCES SIGNIFICATIVOS EN EL CAMPO DE RECONOCIMIENTO AUTOMATICO DE CONCEPTOS VISUALES, ESTOS AVANCES, HAN PROPICIADO LA CREACION DE SISTEMAS QUE PERMITEN ANOTAR AUTOMATICAMENTE IMAGENES CON PALABRAS CLAVE, EL OBJETIVO DEL PROYECTO ES IR UN PASO MAS ALLA Y PREDECIR REPRESENTACIONES SEMANTICAS DE IMAGENES QUE PUEDAN A SU VEZ SER USADAS PARA GENERAR ANOTACIONES DE IMAGENES MAS INFORMATIVAS A NIVEL DE IMAGEN, ESTO FACILITARA TAREAS BUSQUEDA Y NAVEGACION EN GRANDES BASES DE DATOS MULTI-MODALES, EL PROYECTO PREVE LOS SIGUIENTES TRES CASOS DE ESTUDIO: ANOTACION DE IMAGENES, RE-RANQUEADO PARA BUSQUEDA DE IMAGENES, Y EXPLORACION AUTOMATICA DE ARTICULOS, EN PARTICULAR, SE CONSIDERAN LOS SIGUIENTES OBJETIVOS:1, DESARROLLO DE METODOS QUE PERMITAN PREDECIR LA REPRESENTACION SEMANTICA DE CONCEPTOS VISUALES, ESTA REPRESENTACION IRA MAS ALLA QUE LA SIMPLE DETECCION DE OBJETOS Y ESCENARIOS, Y TAMBIEN RECONOCERA UN AMPLIO RANGO DE RELACIONES ENTRE OBJETOS,2, EXTENDER EL ESTADO DEL ARTE EN TECNICAS DE LENGUAJE NATURAL, PARA TAREAS DE EXPLORACION DE GRANDES COLECCIONES DE DOCUMENTOS MULTI-MODALES, Y DE GENERACION DE DESCRIPCIONES DE IMAGENES USANDO TANTO REPRESENTACIONES SEMANTICAS DEL CONTENIDO VISUAL COMO MODELOS DE LOS TIPOS DE OBJETO/ESCENA EXTRAIDOS DE LAS REPRESENTACIONES SEMANTICAS DE DOCUMENTOS MULTI-MODALES,3, DESARROLLAR ALGORITMOS DE APRENDIZAJE QUE PUEDAN EXPLOTAR DATOS MULTI-MODALES PARA DESCUBRIR RELACIONES ENTRE TEXTO E IMAGENES, ESTOS ALGORITMOS DEBERAN APROVECHAR DATOS CON SIMPLES ANOTACIONES, Y SER ROBUSTOS A ALTOS NIVELES DE RUIDO,PARA ALCANZAR ESTOS OBJETIVOS, EL PROYECTO REQUIERE ESPECIALISTAS EN MULTIPLES DISCIPLINAS, INCLUYENDO VISION POR COMPUTADOR, APRENDIZAJE AUTOMATICO Y PROCESADO DE LENGUAJE NATURAL (NLP), ESTOS CONOCIMIENTOS SE ENCUENTRAN EN LOS CUATRO GRUPOS QUE FORMA EL CONSORCIO, UNIVERSIDAD DE SURREY (SURREY, REINO UNIDO), INSTITUT DE ROBOTICA I INFORMATICA INDUSTRIAL-CSIC (IRI-CSIC, ESPAÑA), ECOLE CENTRALE DE LYON (ECL, FRANCIA), Y UNIVERSIDAD DE SHEFFIELD (SHEFFIELD, REINO UNIDO), EN PARTICULAR, EN EL GRUPO SOLICITANTE IRI-CSIC, CONTAMOS CON EXPERTOS EN CADA UNA DE ESTAS AREAS DE CONOCIMIENTO,