Descripción del proyecto
LA NECESSIDADEL TEXTO ES UBICUO EN AMBIENTES CREADOS POR EL HOMBRE, Y LA MAYORIA DE LAS ACTIVIDADES DIARIAS IMPLICAN LA LECTURA DE INFORMACION ESCRITA, DOTAR A LAS MAQUINAS DE LA CAPACIDAD DE LEER ES UNO DE LOS RETOS DE MAYOR TRADICION EN EL CAMPO DE VISION POR COMPUTADOR, LA AUTOMATIZACION DE LA COMPRENSION DEL TEXTO EN ESCENAS COMPORTA UN ENORME VALOR SOCIAL Y TECNOLOGICO, YA QUE PERMITIRIA UNA GAMA DE APLICACIONES, TALES COMO TRADUCCION BAJO DEMANDA, MARKETING PERSONALIZADO O ASISTENCIA A PERSONAS CIEGAS,EL PROBLEMAPARA UNA EXTRACCION DE TEXTO UTIL, SE DEBE ENFOCAR ESCENARIOS DONDE EL TEXTO APARECE EN UBICACIONES ARBITRARIAS Y NO ES EL FOCO PRINCIPAL DE LA CAPTURA, ABORDAR ESTE ESCENARIO DIFICIL SE ESTA IMPONIENDO Y ATAÑE A DOS TENDENCIAS EMERGENTES: ESCENARIOS DE BIG DATA, COMO PODRIA SER LA INDEXACION DE TODO EL TEXTO DE EN LAS IMAGENES DE GOOGLE STREETVIEW, Y DISPOSITIVOS PORTATILES QUE DEBEN DAR RESPUESTAS PERTINENTES, POCO FRECUENTES, Y PERSONALIZADAS AL USUARIO, CURIOSAMENTE, EL ANALISIS DE FLUJOS DE IMAGENES A GRAN ESCALA PROVENIENTES DE DISPOSITIVOS DE REGISTROS DE VIDA COMO LAS GOOGLE GLASS YACE EN EL PUNTO DE ENCUENTRO DE ESTAS TENDENCIAS,OBSERVACIONESLOS SISTEMAS DE LECTURA PARA TALES ESCENARIOS REQUIEREN UNA COMPRENSION ADECUADA TANTO DE LA ESCENA COMO DEL CONTEXTO DEL USUARIO, PARECE QUE UN ENFOQUE HOLISTICO PARA LA COMPRENSION DEL TEXTO, INTENTANDO INTERPRETAR LA ESCENA EN SU CONJUNTO EN LUGAR DEL TEXTO EN SI MISMO, SERIA BENEFICO PARA ASEGURAR RESPUESTAS RELEVANTES Y PERSONALIZADAS,EL TEXTO EN ESCENAS, SE LIMITA NORMALMENTE A UNAS POCAS PALABRAS, LO QUE LIMITA EL USO DE MODELOS DE LENGUAJE,POR OTRO LADO, LAS IMAGENES DE ESCENAS CONTIENEN INFORMACION NO TEXTUAL, QUE PODRIA PROPORCIONAR EL CONTEXTO FALTANTE PARA MEJORAR TANTO LA DETECCION COMO EL RECONOCIMIENTO DE TEXTO, DEL MISMO MODO, INTERPRETAR EL COMPORTAMIENTO DEL USUARIO Y SU INTENCION BASANDOSE EN INFORMACION VISUAL PUEDE PROPORCIONAR EL CONTEXTO DE USUARIO QUE GARANTICE UNA RESPUESTA PERSONALIZADA Y RELEVANTE, ESTE TIPO DE "CONTEXTO VISUAL" AUN NO SE HA EXPLOTADO DE MANERA SIGNIFICATIVA EN LAS METODOLOGIAS DE LECTURA ROBUSTA,HIPOTESIS DE INVESTIGACIONSE POSTULA QUE EL CONTEXTO DEBE APOYAR LA DETECCION Y EL RECONOCIMIENTO ROBUSTO DEL TEXTO, MODELANDOLO SOBRE DISTINTOS ESPACIOS CONTEXTUALES QUE INCLUYAN PISTAS TEXTUALES, SEÑALES VISUALES Y LA INTERPRETACION DEL COMPORTAMIENTO DEL USUARIO,NUESTRA HIPOTESIS ES QUE LA INTERFAZ ENTRE ESTOS DIFERENTES ESPACIOS CONTEXTUALES SE FORMULA MEJOR USANDO UN UNICO MODELO DE INFERENCIA EN EL QUE ESTOS ELEMENTOS SEPARADOS SIRVAN COMO CONTEXTO MUTUO EL UNO DEL OTRO, PARA PROBAR ESTA HIPOTESIS SE DESARROLLARA UN MODELO DE VISION COMPUTACIONAL QUE INTEGRE CUATRO COMPONENTES: CLASIFICACION DE ESCENAS, RECONOCIMIENTO DE OBJETOS, EXTRACCION DE TEXTO Y ANALISIS DE LA MIRADA, CADA UNO DE ELLOS, SE DIRIGE A DIFERENTES NIVELES SEMANTICOS DE COMPRENSION, TANTO DE LA ESCENA COMO DEL USUARIO, SU INTEGRACION EN UN UNICO MODELO DE INFERENCIA DEBE PRODUCIR UN AVANCE SIGNIFICATIVO EN EL ESTADO DEL ARTE EN SISTEMAS DE LECTURA ROBUSTA,VAMOS A DESARROLLAR ESTE PROYECTO MANO A MANO CON LOS USUARIOS FINALES, Y EVALUAR LOS RESULTADOS EN CONTEXTOS DE APLICACION REALES, PARA LOGRAR ESTO, VAMOS A HACER USO DE UNA INFRAESTRUCTURA DE LABORATORIO VIVO DEL CENTRO DE VISION POR COMPUTADOR, Y APROVECHAR NUESTRA CONTINUA COLABORACION CON EL MUNICIPIO DE ST, CUGAT DEL VALLES PARA DEFINIR ESCENARIOS DE APLICAICON REALISTAS, RECONOCIMIENTO DE TEXTO\COMPRENSIÓN DE TEXTO\COMPRENSIÓN DE ESCENAS\LECTURA ROBUSTA\CONTEXTO\VISIÓN POR COMPUTADOR\RECONOCIMIENTO DE PATRONES\APRENDIZAJE AUTOMÁTICO