Descripción del proyecto
SE CONFIA EN LA VISION POR COMPUTADORA (CV) PARA LA REVOLUCION QUE EXISTE EN LA ACTUALIDAD DE LAS APLICACIONES DE INTELIGENCIA ARTIFICIAL (IA) BASADAS EN EL PROCESAMIENTO DE INFORMACION VISUAL. JUNTO CON EL CAMPO DE LA IA, CV ESTA EN AUGE ACTUALMENTE, SIENDO EL FOCO DE INICIATIVAS Y ESFUERZOS DE FINANCIACION SIN PRECEDENTES QUE APUNTAN A IMPULSARLA COMO UNA TECNOLOGIA TRANSFORMADORA. LAS PRINCIPALES RAZONES DE ESTE CRECIMIENTO EXPLOSIVO HAN SIDO EL DESARROLLO DE ESQUEMAS DE MACHINE LEARNING (PRINCIPALMENTE REDES NEURONALES CONVOLUCIONALES PROFUNDAS - CNNS) QUE ESTAN PERMITIENDO ALCANZAR TASAS DE EXITO SIMILARES A LAS HUMANAS EN PROBLEMAS QUE REQUIEREN EL ANALISIS DE INFORMACION VISUAL (P.E., DETECCION DE OBJETOS O SEGMENTACION SEMANTICA). DE HECHO, MULTITUD DE INFORMES (OCDE.ORG O LA COMISION EUROPEA) DECLARAN A LA IA COMO LA TECNOLOGIA DE PROPOSITO GENERAL (GPT) DE MAYOR IMPACTO EN LA ACTUALIDAD Y CONFIAN EN LA CV PARA LA REVOLUCION ACTUAL DE APLICACIONES BASADAS EN EL PROCESAMIENTO DE INFORMACION VISUAL.SIN EMBARGO, LA ADAPTACION DE LAS IDEAS EXISTENTES Y DE LOS MODELOS, METODOS Y PROCEDIMIENTOS DE APRENDIZAJE CANONICOS QUE LAS CODIFICAN A DOMINIOS ESPECIFICOS HAN REVELADO NUEVAS LIMITACIONES, PROBLEMAS Y DESAFIOS QUE PONEN EN PELIGRO SU PROMESA FUNDAMENTAL DE UNIVERSALIDAD Y, SI NO SE ATIENDEN, PUEDEN PONER EN RIESGO LOS DERECHOS DE LA SOCIEDAD PROTEGIDOS POR LA LEGISLACION DE LA UE.NUESTRO PRINCIPAL OBJETIVO ES REDUCIR LA ENORME DEPENDENCIA QUE TIENEN LA IA Y LOS ALGORITMOS DEEP CNN DE LA DISPONIBILIDAD DE DATOS DE ENTRENAMIENTO ANOTADOS. LOS DATOS SON LA CONDICION QUE HABILITAN LOS MODELOS DE CV EN LA ACTUALIDAD. A PESAR DE HABER RECIBIDO UNA ATENCION SUSTANCIALMENTE MENOR QUE LOS ALGORITMOS, METODOS O MODELOS, SE ESTAN HACIENDO CADA VEZ MAS ESFUERZOS PARA PROPORCIONAR REPOSITORIOS ACCESIBLES A GRAN ESCALA, POR EJEMPLO, FOMENTANDO EL ACCESO JUSTO A LOS DATOS Y EL INTERCAMBIO DE DATOS. CON RESPECTO A LA DISPONIBILIDAD DE DATOS ANOTADOS, DADO QUE LAS SOLUCIONES DE VANGUARDIA ACTUALES SE BASAN PRINCIPALMENTE EN ENFOQUES DE APRENDIZAJE SUPERVISADO, SU EXITO REQUIERE LA DISPONIBILIDAD DE GRANDES CONJUNTOS DE DATOS ANOTADOS POR HUMANOS (COMO IMAGENET) QUE DEPENDEN DE UNA GRAN CANTIDAD DE SUPERVISION EN TIEMPO Y ESFUERZO. ADEMAS, PARA ALGUNOS DOMINIOS SENSIBLES, COMO LOS ACCIDENTES DE TRAFICO, LAS ANOTACIONES Y EL CONTENIDO RARA VEZ ESTAN DISPONIBLES. ALGUNAS APLICACIONES REQUIEREN UNA ADICION CONTINUA DE DATOS O ANOTACIONES MIENTRAS SE MANTIENEN LOS PESOS DEL MODELO PREVIAMENTE ENTRENADOS, POR EJEMPLO, DEBIDO A LA INCLUSION DE TAREAS ADICIONALES O CLASES ADICIONALES PARA PREDECIR. ADEMAS, ESTOS SISTEMAS ASI ENTRENADOS GENERALMENTE SE ADAPTAN A UNA TAREA ESPECIFICA Y NO PUEDEN ADAPTARSE A OTRAS TAREAS SIN REENTRENAMIENTO. PARA HACER FRENTE A ESTOS PROBLEMAS, SE HA DEDICADO UN GRAN ESFUERZO DE INVESTIGACION A LOGRAR SISTEMAS QUE PUEDAN: MODELAR LOS PATRONES INTRINSECOS EN LOS DATOS SIN APROVECHAR (COMPLETAMENTE) EL ETIQUETADO HUMANO; ADAPTAR CONTINUAMENTE EL PROCESO DE APRENDIZAJE A LA DISPONIBILIDAD DE NUEVOS DATOS ADICIONALES; Y EXTRAPOLAR EL APRENDIZAJE DE INFORMACION UTIL UTILIZANDO CONJUNTOS DE DATOS SINTETICOS COMPLEMENTARIOS PARA LOS QUE SE PUEDE OBTENER UNA ANOTACION AUTOMATICA. EN ESTA DIRECCION, PROPONEMOS 1) EXPLORAR EL USO DE DATOS REALES EN AUSENCIA DE ANOTACIONES A TRAVES DE ENFOQUES NO SUPERVISADOS Y AUTO-SUPERVISADOS; Y 2) EXPLORAR LA CREACION Y USO DE DATOS SINTETICOS PARA COMPLEMENTAR EL PROCESO DE APRENDIZAJE. MAGE AND VIDEO PROCESSING\MODEL PROFILING\DOMAIN ADAPTATION\CURRICULUM LEARNING\SYNTHETIC DATA GENERATION\CONTINUAL LIFELONG LEARNING\NON-SUPERVISED AND SELF-SUPERVISED LEARN\DEEP LEARNING