Descripción del proyecto
LAS TAREAS DE PREDICCION MAS COMUNES DEL APRENDIZAJE AUTOMATICO SUPERVISADO SON LA CLASIFICACION Y LA REGRESION, EN AMBOS CASOS EL VALOR A PREDECIR, SEA ESTE DISCRETO O CONTINUO, ES UNICO, ES DECIR, DADOS LOS VALORES DE UNOS ATRIBUTOS DE UN OBJETO O INSTANCIA, QUE SE TOMAN COMO ENTRADA, EL PROBLEMA A RESOLVER ES COMO ASIGNAR A ESTE UNA CLASE O UN VALOR NUMERICO, SIN EMBARGO, CON FRECUENCIA, LA RESTRICCION DE UNA ETIQUETA POR INSTANCIA ES CLARAMENTE INSUFICIENTE, POR EJEMPLO, UN ARTICULO CIENTIFICO PODRIA SER TANTO DE «MINERIA DE DATOS» COMO DE «SOLUCION DE PROBLEMAS INDUSTRIALES»; EL MAL FUNCIONAMIENTO DE UNA FRESADORA PODRIA CARACTERIZARSE POR APARECER AL MISMO TIEMPO «ALTOS NIVELES DE VIBRACION» Y «UNA BAJA EFICIENCIA ENERGETICA»; EN UN DIAGNOSTICO DE CALIDAD DEL SOFTWARE, UN DISEÑO POBRE LO PUEDE SER POR LA PRESENCIA SIMULTANEA DE DIVERSAS PATOLOGIAS: «UNA CLASE HACE UN USO EXCESIVO DE METODOS DE OTRA», «EXISTE CODIGO DUPLICADO O SIMILAR EN DISTINTAS PARTES», «EXISTEN METODOS CON UNA LISTA DE ARGUMENTOS DEMASIADO GRANDE», EN TODOS ESTOS CASOS, LOS OBJETOS PUEDEN TENER ASOCIADOS DISTINTAS ETIQUETAS Y BIEN LA CLASIFICACION MULTIETIQUETA O LA REGRESION MULTIVALOR SER ENFOQUES MAS ADECUADOS,EN NUESTRO GRUPO DE INVESTIGACION TENEMOS UNA AMPLIA EXPERIENCIA EN EL DISEÑO DE NUEVOS ALGORITMOS PARA LA CONSTRUCCION DE MULTICLASIFICADORES, LOS MULTICLASIFICADORES, O ENSEMBLES, SON METODOS QUE CONSIGUEN MEJORAR NOTABLEMENTE EL DESEMPEÑO DE UN UNICO CLASIFICADOR INDIVIDUAL MEDIANTE LA COMBINACION DE VARIOS DE ELLOS, NUESTRO GRUPO HA CONTRIBUIDO AL AUMENTO DE METODOS DISPONIBLES DE APRENDIZAJE AUTOMATICO CON VARIOS ALGORITMOS DE CONSTRUCCION DE ENSEMBLES: ROTATION FOREST, DISTURBING NEIGHBOURS, RANDOM ORACLES AND RANDOM FEATURE WEIGHTS, ESTOS NUEVOS ALGORITMOS HAN DEMOSTRADO QUE OFRECEN UN DESEMPEÑO MEJOR QUE OTROS ALGORITMOS CLASICOS EN EL AREA, EN EL CASO DEL ROTATION FOREST, ESTE SE HA CONVERTIDO EN UN METODO DE REFERENCIA CON EL QUE INTENTAN COMPARARSE LAS NUEVAS PROPUESTAS DE ALGORITMOS, Y ALGUNOS LIBROS DE MINERIA DE DATOS YA LO INCLUYEN TAMBIEN COMO UN METODO CLASICO,TAMBIEN TENEMOS EXPERIENCIA EN EL DISEÑO DE ALGORITMOS DE ENSEMBLES PARA PROBLEMAS DESEQUILIBRADOS (UNA CLASE TIENE MUCHAS MAS INSTANCIAS QUE LAS RESTANTES) Y DE SELECCION DE INSTANCIAS (TECNICA DE PREPROCESAMIENTO QUE PERMITE REDUCIR EL TAMAÑO DE UN CONJUNTO DE DATOS),EN UN PROYECTO PREVIO HEMOS TENIDO EXITO EN LA ADAPTACION A PROBLEMAS DE REGRESION DE ALGUNOS DE ESTOS METODOS, INICIALMENTE PENSADOS PARA CLASIFICACION, EL OBJETIVO PRINCIPAL DEL PRESENTE PROYECTO SERIA INVESTIGAR EN COMO PODRIAMOS ADAPTAR ESTOS METODOS A LA RESOLUCION DE PROBLEMAS MULTIETIQUETA Y MULTIVALOR,COMO SEGUNDO OBJETIVO BUSCAMOS LA APLICACION DE ESTOS NUEVOS ALGORITMOS A LA SOLUCION DE PROBLEMAS INDUSTRIALES, EN LA LINEA DE NUESTRAS INVESTIGACIONES PREVIAS, PERO TAMBIEN DE PROBLEMAS DE INGENIERIA DE SOFTWARE, LO QUE NOS DA LA OPORTUNIDAD DE INCORPORAR AL GRUPO NUEVOS INVESTIGADORES QUE SE ESPECIALIZARAN EN ESTE TIPO DE PROBLEMAS, EN EL ESPIRITU DE ESTA CONVOCATORIA, QUE BUSCA EVITAR LA FRAGMENTACION Y AGLUTINAR INVESTIGADORES EN TORNO A OBJETIVOS COMUNES,DOS OBJETIVOS ADICIONALES SON, POR UN LADO, BUSCANDO UN MAYOR IMPACTO E INTERNACIONALIZACION, OFRECER EL ACCESO A LOS METODOS DESARROLLADOS A TRAVES DE SERVICIOS WEB (MACHINE LEARNING AS A SERVICE, MLAAS); POR OTRO, INVESTIGAR LA POSIBILIDAD DE ADAPTARLOS A LOS MODELOS DE COMPUTO QUE PERMITIRIAN SU UTILIZACION EN LAS PLATAFORMAS DE BIG DATA, APRENDIZAJE AUTOMÁTICO\ENSEMBLE LEARNING\PROBLEMAS MUTIETIQUETA\INGENIERÍA DEL SOFTWARE\MACHINE LEARNING AS A SERVICE\BIG DATA