Descripción del proyecto
EL SUBPROYECTO TITULADO: NUEVO METODO DE APRENDIZAJE POR REFUERZO MULTIOBJETIVO BASADO EN MODELOS. APLICACION A CONTROL PREDICTIVO. TIENE COMO OBJETIVO PRINCIPAL GENERAR NUEVOS ALGORITMOS, METODOLOGIAS Y PROCEDIMIENTOS DE APRENDIZAJE POR REFUERZO BASADO EN MODELOS CON APLICACION AL CONTROL DE PROCESOS INDUSTRIALES. PARTIENDO DE LA METODOLOGIA CLASICA DE APRENDIZAJE POR REFUERZO DONDE SE MANEJA UNA UNICA FUNCION DE RECOMPENSA, EN EL PROYECTO SE INVESTIGARA SOBRE EL DISEÑO DE ALGORITMOS DE APRENDIZAJE POR REFUERZO CUANDO HAY QUE ATENDER SIMULTANEAMENTE A DISTINTAS RECOMPENSAS U OBJETIVOS. POR ELLO, EL PROYECTO COMIENZA CON EL DISEÑO Y DESARROLLO DE NUEVOS ALGORITMOS DE OPTIMIZACION MULTIOBJETIVO PARA LA OBTENCION DE SOLUCIONES SUBOPTIMAS (EL MANEJO DE SOLUCIONES SUBOPTIMAS ES INTERESANTE EN PROBLEMAS DE CONTROL OPTIMO CUANDO SE QUIERE CONTEMPLAR INCERTIDUMBRE EN EL MODELO). EL PUNTO DE PARTIDA SERAN LOS EDAS (ALGORITMOS DE ESTIMACION DE DISTRIBUCIONES) Y SE INVESTIGARA EL DESARROLLO DE UNA VERSION MULTIOBJETIVO CON CAPACIDAD DE GENERACION DE OPTIMOS Y SUBOPTIMOS. POR OTRO LADO, E INHERENTE A LA MINIMIZACION SIMULTANEA DE RECOMPENSAS SE TRABAJARA EN LA FASE DE TOMA DE DECISIONES SOBRE METODOLOGIAS Y PROCEDIMIENTOS PARA LA SELECCION DE SOLUCIONES AUTOMATIZADAS. ESTOS RESULTADO SE INCORPORARAN A LOS DESARROLLOS REALIZADOS EN EL SUBPROYECTO 2, DONDE SE PERFILA UNA ARQUITECTURA DE CONTROL PREDICTIVO INTELIGENTE PARA PROCESOS MULTIVARIABLES UTILIZANDO REDES NEURONALES COMO MODELOS. TANTO EL ALGORITMO MULTIOBJETIVO COMO EL DECISOR AUTOMATIZADO FORMARAN PARTE DE ESTA ARQUITECTURA COMO OPTIMIZADOR Y COMO DECISOR. EN PARALELO, Y UTILIZANDO TAMBIEN ESTOS RESULTADOS, SE DESARROLLARA LA PROPUESTA DE APRENDIZAJE POR REFUERZO MULTIOBJETIVO BASADO EN MODELOS. EL PUNTO DE PARTIDA INICIAL SERA LA TECNICA PILCO (PROBABILISTIC INFERENCE FOR LEARNING CONTROL) QUE HA SIDO APLICADA A SISTEMAS SISO ROBOTIZADOS PERO NO A PROCESOS INDUSTRIALES MULTIVARIABLES EN UN CONTEXTO DE CONTROL PREDICTIVO, NI CONTEMPLA OPTIMIZAR VARIAS RECOMPENSAS. SE ESPERA INCORPORAR EL METODO DESARROLLADO EN LA NUEVA ARQUITECTURA DE CONTROL PROPUESTA EN EL PROYECTO. POR UN LADO, COMO MECANISMO DE AUTO-TUNING PARA EL CONTROLADOR PREDICTIVO MULTIVARIABLE Y POR OTRO, COMO EL PROPIO ALGORITMO DE CONTROL. FINALMENTE SE ESPERA IMPLEMENTAR LA ARQUITECTURA DE CONTROL Y TODOS SUS COMPONENTES EN HARDWARE DE CONTROL INDUSTRIAL Y VALIDARLA FRENTE A DOS CASOS DE APLICACION: UNO RELACIONADO CON LA ENERGIA (CONTROL DE PILAS DE COMBUSTIBLE) Y OTRO CON LA INDUSTRIA METALURGICA (CONTROL DE PROCESO DE LAMINACION). ONTROL INTELIGENTE\APRENDIZAJE AUTOMATICO\CONTROL PREDICTIVO\OPTIMIZACION MULTIOBJETIVO