NUEVO METODO DE APRENDIZAJE POR REFUERZO MULTIOBJETIVO BASADO EN MODELOS. APLICA...
NUEVO METODO DE APRENDIZAJE POR REFUERZO MULTIOBJETIVO BASADO EN MODELOS. APLICACION A CONTROL PREDICTIVO.
EL SUBPROYECTO TITULADO: NUEVO METODO DE APRENDIZAJE POR REFUERZO MULTIOBJETIVO BASADO EN MODELOS. APLICACION A CONTROL PREDICTIVO. TIENE COMO OBJETIVO PRINCIPAL GENERAR NUEVOS ALGORITMOS, METODOLOGIAS Y PROCEDIMIENTOS DE APREND...
ver más
Fecha límite participación
Sin fecha límite de participación.
Financiación
concedida
El organismo AGENCIA ESTATAL DE INVESTIGACIÓN notifico la concesión del proyecto
el día 2020-01-01
No tenemos la información de la convocatoria
0%
100%
Información adicional privada
No hay información privada compartida para este proyecto. Habla con el coordinador.
¿Tienes un proyecto y buscas un partner? Gracias a nuestro motor inteligente podemos recomendarte los mejores socios y ponerte en contacto con ellos. Te lo explicamos en este video
Proyectos interesantes
CoDeFeL
Control for Deep and Federated Learning
2M€
Cerrado
TIN2008-06242
TRANFERENCIA INDIRECTA DE POLITICAS EN APRENDIZAJE RELACIONA...
24K€
Cerrado
FJC2020-044003-I
Machine learning for the optimization of controller systems
Cerrado
Fecha límite de participación
Sin fecha límite de participación.
Descripción del proyecto
EL SUBPROYECTO TITULADO: NUEVO METODO DE APRENDIZAJE POR REFUERZO MULTIOBJETIVO BASADO EN MODELOS. APLICACION A CONTROL PREDICTIVO. TIENE COMO OBJETIVO PRINCIPAL GENERAR NUEVOS ALGORITMOS, METODOLOGIAS Y PROCEDIMIENTOS DE APRENDIZAJE POR REFUERZO BASADO EN MODELOS CON APLICACION AL CONTROL DE PROCESOS INDUSTRIALES. PARTIENDO DE LA METODOLOGIA CLASICA DE APRENDIZAJE POR REFUERZO DONDE SE MANEJA UNA UNICA FUNCION DE RECOMPENSA, EN EL PROYECTO SE INVESTIGARA SOBRE EL DISEÑO DE ALGORITMOS DE APRENDIZAJE POR REFUERZO CUANDO HAY QUE ATENDER SIMULTANEAMENTE A DISTINTAS RECOMPENSAS U OBJETIVOS. POR ELLO, EL PROYECTO COMIENZA CON EL DISEÑO Y DESARROLLO DE NUEVOS ALGORITMOS DE OPTIMIZACION MULTIOBJETIVO PARA LA OBTENCION DE SOLUCIONES SUBOPTIMAS (EL MANEJO DE SOLUCIONES SUBOPTIMAS ES INTERESANTE EN PROBLEMAS DE CONTROL OPTIMO CUANDO SE QUIERE CONTEMPLAR INCERTIDUMBRE EN EL MODELO). EL PUNTO DE PARTIDA SERAN LOS EDAS (ALGORITMOS DE ESTIMACION DE DISTRIBUCIONES) Y SE INVESTIGARA EL DESARROLLO DE UNA VERSION MULTIOBJETIVO CON CAPACIDAD DE GENERACION DE OPTIMOS Y SUBOPTIMOS. POR OTRO LADO, E INHERENTE A LA MINIMIZACION SIMULTANEA DE RECOMPENSAS SE TRABAJARA EN LA FASE DE TOMA DE DECISIONES SOBRE METODOLOGIAS Y PROCEDIMIENTOS PARA LA SELECCION DE SOLUCIONES AUTOMATIZADAS. ESTOS RESULTADO SE INCORPORARAN A LOS DESARROLLOS REALIZADOS EN EL SUBPROYECTO 2, DONDE SE PERFILA UNA ARQUITECTURA DE CONTROL PREDICTIVO INTELIGENTE PARA PROCESOS MULTIVARIABLES UTILIZANDO REDES NEURONALES COMO MODELOS. TANTO EL ALGORITMO MULTIOBJETIVO COMO EL DECISOR AUTOMATIZADO FORMARAN PARTE DE ESTA ARQUITECTURA COMO OPTIMIZADOR Y COMO DECISOR. EN PARALELO, Y UTILIZANDO TAMBIEN ESTOS RESULTADOS, SE DESARROLLARA LA PROPUESTA DE APRENDIZAJE POR REFUERZO MULTIOBJETIVO BASADO EN MODELOS. EL PUNTO DE PARTIDA INICIAL SERA LA TECNICA PILCO (PROBABILISTIC INFERENCE FOR LEARNING CONTROL) QUE HA SIDO APLICADA A SISTEMAS SISO ROBOTIZADOS PERO NO A PROCESOS INDUSTRIALES MULTIVARIABLES EN UN CONTEXTO DE CONTROL PREDICTIVO, NI CONTEMPLA OPTIMIZAR VARIAS RECOMPENSAS. SE ESPERA INCORPORAR EL METODO DESARROLLADO EN LA NUEVA ARQUITECTURA DE CONTROL PROPUESTA EN EL PROYECTO. POR UN LADO, COMO MECANISMO DE AUTO-TUNING PARA EL CONTROLADOR PREDICTIVO MULTIVARIABLE Y POR OTRO, COMO EL PROPIO ALGORITMO DE CONTROL. FINALMENTE SE ESPERA IMPLEMENTAR LA ARQUITECTURA DE CONTROL Y TODOS SUS COMPONENTES EN HARDWARE DE CONTROL INDUSTRIAL Y VALIDARLA FRENTE A DOS CASOS DE APLICACION: UNO RELACIONADO CON LA ENERGIA (CONTROL DE PILAS DE COMBUSTIBLE) Y OTRO CON LA INDUSTRIA METALURGICA (CONTROL DE PROCESO DE LAMINACION). ONTROL INTELIGENTE\APRENDIZAJE AUTOMATICO\CONTROL PREDICTIVO\OPTIMIZACION MULTIOBJETIVO