Descripción del proyecto
ESTE PROYECTO SE PLANTEA EN EL CONTEXTO DEL PROBLEMA DE LA ESCALABILIDAD FRENTE AL TAMAÑO DEL PROBLEMA, EN EL CAMPO DE LAS TECNICAS DE APRENDIZAJE RELACIONAL CON REFUERZO, EN PARTICULAR, SE CENTRA EN LA LINEA DE INVESTIGACION QUE TRATA DE HACER EFECTIVA LA TRANSFERENCIA DE POLITICAS OBTENIDAS DE UNA INSTANCIA DE UN PROBLEMA A OTRA DE LA MISMA CLASE Y MAYOR TAMAÑO, LA ESTRATEGIA QUE SE INVESTIGA PROPONE UNA TECNICA DE TRANSFERENCIA INDIRECTA E INCLUYE UN SISTEMA CLASIFICADOR CON APRENDIZAJE COMO INTERMEDIARIO, ACTUANDO POR UNA PARTE, COMO RECEPTOR DE CONOCIMIENTO EXTERNO PROVENIENTE DEL SISTEMA RELACIONAL (UNA POLITICA REPRESENTADA EN LOGICA DE PRIMER ORDEN) Y POR OTRA COMO SISTEMA DE PROPOCIONADOR DE GUIADO SOBRE UN PROCESO DE APRENDIZAJE RELACIONAL CON REFUERZO, QUE ESTA ABORDANDO LA RESOLUCION DE UNA INSTANCIA DEL MISMO PROBLEMA PERO DE MAYOR TAMAÑO,LOS OBJETIVOS PROPUESTOS EN ESTE PROYECTO SON CUATRO, SE PROPONE EN PRIMER LUGAR, ATENDER UNA DEMANDA EXPRESADA POR INVESTIGADORES DEL AREA EN EL SENTIDO DE REALIZAR UN ESTUDIO SISTEMATICO DE LAS PROPIEDADES DEL APRENDIZAJE RELACIONAL CON REFUERZO EN FUNCION DE LAS CARACTERISTICAS DEL PROCESO DE DECISION MARKOVIANO SUBYACENTE, ESTE TRABAJO SERVIRA TAMBIEN PARA OBTENER UN MARCO EXPERIMENTAL SOBRE EL QUE DESARROLLAR EL RESTO DE LA INVESTIGACION,EL SEGUNDO OBJETIVO ABORDA LA IDEA DE LA OBTENCION DIRECTA DE LA POLITICA A PARTIR DE LA ESTIMACION REALIZADA CON UN SISTEMA CLASIFICADOR BASADO EN UNA REPRESENTACION PROPOSICIONAL Y SU ABSTRACCION A PARTIR DE CONOCIMIENTO PREVIO SOBRE EL PROBLEMA, ESTE OBJETIVO PRETENDE ENCONTRAR DE ESTA MANERA UN MEDIO DE OBTENER POLITICAS EN UNA REPRESENTACION RELACIONAL, CON MENOR COSTE COMPUTACIONAL, DE ESTA MANERA SE EVITARIA EL CALCULO DE FUNCIONES VALOR EN UNA REPRESENTACION CON ELEVADO NIVEL DE ABSTRACCION, QUE INCLUSO EN PROBLEMAS ACADEMICOS TIENE UN TAMAÑO CONSIDERABLE, EL TERCER OBJETIVO PLANTEA EL GUIADO DEL APRENDIZAJE CON REFUERZO EN EL SISTEMA RELACIONAL MEDIANTE LAS POLITICAS SUBOPTIMAS OBTENIDAS DE UN SISTEMA CLASIFICADOR, FINALMENTE EL CUARTO OBJETIVO SE REFIERE A LA UTILIZACION DE UNA POLITICA EXPRESADA EN LOGICA DE PRIMER ORDEN COMO BASE PARA INCORPORAR EN EL SISTEMA CLASIFICADOR UN MECANISMO DE BUSQUEDA LOCAL QUE HAGA MAS EFICIENTE SU FUNCIONAMIENTO AL AUMENTAR EL TAMAÑO DEL PROBLEMA, LOS OBJETIVOS TERCERO Y CUARTO COMPONEN EL PROCESO DE TRANSFERENCIA INDIRECTA DE POLITICA ENTRE SISTEMAS QUE DESARROLLAN APRENDIZAJE RELACIONAL CON REFUERZO, aprendizaje relacional con refuerzo\sistema clasificador con aprendizaje\transferencia indirecta de políticas\escalabilidad