Descripción del proyecto
EL PROYECTO PROPUESTO TIENE COMO OBJETIVO DESARROLLAR NUEVOS ALGORITMOS DE AI PARA EL APRENDIZAJE Y PLANIFICACION CONTINUA, ALGORITMOS QUE FORMARAN PARTE DEL MOVIMIENTO AI ACTUAL Y FUTURO EN LA SOCIEDAD, CON UN ENFOQUE ESPECIAL A LAS TAREAS QUE REQUIEREN DE SECUENCIAS DE ACCIONES PARA RESOLVER, CRUCIALMENTE, ESTOS ALGORITMOS NO ENFOCARAN EN UNA SOLA TAREA POR RESOLVER, SINO EN EXPANDER SU CONOCIMIENTO Y GENERALIZARLO A LAS TAREAS NUEVAS, EN LOS PROBLEMAS DE DECISION SECUENCIAL, EL OBJETIVO ES MAXIMIZAR LA UTILIDAD DE LARGO PLAZO EN VEZ DE LA RECOMPENSA INMEDIATA, Y CADA DECISION DEPENDE DE LAS SECUENCIAS DE DECISIONES TOMADAS PREVIAMENTE POR EL SISTEMA, ESTE ES UN PROBLEMA DIFICIL POR DIFERENTES MOTIVOS: LA UTILIDAD DE UNA ACCION A VECES NO ES EVIDENTE HASTA MUCHO MAS TARDE, UN AGENTE MUCHAS VECES CARECE DE UN MODELO DE SUS ACCIONES Y TIENE QUE ESTIMAR UN MODEL A TRAVES DE LA EXPERIENCIA, Y EL NUMERO ENORME DE ESTADOS HACE DIFICIL LA EXPLORACION EFICIENTE DEL ESPACIO DE POSIBLES ACCIONES,UN SISTEMA AI QUE IMPLEMENTA EL APRENDIZAJE Y PLANIFICACION CONTINUA REQUIERE DE DIFERENTES COMPONENTES QUE INTERACTUAN PARA ACUMULAR CONOCIMIENTO Y GENERALIZARLO CON EL FIN DE RESOLVER LAS TAREAS NUEVAS DE MANERA MAS EFICIENTE, UNOS DE ESTOS COMPONENTES ES LA PLANIFICACION GENERALIZADA, QUE CONSISTE EN DESARROLLAR LOS ESTRATEGIAS DE SOLUCION QUE SE APLICAN NO SOLAMENTE A UN PROBLEMA UNICO, SINO A TODA UNA FAMILIA DE PROBLEMAS RELACIONADOS, EN EL APRENDIZAJE Y PLANIFICACION CONTINUA, ESTA GENERALIZACION ES CRITICA PARA PODER RESOLVER NUEVAS TAREAS MAS EFICIENTEMENTE, OTRO COMPONENTE ES LA DESCOMPOSICION JERARQUICA, QUE CONSISTE EN DESCOMPONER UNA TAREA EN SUBTAREAS QUE CADA UNA ES MAS FACIL DE RESOLVER, ES PARTICULARMENTE RELEVANTE EN EL CASO DE QUE LA SOLUCION A LAS SUBTAREAS SE PUEDA REUTILIZAR PARA RESOLVER LAS TAREAS NUEVAS, UN TERCER COMPONENTE ES LA HABILIDAD DE APRENDER Y PLANIFICAR PARA MULTIPLES AGENTES A LA VEZ, YA QUE MUCHOS PROBLEMAS DE DECISION DEL MUNDO REAL INVOLUCRAN MAS QUE UN AGENTE, APRENDIZAJE POR REFUERZO\PLANIFICACION AUTOMATICA\APRENDIZAJE CONTINUO