Descripción del proyecto
EL OBJETIVO DE ESTE PROYECTO ES AVANZAR EN EL RETO AL QUE LA COMPUTACION EN LA EXAESCALA SE ENFRENTA: MEJORAR LAS CAPACIDADES DE TOLERANCIA A FALLOS Y LA PLANIFICACION DE TAREAS EN LOS FUTUROS SUPERCOMPUTADORES,AMBAS CUESTIONES ESTAN ESTRECHAMENTE RELACIONADAS Y EN ESTE PROYECTO SE PROPONE UNA PARTE FUNDAMENTAL DE SU SOLUCION: LA CREACION DE UN MECANISMO DE PUNTOS DE CONTROL/REINICIO CAPAZ DE MIGRAR LAS TAREAS INDIVIDUALES QUE COMPONEN LOS TRABAJOS PARALELOS DENTRO DE UNA INFRAESTRUCTURA DISTRIBUIDA, SU INTEGRACION EN LOS ULTIMOS GESTORES DE RECURSOS Y SU AMPLIACION PARA UNA MEJOR CAPACIDAD DE TOLERANCIA A FALLOS Y UNA PLANIFICACION EFICIENTE DE TAREAS,EN INFRAESTRUCTURAS MASIVAMENTE PARALELAS UN SOLO FALLO EN UNA EJECUCION EN PARALELO MULTITAREA PUEDE CONDUCIR A UN USO INEFICIENTE DE MILES DE RECURSOS, POR LO QUE ES IMPRESCINDIBLE DISPONER DE UN MECANISMO DE PUNTOS DE CONTROL EFICIENTE Y ROBUSTO,CONSEGUIRLO SIN EMBARGO ESTA LEJOS DE SER TRIVIAL DEBIDO A PROBLEMAS EN MATERIA DE ESCALABILIDAD, OVERHEAD Y FLEXIBILIDAD, LOS CUALES AUN CARECEN DE UNA SOLUCION ADECUADA, LOGRAR ESTE OBJETIVO ES, PROBABLEMENTE, UNO DE LOS PRINCIPALES RETOS HOY EN DIA EN HPC,NO SOLO ESO, TENER UN MECANISMO DE PUNTOS DE CONTROL NO INTRUSIVO Y FLEXIBLE ABRE UN NUEVO CONJUNTO DE POSIBILIDADES,UNA EVOLUCION NATURAL ES AMPLIARLO TAMBIEN A LA MIGRACION DE LAS TAREAS QUE SE ESTEN EJECUTANDO A RECURSOS MAS ADECUADOS DE COMPUTACION EN TERMINOS DE RENDIMIENTO O LOCALIDAD,CON UN CRECIENTE NUMERO DE SLOTS EN LAS INFRAESTRUCTURAS Y APLICACIONES CON PERFILES MUY DIFERENTES DE EJECUCION, LOS ALGORITMOS DE PLANIFICACION DE TAREAS TENDRAN UNA IMPORTANCIA AUN MAYOR,POR ESTA RAZON, SER CAPAZ DE MIGRAR TAREAS ENTRE LOS DIFERENTES RECURSOS COMPUTACIONALES REPRESENTA UN IMPORTANTE DESAFIO,EN ESTE PROYECTO, SE DISEÑARAN ALGORITMOS DE PLANIFICACION DINAMICA DE TAREAS LIGERAS Y ESCALABLES PARA HPC QUE PERMITAN MIGRAR TAREAS DURANTE LA EJECUCION ADAPTANDOSE A LAS EXIGENCIAS Y AL ESTADO DE LA INFRAESTRUCTURA,ESTO REDUNDARA EN UN USO MAS EFICIENTE DE LOS RECURSOS DISPONIBLES, CONSIGUIENDO UNA MAYOR EFICIENCIA COMPUTACIONAL Y UN MENOR CONSUMO DE ENERGIA,PARA LOGRAR ESTOS OBJETIVOS, SE DARAN VARIOS PASOS: PRIMERO, DISEÑAR E IMPLEMENTAR UNA TECNICA DE PUNTOS DE CONTROL EFICAZ QUE SUPERE LAS LIMITACIONES ACTUALES; SEGUNDO, CREAR LOS MECANISMOS PARA LA MIGRACION TRANSPARENTE DE LAS TAREAS QUE COMPONGAN LAS APLICACIONES PARALELAS DENTRO DE UN CLUSTER HPC; Y TERCERO, DEFINIR E IMPLEMENTAR UNA INTERFAZ HOMOGENEA PARA MIGRAR TAREAS SECUENCIALES Y PARALELAS, ESTA INTERFAZ UTILIZARA ALGORITMOS DE PLANIFICACION PARA MAXIMIZAR LA EFICIENCIA, AUMENTAR LA ESTABILIDAD Y OPTIMIZAR EL CONSUMO DE ENERGIA DE LA INFRAESTRUCTURA A TRAVES DE UNA ADAPTACION RACIONAL DE LAS TAREAS QUE SE ESTAN EJECUTANDO Y QUE ESTEN EN COLA,TODOS ESTOS OBJETIVOS SE ALCANZARAN MEDIANTE LA MEJORA DE HERRAMIENTAS Y MECANISMOS ESTANDARES AMPLIAMENTE UTILIZADOS EN LOS ACTUALES SUPERCOMPUTADORES DEL TOP500,POR ELLO, LAS SOLUCIONES PROPUESTAS EN ESTE PROYECTO SERAN FACILMENTE ADOPTABLES POR MUCHOS CENTROS HPC, LOGRANDO ASI UN IMPACTO CIENTIFICO Y TECNOLOGICO, LOS RESULTADOS SERAN EVALUADOS POR UN EQUIPO INTERNACIONAL EN MODERNOS SUPERCOMPUTADORES HIBRIDOS COMPUESTOS POR CPU Y ACELERADORES XEON PHI EJECUTANDO EXIGENTES APLICACIONES CIENTIFICAS,GRACIAS A ELLO, SE LOGRARA IGUALMENTE UNA TRANSFERENCIA DE CONOCIMIENTO MULTIDISCIPLINAR A NIVEL MUNDIAL A LOS ADMINISTRADORES Y USUARIOS PREVENIENTES DE DIFERENTES AMBITOS, EXAESCALA\ HPC\ TOLERANCIA A FALLOS\ PUNTOS DINÁMICOS DE CHEQUEO\ PLANIFICACIÓN DINÁMICA\ MIGRATION DINÁMICA DE TAREAS\ APLICACIONES DEMANDANTES DE CÁLCULO