Descripción del proyecto
EL BIG DATA HA TRAIDO UN AUMENTO SIN PRECEDENTES EN EL VOLUMEN DE DATOS, DONDE LA INTELIGENCIA ARTIFICIAL (IA) Y EL APRENDIZAJE AUTOMATICO (AA) HAN ADOPTADO UN PAPEL CRUCIAL PARA DESCUBRIR DE MANERA EFICIENTE NUEVA INFORMACION Y CONOCIMIENTO. SIN EMBARGO, EL ENTRENAMIENTO DE ALGUNOS MODELOS DE AA, QUE NORMALMENTE SE REALIZA EN SERVIDORES EN LA NUBE, CONSUME GRANDES CANTIDADES DE ENERGIA ELECTRICA CON SUS EMISIONES DE CARBONO ASOCIADAS. UNA POSIBLE SOLUCION ES REALIZAR TODO EL APRENDIZAJE EN DISPOSITIVOS LOCALES ON THE EDGE, AUNQUE ESTOS SUELEN TENER UNA POTENCIA DE COMPUTO LIMITADA.SI BIEN SE HAN REALIZADO ALGUNAS INVESTIGACIONES PARA TRATAR DE HACER QUE LOS METODOS DE AA SEAN VERDES, SIGUE EXISTIENDO UNA BRECHA METODOLOGICA CLAVE: NO EXISTEN METODOS DE SELECCION DE CARACTERISTICAS (SC) VERDES. LA SC, EL PROCESO DE SELECCIONAR LAS CARACTERISTICAS RELEVANTES Y DESCARTAR LAS IRRELEVANTES, SE HA APLICADO CON EXITO EN LAS ULTIMAS DECADAS PARA REDUCIR LA DIMENSIONALIDAD DE LOS DATOS. EN PARTICULAR, HAY APLICACIONES EN LAS QUE ENCONTRAR LAS CARACTERISTICAS RELEVANTES ES TAN IMPORTANTE COMO UNA CLASIFICACION PRECISA: BIOINFORMATICA (P. EJ., PARA IDENTIFICAR ALGUNAS BIOMOLECULAS CLAVE QUE EXPLICAN LA MAYOR PARTE DE UN FENOTIPO OBSERVADO), IMPARCIALIDAD EN LA TOMA DE DECISIONES (P. EJ., PARA ENCONTRAR LAS CARACTERISTICAS DE ENTRADA UTILIZADAS EN EL PROCESO DE DECISION, EN LUGAR DE CENTRARSE EN LA EQUIDAD DE LOS RESULTADOS DE LA DECISION), O NANOTECNOLOGIA (P. EJ., PARA DETERMINAR LAS CONDICIONES EXPERIMENTALES Y LAS CARACTERISTICAS FISICOQUIMICAS MAS RELEVANTES QUE DEBEN TENERSE EN CUENTA EN LA EVALUACION DE RIESGOS DE LA NANOTOXICOLOGIA). DESCUBRIR LAS CARACTERISTICAS RELEVANTES PROPORCIONARA INFORMACION SOBRE EL SISTEMA SUBYACENTE, LO CUAL ES NECESARIO PARA IMPLEMENTAR EL DERECHO A LA EXPLICACION Y TRANSPARENCIA DE LOS SISTEMAS DE IA.ADEMAS, LA MAYORIA DE ALGORITMOS DE SC SE BASAN EN LA BUSQUEDA EN EL ESPACIO DE CARACTERISTICAS, QUE ES EXHAUSTIVA, COSTOSA Y REQUIERE MUCHO TIEMPO, POR LO QUE ACELERAR LA EJECUCION DE ESTE TIPO DE ALGORITMOS TAMBIEN ES UNA PRIORIDAD. SIN EMBARGO, ESTAS OPTIMIZACIONES REQUIEREN MUCHOS RECURSOS COMPUTACIONALES QUE DEMANDAN MILES DE HORAS DE GPU Y CPU (PRINCIPALMENTE EN SERVIDORES EN LA NUBE) Y SU CORRESPONDIENTE CONSUMO ENERGETICO. EN CONTRASTE CON ESTE PARADIGMA, LA COMPUTACION PORTATIL HA HECHO INCURSIONES EXITOSAS Y SIGNIFICATIVAS EN MUCHAS AREAS DE APLICACION. ESTOS DISPOSITIVOS (WEARABLES) SUELEN EMPLEARSE COMO SISTEMAS LOCALES Y TRABAJAN CON POCA POTENCIA DE CALCULO Y MEMORIAS PEQUEÑAS. RECIENTEMENTE SE ESTA PONIENDO MUCHO ENFASIS EN HACER QUE LOS ALGORITMOS DE APRENDIZAJE PROFUNDO SEAN EFICIENTES, AUNQUE LA MAYORIA DE LAS VECES NO ESTAN MOTIVADOS POR SER VERDES. CON RESPECTO A LA REDUCCION DEL CONSUMO DE ENERGIA EN SC, SOLO PODEMOS ENCONTRAR NUESTRO PROPIO TRABAJO EN EL QUE PRESENTAMOS UNA MEDIDA DE LA INFORMACION MUTUA EN PRECISION REDUCIDA APLICABLE A CUALQUIER METODO DE SC QUE LA USE INTERNAMENTE.NUESTRO OBJETIVO GENERAL ES UN CAMBIO DE PARADIGMA HACIA NUEVOS METODOS DE SC VERDES QUE PUEDAN FUNCIONAR EN DISPOSITIVOS DE BAJO CONSUMO. LA CLAVE PARA LOGRAR ESTE AVANCE ES LA INCLUSION DE ENFOQUES DE HPC, NO SOLO PARA HACER QUE LOS NUEVOS METODOS SEAN MAS EFICIENTES, SINO TAMBIEN MAS RAPIDOS Y ESCALABLES. LOS RESULTADOS DEL PROYECTO TENDRAN UN GRAN IMPACTO EN MULTITUD DE APLICACIONES EN LAS QUE LA INTERPRETACION Y LA COMPRENSION DEL MODELO SON PRIMORDIALES, DESDE LA MEDICINA HASTA LA NANOTECNOLOGIA ELECCION DE CARACTERISTICAS\PRECISION REDUCIDA\COMPUTACION DE ALTAS PRESTACIONES\APRENDIZAJE MAQUINA\ALGORITMOS VERDES