Descripción del proyecto
LA INVESTIGACION QUE PLANTEA ESTE PROYECTO PRETENDE CONTRIBUIR AL AVANCE EN EL DISEÑO DE NUEVAS SOLUCIONES INTELIGENTES PARA PROBLEMAS COMPLEJOS, QUE EXIGEN LA UTILIZACION PLATAFORMAS DE COMPUTACION DE ALTAS PRESTACIONES, EN LAS AREAS E LA BIOINFORMATICA, BIOTECNOLOGIA Y BIOMEDICINA, SON INCONTABLES LAS APLICACIONES DENTRO DE ESTAS AREAS QUE ESTAN SUFRIENDO CAMBIOS MUY IMPORTANTES EN LAS NECESIDADES DE TRATAMIENTO DE DATOS, DEBIDO AL AUMENTO DE LA CANTIDAD DE ESTOS, Y A LA DIVERSIDAD LAS FUENTES QUE LOS PROPORCIONAN, EN PARALELO, ESTAN SURGIENDO PARADIGMAS DE APRENDIZAJE MAQUINA NOVEDOSOS Y MUY POTENTES QUE ESTAN PERMITIENDO TRATAR PROBLEMAS CADA VEZ MAS COMPLEJOS CON GRAN EXITO, GRACIAS TAMBIEN A LOS RECIENTES AVANCES TECNOLOGICOS EN EL DISEÑO DE PLATAFORMAS DE COMPUTO DISTRIBUIDO Y DE ALTO RENDIMIENTO, LAS CUALES PERMITEN EL ENTRENAMIENTO Y USO EFICIENTE DE ESTOS MODELOS, TODOS ESTOS CAMBIOS ESTAN EXIGIENDO ESFUERZOS MUY IMPORTANTES DE INVESTIGACION TANTO EN EL DISEÑO Y COMPARACION DE ALGORITMOS, EN EL DISEÑO Y COMPARACION DE PLATAFORMAS DE COMPUTO USADAS, Y EN DISEÑO DE APLICACIONES PODEROSAS QUE SEAN CAPACES DE EXTRAER TODO EL CONOCIMIENTO INHERENTE DE LOS DATOS MASIVOS DISPONIBLES Y PROVENIENTES DE FUENTES HETEROGENEAS,ASI, EN ESTE CONTEXTO, ESTE PLANTEA COMO PRIMER OBJETIVO EL AVANCE EN EL DISEÑO Y APLICACION DE ALGORITMOS DE APRENDIZAJE MAQUINA NOVEDOSOS PARA PROBLEMAS COMPLEJOS, EN CONCRETO SE PROPONDRAN SOLUCIONES NOVEDOSAS DE SELECCION/EXTRACCION DE CARACTERISTICAS Y MODELADO (CLASIFICACION, REGRESION Y PREDICCION DE SERIES TEMPORALES), ASI COMO SU COMPARACION, PONIENDO ESPECIAL ATENCION A LA JERARQUIZACION DE MODELOS DE DIVERSOS PARADIGMAS (DEEP LEARNING, SISTEMAS DIFUSOS, SVMS, ETC,) COMO MEDIO DE SIMPLIFICAR Y MEJORAR LAS SOLUCIONES OBTENIDAS, ASI COMO A LA OPTIMIZACION DE LA ARQUITECTURA DE MODELOS COMPLEJOS (DEEP NEURAL NETWORKS),EN ESTAS TAREAS RESULTA ESENCIAL EL ASEGURAR UNA PARALELIZACION CORRECTA DE LAS TAREAS DE ENTRENAMIENTO Y EVALUACION DE MODELOS, ASI SE PLANTEA COMO SEGUNDO OBJETIVO EL ESTUDIO EN PROFUNDIDAD SOBRE ALTERNATIVAS DE PARALELIZACION PARA LOS PROBLEMAS PLANTEADOS, DICHAS ALTERNATIVAS INCLUIRAN EL USO DE GPUS, CLUSTERS, HADOOP Y SPARK Y OTRAS, ESPECIAL HINCAPIE SE HARA EN LA PARALELIZACION DE TAREAS PARA LA CONSTRUCCION JERARQUICA/HIBRIDA DE MODELOS Y PARA LA DISTRIBUCION DEL APRENDIZAJE EN PROBLEMAS CON MULTIPLES FUENTES DE DATOS HETEROGENEAS,POR ULTIMO, ESTOS DOS PRIMEROS OBJETIVOS TIENEN COMO FIN ULTIMO LA RESOLUCION EFECTIVA DE LOS PROBLEMAS DE COMPLEJIDAD CRECIENTE QUE SE VAN A DESARROLLAR EN ESTE PROYECTO, TODOS ELLOS DIRECTAMENTE RELACIONADOS CON LAS AREAS DE SALUD Y BIENESTAR, DICHAS AREAS INCLUYEN LA BIOINFORMATICA (DESARROLLO DE UNA MULTIPLATAFORMA INTEGRADORA DE BASES DE DATOS DE DIFERENTES OMICAS PARA ANALISIS DE EXPRESION DE GEN), LA BIOTECNOLOGIA (DETECCION MULTI-TEMPORAL AUTOMATICA DEL COMPORTAMIENTO HUMANO, Y DIAGNOSTICO DE ENFERMEDADES CARDIOVASCULARES A PARTIR DE SEÑALES ECG Y FUSION DE SONIDOS DEL CORAZON) Y BIOMEDICINA (DIAGNOSTICO DE PARKINSON Y ALZHEIMER A PARTIR DE IMAGENES BIOMEDICAS Y CARACTERIZACION DE DISTINTAS PROPIEDADES DE TEJIDOS ARTIFICIALES Y BIOMATERIALES), ESTOS PROBLEMAS PRESENTAN UN ESCENARIO DE TRABAJO COMUN EN EL QUE CADA VEZ SE DISPONE DE MAS DATOS, PROVENIENTES DE DIVERSAS FUENTES DIVERSAS EN EL QUE SE HACE NECESARIA LA EXTRACCION DE CONOCIMIENTO PRECISO, EN EL OBJETIVO ULTIMO DE PROPORCIONAR UN SERVICIO DIRECTO CON APLICACIONES DIVERSAS EN SALUD APRENDIZAJE MAQUINA\HIGH-PERFORMANCE COMPUTING\GPUS\BIOINFORMÁTICA\BIOTECNOLOGÍA\BIOMEDICINA.