Descripción del proyecto
LA INVESTIGACION PLANTEADA EN ESTE PROYECTO PRETENDE CONTRIBUIR AL AVANCE EN EL DOMINIO DE TECNICAS DE APRENDIZAJE MAQUINA PARA PROBLEMAS REALES COMPLEJOS, DONDE LAS NECESIDADES DE COMPUTO DE ALTAS PRESTACIONES PUEDEN SER VARIABLES, TODO ELLO DENTRO DE LOS CAMPOS CLAVE DE LA SALUD Y EL BIENESTAR,LA EVOLUCION ACTUAL DE LAS AREAS DE LAS TECNOLOGIAS DE LA INFORMACION Y LAS COMUNICACIONES EN SU APLICACION A LA BIOMEDICINA, BIOINFORMATICA, BIOTECNOLOGIA Y OTRAS DISCIPLINAS AFINES, CONLLEVA EL TRATAMIENTO DE VOLUMENES DE DATOS CADA VEZ MAYORES, DE CARACTER HETEROGENEO Y DE FUENTES DIVERSAS DE INFORMACION, DENTRO DE UN CONTEXTO GENERICO DE SUMINISTRO DE UN SERVICIO DE APRENDIZAJE AUTOMATICO, SURGE CADA VEZ MAS LA NECESIDAD DE AUTOMATIZACION EN LA TOMA DE DECISIONES DEL MODELO Y/O MODELOS DE APRENDIZAJE A UTILIZAR, ASI COMO DE LA ARQUITECTURA DE COMPUTO DE LA QUE SERVIRSE,EN ESTE CONTEXTO SE PLANTEA COMO PRIMER OBJETIVO EL AVANCE EN EL CONOCIMIENTO SOBRE ALGORITMOS DE ULTIMA GENERACION PARA EL ABORDAJE DE PROBLEMAS COMPLEJOS, INCLUYENDO ESPECIALMENTE REDES NEURONALES PROFUNDAS, MAQUINAS DE VECTORES SOPORTE Y SISTEMAS DIFUSOS, CENTRANDOSE EN SUBTAREAS DE SELECCION, CONJUNCION (ENSEMBLE MODELS) E HIBRIDACION DE MODELOS, CON EL OBJETIVO DE UTILIZAR ADECUADAMENTE LAS PROPIEDADES Y VENTAJAS DE CADA TIPO DE MODELO DENTRO DE UN CONTEXTO DE USO DE INFORMACION DE FUENTES HETEROGENEAS,EN ESTAS TAREAS RESULTA CRITICO EL ASEGURAR UN BUEN RENDIMIENTO COMPUTACIONAL, ASI SE PLANTEA COMO SEGUNDO OBJETIVO EL ESTUDIO EN PROFUNDIDAD SOBRE OPTIMIZACION DE LOS RECURSOS DE COMPUTO DISPONIBLES PARA UNA SIMULACION DADA, LAS GPUS, EL GRID-COMPUTING Y EL HIGH THROUGHPUT COMPUTING, ASI COMO EL CLOUD COMPUTING SURGEN EN ESTOS ULTIMOS AÑOS COMO ALTERNATIVAS DE COMPUTO DE ALTO RENDIMIENTO QUE PERMITEN APROVECHAR RESPECTIVAMENTE EL PARALELISMO INHERENTE EN EL TRATAMIENTO DE LOS DATOS, LAS SUPER-ARQUITECTURAS DE COMPUTO DISPONIBLES Y SU AMPLIACION MEDIANTE CONTRATACION DE SERVICIOS EXTERNOS DE CLOUD, POR OTRO LADO LOS PARADIGMAS DE MAP-REDUCE BAJO HADOOP Y LA COMPUTACION EN MEMORIA BAJO SPARK SON ALTERNATIVAS EN AUGE A TENER EN CUENTA QUE PUEDEN RESULTAR ALTAMENTE EFICIENTES, LA SELECCION DE LOS RECURSOS A UTILIZAR EN UN PROBLEMA DADO REQUIERE DE UN CONOCIMIENTO EXHAUSTIVO DE LAS NECESIDADES Y FUNCIONAMIENTO DE LOS MODELOS UTILIZADOS, DEL TIPO DE IMPLEMENTACION UTILIZADO, ASI COMO DE LAS PRESTACIONES, VENTAJAS E INCONVENIENTES DE CADA RECURSO DISPONIBLE,POR ULTIMO, ESTOS DOS PRIMEROS OBJETIVOS TIENEN COMO FIN ULTIMO EL RETO EN LA PROFUNDIZACION Y AVANCE EFECTIVO A NIVEL DE COMPUTACION INTELIGENTE EN PROBLEMAS DIVERSOS Y APROVECHAMIENTO DE RECURSOS DE COMPUTO EN LAS AREAS DE LA SALUD Y BIENESTAR, LAS AREAS TRATADAS INCLUYEN LA METABOLOMICA (ESTUDIO DE BIOMARCADORES EN PLASMA PARA EL DIAGNOSTICO DE CANCER), PROBLEMAS DE ALINEAMIENTO MULTIPLE CON PROTEINAS (UN RETO MUY ACTUAL DEBIDO AL AUMENTO DE INFORMACION HETEROGENEA PARA LA CARACTERIZACION BIOLOGICA DE INTERACCIONES ENTRE PROTEINAS PROPORCIONADA POR LAS TECNICAS DE SECUENCIACION DE NUEVA GENERACION) Y LA BIOTECNOLOGIA (LA MONITORIZACION EN TIEMPO REAL A ALTO NIVEL EN EL HOGAR) Y OTROS PROBLEMAS DENTRO DEL AREA DE LA BIOMEDICINA, LOS PROBLEMAS TRATADOS PRESENTAN UN ESCENARIO DE TRABAJO COMUN DONDE UNA INGENTE CANTIDAD DE DATOS, DE FUENTES HETEROGENEAS TIENEN QUE TRATARSE PARA EXTRAER EL CONOCIMIENTO NECESARIO DE ESTOS, Y CON EL OBJETIVO ULTIMO DE PROPORCIONAR UN SERVICIO A LOS ORGANISMOS/EMPRESAS Y/O AL PACIENTE FINAL ARQUITECTURAS DE CÓMPUTO AVANZADAS\APRENDIZAJE AUTOMÁTICO\FUENTES DE DATOS HETEROGÉNEAS\BIOMEDICINA\BIOINFORMÁTICA\BIENESTAR