Descripción del proyecto
LA SECUENCIACION DE ARN UNICELULAR (SCRNA-SEQ) Y OTRAS TECNOLOGIAS GENOMICAS HAN GENERADO ENORMES CANTIDADES DE DATOS QUE HAN CONTRIBUIDO A LA INTERPRETACION DE FENOMENOS BIOLOGICOS FUNDAMENTALES. SIN EMBARGO, ESTOS ENFOQUES NO PUEDEN CAPTURAR CONTEXTOS DINAMICOS EN LOS QUE LAS CELULAS CAMBIAN CONTINUAMENTE SUS PROPIEDADES BIOQUIMICAS Y ESTADOS FENOTIPICOS DE COMPORTAMIENTO. ESTO ES DE GRAN RELEVANCIA EN ONCOLOGIA, DONDE LAS CELULAS TUMORALES SE CARACTERIZAN POR UNA HETEROGENEIDAD DE SU FENOMA CAMBIANTE. ADEMAS, SON SIEMPRE DESTRUCTIVOS, LO QUE IMPIDE EL SEGUIMIENTO ESPACIO-TEMPORAL DE LAS CELULAS VIVAS, YA SEA EN CULTIVOS O EN TODO EL ORGANISMO. POR TANTO, UNA COMPRENSION MAS PROFUNDA DE LAS PROPIEDADES CELULARES, SUS FUNCIONALIDADES Y REGULACION EXIGE EL DESARROLLO DE NUEVAS METODOLOGIAS INHERENTEMENTE DIGITALES QUE PUEDAN INCORPORAR GRANDES CANTIDADES DE DATOS ESPACIO-TEMPORALES, A TRAVES DE LA MEDICION DE AMPLIOS CONJUNTOS DE VARIABLES, PARA SU POSTERIOR ANALISIS UTILIZANDO ALGORITMOS DE APRENDIZAJE AUTOMATICO Y SELECCION JUNTO CON MODELADO MATEMATICO. A PARTIR DE ESTOS ANALISIS, LAS VARIABLES IDENTIFICADAS QUE PRESENTEN UN MEJOR PODER PREDICTIVO DEL COMPORTAMIENTO CELULAR Y SUS PROCESOS DE TRANSICION PUEDEN UTILIZARSE EN ESCENARIOS FISIO-PATOLOGICOS, COMO EN LA LEUCEMIA.PROPONEMOS USAR DIFERENTES ENFOQUES DE APRENDIZAJE AUTOMATICO Y MODELADO MATEMATICO PARA IDENTIFICAR VARIABLES MECANICAS E INMUNOFENOTIPICAS MEDIDAS EN CULTIVOS CELULARES PRIMARIOS IN VITRO PROVENIENTES DE PACIENTES CON LEUCEMIA. EN PRIMER LUGAR, A TRAVES DE ALGORITMOS DE SELECCION (COMO METODOS ENVOLVENTES, DE FILTRADO Y EMBEBIDOS), IDENTIFICAREMOS AQUELLAS VARIABLES FUNCIONALES QUE MUESTRAN LA MEJOR CAPACIDAD DE CLASIFICACION PARA GRUPOS DE PACIENTES (I.E., RESPUESTA A MODALIDADES TERAPEUTICAS Y/O PROGRESION DE LA ENFERMEDAD). UN OBSTACULO IMPORTANTE AL TRATAR CON DATOS BIOMEDICOS MASIVOS ES EL HECHO DE QUE UNA BUSQUEDA EXHAUSTIVA DE TODO EL ESPACIO DE VARIABLES ES INTRATABLE DESDE UN PUNTO DE VISTA COMPUTACIONAL. PARA ABORDARLO, UTILIZAREMOS REDES DE CORRELACION; QUE FACILITAN LA FASE NO SUPERVISADA DEL PROCESO DE SELECCION QUE COMPLEMENTA A OTRAS TECNICAS DE REDUCCION DE DIMENSIONALIDAD AMPLIAMENTE USADAS PARA VISUALIZAR DATOS UNICELULARES (E.G., T-SNE Y UMAP). LA SEGUNDA ETAPA IMPLICA LA CARACTERIZACION TOPOLOGICA DE ESTAS VARIABLES. ESPECIFICAMENTE, LOS CONJUNTOS DE DATOS ADQUIRIDOS (CITOMETRIA DE FLUJO) REQUIEREN NO SOLO UN ANALISIS BASADO EN LA INTENSIDAD DE LAS VARIABLES INMUNOFENOTIPICAS OBTENIDAS SINO, TAMBIEN, EVALUAR LAS FORMAS DE LOS DATOS PROYECTADOS. NUESTRO OBJETIVO ES ENCONTRAR CARACTERISTICAS MAS ALLA DE LOS DESCRIPTORES HABITUALES (MEDIA, MAXIMO, MINIMO, RANGO, ETC.) QUE CAPTEN TOPOLOGICAMENTE LAS RELACIONES ENTRE LAS VARIABLES SELECCIONADAS. PARA ELLO, RECURRIREMOS A TECNICAS DE ANALISIS DE DATOS TOPOLOGICOS, QUE SON CAPACES DE ESTUDIAR LA 'FORMA' DE DATOS DE ALTA DIMENSION. EL ANALISIS DE DATOS TOPOLOGICOS ES UN CAMPO MATEMATICO EMERGENTE QUE EMPLEA ENFOQUES GEOMETRICOS PARA CUANTIFICAR LA "FORMA" DE LOS DATOS DE UNA MANERA OBJETIVA Y REPRODUCIBLE. UN METODO CENTRAL DEL ANALISIS DE DATOS TOPOLOGICOS ES LA HOMOLOGIA DE PERSISTENCIA, QUE RECIENTEMENTE SE HA APLICADO CON EXITO A DATOS BIOMEDICOS. POR LO TANTO, AL COMBINAR METODOS DE APRENDIZAJE AUTOMATICO CON TECNICAS TOPOLOGICAS Y DE REDUCCION DE DIMENSIONALIDAD, PODREMOS CLASIFICAR GRUPOS DE PACIENTES, ASI COMO CARACTERIZAR SU PROGRESION Y RESPUESTA A TRATAMIENTOS A LO LARGO DEL TIEMPO.