Descripción del proyecto
EN ESTE PROYECTO, DESARROLLARE NUEVOS METODOS COMPUTACIONALES QUE INTEGREN DATOS GENOMICOS, EPIGENOMICOS Y TRANSCRIPTOMICOS DE CELULAS INDIVIDUALES PARA ESTUDIAR LA HETEROGENEIDAD Y LA DINAMICA DE POBLACIONES CELULARES. LA INCLUSION DE LA HETEROGENEIDAD A NIVEL GENOMICO, ES DECIR, A NIVEL DE LAS VARIACIONES EN EL NUMERO DE COPIAS (CNV), ES EXTREMADAMENTE RELEVANTE EN EL CAMPO DEL CANCER. LAS CNV SON EVENTOS DE DUPLICACION O DELECION DEL ADN QUE ABARCAN DESDE CROMOSOMAS ENTEROS HASTA UN PEQUEÑO NUMERO DE BASES EN EL GENOMA, Y ESTAN FUERTEMENTE ASOCIADAS AL CANCER, YA QUE LOS TUMORES SON EN GRAN PROPORCION ANEUPLOIDES. LA PRESENCIA COMUN DE ANEUPLOIDIAS EN EL CANCER CONDUJO A LA HIPOTESIS DE QUE LA ANEUPLOIDIA PROPORCIONA UNA VENTAJA DE CRECIMIENTO A LAS CELULAS CANCEROSAS. SIN EMBARGO, EL PAPEL DE LA ANEUPLOIDIA EN LA TUMORIGENESIS SIGUE SIN ESTAR CLARO. A PESAR DE SU ENORME RELEVANCIA, LA PRESENCIA O AUSENCIA DE CNVS NO SUELE TENERSE EN CUENTA CUANDO SE ANALIZAN DATOS UNICELULARES.DESARROLLARE LOS PRIMEROS METODOS PARA ESTUDIAR LA HETEROGENEIDAD ENTRE CELULAS A NIVEL DE CNVS UTILIZANDO DATOS MULTI-OMICOS UNICELULARES. MIS METODOS UTILIZARAN LA COBERTURA GENOMICA POR CELULA UNICA EN LAS MODALIDADES SCRNA-SEQ Y SCATAC-SEQ, ASI COMO LAS FRECUENCIAS ALELICAS POR SEGMENTO GENOMICO DE CADA MODALIDAD, Y UTILIZARAN SEGMENTACION BINARIA MULTIVARIANTE PARA DETERMINAR QUE PARTES DEL GENOMA SE GANAN O SE PIERDEN. ESTE TRABAJO SE BASA EN MI SOLIDA EXPERIENCIA EN EL DESARROLLO DE METODOS PARA DETERMINAR CNV UTILIZANDO DIFERENTES MODALIDADES DE DATOS UNICELULARES.LAS CNV REFLEJAN UN ESTADO GENOMICO, PERO POR SI SOLAS NO CONSTITUYEN UNA MEDIDA FUNCIONAL. PARA ESTUDIAR EL ESTADO FUNCIONAL DE LAS CELULAS INDIVIDUALES, TAMBIEN TRABAJARE EN LA REPRESENTACION DE LOS DATOS MULTIOMICOS (GENOMICOS (CNVS), EPIGENOMICOS Y TRANSCRIPTOMICOS) EN UN ESPACIO COMUN DE BAJA DIMENSION UTILIZANDO AUTOCODIFICADORES DE GEOMETRIA REGULARIZADA. PARA ELLO, UTILIZARE MI EXPERIENCIA EN EL ANALISIS DE DATOS UNICELULARES, DONDE HE TRABAJADO CON EXITO CON MUCHAS MODALIDADES. ESTA SERA LA PRIMERA VEZ QUE SE APLIQUEN A DATOS UNICELULARES AUTOCODIFICADORES QUE PRESERVAN LA GEOMETRIA DE LOS DATOS, Y TAMBIEN LA PRIMERA VEZ QUE LA INFORMACION GENOMICA DE LAS CELULAS INDIVIDUALES SE INTEGRA JUNTO CON LA INFORMACION TRANSCRIPTOMICA Y EPIGENOMICA. ESTO PERMITIRA COMPRENDER MEJOR LA HETEROGENEIDAD PRESENTE EN LAS MUESTRAS DE CANCER Y DESCUBRIR LAS RELACIONES NO LINEALES ENTRE LAS DISTINTAS CAPAS DE INFORMACION.POR ULTIMO, TAMBIEN ES IMPORTANTE DESENTRAÑAR LAS CONTRIBUCIONES DE ESTAS CAPAS DE VARIACION A LA DINAMICA DE LA POBLACION, CON LA IDENTIFICACION DE LAS RELACIONES ENTRE LOS TIPOS DE CELULAS DURANTE LA ENFERMEDAD. UTILIZARE POR PRIMERA VEZ METODOS DE ORDENACION PSEUDOTEMPORAL MULTIMODAL QUE TOMAN COMO ENTRADA INFORMACION GENOMICA, EPIGENOMICA Y TRANSCRIPTOMICA. LA ADICION DE INFORMACION CROMATINICA Y GENOMICA DE CELULAS INDIVIDUALES A LOS MODELOS NOS PERMITIRA NO SOLO IDENTIFICAR GENES Y VIAS REGULADORAS CLAVE, SINO TAMBIEN DILUCIDAR COMO LA ACCESIBILIDAD A LA CROMATINA Y LA ARQUITECTURA CROMOSOMICA INFLUYEN EN LA DINAMICA DE LA EXPRESION GENICA DURANTE LA DIFERENCIACION CELULAR, LA RESPUESTA A ESTIMULOS Y LA PROGRESION DE LA ENFERMEDAD.ESTA PROPUESTA DESARROLLARA LAS HERRAMIENTAS NECESARIAS PARA CARACTERIZAR MEJOR LA HETEROGENEIDAD DEL CANCER DESDE EL PUNTO DE VISTA DEL GENOMA, EL EPIGENOMA Y EL TRANSCRIPTOMA, OFRECIENDO ASI UN ENFOQUE GENERAL PARA COMPRENDER LA ENFERMEDAD. BIOLOGIA COMPUTACIONAL\VARIACIONES DEL NUMERO DE COPIAS\CANCER\GENOMICA UNICELULAR\EPIGENOMICA\MACHINE LEARNING\BIOINFORMATICA