Descripción del proyecto
DIRECT-MOL TIENE COMO OBJETIVO DESARROLLAR UN NUEVO ENFOQUE COMPUTACIONAL BASADO EN INTELIGENCIA ARTIFICIAL (IA) PARA DETERMINAR LA IDENTIDAD, POSICION Y ORIENTACION DE LAS SUBUNIDADES PROTEICAS QUE FORMAN COMPLEJOS MACROMOLECULARES DENTRO DE LA CELULA (PROTEOMICA VISUAL), PARA ELLO PROCESARA DATOS DE CRIO-TOMOGRAFIA ELECTRONICA (CRYO-ET). LOS AVANCES TECNOLOGICOS DE ESTE PROYECTO PERMITIRAN LOGRAR UNA ASPIRACION IMPORTANTE EN BIOLOGIA MOLECULAR: EL ANALISIS INTEGRAL Y CUANTITATIVO DE LA ORGANIZACION CELULAR A NIVEL MOLECULAR.EL ENTORNO CELULAR SE CARACTERIZA POR LA PRESENCIA DE MUCHAS ESPECIES MOLECULARES DIFERENTES, DONDE LOS COMPLEJOS MACROMOLECULARES, ESTABLES O TRANSITORIOS, SUBYACEN A FUNCIONES CELULARES CRITICAS. LA CRYO-ET ES UNA EXTENSION DE LA TECNICA QUE FUE GALARDONADA CON EL PREMIO NOBEL EN 2017, LA CRIO-MICROSCOPIA ELECTRONICA (CRYO-EM). CON LA PRESERVACION FIEL DE LAS MUESTRAS Y LA VISUALIZACION DIRECTA DE MATERIAL BIOLOGICO COMPLETAMENTE HIDRATADO, LA CRYO-ET HA SURGIDO COMO LA UNICA TECNICA PARA GENERAR REPRESENTACIONES TRIDIMENSIONALES (3D) DEL CONTEXTO CELULAR, IN SITU, A UNA RESOLUCION SUB-NANOMETRICA. LA CRYO-ET DEPENDE EN GRAN MEDIDA DE LA INFORMATICA, YA QUE LAS ESTRUCTURAS CELULARES SON ALTAMENTE HETEROGENEAS Y LA INTERPRETACION DE IMAGENES Y VOLUMENES SE VE GRAVEMENTE OBSTACULIZADA POR VARIOS FACTORES, COMO EL RUIDO, EL BAJO CONTRASTE Y LAS DISTORSIONES ANISOTROPICAS. EN CONSECUENCIA, SE REQUIERE EL DESARROLLO DE METODOS INFORMATICOS ESPECIFICOS PARA ANALIZAR DATOS DENTRO DE LOS CRIO-TOMOGRAMAS.DEBIDO A SU EXITO EN EL PROCESAMIENTO DE IMAGENES EN LOS ULTIMOS AÑOS, LOS ALGORITMOS DE APRENDIZAJE PROFUNDO (DL) Y, ESPECIALMENTE LAS REDES NEURONALES CONVOLUCIONALES (CNN), SE ESTAN ADAPTANDO PARA PROCESAR CRIO-TOMOGRAMAS DE CRYO-ET EN DIFERENTES ETAPAS DEL FLUJO DE TRABAJO: RECONSTRUCCION, ELIMINACION DE RUIDO, SEGMENTACION O DETECCION MACROMOLECULAR. LAS CNNS PERMITEN UN ANALISIS EFICIENTE EN IMAGENES DIGITALES PORQUE APROVECHAN SU ESTRUCTURA DE REJILLA REGULAR. CUANDO EL CONJUNTO DE ENTRENAMIENTO ES REPRESENTATIVO Y LO SUFICIENTEMENTE GRANDE, LOS METODOS BASADOS EN CNN SUPERVISADOS SUPERAN A LOS ENFOQUES CLASICOS COMO TEMPLATE MATCHING. SIN EMBARGO, LA FALTA DE DATOS ANOTADOS CONFIABLES DE CRIO-TOMOGRAMAS REALES ESTA EVITANDO LA APLICACION EFECTIVA DE ALGORITMOS SUPERVISADOS DE DL EN CRYO-ET. EN LA ACTUALIDAD, LOS MODELOS DE DL UTILIZADOS EN CRYO-ET PUEDEN DETECTAR UNA FRACCION MUY PEQUEÑA DE MACROMOLECULAS GRANDES Y AISLADAS, PERO LA GRAN MAYORIA DE LAS MOLECULAS NO PUEDEN SER ANALIZADAS. ADEMAS, EL ESTADO CONFORMACIONAL DE LAS MACROMOLECULAS NO SE PUEDE DETERMINAR DE MANERA DIRECTA, YA QUE LOS METODOS ACTUALES NO PUEDEN DESCOMPONER LAS MACROMOLECULAS EN SUS SUBUNIDADES ESTRUCTURALES.ESTE PROYECTO TIENE COMO OBJETIVO SUPERAR LAS LIMITACIONES ACTUALES DE LOS METODOS DE DL PARA ANALIZAR DATOS DE CRYO-ET A NIVEL DE SUBUNIDADES PROTEICAS MEDIANTE LA INTRODUCCION DEL SIGUIENTE ENFOQUE: 1. DESARROLLO DE METODOS PARA GENERAR CRIO-TOMOGRAMAS SINTETICOS QUE REPRODUZCAN LA INTERACCION COMPLEJA EN LAS SUBUNIDADES DE LAS MACROMOLECULAS DENTRO DE LA CELULA A ALTA RESOLUCION. 2. NUEVOS ALGORITMOS DE DL SUPERVISADOS ENTRENADOS CON LOS DATOS SINTETICOS PARA DETECTAR Y DETERMINAR LA ORIENTACION DE LAS SUBUNIDADES PROTEICAS PRINCIPALES QUE CONSTITUYEN UNA MACROMOLECULA DENTRO DE UN CRIO-TOMOGRAMA CELULAR. APRENDIZAJE MAQUINA\BIOLOGIA CELULAR\BIOLOGIA MOLECULAR\MICROSCOPIA ELECTRONICA\COMPUTACION CIENTIFICA\VISION POR COMPUTADOR\PROCESAMIENTO DE IMAGENES\APRENDIZAJE PROFUNDO