FISICA ESTADISTICA EN TEXTOS Y SECUENCIAS DE ADN: IDENTIFICACION DE PALABRAS REL...
FISICA ESTADISTICA EN TEXTOS Y SECUENCIAS DE ADN: IDENTIFICACION DE PALABRAS RELEVANTES, CORRELACIONES DE LARGO ALCANCE E INTERACCIONES MEDIANTE REDES COMPLEJAS.
EL GENOMA HUMANO CONTIENE ALREDEDOR DE 20000 GENES, QUE CUBREN SOLAMENTE EL 2% DEL GENOMA. ESA PEQUEÑA CANTIDAD DE GENES NO ES CAPAZ DE DAR CUENTA DE LA COMPLEJIDAD DE UN SER HUMANO Y DE LAS NUMEROSISMAS FUNCIONES QUE REALIZAUN OR...
ver más
Descripción del proyecto
EL GENOMA HUMANO CONTIENE ALREDEDOR DE 20000 GENES, QUE CUBREN SOLAMENTE EL 2% DEL GENOMA. ESA PEQUEÑA CANTIDAD DE GENES NO ES CAPAZ DE DAR CUENTA DE LA COMPLEJIDAD DE UN SER HUMANO Y DE LAS NUMEROSISMAS FUNCIONES QUE REALIZAUN ORGANISMO. POR TANTO, LA INFORMACION ADICIONAL QUE CONTROLA LA EXPRESION DE LOS GENES, Y LA RELACION ENTRE ELLOS DEBE ESTAR ESCRITA EN EL 98% RESTANTE DEL GENOMA. PERO NO SE CONOCE COMO ESTA ESCRITA ESA INFORMACION: QUE CODIGO SE UTILIZA, QUE VOCABULARIO SE USA Y EL SIGNIFICADO DEL MISMO. NOSOTROS PROPONEMOS ABORDAR ESTE PROBLEMA EN TRES FASES:1) DETECCION DEL 'VOCABULARIO' DEL GENOMA USANDO TECNICAS LINGUISTICAS DESARROLLADAS POR NUESTRO GRUPO. HEMOS DEMOSTRADO QUE LAS PALABRAS RELEVANTES EN UN TEXTO ESTAN CLUSTERIZADAS A LO LARGO DEL MISMO, Y QUE CON UNA MEDIDA ADECUADA DEL CLUSTERING DE LA PALABRA, SE PUEDEN EXTRAERLAS PALABRAS RELEVANTES DE UN TEXTO SIN INFORMACION ADICIONAL EXTERNA. ASI MISMO, MUY RECIENTEMENTE HEMOS DEMOSTRADO QUE EN EL ADN LASCADENAS DE $K$-MEROS CON MAYOR CLUSTERING APARECEN PREFERENTEMENTE EN REGIONES CON FUNCION BIOLOGICA Y NO LO HACEN FUERA DE ELLAS. POR LO TANTO, USANDO DE NUEVO LA ASOCIACION ENTRE CLUSTERING Y RELEVANCIA PODEMOS ENCONTRAR LAS PALABRAS RELEVANTES (EL 'VOCABULARIO') DE ESTE 98% DEL GENOMA.2) DISEÑO DE MODELOS CON CORRELACIONESDE LARGO ALCANCE QUE SIMULEN LA APARICION DE PALABRAS CLAVE EN UN TEXTO O EN UNA SECUENCIA DE ADN. EL CLUSTERING DE LAS PALABRAS RELEVANTES SE DEBE A FUERTES INTERACCIONES ENTRE ELLAS, QUE SE MANIFIESTAN COMO CORRELACIONES DE LARGOALCANCE EN LEY DE POTENCIAS QUE ALCANZAN ESCALAS ESPACIALES ENORMES TANTO EN TEXTOS COMO ADN. DE ESTA FORMA, PRETENDEMOS ENTENDER LOSMECANISMOS QUE CONTROLAN LA APARICION DE INFORMACION IMPORTANTE TANTO EN TEXTOS COMO EN ADN.3) APLICACION DE LAS HERRAMIENTAS DE LA TEORIA DE REDES COMPLEJAS A LAS REDES DERIVADAS DE PALABRAS CLAVE. EN TEXTOS, LOS NODOS DE LA REDSERAN LAS PALABRAS RELEVANTES Y LOS LINKS SE CREARAN POR PROXIMIDAD EN EL TEXTO. LAS REDES RESULTANTES NOS CARACTERIZARAN COMO SE ASOCIAN LOS CONCEPTOSIMPORTANTES EN UN TEXTO. EN EL ADN, PROPONEMOS DOS TIPOS DE REDES: A) LOS NODOS CORRESPONDEN A LAS PALABRAS DEL VOCABULARIO Y LOS LINKS SE ESTABLECEN POR PROXIMIDAD EN LA SECUENCIA. LA RED RESULTANTE NOS DARA QUE PALABRAS SE USAN CONJUNTAMENTE, SI EXISTEN PALABRAS ``HUBS', ETC, ES DECIR, LAS 'REGLAS DE ESCRITURA' O SINTACTICAS EN EL GENOMA. B) LOS NODOS SON LOS GENES, Y LOS LINKS SE CREAN ENTRE ELLOS SI TIENEN EN SUS CERCANIAS PALABRAS COMUNES DEL VOCABULARIO. ESTAS REDES NOS DARAN EL CONTENIDO 'SEMANTICO' O SIGNIFICADO DE LAS PALABRAS, ES DECIR, SU ASOCIACION A LAS FUNCIONES DE LOS GENES.
Seleccionando "Aceptar todas las cookies" acepta el uso de cookies para ayudarnos a brindarle una mejor experiencia de usuario y para analizar el uso del sitio web. Al hacer clic en "Ajustar tus preferencias" puede elegir qué cookies permitir. Solo las cookies esenciales son necesarias para el correcto funcionamiento de nuestro sitio web y no se pueden rechazar.
Cookie settings
Nuestro sitio web almacena cuatro tipos de cookies. En cualquier momento puede elegir qué cookies acepta y cuáles rechaza. Puede obtener más información sobre qué son las cookies y qué tipos de cookies almacenamos en nuestra Política de cookies.
Son necesarias por razones técnicas. Sin ellas, este sitio web podría no funcionar correctamente.
Son necesarias para una funcionalidad específica en el sitio web. Sin ellos, algunas características pueden estar deshabilitadas.
Nos permite analizar el uso del sitio web y mejorar la experiencia del visitante.
Nos permite personalizar su experiencia y enviarle contenido y ofertas relevantes, en este sitio web y en otros sitios web.