Descripción del proyecto
LA RAPIDA EVOLUCION DE LAS TECNOLOGIAS PARA LA SECUENCIACION DE GENOMAS LAS HA LLEVADO A SUSTITUIR AL GENOTIPADO EN EL ESTUDIO GENETICO DE ENFERMEDADES A PEQUEÑA ESCALA (P. EJ. ESTUDIO DE MUTACIONES SOMATICAS Y REORDENAMIENTOS GENOMICOS EN CANCER, O EL ESTUDIO DE MUTACIONES DE BAJA FRECUENCIA QUE APARECEN EN FAMILIAS). ES EVIDENTE QUE ESTA EVOLUCION CONTINUARA DURANTE LOS PROXIMOS AÑOS, FACILITANDO LA SECUENCIACION DE MANERA RUTINARIA DE GENOMAS COMPLETOS A GRAN ESCALA EN ESTUDIOS DE ASOCIACION Y LIGAMIENTO. SE HA PROGRESADO MUCHO DURANTE LOS ULTIMOS AÑOS EN EL DESARROLLO DE HERRAMIENTAS ESTADISTICAS Y COMPUTACIONALES PARA EL ANALISIS DE DATOS DE SECUENCIACION. AUN ASI, EXISTE MUCHO TRABAJO POR HACER ANTES DE QUE SEA FACTIBLE Y SUFICIENTEMENTE EFICIENTE UTILIZAR ESTAS TECNICAS DE MANERA RUTINARIA PARA CENTENARES O MILES DE GENOMAS DE TAMAÑO SIMILAR AL HUMANO.LA PRIMERA PARTE DE ESTA PROPUESTA SE CENTRA EN EL REFINAMIENTO Y LA AMPLIACION DE LOS ENFOQUES ACTUALES PARA PREDECIR VARIANTES DE SECUENCIA (SNVS, INDELS, Y VARIANTES ESTRUCTURALES) A PARTIR DE LOS DATOS DE SECUENCIACION ALINEADOS A UNA SECUENCIA DE REFERENCIA. EL OBJETIVO ES DESARROLLAR METODOS QUE PERMITAN REALIZAR ANALISIS RAPIDOS, CON UNA INTERVENCION MANUAL MINIMA Y QUE A LA VEZ PROPORCIONEN RESULTADOS ROBUSTOS Y FIABLES. LOS METODOS PROPUESTOS COMBINARAN MULTIPLES FUENTES DE INFORMACION (P. EJ. HAPLOTIPOS PARCIALES Y RELACIONES FAMILIARES EN EL CASO DE SNVS Y INDELS; LIBRERIAS DE LECTURAS APAREJADAS, LECTURAS SPLIT-MAPPED Y COBERTURA LOCAL PARA VARIANTES ESTRUCTURALES). LA EFICIENCIA COMPUTACIONAL SERA UN OBJETIVO PRINCIPAL DURANTE EL DESARROLLO DE LA METODOLOGIA, CON LA FINALIDAD DE POSIBILITAR EL ANALISIS DE CIENTOS DE MUESTRAS EN UN RANGO DE TIEMPO RAZONABLE MEDIANTE MODESTOS RECURSOS DE COMPUTACION.LA SEGUNDA PARTE DEL PROYECTO SE CENTRARA EN EL ANALISIS DE ALINEAMIENTOS DE-NOVO. EXISTEN MUCHAS SITUACIONES EN LAS QUE ES PREFERIBLE O NECESARIO TRABAJAR CON ALINEAMIENTOS DE SECUENCIAS DE-NOVO EN LUGAR DE DATOS ALINEADOS A UNA REFERENCIA (P. EJ. EN ESPECIES SIN UNA SECUENCIA DE REFERENCIA COMPLETA O EL ESTUDIO DE GENOMAS TUMORALES). PROPONEMOS ADAPTAR A LA DETECCION DE VARIANTES LAS APROXIMACIONES DETALLADAS ANTERIORMENTE PARA FACILITAR EL ANALISIS DE DATOS DE ENSAMBLAJES DE-NOVO DE MANERA EFICIENTE. ADEMAS, TAMBIEN SE DESARROLLARAN NUEVAS METODOLOGIAS PARA LA REALIZACION DE ANALISIS ESPECIFICOS DE DATOS DE ENSAMBLAJE (P. EJ. COMPARAR ENSAMBLAJES DE MULTIPLES GENOMAS).EL OBJETIVO DE ESTE PROYECTO ES DESARROLLAR UN SOFTWARE DE CODIGO ABIERTO QUE SERA UTILIZADO EN EL CENTRO NACIONAL DE ANALISIS GENOMICO (CNAG) PARA EL ANALISIS RUTINARIO DE DATOS DE SECUENCIA PRODUCIDOS EN NUESTRO CENTRO, Y QUE A SU VEZ, SE PONDRA A DISPOSICION DE MANERA GRATUITA PARA TODOS LOS MIEMBROS DE LA COMUNIDAD CIENTIFICA. ECUENCIACION\ENSAMBLAJE\DETECCION DE VARIANTES