Descripción del proyecto
LOS OBJETIVOS GENERALES DEL PROYECTO SE CENTRAN EN LA ESPECIFICACION, DISEÑO, IMPLEMENTACION Y VALIDACION DE UN SISTEMA OPTIMO DE COMPRESION DE INFORMACION GENOMICA CON GARANTIAS DE SEGURIDAD Y PRIVACIDAD,EL PRESENTE SUBPROYECTO CONTRIBUIRA POR UN LADO A LA VALIDACION DE LOS ALGORITMOS Y MECANISMOS DESARROLLADOS Y APLICARA SU EXPERIENCIA EN ANALISIS DE INFORMACION GENOMICA PARA CONSEGUIR LA MEJOR OPTIMIZACION DE LOS ALGORITMOS Y MECANISMOS ESPECIFICADOS,PARA ELLO SE GENERARAN DATASETS PARA BENCHMARKING QUE SEAN REPRESENTATIVOS DE DATOS GENOMICOS REALES, Y SE ANALIZARA EL COMPORTAMIENTO DE LAS ESTRATEGIAS PROPUESTAS EN EL SUBPROYECTO 1 EN DISTINTOS ENTORNOS TANTO COMPUTACIONALES COMO DE ESTRUCTURA DE DATOS, PARA FACILITAR LA ADOPCION DE LOS RESULTADOS DEL PROYECTO POR LA COMUNIDAD, SE GENERARAN INTERFACES PARA POSIBILITAR LA INTERACCION CON SOFTWARE DE USO COMUN EN GENOMICA, EN LA GENERACION DE STANDARDS DE COMPRESION Y PRIVACIDAD DE DATOS, SE ADAPTARAN LAS ESTRATEGIAS DESARROLLADAS EN EL PROYECTO 1 A LAS NECESIDADES ESPECIFICAS DEL EUROPEAN GENOME-PHENOME ARCHIVE (EGA), EL PRINCIPAL REPOSITORIO EUROPEO DE INFORMACION GENOMICA IDENTIFICABLE, COMO CASO DE USO,UN ASPECTO PARTICULARMENTE NOVEDOSO DEL SUBPROYECTO GENCOM2 ES EL ANALISIS DE LA POSIBILIDAD DE UTILIZAR UN MISMO TIPO DE ESTRUCTURA DE DATOS TANTO PARA COMPRESION COMO PARA ANALISIS (COMPRESSIVE ANALYSIS), FACILITANDO ASI LA REALIZACION DE DICHOS ANALISIS DIRECTAMENTE SOBRE DATOS COMPRIMIDOS, LAS POSIBILIDADES DE ESTE ASPECTO, HASTA AHORA POCO APROVECHADO EN EL CAMPO, SON EXTRAORDINARIAMENTE IMPORTANTES, POR UN LADO, LOS PROGRAMAS DE ANALISIS NO NECESITARAN ACCEDER A LA TOTALIDAD DE LOS DATOS Y ALMACENARLOS EN MEMORIA, CON LAS OBVIAS LIMITACIONES QUE ELLO SIGNIFICA, SINO QUE EL ANALISIS PODRA LIMITARSE A CONJUNTOS DE DATOS ESPECIFICOS DESCARTANDO EL RESTO, CON EL TAMAÑO CRECIENTE DE LOS DATOS GENOMICOS ESTE MODELO DE ACTUACION SERA PROBABLEMENTE EL UNICO POSIBLE EN UN FUTURO CERCANO, FINALMENTE, UN IMPACTO NADA DESPRECIABLE DEL PROYECTO TIENE QUE VER CON LA IMPLICACION DEL GRUPO EN DIVERSAS ESTRUCTURAS DE INVESTIGACION Y PROYECTOS GENOMICOS A GRAN ESCALA, EL GRUPO PERTENECE AL BARCELONA SUPERCOMPUTING CENTER, PRINCIPAL CENTRO DE SUPERCOMPUTACION EN ESPAÑA, MIEMBRO DE LA INFRAESTRUCTURA EUROPEA DE SUPERCOMPUTACION (PRACE), RESPONSABLE DE GESTION DE DATOS EN PROYECTOS COMO PCAWG Y EGA; AL INSTITUTO NACIONAL DE BIOINFORMATICA, CENTRO DE REFERENCIA DE LA BIOINFORMATICA EN ESPAÑA Y NODO ESPAÑOL DE ELIXIR, LA ESTRUCTURA QUE DICTA LAS NORMAS Y CRITERIOS PARA LA GESTION DE DATOS BIOLOGICOS A NIVEL EUROPEO, GENOMA\COMPRESIÓN\PRIVACIDAD\SEGURIDAD\ESTANDARIZACIÓN\MPEG\HL7\SALUD