Descripción del proyecto
LAS SIMULACIONES DE DINAMICA MOLECULAR GENERALMENTE SE HAN VISTO LIMITADAS POR LA PRECISION DE LOS CAMPOS DE FUERZA Y EL ELEVADO COSTE DE SIMULACION, LOS CAMPOS DE FUERZA DISPONIBLES SON MUY POCOS, Y SON UTILIZADOS POR LOS INVESTIGADORES PARA REALIZAR SIMULACIONES EXTREMADAMENTE LARGAS CON EL FIN DE MUESTREAR ESCALAS BIOLOGICAS, SI BIEN SE HAN DESARROLLADO CON EXITO CAMPOS DE FUERZA DE GRANO GRUESO MAS RAPIDOS, GENERALMENTE ESTOS SE OBTIENEN DE UNA MANERA AD-HOC IMPONIENDO LA FORMA FUNCIONAL DEL POTENCIAL DE GRANO GRUESO Y AJUSTANDO LOS PARAMETROS A POSTERIORI, DE HECHO, LOS CAMPOS DE FUERZA DE LA MECANICA MOLECULAR COMUNMENTE UTILIZADOS EN BIOLOGIA COMPUTACIONAL SON EJEMPLOS EXITOSOS DE ESTE PROCEDIMIENTO, SIN EMBARGO, ESTOS CAMPOS DE FUERZA TIENEN CLARAS LIMITACIONES, EN ESTE PROYECTO, PROPONEMOS REPENSAR LAS SIMULACIONES MOLECULARES DESDE EL PUNTO DE VISTA DEL APRENDIZAJE AUTOMATICO, COMO UNAS PARAMETRIZACIONES DE CAMPOS DE FUERZA Y DE INFERENCIA RAPIDA, DE ESTE MODO, PLANTEADA UNA CUESTION SOBRE UN SISTEMA MOLECULAR, SE ENTRENARIA UN POTENCIAL DE APRENDIZAJE AUTOMATICO ESPECIFICO PARA DICHO PROBLEMA, LO QUE LIMITARIA LA CANTIDAD DE RECURSOS COMPUTACIONALES NECESARIOS PARA REALIZAR LAS PREDICCIONES, ACTUALMENTE, EL PARADIGMA DE LAS SIMULACIONES MOLECULARES ES EL SIGUIENTE: 1) UN CAMPO DE FUERZA RARA VEZ SE PARAMETRIZA, Y LAS PARAMETRIZACIONES DISPONIBLES ESTAN HECHAS POR UN NUMERO PEQUEÑO DE GRUPOS DE INVESTIGACION 2) LA MAYOR PARTE DEL TIEMPO COMPUTACIONAL SE INVIERTE EN TOMAR DICHO CAMPO DE FUERZA Y ​​EJECUTAR TRAYECTORIAS MULTIPLES DURANTE PERIODOS LARGOS DE TIEMPO,EN ESTE PROYECTO, PROPONEMOS UN ENFOQUE MULTI-FISICO PARA QUE REALIZAR LA PARAMETRIZACION DE MODELOS FISICOS EN LA ESCALA CORRECTA SEA UN PROCEDIMIENTO RUTINARIO Y PODER GENERAR MODELOS PRECISOS DE APRENDIZAJE AUTOMATICO A PARTIR DE DATOS DE SIMULACION, DESARROLLAREMOS LAS METODOLOGIAS Y HERRAMIENTAS PARA ENTRENAR Y SIMULAR POTENCIALES MOLECULARES EFICIENTES, UTILIZANDO REDES NEURONALES ARTIFICIALES COMO APROXIMADORES UNIVERSALES DENTRO DE LOS ECOSISTEMAS ACEMD/OPENMM Y TORCHMD, DURANTE ESTE PROCESO, PRODUCIREMOS UNA CANTIDAD INGENTE DE DATOS QUE ESTARAN DISPONIBLES DE MANERA ABIERTA PARA LA COMUNIDAD CIENTIFICA,RECIENTEMENTE, HEMOS CONSEGUIDO DEMOSTRAR LA PARTE FUNDAMENTAL DE ESTA METODOLOGIA, EL METODO DE ENTRENAMIENTO DE EMPAREJAMIENTO DE FUERZAS, OBTENIENDO POTENCIALES DE REDES NEURONALES (NNP) QUE REDUCEN ALGUNOS DE LOS GRADOS DE LIBERTAD DE UN SISTEMA MOLECULAR, PERO AUN RETIENEN LA ENERGIA DEL SISTEMA ALL-ATOM, ACELERANDO LA DINAMICA,SI LOGRAMOS ESTA CONSTRUCCION DE GRANO FINO DE POTENCIALES MOLECULARES, PODREMOS ASPIRAR A RESOLVER MULTIPLES PROMESAS DE LA BIOLOGIA ESTRUCTURAL COMPUTACIONAL: PLEGAMIENTO DE PROTEINAS, UNION PROTEINA-LIGANDO, PROTEINAS DESORDENADAS, UNION PROTEINA-PROTEINA, CARACTERIZACIONES DE MOLECULAS PEQUEÑAS, ETC, ADEMAS, ESTE ENFOQUE TIENE EL POTENCIAL DE REUNIR RAMAS DE SIMULACIONES MOLECULARES QUE HAN DIVERGIDO CON EL TIEMPO, COMO SIMULACIONES CUANTICAS AB-INITIO (UTILIZADAS PRINCIPALMENTE PARA REACCIONES), SIMULACIONES MOLECULARES CLASICAS (UTILIZADAS PRINCIPALMENTE PARA PROTEINAS) Y SIMULACIONES DE GRANO GRUESO (UTILIZADAS PRINCIPALMENTE PARA SISTEMAS MULTIMOLECULARES), SIMULACIONES MOLECULARES\MACHINE LEARNING\CAMPOS DE FUERZA\PLEGAMIENTO Y INTERACCIONES DE PROTEINAS\REDES NEURONALES ARTIFICIALES\POTENCIALES MOLECULARES