Descripción del proyecto
MAS ALLA DE TODOS LOS DESAFIOS TECNICOS QUE SUPUSO LA ERA DEL BIG DATA, EN TERMINOS DE CAPACIDAD DE ALMACENAMIENTO Y GESTION DE DATOS, EL DISEÑO Y LA IMPLEMENTACION DE NUEVOS ENFOQUES PARA EL ANALISIS Y LA INFERENCIA DE DATOS HA LLAMADO INEVITABLEMENTE LA ATENCION DE LOS GRUPOS DE INVESTIGACION ESTADISTICA QUE TRABAJAN EN LA INTERFAZ ENTRE ESTADISTICA Y APRENDIZAJE AUTOMATICO, DEDICADO AL DISEÑO E IMPLEMENTACION DE HERRAMIENTAS ESTADISTICAS PARA EL MANEJO DE DATOS DE ALTA DIMENSION. SIN EMBARGO, TRABAJAR CON GRANDES CANTIDADES DE DATOS NO ES EL UNICO PROBLEMA QUE NOSOTROS, COMO PROFESIONALES DE LA ESTADISTICA, DEBEMOS ENFRENTAR PARA EXTRAER INFORMACION DE LOS DATOS DE MANERA EFECTIVA. LOS DATOS NO SOLO SON BIG, SINO TAMBIEN COMPLEJOS; Y LA COMPLEJIDAD SURGE NO SOLO POR SU NATURALEZA, SINO TAMBIEN POR LA DINAMICA QUE SIGUEN. NUESTRA PROPUESTA, DINAMICA COMPLEJA E INFERENCIA NO PARAMETRICA (CODYNP) TIENE COMO OBJETIVO PROPORCIONAR HERRAMIENTAS NO PARAMETRICAS PARA COMPRENDER LA EVOLUCION, DEPENDENCIA Y RELACIONES (DINAMICAS) DE DATOS EN ENTORNOS NO ESTANDAR (DATOS INCOMPLETOS Y AGREGADOS, FUNCIONALES, DIRECCIONALES Y ESPACIO-TEMPORALES). CODYNP SE ESTRUCTURA EN CUATRO PAQUETES DE TRABAJO, CUYO DISEÑO NOS PERMITE SEGUIR EXPLOTANDO NUESTRAS CAPACIDADES Y CONOCIMIENTOS EN DIFERENTES AREAS (POR EJEMPLO, ANALISIS DE DATOS FUNCIONALES O DIRECCIONALES), ASI COMO EXPLORAR NUEVAS METODOLOGIAS Y CONTEXTOS DE APLICACIONES (POR EJEMPLO, METODOS DE CORRELACION DISTANCIA, REGRESION MODAL O REDES ESTRUCTURAS). CODYNP SE ESTRUCTURA EN 4 PAQUETES DE TRABAJO. EN EL PRIMERO, LAS LINEAS SURGEN SEGUN LA NATURALEZA DE LOS DATOS: DATOS INCOMPLETOS (INCLUIDOS DATOS SESGADOS, TRUNCADOS Y / O CENSURADOS, ASI COMO DATOS FALTANTES; L1.1) Y DATOS AGREGADOS; DATOS FUNCIONALES Y DE ALTA DIMENSION (L1.2); DATOS DIRECCIONALES (CON DATOS CIRCULARES, CILINDRICOS Y TOROIDALES COMO CASOS PARTICULARES / DERIVADOS; L1.3); Y PROCESOS ESPACIO-TEMPORALES (L1.4). EL SEGUNDO PAQUETE, INFERENCIA NO PARAMETRICA, ESTA CONFIGURADO POR TRES LINEAS DE INVESTIGACION DEDICADAS A LA ESTIMACION DE CONJUNTOS (L2.1); METODOS MAS ALLA DE LA REGRESION MEDIA (L2.2) Y LA DISTANCIA DE CORRELACION (L2.3). DENTRO DE WP3. SOFTWARE, NUESTRO OBJETIVO ES ACTUALIZAR Y MEJORAR NUESTROS PAQUETES R RELACIONADOS CON LAS LINEAS DE INVESTIGACION EN WP1 Y WP2, A SABER, ALPHAHULL Y ALPHAHULL3D PARA ESTIMACION DE CONJUNTOS; NPCIRC PARA DATOS CIRCULARES; DOVALIDACION DE DATOS INCOMPLETOS Y AGREGADOS; MULTIMODO PARA PRUEBAS DE MULTIMODALIDAD, FDA.USC PARA DATOS FUNCIONALES Y EL MAS RECIENTE (HDIR) PARA REGIONES DIRECCIONALES DE ALTA DENSIDAD. TAMBIEN PRETENDEMOS PRODUCIR AL MENOS UN PAQUETE SOBRE REGRESION CUANTILICA (BWQUANT) Y OTRO SOBRE COMPARACIONES ROC. RESPECTO A WP4. APLICACION DE DATOS, DESCRIBIREMOS ALGUNAS AREAS DE APLICACION DENTRO DE LAS COLABORACIONES EN CURSO CON OTROS GRUPOS (COVID-19, IMAGEN MEDICA, GENETICA, CIENCIAS AMBIENTALES, ECOLOGIA, SEGURIDAD, LINGUISTICA) TODAS ELLAS DIRECTAMENTE RELACIONADAS CON AREAS DE INTERVENCION EN EL PILAR 2 DE HORIZONTE EUROPA (Y CONSECUENTEMENTE, CON LA ESTRATEGIA ESPAÑOLA DE CIENCIA, TECNOLOGIA E INNOVACION). NFERENCIA NO PARAMETRICA\PROCESOS ESPACIALES\ESTIMACION DE CONJUNTOS\CONTRASTES DE ESPECIFICACION\DATOS INCOMPLETOS\REGRESION CUANTIL\REGRESION MODAL\DATOS DIRECCIONALES\DATOS FUNCIONALES