Descripción del proyecto
UNO DE LOS MOTIVOS FUNDAMENTALES DEL NOTABLE DESARROLLO ACTUAL DE LAS TECNICAS DE CLASIFICACION Y VALIDACION RESIDE EN EL VERTIGINOSO AVANCE DE LA INFORMATICA Y LAS TECNOLOGIAS DE LA INFORMACION, QUE PROPORCIONAN HERRAMIENTAS EFICIENTES DE ADQUISICION, ALMACENAMIENTO Y TRATAMIENTO DE DATOS, PERO QUE TAMBIEN DA LUGAR A NECESIDADES DE TRATAMIENTO DE CONJUNTOS DE DATOS CON CRECIENTE NIVEL DE COMPLEJIDAD. ES MUY COMUN DISPONER DE DATOS CON MUY DIVERSAS ESTRUCTURAS, ALTA DIMENSIONALIDAD, DATOS ANOMALOS Y FALTANTES, ASI COMO CON OTROS CONDICIONANTES QUE DEBEN TAMBIEN SER TENIDOS EN CUENTA. ASI, ES BIEN SABIDO QUE LA PRESENCIA DE DATOS ANOMALOS PUEDE PRODUCIR SERIOS DESAJUSTES EN LOS PROCEDIMIENTOS DE CLASIFICACION Y VALIDACION CLASICOS, SIENDO LA DETECCION DE PATRONES ANOMALOS INCLUSO UN OBJETIVO EN SI MISMO POR SU POSIBLE INTERES A NIVEL CIENTIFICO. SIRVA IGUALMENTE DE EJEMPLO DESTACADO, ENTRE LOS CONDICIONANTES REQUERIDOS AL APLICAR TECNICAS DE CLASIFICACION, LAS CONDICIONES DE EQUIDAD RESPECTO A VARIABLES PROTEGIDAS (SEXO, RAZA,
), CADA VEZ MAS DEMANDADAS. EN DEFINITIVA, EL ESTUDIO Y DESARROLLO DE PROCEDIMIENTOS CAPACES DE TRATAR ESTAS NUEVAS COMPLEJIDADES RESULTAN FUNDAMENTALES POR SU GRAN REPERCUSION TANTO CIENTIFICA COMO SOCIAL. NUESTRA PROPUESTA, CON EL APOYO DE LOS DIFERENTES ENFOQUES Y TECNICAS YA EXISTENTES, SERA LA APLICACION Y ADAPTACION DE PRINCIPIOS RELATIVOS A LAS TECNICAS DE RECORTE Y METRICAS PROBABILISTICAS, QUE SUPONEN EL HILO CONDUCTOR DE LOS PROYECTOS PREVIOS DE INVESTIGACION DEL EQUIPO.ESTE PROYECTO ESTA BASADO EN LA CONTINUACION DE LINEAS PREVIAS DE TRABAJO CARACTERISTICAS DE LOS INTEGRANTES DEL EQUIPO DE INVESTIGACION, AVALADAS POR UNA FRUCTIFERA TRAYECTORIA DE INVESTIGACION CONJUNTA INICIADA HACE YA MAS DE 30 AÑOS. SE PRETENDE LOGRAR ADAPTACIONES Y AMPLIACIONES DE ESTAS LINEAS ORIENTANDOLAS HACIA EL DESARROLLO DE METODOLOGIAS DE CLASIFICACION Y VALIDACION APLICABLES ANTE DATOS COMPLEJOS EN EL AMBITO DE LA CIENCIA DE DATOS. COMO YA ES HABITUAL EN NUESTRO EQUIPO DE INVESTIGACION, SE PRETENDE PARTIR DE ASPECTOS FORMALES Y TEORICOS DE LA PROBABILIDAD Y ESTADISTICA MATEMATICA, PERO DESDE UNA PERSPECTIVA CON FUERTE COMPONENTE DE APLICABILIDAD.LAS LINEAS FUNDAMENTALES ALREDEDOR DE LAS QUE SE ARTICULA EL PROYECTO SON: ROBUSTEZ EN CLASIFICACION NO-SUPERVISADA (DATOS ESTRUCTURADOS Y ALTA DIMENSIONALIDAD, RECORTES POR CELDAS, DATOS FUNCIONALES, ELECCION DE PARAMETROS E IMPLEMENTACION EFICIENTE), TRANSPORTE OPTIMO PARA LA CIENCIA DE DATOS (DISEÑO DE ALGORITMOS, DIFERENCIAS PRINCIPALES ENTRE POBLACIONES, TEORIA DISTRIBUCIONAL PARA EL TRANSPORTE OPTIMO, ESTIMACION DE LA APLICACION DE TRANSPORTE OPTIMO, APRENDIZAJE ROBUSTO BASADO EN TRANSPORTE OPTIMO, TRANSPORTE OPTIMO EN FAIR LEARNING) Y TECNICAS DE VALIDACION, ALINEAMIENTO Y META-ANALISIS (VALIDACION ESENCIAL DE MODELOS, TRANSFER LEARNING PARA CITOMETRIAS DE FLUJO, VALIDACION EN DATOS FUNCIONALES, CLASIFICACION PERFECTA DE DATOS FUNCIONALES).EL EQUIPO DE INVESTIGACION ESTA CONSTITUIDO POR LOS PROFESORES E. DEL BARRIO (IP), L.A. GARCIA-ESCUDERO (IP), P.C ALVAREZ-ESTEBAN, A. GORDALIZA, C. MATRAN, Y A. MAYO-ISCAR DE LA UNIVERSIDAD DE VALLADOLID Y EL PROFESOR J. A. CUESTA-ALBERTOS DE LA UNIVERSIDAD DE CANTABRIA. EL EQUIPO DE TRABAJO INCLUYE A LOS INVESTIGADORES A. GONZALEZ-SANZ, P. GORDALIZA, F. GRESELIN, M. HALLIN, J.M. LOUBES, D. RODRIGUEZ-VITORES Y M. RIANI. NALISIS CLUSTER\APRENDIZAJE JUSTO\RECORTES\METRICAS PROBABILISTICAS\ROBUSTEZ\VALIDACION DE MODELOS\TRANSPORTE OPTIMO