Descripción del proyecto
EL ANALISIS INTELIGENTE DE DATOS HA ESTABLECIDO COMO ESTANDAR EL TERMINO CIENCIA DE DATOS, DEFINIDO COMO EL ESTUDIO DE LA EXTRACCION GENERALIZABLE DE CONOCIMIENTO DESDE LOS DATOS, SE PUEDE DECIR QUE EL TERMINO CIENCIA DE DATOS ES UNA EVOLUCION NATURAL DEL CAMPO DE MINERIA DE DATOS QUE ENGLOBA TODAS LAS TECNOLOGIAS RELACIONADAS CON BIG DATA, Y TODO EL TRABAJO RELACIONADO CON LA PREPARACION, ANALISIS, VISUALIZACION, GESTION Y MANTENIMIENTO DE GRANDES COLECCIONES DE DATOS PARA LA OBTENCION DE CONOCIMIENTO QUE GENERE VENTAJAS DE NEGOCIO,LA GRAN CANTIDAD DE DATOS DISPONIBLES JUNTO CON LAS HERRAMIENTAS CAPACES DE ANALIZARLOS Y PROCESARLOS ES LO QUE SE CONOCE COMO BIG DATA, DADA LA PROLIFERACION DE ESTAS GRANDES COLECCIONES DE DATOS, EL TERMINO BIG DATA SE UTILIZA FRECUENTEMENTE PARA DESIGNAR CONJUNTOS DE DATOS DE UN ELEVADO TAMAÑO, NO OBSTANTE, BIG DATA TAMBIEN SE REFIERE A DATOS CUYO VOLUMEN, DIVERSIDAD Y COMPLEJIDAD REQUIEREN EL USO DE NUEVAS ARQUITECTURAS, TECNICAS, ALGORITMOS Y ANALISIS PARA GESTIONAR Y EXTRAER EL VALOR Y CONOCIMIENTO OCULTO EN ELLOS,LA IMPORTANCIA DE LAS TECNICAS DE INTELIGENCIA COMPUTACIONAL (SISTEMAS DIFUSOS, ALGORITMOS EVOLUTIVOS PARA OPTIMIZACION DE MODELOS DE APRENDIZAJE, O CONJUNTOS RUGOSOS) ESTA BIEN ESTABLECIDA EN EL AREA DE CIENCIA DE DATOS, LA FUSION DE ESTOS METODOS NOS PROPORCIONA HERRAMIENTAS POTENTES PARA LA EXTRACCION DE CONOCIMIENTO, INCORPORADAS EN LA REPRESENTACION, APRENDIZAJE Y OPTIMIZACION DE LOS MODELOS,EL PROYECTO SE ENFOCA EN EL DESARROLLO DE NUEVAS TECNICAS DE INTELIGENCIA COMPUTACIONAL Y APRENDIZAJE AUTOMATICO DE DIFERENTES PROBLEMAS, DESDE UNA TRIPLE PERSPECTIVA: PREPROCESAMIENTO DE DATOS, DISEÑO DE MODELOS PREDICTIVOS Y DESCRIPTIVOS (ANALIZANDO LAS CARACTERISTICAS DE LOS DATOS, Y PROPONIENDO MODELOS PARA LOS NUEVOS RETOS), Y DESARROLLO DE SOLUCIONES BIG DATA (ALGORIMOS PARA EL ANALISIS DE DATOS MASIVOS),EL PROYECTO SE PLANTEA DESDE SEIS EJES: 1) DESARROLLO DE TECNICAS DE INTELIGENCIA COMPUTACIONAL, 2) DISEÑO DE MODELOS EN PROBLEMAS DE CIENCIA DE DATOS, 3) DISEÑO DE ALGORITMOS PARA BIG DATA, 4) ESTUDIOS EN EL DISEÑO Y ANALISIS DE EXPERIMENTOS, 5) APLICACIONES EN TRES PROBLEMAS, Y 6) DESARROLLO DE HERRAMIENTAS SOFTWARE, EN LOS SIGUIENTES TRES PARRAFOS LOS DESCRIBIMOS, LAS TECNICAS DE INTELIGENCIA COMPUTACIONAL QUE UTILIZAREMOS, DESARROLLAREMOS O ADAPTAREMOS PARA PROBLEMAS DE CIENCIA DE DATOS SON: ALGORITMOS EVOLUTIVOS, LOS SISTEMAS DIFUSOS EVOLUTIVOS, LA TEORIA DE CONJUNTOS RUGOSOS, LOS MODELOS DE COMBINACION DE CLASIFICADORES (COEVOLUCION Y DESCOMPOSICION EN PAREJAS DE CLASES) Y EL APRENDIZAJE A PARTIR DE UNA CLASE,LOS PROBLEMAS DE CIENCIA DE DATOS Y BIG DATA SE ABORDAN DESDE UNA TRIPLE PERSPECTIVA: A) EN PREPROCESAMIENTO NOS CENTRAMOS EN DATOS IMPERFECTOS Y REDUCCION DE DATOS; B) DISEÑO DE MODELOS PREDICTIVOS Y DESCRIPTIVOS PARA CLASIFICACION NO BALANCEADA, CLASIFICACION MONOTONICA, FLUJO DE DATOS, APRENDIZAJE MULTI-INSTANCIA, APRENDIZAJE SEMI-SUPERVISADO Y ASOCIACIONES; C) SOLUCIONES BIG DATA PARA EL DISEÑO DE MODELOS BASADOS EN REGLAS, PREPROCESAMIENTO DE DATOS MASIVOS, Y ESTUDIOS PARA LOS PROBLEMAS MENCIONADOS EN CIENCIA DE DATOS UTILIZANDO TECNOLOGIAS BIG DATA,Y LOS 3 EJES RESTANTES SE PLANTEAN COMO: DISEÑO DE EXPERIMENTOS Y ANALISIS DE ALGORITMOS, APLICACIONES REALES COMO LA CLASIFICACION DE HUELLAS DACTILARES, GESTION EMPRESARIAL Y FLUJOS DE DATOS PARA PSICOFISIOLOGIA; Y EL DESARROLLO DE HERRAMIENTAS SOFTWARE DE CODIGO ABIERTO QUE INTEGRAN LOS MODELOS DESARROLLADOS, CIENCIA DE DATOS\INTELIGENCIA COMPUTACIONAL\BIG DATA