Descripción del proyecto
LA CIENCIA DE LOS DATOS SE REFIERE A UN AREA DE TRABAJO EMERGENTE QUE SE OCUPA DE LA RECOPILACION, PREPARACION, ANALISIS, VISUALIZACION, GESTION Y CONSERVACION DE GRANDES COLECCIONES DE INFORMACION, SE TRATA DE CAMPO INTERDISCIPLINARIO EN EL QUE INTERVIENEN METODOS DE ANALISIS DE DATOS COMO LA ESTADISTICA, LA MINERIA DE DATOS Y EL APRENDIZAJE AUTOMATICO PARA EXTRAER CONOCIMIENTO O MEJOR ENTENDIMIENTO DE LOS DATOS,LA EXISTENCIA DE CONJUNTOS DE DATOS TAN GRANDES QUE LA APLICACIONES INFORMATICAS TRADICIONALES NO SON CAPACES DE TRATAR, HA DADO ORIGEN A LO QUE SE CONOCE COMO BIG DATA, HOY DIA, EL BIG DATA SE REFIERE A DATOS CUYO VOLUMEN, DIVERSIDAD Y COMPLEJIDAD REQUIEREN EL USO DE NUEVAS ARQUITECTURAS, TECNICAS, ALGORITMOS Y ANALISIS PARA GESTIONAR Y EXTRAER EL VALOR OCULTO EN ELLOS, COMO CONCEPTO RELACIONADO, ENCONTRAMOS EL DESCUBRIMIENTO DE SMART DATA, QUE SE CONCIBE COMO UNA NUEVA GENERACION DE METODOLOGIAS QUE, PARTIENDO DE DATOS DE CALIDAD, PROPORCIONA A LOS USUARIOS LAS REVELACIONES MAS INTERESANTES SOBRE LOS DATOS,LA INFLUENCIA DE LAS TECNICAS DE INTELIGENCIA COMPUTACIONAL (SISTEMAS DIFUSOS, ALGORITMOS EVOLUTIVOS PARA OPTIMIZACION DE MODELOS DE APRENDIZAJE Y EL DEEP LEARNING BASADO EN REDES NEURONALES) ESTA BIEN ESTABLECIDA EN EL AREA DE CIENCIA DE DATOS, LA INCORPORACION DEL ENSAMBLADO Y CONSENSO DE ESTOS METODOS EN LA REPRESENTACION, APRENDIZAJE Y OPTIMIZACION DE MODELOS NOS PROPORCIONA HERRAMIENTAS POTENTES PARA LA EXTRACCION DE CONOCIMIENTO,ESTE PROYECTO SE ENFOCA EN EL DESARROLLO DE NUEVAS TECNICAS DE INTELIGENCIA COMPUTACIONAL Y DE PREPROCESAMIENTO DE DATOS EN ARAS DE GENERAR SMART DATA PARA ABORDAR DIFERENTES PROBLEMAS DE CIENCIA DE DATOS, DESDE UNA DOBLE PERSPECTIVA: EL DISEÑO DE MODELOS DESCRIPTIVOS Y PREDICTIVOS (INCLUYENDO TECNICAS DE DEEP LEARNING Y PROPONIENDO MODELOS PARA LOS NUEVOS RETOS), Y DESARROLLO DE SOLUCIONES BIG DATA (ALGORIMOS PARA EL ANALISIS DE DATOS MASIVOS),EL PROYECTO SE PLANTEA DESDE SEIS VERTIENTES: 1) DESARROLLO DE TECNICAS DE INTELIGENCIA COMPUTACIONAL, 2) DESARROLLOS EN VARIOS PROBLEMAS DE CIENCIA DE DATOS INCLUYENDO SOLUCIONES BIG DATA, 3) PREPROCESAMIENTO DE DATOS PARA CONSEGUIR SMART DATA, 4) ESTUDIOS EN EL ANALISIS DE EXPERIMENTOS, 5) APLICACIONES EN CUATRO PROBLEMAS, Y 6) DESARROLLO DE HERRAMIENTAS SOFTWARE, SE DAN MAS DETALLES A CONTINUACION, LAS TECNICAS DE INTELIGENCIA COMPUTACIONAL QUE UTILIZAREMOS, DESARROLLAREMOS O ADAPTAREMOS PARA PROBLEMAS DE CIENCIA DE DATOS SON LOS ALGORITMOS EVOLUTIVOS, LOS SISTEMAS DIFUSOS, LOS MODELOS DE ENSAMBLADO DE CLASIFICADORES Y DESCOMPOSICION DE PROBLEMAS Y LAS TECNICAS DE CONSENSO PARA PROBLEMAS CON PROCESOS DE FUSION,LOS PROBLEMAS DE CIENCIA DE DATOS Y BIG DATA SE ABORDAN DESDE UNA DOBLE PERSPECTIVA: A) PARA EL DESCUBRIMIENTO DE SMART DATA, NOS CENTRAMOS EN DATOS CON RUIDO Y REDUCCION, TRANSFORMACION Y AUMENTACION DE DATOS; B) DISEÑO DE MODELOS PREDICTIVOS Y DESCRIPTIVOS, UTILIZANDO TECNOLOGIAS BIG DATA SI ES PRECISO, PARA CLASIFICACION NO BALANCEADA, CLASIFICACION ORDINAL, FLUJO DE DATOS, APRENDIZAJE MULTI-INSTANCIA Y MULTI-ETIQUETA, CLASIFICACION CON ADVERSARIOS, CLASIFICACION DE IMAGENES, ASOCIACIONES Y DETECCION DE ANOMALIAS,EL RESTO DE ENFOQUES SON: DISEÑO DE EXPERIMENTOS Y ANALISIS DE ALGORITMOS, APLICACIONES REALES COMO EL ANALISIS DE BIO-SEÑALES, PREDICCION DE CONSUMO DE AGUA, DETECCION DE ARMAS EN VIDEO Y APLICACIONES EN BIOMEDICINA; Y EL DESARROLLO DE HERRAMIENTAS SOFTWARE QUE INCORPORAN LOS MODELOS DESARROLLADOS, CIENCIA DE DATOS\BIG DATA\SMART DATA\ANÁLISIS DE DATOS ESCALABLE\APRENDIZAJE AUTOMÁTICO DISTRIBUIDO\MINERÍA DE DATOS