Descripción del proyecto
DE LAS TRES VS QUE DEFINIERON INICIALMENTE BIG DATA, EL VOLUMEN ES QUIZAS LA CARACTERISTICA EN LA QUE LOS INVESTIGADORES HAN HECHO UN MAYOR ESFUERZO, CASI TODA LA TECNOLOGIA DESARROLLADA PERMITE DAR SOLUCIONES APROXIMADAS A LOS PROBLEMAS HABITUALES DEL ANALISIS DE DATOS MASIVOS, SIN EMBARGO, LA VELOCIDAD, A PESAR DE SER UNA CARACTERISTICA PRESENTE EN MUCHOS PROBLEMAS DE DATOS MASIVOS, NO HA TENIDO LA MISMA REPERCUSION, BIEN ES VERDAD, QUE EL ANALISIS DE FLUJOS DE DATOS O DATA STREAMING (DS) HA SIDO ESTUDIADO PROFUSAMENTE EN LA ULTIMA DECADA, CONOCIENDOSE TECNICAS QUE PERMITEN TENER ACTUALIZADO EN TODO MOMENTO UN MODELO, EL CUAL HA SIDO APRENDIDO A PARTIR DE UN CONJUNTO DE DATOS QUE RESUMEN DE MANERA APROPIADA EL DS, SIN EMBARGO, TENIENDO EN CUENTA LA PERSPECTIVA ACTUAL DEL BIG DATA SE PUEDEN IMPLEMENTAR NUEVAS SOLUCIONES, EN NUESTRO ANTERIOR PROYECTO, SE HA TRABAJADO CON GRANDES VOLUMENES DE DATOS QUE TIENEN UNA COMPONENTE TEMPORAL, EL PROYECTO QUE PRESENTAMOS ES LA CONTINUACION NATURAL DE LOS TRABAJOS REALIZADOS, EN LOS DS LA FRECUENCIA DE LLEGADA ES DESCONOCIDA, SUELE SER MUCHO MAYOR EN TASA POR UNIDAD DE TIEMPO Y LOS DATOS SUELEN TENER UNA RELACION FUNCIONAL MAS RELAJADA CON EL TIEMPO QUE EN LAS SERIES TEMPORALES, SIN EMBARGO, LOS CONOCIMIENTOS ADQUIRIDOS DURANTE EL DESARROLLO DEL PROYECTO ANTERIOR NOS PERMITEN PRESENTAR ESTE NUEVO PROYECTO CON EL PROPOSITO DE EXTENDER O ADAPTAR LAS TECNICAS DESARROLLADAS A PROBLEMAS CON DS,ASI PUES, NUESTRA PROPUESTA TIENE COMO OBJETIVO EL ANALISIS DE DATOS MASIVOS QUE SE RECIBEN DE FORMA CONTINUA Y QUE REQUIERE LA ACTUALIZACION DEL MODELO EN TIEMPO CUASI-REAL, ASI SE ESTUDIARAN Y DESARROLLARAN MODELOS Y TECNOLOGIAS PARA EL PREPROCESADO, ANALISIS Y EXPLOTACION DE DS, CON EL OBJETO FINAL DE CREAR SERVICIOS QUE GENEREN VALOR EN AMBITOS CONCRETOS EN LOS QUE SE PUEDEN APLICAR: EHEALTH, ENERGIA O SISMOLOGIA, LA METODOLOGIA ESTARA BASADA EN UN ESQUEMA PARA EL PROCESAMIENTO DE DS CONSISTENTE EN TENER UN MODELO BATCH INICIAL Y UN MODELO ONLINE QUE SE BASA EN LOS PATRONES DEL PRIMERO PARA SU CONTINUIDAD O MODIFICACION,LOS SUBOBJETIVOS ESPECIFICOS QUE SE PROPONEN EN ESTE SUBPROYECTO SON ACORDES CON NUESTRA EXPERIENCIA: PREPROCESADO, APRENDIZAJE NO SUPERVISADO Y APLICACIONES, EN PREPROCESADO, LA GENERACION DE NUEVOS ATRIBUTOS MEDIANTE LA EXTENSION DEL DEEP LEARNING A DS, EN LAS TAREAS DE APRENDIZAJE NO SUPERVISADO, TRABAJAREMOS EN MODELOS PARA REGLAS DE ASOCIACION CUANTITATIVAS, EN EL QUE EL GRUPO TIENE UNA LARGA TRAYECTORIA CON DATOS ESTACIONARIOS; Y EN CLUSTERING NUESTRO OBJETIVO SERA BUSCAR INDICES QUE NOS PERMITAN APROXIMAR EL NUMERO OPTIMO DE CLUSTERS, EN CUANTO A LAS APLICACIONES, LOS PROYECTOS DE TRANSFERENCIA EN EJECUCION Y LOS CONTACTOS ESTABLECIDOS CON LAS EMPRESAS INTERESADAS, NOS GARANTIZAN LA DISPOSICION DE DATOS EN LOS AMBITOS SEÑALADOS,NUESTRO GRUPO LLEVA TRABAJANDO EN EL AREA DE ANALISIS DE DATOS MAS DE QUINCE AÑOS, TANTO EN LA CREACION DE NUEVOS MODELOS COMO SU APLICACION EN DISTINTOS AMBITOS, DURANTE ESTOS AÑOS HEMOS PARTICIPADO DE MANERA CONTINUADA EN PROYECTOS DEL PLAN NACIONAL SOBRE ESTA TEMATICA CON UNOS RESULTADOS DE PUBLICACIONES Y TRANSFERENCIA QUE PODRIAN CALIFICARSE COMO NOTABLES, TIEMPO REAL\FLUJO DE DATOS\DATOS MASIVOS