Descripción del proyecto
ES CONOCIDO QUE EN LOS ULTIMOS AÑOS LOS AVANCES DE LA TECNOLOGIA HAN DADO LUGAR A QUE LA CANTIDAD DE DATOS QUE SE ESTA GENERANDO Y ALMACENANDO ES CADA VEZ MAYOR, HASTA EL PUNTO DE QUE EL 90% DE LOS DATOS EN EL MUNDO SE HAN GENERADO EN LOS ULTIMOS AÑOS,LA NECESIDAD DE PROCESAR ESTA INGENTE CANTIDAD HA HECHO IMPRESCINDIBLE LA EVOLUCION DE LAS HERRAMIENTAS QUE DURANTE LOS ULTIMOS AÑOS HEMOS INCLUIDO EN LA DENOMINACION DE MINERIA DE DATOS, ESTA EVOLUCION HA DADO LUGAR AL TERMINO BIG DATA, BIG DATA COMIENZA CON EL DESARROLLO DE HERRAMIENTAS CAPACES DE PROCESAR GRANDES CANTIDADES DE DATOS Y PROPORCIONAR UN VALOR ASOCIADO, COMO EL PARADIGMA MAPREDUCE DE GOOGLE, Y SU IMPLEMENTACION EN CODIGO ABIERTO HADOOP O MAS RECIENTE, LA PUESTA EN MARCHA DE HERRAMIENTA SPARK BAJO LA PLATAFORMA APACHE, EL INTERES DESPERTADO POR LAS TECNOLOGIAS BIG DATA EN EL MUNDO EMPRESARIAL HA CONSEGUIDO UN IMPORTANTE APOYO MEDIATICO, INCLUSO EN LA PRENSA GENERALISTA, Y DE LOS PODERES PUBLICOS, TANTO ESTADOS UNIDOS COMO LA UNION EUROPEA PROPUGNAN EL DESARROLLO DE METODOLOGIAS PARA EXTRAER INFORMACION UTIL DE BIG DATA EN SUS PLANES DE I+D+I, ESTE IMPULSO HA PROPICIADO QUE NUMEROSOS GRUPOS DE INVESTIGACION NACIONALES SE HAYAN PLANTEADO ESTA LINEA DE TRABAJO EN SUS PROYECTOS COMO DEMUESTRA LA ULTIMA CONVOCATORIA DEL PLAN NACIONAL DE I+D, NUESTRA PROPUESTA TIENE COMO OBJETIVO EL ANALISIS DE DATOS MASIVOS PERO CON LA PARTICULARIDAD DE QUE ESTEN INDEXADOS EN EL TIEMPO, ES DECIR, QUE UNA COMPONENTE ESENCIAL EN LA NATURALEZA DE LOS DATOS ES QUE SE HAYAN OBTENIDOS DEPENDIENDO DEL TIEMPO, ESTE CASO ES MUY COMUN EN EL AMBITO DEL BIG DATA, POR EJEMPLO, DOS DE LAS PRINCIPALES FUENTES DE BIG DATA SON LOS REPOSITORIOS DE DATOS ABIERTOS QUE PROPONE LA ADMINISTRACION, EN ARAS DE POLITICAS DE TRANSPARENCIA, Y LAS CIUDADES INTELIGENTES, DONDE MULTIPLES SENSORES PROPORCIONAN INFORMACION SOBRE CONSUMOS, TRAFICO, CONTAMINACION, ETC, ESTOS DOS TIPOS DE DATOS TIENEN SENTIDO SI SU ANALISIS SE REALIZA CON RESPECTO A SU EVOLUCION EN EL TIEMPO: LOS DATOS QUE MIDEN LA DEMANDA ELECTRICA O LA CONTAMINACION PUEDEN SER ANALIZADOS CON DIVERSOS OBJETIVOS: PARA PREDECIR SU EVOLUCION, PARA PREDECIR VALORES ANORMALES, PARA OBTENER PATRONES QUE NOS PERMITAN COMPARAR SU EVOLUCION CON OTROS DATOS, PARA ESTABLECER RELACIONES DE UNAS VARIABLES CON RESPECTO A OTRAS, ETC,DE ESTA MANERA PODEMOS CONCLUIR QUE SI BIEN EL ANALISIS DE DATOS MASIVOS INDEXADOS EN EL TIEMPO TIENE UNAS CARACTERISTICAS COMUNES CON LOS PROBLEMAS RESUELTOS MEDIANTE TECNOLOGIAS BIG DATA, TAMBIEN POSEE UNAS PARTICULARIDADES PROPIAS CUYA SOLUCION NOS PLANTEAMOS COMO OBJETIVO PRINCIPAL DE ESTE PROYECTO, CUATRO SON LOS SUBOBJETIVOS QUE SE PLANTEAN: PREDICCION DE VALORES FUTUROS, CLASIFICACION U OBTENCION DE PATRONES POR SIMILITUD, CLUSTERING DE DATOS CON RESPECTO AL TIEMPO Y OBTENCION DE PATRONES DE RELACION EN LAS VARIABLES DE SERIES TEMPORALES MULTIDIMENSIONALES, TODO ELLO BAJO UNA PERSPECTIVA BIG DATA,NUESTROS GRUPOS LLEVAN TRABAJANDO CONJUNTAMENTE EN EL AREA DE MINERIA DE DATOS MAS DE DIEZ AÑOS, CON EXPERIENCIA EN EL ANALISIS DE SERIES TEMPORALES EN DISTINTOS AMBITOS: SECTOR ELECTRICO, CONTAMINACION ATMOSFERICA, ANALISIS GENOMICO, ETC, DURANTE ESTOS AÑOS HEMOS PARTICIPADO EN NUMEROSOS PROYECTOS DEL PLAN NACIONAL Y DEL PLAN ANDALUZ DE INVESTIGACION SOBRE ESTAS TEMATICAS CON UNOS RESULTADOS DE PUBLICACIONES Y TRANSFERENCIA DE RESULTADOS NOTABLE, ANALISIS DE DATOS\MINERÍA DE DATOS\SERIES TEMPORALES