Descripción del proyecto
EN LA MAYORIA DE LOS AMBITOS DE CONOCIMIENTO ES NECESARIO PROCESAR Y ANALIZAR ADECUADAMENTE LA CRECIENTE CANTIDAD DE DATOS DISPONIBLES, EL INFORME DE LA COMISION EUROPEA DE JULIO DE 2014 (TOWARDS A THRIVING DATA-DRIVEN ECONOMY) YA ESTABLECE QUE LOS DATOS ESTAN EN EL CENTRO DE LA SOCIEDAD Y LA ECONOMIA DEL CONOCIMIENTO, LA CIENCIA DE DATOS, EL AMBITO DEL CONOCIMIENTO QUE ENGLOBA LAS HABILIDADES ASOCIADAS AL PROCESAMIENTO DE DATOS, INCLUYENDO DATOS MASIVOS (BIG DATA), SE BASA EN TECNICAS Y TEORIAS DE CAMPOS COMO LAS CIENCIAS DE LA COMPUTACION, ESTADISTICA, RECONOCIMIENTO DE PATRONES Y APRENDIZAJE, COMPUTACION AVANZADA, VISUALIZACION, MODELADO DE LA INCERTIDUMBRE, ALMACENAMIENTO DE DATOS, INFORMATICA DE ALTO RENDIMIENTO, JUNTO CON EL CONOCIMIENTO EXPERTO SOBRE EL PROBLEMA CON EL OBJETIVO DE EXTRAER EL SIGNIFICADO DE DATOS Y CREAR PRODUCTOS DE DATOS, EL AVANCE EN DISPOSITIVOS DE GENERACION Y TRANSMISION DE INFORMACION HACE QUE LOS DATOS CREZCAN EN VOLUMEN Y COMPLEJIDAD, POR ELLO LOS METODOS DE CIENCIA DE DATOS DEBEN PROGRESAR HACIA NUEVAS PROPUESTAS EN CLASIFICACION, PREDICCION DE SERIES TEMPORALES Y DESCRIPCION DE SUBGRUPOS ESTANDAR, HACIA DESARROLLOS PARA TAREAS COMO EL DESCUBRIMIENTO DE PATRONES EMERGENTES Y EXCEPCIONES, Y TAMBIEN HACIA PROPUESTAS QUE AFRONTEN ADECUADAMENTE PROBLEMAS CON MAYOR COMPLEJIDAD COMO EL ANALISIS DE FLUJOS CONTINUOS DE DATOS, LOS DATOS DESBALANCEADOS O MULTIETIQUETA, EN GENERAL, EN EL CONTEXTO DE BIG DATA, QUE CADA VEZ CON MAYOR FRECUENCIA SE TIENE QUE AFRONTAR EN CIENCIA DE DATOS, SE DEBEN DISEÑAR ALGORITMOS QUE EXTRAIGAN CONOCIMIENTO DE CONJUNTOS DE DATOS DE GRAN VOLUMEN, NO NECESARIAMENTE ESTRUCTURADOS, CON VELOCIDAD, VARIABLES, CONSIDERANDO EL CARACTER VARIABLE DE LOS MISMOS Y CUESTIONES RELATIVAS A VERACIDAD, VALOR, ETC,, EN LO QUE DENOMINAN LAS V'S CARACTERISTICAS DE UN PROCESO DE CIENCIA DE DATOS CON DATOS MASIVOS,EN EL AREA DE CIENCIA DE DATOS SE HAN APLICADO PROFUSAMENTE LAS TECNICAS DE INTELIGENCIA COMPUTACIONAL PARA LA REPRESENTACION, EXTRACCION DE CONOCIMIENTO U OPTIMIZACION DEL MISMO: SISTEMAS BASADOS EN REGLAS DIFUSAS, APRENDIZAJE EVOLUTIVO O REDES NEURONALES, POR MENCIONAR ALGUNOS EJEMPLOS DE PARADIGMAS QUE DE FORMA INDEPENDIENTE O COMBINADA (MEDIANTE MEZCLA DE TECNICAS Y/O COMBINACIONES DE MODELOS -ENSEMBLES-) PERMITEN DISEÑAR ALGORITMOS DE EXTRACCION DE CONOCIMIENTO, LOS PROBLEMAS QUE SE ABORDAN EN CIENCIA DE DATOS, ESPECIALMENTE EN ANALISIS DE DATOS REALES, REPRESENTAN HABITUALMENTE UN NIVEL SUPERIOR DE COMPLEJIDAD, EN ESTAS SITUACIONES, EL APRENDIZAJE PROFUNDO (EN INGLES, DEEP LEARNING DL) ES UNA TECNICA QUE TIENE A SU DISPOSICION ESTE MOMENTO FACTORES QUE POTENCIAN SU USO EN EL DESARROLLO DE NUEVOS MODELOS DE CIENCIAS DE DATOS: EL DESARROLLO DE TECNOLOGIAS -HARDWARE Y SOFTWARE- PARA EL PROCESAMIENTO DISTRIBUIDO DE LA INFORMACION, EL INCREMENTO EN LA GENERACION Y ALMACENAMIENTO DE GRANDES VOLUMENES DE DATOS, Y LOS AVANCES CONSEGUIDOS EN EL PROCESAMIENTO DE LA INFORMACION, EL PROYECTO SE CENTRA EN EL DESARROLLO DE MODELOS DE CIENCIA DE DATOS PARA PROBLEMAS COMPLEJOS QUE INCLUYEN CLASIFICACION NO BALANCEADA, MULTIETIQUETA, ANALISIS DE FLUJOS CONTINUOS DE DATOS Y DATOS MASIVOS, CON TECNICAS DE INTELIGENCIA COMPUTACIONAL INCLUYENDO ARQUITECTURAS DE APRENDIZAJE DEEP LEARNING, PRESTAREMOS ESPECIAL ATENCION A LA TRANSFERENCIA DE LOS METODOS DESARROLLADOS, APLICANDOLOS A PROBLEMAS DEL AREA DE LA BIOMEDICINA, BIOTECNOLOGIA, ENERGIAS RENOVABLES Y EMPRESA, CIENCIA DE DATOS\INTELIGENCIA COMPUTACIONAL\APRENDIZAJE PROFUNDO\FLUJOS CONTÍNUOS DE DATOS\BIG DATA\APLICACIONES