Innovating Works

MTM2017-88142-P

Financiado
ESTRECHANDO LA BRECHA ENTRE LA ESTADISTICA Y LA CIENCIA DE DATOS
UNO DE LOS GRANDES RETOS A LOS QUE SE ENFRENTA LA SOCIEDAD DEL SIGLO XXI ES LA ENORME CAPACIDAD DE GENERACION Y ALMACENAMIENTO DE DATOS LIGADOS A LA ECONOMIA Y LA SOCIEDAD DIGITAL, ES LO QUE SE CONOCE COMO BIG DATA, EN LOS ULTIMOS... UNO DE LOS GRANDES RETOS A LOS QUE SE ENFRENTA LA SOCIEDAD DEL SIGLO XXI ES LA ENORME CAPACIDAD DE GENERACION Y ALMACENAMIENTO DE DATOS LIGADOS A LA ECONOMIA Y LA SOCIEDAD DIGITAL, ES LO QUE SE CONOCE COMO BIG DATA, EN LOS ULTIMOS AÑOS, SIN EMBARGO, LA POPULARIDAD DEL TERMMINO PARECE ESTAR DISMINUYENDO, MIENTRAS IRRUMPE CON FUERZA UN TERMINO RELACIONADO, “DATA SCIENCE”, COMO FORMA GENERICA DE REFERIRSE A LA DISCIPLINA CIENTIFICA EMERGENTE, A CABALLO ENTRE LAS MATEMATICAS, LA INFORMATICA Y LA ESTADISTICA, QUE TIENE POR OBJETIVO EXTRAER INFORMACION SIGNIFICATIVA DE LOS DATOS, MUCHOS ESTADISTICOS RECONOCEMOS NUESTRA PROPIA DISCIPLINA, LA ESTADISTICA, EN ESA DEFINICION, SIN EMBARGO, EL TERMINO DATA SCIENCE SE ASOCIA CON CONCEPTOS Y TECNICAS QUE SE HAN DESARROLLADO FUERA DEL CAMPO DE LA ESTADISTICA: BIG DATA, MACHINE LEARNING, ALGORITMOS PREDICTIVOS, DATOS COMPLEJOS (TEXTOS, IMAGENES, GRAFOS, ETC,), ENTRE OTROS, DESDE EL PUNTO DE VISTA DE LA ESTADISTICA, COMO DISCIPLINA CIENTIFICA, LA APARICION DEL CONCEPTO DATA SCIENCE SUPONE UN RETO Y UNA OPORTUNIDAD QUE EL COLECTIVO DE PROFESIONALES DE LA ESTADISTICA NO DEBEMOS DEJAR PASAR, DEBEMOS HACER PATENTE NUESTRA EXPERIENCIA CENTENARIA EN EL TRATAMIENTO Y ANALISIS DE CONJUNTOS DE DATOS DE MUY DIVERSOS TIPOS Y TAMAÑOS, LO QUE NOS LEGITIMA SOBRADAMENTE PARA PARTICIPAR EN LA NUEVA DISCIPLINA DATA SCIENCE, PERO TAMBIEN ES IMPRESCINDIBLE QUE LOS ESTADISTICOS ADQUIRAMOS LAS DESTREZAS NECESARIAS PARA PODER RESOLVER DE MANERA EFICIENTE LOS PROBLEMAS QUE ACTUALMENTE SE PLANTEAN AL ANALISTA DE DATOS: GRANDES VOLUMENES DE DATOS, BASES DE DATOS DISTRIBUIDAS (SISTEMAS DE FICHEROS HADOOP, POR EJEMPLO) QUE REQUIEREN COMPUTACION EN PARALELO (MODELO DE PROGRAMACION MAP-REDUCE, POR EJEMPLO), DATOS DE TIPO STREAMING (QUE LLEGAN DE FORMA ININTERRUMPIDA A LA BASE DE DATOS), NUEVOS PROBLEMAS (SISTEMAS DE RECOMENDACION, POR EJEMPLO), COMPLEJIDAD DE LOS DATOS (IMAGNES, GRAFOS, …), POR CITAR UNOS CUANTOS,LA FINALIDAD ULTIMA DE NUESTRO PROYECTO ES AVANZAR EN EL CAMINO HACIA LA CONVERGENCIA ENTRE ESTADISTICA Y DATA SCIENCE, SOMOS CONSCIENTES DE QUE ESTE CAMINO NO ES FACIL: NO PODEMOS CONFIAR QUE LAS TECNICAS ESTADISTICAS QUE HEMOS DESARROLLADO HASTA AHORA Y QUE HEMOS APLICADO A CONJUNTOS DE DATOS ESTANDARES (EN FORMA DE MATRIZ DE DATOS, CON TAMAÑOS MUESTRALES NO SUPERIORES A LAS DECENAS DE MILES DE INDIVIDUOS, QUE PODIAMOS CARGAR EN LA MEMORIA DE UN ORDENADOR PERSONAL) SEAN APLICABLES A CONJUNTOS DE DATOS MAS COMPLEJOS, O CON MILLONES DE INDIVIDUOS, DISTRIBUIDOS EN MULTIPLES ORDENADORES E IMPOSIBLES DE CARGAR EN MEMORIA), SABEMOS QUE TENDREMOS QUE UTILIZAR TECNICAS DE COMPUTACION DISTINTAS A LAS QUE VENIMOS USANDO, EN LAS QUE LA COMPUTACION EN PARALELO SEA PIEZA FUNDAMENTAL, A MEDIO Y LARGO PLAZO NOS PLANTEAMOS DOS OBJETIVOS PRINCIPALES, POR UN LADO, LA REALIZACION, BAJO LA CO-DIRECCION DE P, DELICADO Y DEL PROFESOR EDDIE SCHREVENS, DE LA TESIS DOCTORAL DE F, DE MENDIBURU (RECIEN COMENZADA), EN LA QUE SE LLEVARA A CABO EL ANALISIS DE LOS DATOS PROCEDENTES DE IMAGENES CAPTADAS POR DRONES, LA METODOLOGIA QUE SE PROPONE ES ANALISIS DE DATOS FUNCIONALES, POR EL OTRO, EXPLORAR TEMAS DE INVESTIGACION A CABALLO ENTRE ESTADISTICA Y DATA SCIENCE, Y CONCRETAMENTE ESTUDIAR LA IMPLEMENTACION DEL MULTIDIMENSIONAL SCALING EN SPARK, SIGUIENDO EL MODELO DE PROGRAMACION MAP-REDUCE, COMO BANCO DE PRUEBAS SE USARA LA BASE DE DATOS GORGOBASE, QUE CONTIENE UNOS 3 MILLONES DE PARTIDAS DE AJEDREZ, DATA SCIENCE\MAP-REDUCE\SPARK\IMÁGENES\DRONES\ANÁLSISI DE DATOS FUNCIONALES\MULTIDIMENSIONAL SCALING. ver más
01/01/2017
UPC
6K€
Perfil tecnológico estimado

Línea de financiación: concedida

El organismo AGENCIA ESTATAL DE INVESTIGACIÓN notifico la concesión del proyecto el día 2017-01-01
Presupuesto El presupuesto total del proyecto asciende a 6K€
Líder del proyecto
Universidad Politécnica de Cataluña No se ha especificado una descripción o un objeto social para esta compañía.
Total investigadores 9