ESTRECHANDO LA BRECHA ENTRE LA ESTADISTICA Y LA CIENCIA DE DATOS
UNO DE LOS GRANDES RETOS A LOS QUE SE ENFRENTA LA SOCIEDAD DEL SIGLO XXI ES LA ENORME CAPACIDAD DE GENERACION Y ALMACENAMIENTO DE DATOS LIGADOS A LA ECONOMIA Y LA SOCIEDAD DIGITAL, ES LO QUE SE CONOCE COMO BIG DATA, EN LOS ULTIMOS...
UNO DE LOS GRANDES RETOS A LOS QUE SE ENFRENTA LA SOCIEDAD DEL SIGLO XXI ES LA ENORME CAPACIDAD DE GENERACION Y ALMACENAMIENTO DE DATOS LIGADOS A LA ECONOMIA Y LA SOCIEDAD DIGITAL, ES LO QUE SE CONOCE COMO BIG DATA, EN LOS ULTIMOS AÑOS, SIN EMBARGO, LA POPULARIDAD DEL TERMMINO PARECE ESTAR DISMINUYENDO, MIENTRAS IRRUMPE CON FUERZA UN TERMINO RELACIONADO, DATA SCIENCE, COMO FORMA GENERICA DE REFERIRSE A LA DISCIPLINA CIENTIFICA EMERGENTE, A CABALLO ENTRE LAS MATEMATICAS, LA INFORMATICA Y LA ESTADISTICA, QUE TIENE POR OBJETIVO EXTRAER INFORMACION SIGNIFICATIVA DE LOS DATOS, MUCHOS ESTADISTICOS RECONOCEMOS NUESTRA PROPIA DISCIPLINA, LA ESTADISTICA, EN ESA DEFINICION, SIN EMBARGO, EL TERMINO DATA SCIENCE SE ASOCIA CON CONCEPTOS Y TECNICAS QUE SE HAN DESARROLLADO FUERA DEL CAMPO DE LA ESTADISTICA: BIG DATA, MACHINE LEARNING, ALGORITMOS PREDICTIVOS, DATOS COMPLEJOS (TEXTOS, IMAGENES, GRAFOS, ETC,), ENTRE OTROS, DESDE EL PUNTO DE VISTA DE LA ESTADISTICA, COMO DISCIPLINA CIENTIFICA, LA APARICION DEL CONCEPTO DATA SCIENCE SUPONE UN RETO Y UNA OPORTUNIDAD QUE EL COLECTIVO DE PROFESIONALES DE LA ESTADISTICA NO DEBEMOS DEJAR PASAR, DEBEMOS HACER PATENTE NUESTRA EXPERIENCIA CENTENARIA EN EL TRATAMIENTO Y ANALISIS DE CONJUNTOS DE DATOS DE MUY DIVERSOS TIPOS Y TAMAÑOS, LO QUE NOS LEGITIMA SOBRADAMENTE PARA PARTICIPAR EN LA NUEVA DISCIPLINA DATA SCIENCE, PERO TAMBIEN ES IMPRESCINDIBLE QUE LOS ESTADISTICOS ADQUIRAMOS LAS DESTREZAS NECESARIAS PARA PODER RESOLVER DE MANERA EFICIENTE LOS PROBLEMAS QUE ACTUALMENTE SE PLANTEAN AL ANALISTA DE DATOS: GRANDES VOLUMENES DE DATOS, BASES DE DATOS DISTRIBUIDAS (SISTEMAS DE FICHEROS HADOOP, POR EJEMPLO) QUE REQUIEREN COMPUTACION EN PARALELO (MODELO DE PROGRAMACION MAP-REDUCE, POR EJEMPLO), DATOS DE TIPO STREAMING (QUE LLEGAN DE FORMA ININTERRUMPIDA A LA BASE DE DATOS), NUEVOS PROBLEMAS (SISTEMAS DE RECOMENDACION, POR EJEMPLO), COMPLEJIDAD DE LOS DATOS (IMAGNES, GRAFOS, ), POR CITAR UNOS CUANTOS,LA FINALIDAD ULTIMA DE NUESTRO PROYECTO ES AVANZAR EN EL CAMINO HACIA LA CONVERGENCIA ENTRE ESTADISTICA Y DATA SCIENCE, SOMOS CONSCIENTES DE QUE ESTE CAMINO NO ES FACIL: NO PODEMOS CONFIAR QUE LAS TECNICAS ESTADISTICAS QUE HEMOS DESARROLLADO HASTA AHORA Y QUE HEMOS APLICADO A CONJUNTOS DE DATOS ESTANDARES (EN FORMA DE MATRIZ DE DATOS, CON TAMAÑOS MUESTRALES NO SUPERIORES A LAS DECENAS DE MILES DE INDIVIDUOS, QUE PODIAMOS CARGAR EN LA MEMORIA DE UN ORDENADOR PERSONAL) SEAN APLICABLES A CONJUNTOS DE DATOS MAS COMPLEJOS, O CON MILLONES DE INDIVIDUOS, DISTRIBUIDOS EN MULTIPLES ORDENADORES E IMPOSIBLES DE CARGAR EN MEMORIA), SABEMOS QUE TENDREMOS QUE UTILIZAR TECNICAS DE COMPUTACION DISTINTAS A LAS QUE VENIMOS USANDO, EN LAS QUE LA COMPUTACION EN PARALELO SEA PIEZA FUNDAMENTAL, A MEDIO Y LARGO PLAZO NOS PLANTEAMOS DOS OBJETIVOS PRINCIPALES, POR UN LADO, LA REALIZACION, BAJO LA CO-DIRECCION DE P, DELICADO Y DEL PROFESOR EDDIE SCHREVENS, DE LA TESIS DOCTORAL DE F, DE MENDIBURU (RECIEN COMENZADA), EN LA QUE SE LLEVARA A CABO EL ANALISIS DE LOS DATOS PROCEDENTES DE IMAGENES CAPTADAS POR DRONES, LA METODOLOGIA QUE SE PROPONE ES ANALISIS DE DATOS FUNCIONALES, POR EL OTRO, EXPLORAR TEMAS DE INVESTIGACION A CABALLO ENTRE ESTADISTICA Y DATA SCIENCE, Y CONCRETAMENTE ESTUDIAR LA IMPLEMENTACION DEL MULTIDIMENSIONAL SCALING EN SPARK, SIGUIENDO EL MODELO DE PROGRAMACION MAP-REDUCE, COMO BANCO DE PRUEBAS SE USARA LA BASE DE DATOS GORGOBASE, QUE CONTIENE UNOS 3 MILLONES DE PARTIDAS DE AJEDREZ, DATA SCIENCE\MAP-REDUCE\SPARK\IMÁGENES\DRONES\ANÁLSISI DE DATOS FUNCIONALES\MULTIDIMENSIONAL SCALING.ver más
Seleccionando "Aceptar todas las cookies" acepta el uso de cookies para ayudarnos a brindarle una mejor experiencia de usuario y para analizar el uso del sitio web. Al hacer clic en "Ajustar tus preferencias" puede elegir qué cookies permitir. Solo las cookies esenciales son necesarias para el correcto funcionamiento de nuestro sitio web y no se pueden rechazar.
Cookie settings
Nuestro sitio web almacena cuatro tipos de cookies. En cualquier momento puede elegir qué cookies acepta y cuáles rechaza. Puede obtener más información sobre qué son las cookies y qué tipos de cookies almacenamos en nuestra Política de cookies.
Son necesarias por razones técnicas. Sin ellas, este sitio web podría no funcionar correctamente.
Son necesarias para una funcionalidad específica en el sitio web. Sin ellos, algunas características pueden estar deshabilitadas.
Nos permite analizar el uso del sitio web y mejorar la experiencia del visitante.
Nos permite personalizar su experiencia y enviarle contenido y ofertas relevantes, en este sitio web y en otros sitios web.