Descripción del proyecto
EN EL ANALISIS DE DATOS CADA VEZ ES MAS FRECUENTE QUE LA MUESTRA QUE SE ANALIZA ESTE FORMADA POR UNIDADES MUESTRALES QUE NO RESPONDEN AL CONCEPTO ESTADISTICO CLASICO DE INDIVIDUO FISICO EN EL QUE SE HAN MEDIDO UNA O VARIAS VARIABLES DE INTERES, ES YA HABITUAL QUE CADA UNIDAD MUESTRAL REPRESENTE UN SUBCONJUNTO DE DATOS INDIVIDUALES, DE RANGO INFERIOR, CUYA INFORMACION HA SIDO AGREGADA PARA DAR LUGAR A LAS UNIDADES MUESTRALES QUE CONFORMAN LA MUESTRA EN ESTUDIO, DURANTE LOS ULTIMOS OCHO AÑOS LOS MIEMBROS DEL EQUIPO DE INVESTIGACION HEMOS ADQUIRIDO EXPERIENCIA EN EL ANALISIS ESTADISTICO DE SITUACIONES QUE SE ENMARCAN DENTRO DE ESTE ESQUEMA JERARQUICO DE MUESTRAS DE MUESTRAS, EN CONCRETO HEMOS TRABAJADO EN EL ANALISIS DE DATOS FUNCIONALES, CON FUNCIONES COMO DENSIDADES DE PROBABILIDAD QUE RESUMEN LA INFORMACION DE MUESTRAS DE RANGO INFERIOR, EN EL ANALISIS DE RESULTADOS ELECTORALES A NIVEL DE AREA PEQUEÑA Y EN EL ANALISIS DE DATOS TEXTUALES, DONDE A NIVEL SUPERIOR LOS DATOS SON DISTRIBUCIONES DISCRETAS Y A NIVEL INFERIOR LAS UNIDADES MUESTRALES SON LOS ELECTORES DE CADA AREA O LAS PALABRAS UTILIZADAS EN CADA CAPITULO, EN ESTE MISMO CONTEXTO DE ANALISIS DE MUESTRAS DE MUESTRAS SE ENMARCARIA POR EJEMPLO EL ANALISIS DE GRAFOS DE REDES SOCIALES O DE PAGINAS WEB, LOS OBJETOS ESTADISTICOS QUE SE OBTIENEN COMO RESUMEN DE LAS MUESTRAS DE NIVEL INFERIOR Y QUE CONFORMAN LA MUESTRA DE NIVEL SUPERIOR PUEDEN SER MUY COMPLEJOS Y DE DIFICIL TRATAMIENTO, EN PARTICULAR NO SIEMPRE SERA POSIBLE DEFINIR SOBRE ELLOS UN PRODUCTO ESCALAR AUNQUE EN MUCHOS CASOS SI SE PODRA DEFINIR UNA MEDIDA DE DISTANCIA ENTRE ELLOS, TAMBIEN OBSERVAMOS QUE CONJUNTOS DE DATOS DE CONTEXTOS MUY DIFERENTES, CON INDIVIDUOS DE RANGO INFERIOR COMPLETAMENTE DISTINTOS, DAN LUGAR A MUESTRAS DE RANGO SUPERIOR DEL MISMO TIPO, CONSIDERAMOS QUE EL ANALISIS DE MUESTRAS DE MUESTRAS ES UN BUEN PUNTO DE PARTIDA PARA ENFOCAR EL ANALISIS DE LOS BIG DATA, EL TRATAMIENTO DE BIG DATA A MENUDO REQUIERE LA AGREGACION DE DATOS INDIVIDUALES BIEN PORQUE LA BASE DE DATOS NO SE ALMACENA EN UN UNICO SERVIDOR, BIEN PORQUE EL TAMAÑO DE LA BASE DE DATOS (DIGAMOS N) PUEDE HACER RECOMENDABLE SU PARTICION EN SUBMUESTRAS (DIGAMOS K) DE PEQUEÑO TAMAÑO (N, CON N=KN), EL ANALISIS INDIVIDUAL DE CADA UNA DE LAS K SUBMUESTRAS Y LA CONSIGUIENTE TRANSFORMACION DE LA INFORMACION QUE CONTIENE EN UN HIPER-DATO, PERMITE PASAR DE UNA MUESTRA DE N INDIVIDUOS PRIMARIOS A UNA MUESTRA DE K UNIDADES ESTADISTICAS DE ORDEN SUPERIOR, NUESTRA FINALIDAD ES AVANZAR PARTIENDO DE NUESTRO TRABAJO EN EL ANALISIS DE MUESTRAS DE MUESTRAS HACIA EL ANALISIS ESTADISTICO DE BIG DATA, PARA REALIZAR ESTA TRANSICION DE FORMA SUAVE, QUEREMOS AMPLIAR EL RANGO DE APLICACIONES EN LAS QUE PONER A PRUEBA NUESTRAS PROPUESTAS (AÑANDIENDO DATOS DE DISTRIBUCION DE LA RENTA Y GRAFOS DE TAMAÑO MEDIO), TRABAJAR CON NUEVAS BASES DE DATOS (DATOS DEMOGRAFICOS, MICRO-DATOS DE RENTA, CONTEO DE ESPECIES EN ECOLOGIA, Y REPOSITORIOS DE GRAFOS) Y PLANTEARNOS PROBLEMAS CON ESTRUCTURA MAS GENERAL QUE LOS TRATADOS HASTA AHORA (DATOS FUNCIONALES QUE DEPENDEN DE DOS ARGUMENTOS, OBSERVACION CONJUNTA DE R DISTRIBUCIONES DISCRETAS EN CADA UNIDAD MUESTRAL DE RANGO SUPERIOR, PERMITIR DEPENDENCIA TEMPORAL O ESPACIAL ENTRE DATOS), BIG DATA\ DATOS ELECTORALES\ DATOS FUNCIONALES\ DATOS TEXTUALES\ DISTRIBUCIÓN DEL GRADO DE NODOS\ DISTRIBUCIONES DISCRETAS\ GRAFO\ INFERENCIA ECOLÓGICA\ REDUCCIÓN DE LA DIMENSIÓN\ RENTA PERSONAL