Descripción del proyecto
ESTE PROYECTO ABORDA RETOS FUNDAMENTALES EN LAS TECNOLOGIAS DE PROTECCION DE LA PRIVACIDAD RELACIONADOS CON LA REVELACION ESTADISTICA DE DATOS SENSIBLES EN LA PUBLICACION DE ENCUESTAS, O DE CUALQUIER BASE DE DATOS QUE COMBINE DATOS DEMOGRAFICOS Y CONFIDENCIALES, SU IMPACTO ESTRIBA EN SU AMPLIA APLICABILIDAD A SISTEMAS DE RECOPILACION, ANALISIS Y DIFUSION DE DATOS ANONIMOS, CON EL PROPOSITO DE SU ESTUDIO ESTADISTICO EN CONTEXTOS SOCIOECONOMICOS QUE INCLUYEN VOTACION ELECTRONICA, SALUD, ANUNCIOS PERSONALIZADOS, RECOMENDACION DE CONTENIDO Y REDES SOCIALES,EL OBJETO PRINCIPAL DEL PROYECTO QUE NOS OCUPA ABARCA DOS ASPECTOS DE INVESTIGACION DIRECTAMENTE APLICABLES AL DESARROLLO DE MECANISMOS PRACTICOS PARA EL CONTROL DE LA REVELACION ESTADISTICA; UNO RELACIONADO CON LA COMPUTACION, Y EL OTRO RELATIVO A LA CONFIANZA DEL USUARIO, EN CONJUNTO, ESTOS ASPECTOS AMPLIAN SIGNIFICATIVAMENTE LA GAMA DE APLICABILIDAD EN LOS SISTEMAS DE INFORMACION MODERNOS, UN EJEMPLO REPRESENTATIVO DE LA APLICACION SIMULTANEA DE AMBOS ASPECTOS ES LA ANONIMIZACION DE ENCUESTAS DEMOGRAFICAS A GRAN ESCALA, CON UNA PARTICIPACION DE LOS ENCUESTADOS INCIERTA,EN MAYOR DETALLE, EL ALCANCE DEL PROYECTO SE ENMARCA EN EL AMBITO DEL CONTROL DE REVELACION ESTADISTICA, ES DECIR, EL PROCESAMIENTO DE LA PORCION DEMOGRAFICA DE LOS RESULTADOS ESTADISTICOS DE ENCUESTAS CON INFORMACION PERSONAL, A FIN DE SALVAGUARDAR EFICAZMENTE EL ANONIMATO DE LOS ENCUESTADOS, EN LA LITERATURA SOBRE EL TEMA ABUNDAN LAS EVALUACIONES COMPARATIVAS DE ALGORITMOS SOBRE DATOS ESTANDARIZADOS, DESAFORTUNADAMENTE, LA MAYORIA DE LAS PUBLICACIONES APENAS SE CENTRA EN EL DESARROLLO DE MECANISMOS ESPECIFICOS DESTINADOS A LIMITAR EL SUBSTANCIAL COSTE COMPUTACIONAL INCURRIDO EN GRANDES CONJUNTOS DE DATOS, A MENUDO CUADRATICO EN EL NUMERO DE REGISTROS,ADEMAS, ESTOS ALGORITMOS DE ANONIMIZACION SON CONCEBIDOS BAJO EL SUPUESTO DE QUE EL SISTEMA A CARGO DE SU EJECUCION TAMBIEN ESTA EN POSESION DE LA TOTALIDAD DE LOS DATOS ORIGINALES, VINCULANDO DE MANERA INEQUIVOCA LAS IDENTIDADES DE LOS ENCUESTADOS CON SU INFORMACION CONFIDENCIAL, ESTE SUPUESTO LIMITA SU APLICABILIDAD AL ESCENARIO NO SIEMPRE REALISTA EN EL QUE LOS ENCUESTADOS CONFIAN EN UNA ENTIDAD CENTRALIZADORA, CONSECUENTEMENTE, SE PLANTEA LA CUESTION DE SI LOS DATOS SE PODRIAN PROCESAR LOCALMENTE POR EL ENCUESTADO, ANTES DE SU ENTREGA A UN SERVIDOR COMUN EN EL QUE NO SE CONFIA, SI ES ASI, ESTO PODRIA INFLUIR POSITIVAMENTE EN LA DISPOSICION DE LOS ENCUESTADOS A REVELAR DATOS CONFIDENCIALES, Y EN LA SEGURIDAD DEL PROCESO DE ANONIMIZACION, EN ULTIMA INSTANCIA, ESTO AMPLIARIA CONSIDERABLEMENTE LA GAMA DE POSIBLES APLICACIONES DE RECABADO DE DATOS CONFIDENCIALES DE USUARIOS, EN SISTEMAS DE INFORMACION DE DIVERSA INDOLE,ASI PUES, ESTE PROYECTO ABORDA TANTO LA CUESTION PRACTICA DE ANONIMIZACION DE GRANDES CONJUNTOS DE DATOS, Y EL NUEVO PARADIGMA DE PRE-PROCESAMIENTO LOCAL PARA MAYOR APLICABILIDAD, MAS TECNICAMENTE, SE ABORDA LA MEJORA OPERATIVA DE LA MICROAGREGACION K-ANONIMA TRADICIONAL PARA GRANDES CONJUNTOS DE DATOS, ASI COMO EL DESARROLLO DE LAS VARIANTES MAS GENERALES EN BASE A MODELOS ESTADISTICOS DE PARTICIPACION, EN EL QUE K-ANONIMATO SE IMPONE CONCORDANTEMENTE CON UNA GARANTIA PROBABILISTICA, LA COMBINACION DE AMBOS ASPECTOS PERMITE RECABAR, ANALIZAR Y PUBLICAR DATOS A GRAN ESCALA, ANONIMIZANDO LOS ATRIBUTOS DEMOGRAFICOS CON MAYOR EFICIENCIA Y SEGURIDAD, INCLUSO ANTES DE SU RECOGIDA, ANONIMATO\MICROAGREGACIÓN\ENCUESTAS DEMOGRÁFICAS\CONTROL DE REVELACIÓN ESTADÍSTICA