Descripción del proyecto
LOS INSTITUTOS NACIONALES DE ESTADISTICA DEBEN CONTROLAR LA REVELACION DE INFORMACION CONFIDENCIAL EN DATOS PUBLICADOS, ANTES DE DISEMINARLOS, LOS DATOS DEBEN SER PROCESADOS POR ALGUN METODO DE PROTECCION, ESTE PROYECTO ABORDA METODOS PARA DATOS AGREGADOS, ES DECIR, TECNICAS PARA BALANCEAR RIESGO DE REVELACION Y UTILIDAD DE TABLAS DE DATOS, UNO DE ESTOS METODOS, AJUSTE CONTROLADO DE TABLAS POR DISTANCIA MINIMA (CTA), SUGERIDO POR EL GRUPO, HA MOSTRADO SER MAS EFICIENTE QUE PROCEDIMIENTOS ALTERNATIVOS, ESTA TECNICA FORMULA UN PROBLEMA DE OPTIMIZACION LINEAL (PARA LA DISTANCIA L1) O CUADRATICO (PARA L2), SE CONVIERTEN EN PROBLEMAS MIXTOS LINEALES O CUADRATICOS SI DECISIONES BINARIAS PARA LAS CELDAS SENSIBLES SON INCLUIDAS EN EL MODELO,RESULTADOS PREVIOS HAN MOSTRADO QUE LOS METODOS POLINOMICOS DE PUNTO INTERIOR SON MUY EFECTIVOS PARA LOS PROBLEMAS CONTINUOS RESULTANTES, PARA ALGUNAS INSTANCIAS ESTRUCTURADAS, LOS METODOS ESPECIALIZADOS DESARROLLADOS POR EL GRUPO FUERON 500 VECES MAS EFICIENTES QUE LOS MEJORES PAQUETES COMERCIALES, SIN EMBARGO, PARA PROBLEMAS MASIVOS SIN ESTRUCTRURA (QUE PLANTEAN PROBLEMAS DE VARIOS MILLONES DE VARIABLES Y MILLONES DE RESTRICCIONES), LOS PAQUETES GENERALES DE PUNTO INTERIOR BASADOS EN FACTORIZACIONES DE CHOLESKY MUESTRAN UN BAJO RENDIMIENTO, Y ESTO SOLO PARA UNA TABLA, SI SE DESEAN PROTEGER CONJUNTAMENTE TODAS LAS TABLAS DE, POR EJEMPLO, UN DETERMINADO CENSO, (QUE NO SE HACE, PERO SERIA EL ENFOQUE MAS SEGURO), EL PROBLEMA RESULTANTE ESTA EN LA FRONTERA (SI NO MAS ALLA) DE LA CAPACIDAD DE LA TECNOLOGIA ACTUAL DE OPTIMIZACION, UNO DE LOS OBJETIVOS DE PROYECTO ES LLENAR ESTE VACIO, DESARROLLANDO Y PROBANDO ALGORITMOS DE PUNTO INTERIOR BASADOS EN METODOS ITERATIVOS PARA ESTOS PROBLEMAS MASIVOS DE OPTIMIZACION,EN UN PROYECTO RECIENTE EN QUE PARTICIPAMOS, LA VERSION ENTERA MIXTA DE CTA FUE UTILIZADA POR EUROSTAT (AGENCIA ESTADISTICA DE LA COMISION EUROPEA) PARA LA PROTECCION DE DATOS ESTRUCTURADOS DE EMPRESAS EUROPEAS, AUNQUE EL TAMAÑO DE LAS TABLAS NO FUE MUY GRANDE, LA SOLUCION POR ALGORITMOS RAMIFICACION-Y-CORTE DE LOS MEJORES PAQUETES ACTUALES FUE MUY COSTOSA, EL PROYECTO TAMBIEN CONSIDERARA LA SOLUCION DE ESTOS PROBLEMAS DISCRETOS POR REFORMULACION DE BENDERS, RELAJACION LAGRANGIANA, Y GENERACION DE CORTES (POR EJEMPLO, CORTES PERSPECTIVOS PARA FUNCIONES CUADRATICAS), UNA ALTERNATIVA A LA VERSION ENTERA MIXTA DE CTA PODRIA SER EL METODO DE PROTECCION POR INTERVALOS, AUNQUE ESTE ENFOQUE FORMULA UN PROBLEMA CONTINUO DE OPTIMIZACION, EL NUMERO DE VARIABLES ES DEL ORDEN DEL CUADRADO DE LAS CELDAS DE LA TABLA, Y EL NUMERO DE RESTRICCIONES ES DEL ORDEN DEL NUMERO DE CELDAS POR EL DE RELACIONES LINEALES DE LA TABLA, PARA UNA TABLA MODERADA, PUEDE DAR LUGAR A PROBLEMAS DE UNAS 1E+8 VARIABLES Y 1E+7 RESTRICCIONES, LA MATRIZ DE RESTRICCIONES EXHIBE UN ESTRUCTURA DUAL POR BLOQUES, ABORDAREMOS ESTE PROBLEMA MEDIANTE METODOS DE PUNTO INTERIOR PARA PROBLEMAS ESTRUCTURADOS,LOS PRINCIPALES OBJETIVOS DEL PROYECTO SON ASI: 1) DESARROLLO DE ALGORITMOS DE PUNTO INTERIOR BASADOS EN METODOS ITERATIVOS PARA PROBLEMAS DE GRAN ESCALA SIN ESTRUCTURA, 2) DESARROLLO DE ALGORITMOS DE PUNTO INTERIOR PARA PROBLEMAS MASIVOS DE ESTRUCTURA DUAL POR BLOQUES, 3) DESARROLLO Y APLICACION DE ESTRAGEGIAS DE ACELERACION: PRECONDICIONADORES, REGULARIZACIONES, ETC, 4) SOLUCION DEL PROBLEMA ENTERO MIXTO CTA USANDO TECNICAS COMO REFORMULACION DE BENDERS, RELAJACION LAGRANGIANA, CORTES PERSPECTIVOS, DESCENSO COORDENADO, OPTIMIZACION DE GRAN ESCALA; OPTIMIZACIO