Descripción del proyecto
LOS AVANCES EN LAS TECNOLOGIAS DE LA INFORMACION Y LAS COMUNICACIONES HAN CONTRIBUIDO A LA PROLIFERACION DE GRANDES BASES DE DATOS, DE MANERA QUE POR EJEMPLO, EN 2012 SE GENERABAN UNOS 2,5 EXABYTES DE DATOS/DIA, Y SE ESTIMA QUE ESTA CANTIDAD SE DUPLICARA CADA 40 MESES, EN GENERAL, ESTE NOTABLE CRECIMIENTO DEL VOLUMEN DE DATOS, JUNTO CON OTROS PROBLEMAS RELACIONADOS CON EL LLAMADO BIG DATA (VARIEDAD, VARIABILIDAD, VERACIDAD, ETC,), HACE QUE MUCHOS DE LOS ALGORITMOS DE APRENDIZAJE COMPUTACIONAL (AC) CLASICOS NO SEAN CAPACES DE FUNCIONAR ADECUADAMENTE, BIEN PORQUE OFRECEN UN POBRE RENDIMIENTO O PORQUE TARDARIAN EN SER EJECUTADOS UNA CANTIDAD DE TIEMPO INASUMIBLE PARA MUCHAS APLICACIONES, DEBIDO A ESTO, LA ESCALABILIDAD DE LOS ALGORITMOS HA PASADO DE SER UNA CUALIDAD DESEABLE, A SER UNA CARACTERISTICA PRACTICAMENTE IMPRESCINDIBLE SI SE PRETENDE QUE SEAN UTILES EN LOS ESCENARIOS REALES QUE SE AVECINAN, LOS PRIMEROS ESFUERZOS DE LA COMUNIDAD QUE TRABAJA EN BIG DATA SE CENTRARON EN LOS DOS PROBLEMAS MAS TRADICIONALES DEL APRENDIZAJE SUPERVISADO: LA CLASIFICACION Y LA REGRESION, DE HECHO, A PESAR DE QUE LAS TECNICAS DE BIG DATA SON RELATIVAMENTE RECIENTES, SE DISPONE YA DE LIBRERIAS QUE INCLUYEN VERSIONES ESCALABLES DE ALGORITMOS DE AC COMUNES, INCLUYENDO ALGORITMOS DE CLASIFICACION, REGRESION Y CLUSTERING, ANTE ESTA SITUACION, EN EL QUE LOS ENTORNOS DISPONIBLES YA OFRECEN LAS HERRAMIENTAS BASICAS, NUESTRO OBJETIVO ES IR UN PASO MAS ALLA, DESARROLLANDO NUEVOS METODOS ESCALABLES PARA PROBLEMAS QUE VAN MAS ALLA DE LA CLASIFICACION Y LA REGRESION TRADICIONALES, PERO QUE TIENE GRAN APLICABILIDAD, EN CONCRETO, NOS CENTRAREMOS FUNDAMENTALMENTE EN EL DESARROLLO DE CUATRO TIPOS DE ALGORITMOS: ALGORITMOS DE RANKING, CAPACES DE ORDENAR TOTAL O PARCIALMENTE CONJUNTOS DE OBJETOS; ALGORITMOS DE UNA SOLA CLASE, APLICABLES, POR EJEMPLO, A LA DETECCION DE ANOMALIAS; ALGORITMOS DE CUANTIFICACION, EN LOS QUE LO QUE SE PRETENDE ES ESTIMAR LA PREVALENCIA DE CIERTAS CLASES DE OBJETOS EN UNA MUESTRA; Y ALGORITMOS DE SELECCION DE CARACTERISTICAS ADAPTADOS A LOS TIPOS DE PROBLEMAS ANTES CITADOS, ADEMAS, UTILIZAREMOS LOS ALGORITMOS DESARROLLADOS EN VARIAS APLICACIONES REALES, AVALANDO EL INTERES PRACTICO QUE TIENE RESOLVER ESTE TIPO DE PROBLEMAS, NOS CENTRAREMOS ESPECIALMENTE EN DOS DE ELLAS, UNA RELACIONADA CON EL SECTOR BANCARIO Y OTRA CON LA EDUCACION, ALGORITMOS ESCALABLES\APRENDIZAJE COMPUTACIONAL\GRANDES VOLÚMENES DE DATOS\SELECCIÓN DE CARACTERÍSTICAS\RANKING\CUANTIFICACIÓN\APRENDIZAJE ONE-CLASS\APRENDIZAJE DISTRIBUIDO\APRENDIZAJE ON-LINE.