Descripción del proyecto
LOS METODOS DE APRENDIZAJE MAQUINA SON CADA VEZ MAS UTILIZADOS PARA EL ANALISIS AUTOMATIZADO DE DATOS, CADA VEZ MAS, LAS BASES DE DATOS SOBRE LAS QUE TRABAJAN ESTOS ALGORITMOS SON DE ALTA DIMENSIONALIDAD, ESTO ES, SE DAN UNA O VARIAS DE LAS SIGUIENTES CARACTERISTICAS: A) EL Nº DE DATOS O MUESTRAS ES MUY ELEVADO; B) EL Nº DE CARACTERISTICAS O VARIABLES QUE DEFINEN LAS MUESTRAS ES MUY ELEVADO; C) EL Nº DE CLASES O GRUPOS A CLASIFICAR ES MUY ALTO, EN MUCHAS OCASIONES, ADEMAS, LOS DATOS SE RECOGEN DE FORMA DISTRIBUIDA, Y ES NECESARIO QUE LOS ALGORITMOS DE APRENDIZAJE TRABAJEN LOCALMENTE, SOBRE CADA UNA DE LAS ESTACIONES DE TRABAJO DONDE SE RECOGEN LOS DATOS, Y SEAN CAPACES DE INFERIR ¿REGLAS¿ LOCALES, QUE LUEGO DEBEN INTEGRARSE EN UN ESCENARIO MAS GENERAL, ESTE ES EL CASO DE MUCHAS APLICACIONES REALES, ALGUNAS DE LAS CUALES SON CLINICAS, BIOINFORMATICAS, SISTEMAS DE DETECCION DE INTRUSOS EN REDES DE ORDENADORES, CLASIFICACION DE TEXTOS (SPAM, NO-SPAM), PROBLEMAS DE INGENIERIA EN LOS QUE SE RECOGEN DATOS EN CONTINUO DESDE OTROS SISTEMAS Y QUE DEBEN ANALIZAR GRANDES CONJUNTOS DE DATOS DE DIVERSOS SENSORES, COMO EN CENTRALES HIDRAULICAS, NUCLEARES, ETC, EN ESTAS SITUACIONES DE ALTA DIMENSIONALIDAD Y NECESIDAD DE APRENDIZAJE DISTRIBUIDO, VARIAS TECNICAS SON NECESARIAS, Y EL DESARROLLO DE LAS MISMAS SERA EL OBJETIVO DE ESTE PROYECTO, EN ESTE PROYECTO, SE PRETENDE PROPONER SOLUCIONES AL APRENDIZAJE A GRAN ESCALA, TRABAJANDO FUNDAMENTALMENTE TRES ASPECTOS: 1, EL DESARROLLO DE MODELOS DE APRENDIZAJE DISTRIBUIDO 2, LA ADAPTACION DE ALGORITMOS PREVIAMENTE DESARROLLADOS POR EL GRUPO SOLICITANTE PARA QUE PUEDAN USARSE CON APRENDIZAJE INCREMENTAL 3, LA BUSQUEDA DE ESQUEMAS Y METODOS EFICIENTES DE SELECCION DE CARACTERISTICAS APLICABLES A GRANDES VOLUMENES DE DATOS,EL OBJETIVO ES CONSEGUIR METODOS DE APRENDIZAJE EFICIENTES QUE EXHIBAN UN BUEN EQUILIBRIO ENTRE SU PRECISION, SU VELOCIDAD Y SU CAPACIDAD PARA MANEJAR GRANDES VOLUMENES DE DATOS, DE ESTE MODO, SE ABRIRA UN NUEVO CAMPO DE POSIBLES APLICACIONES DEL AM AL SER POSIBLE SU USO EN PROBLEMAS DE GRAN ESCALA COMO LA DETECCION DE INTRUSOS O EL ESTUDIO DEL GENOMA HUMANO, APRENDIZAJE MAQUINA\OPTIMIZACION\ESCALABILIDAD\APRENDIZAJE INCREMENTAL\APRENDIZAJE DISTRIBUIDO\SELECCION DE CARACTERISTICAS\REDUCCION DIMENSIONALIDAD