Descripción del proyecto
EN MINERIA DE DATOS, LA CLASIFICACION ES LA TAREA DE PREDICIR CORRECTAMENTE LA CLASE DE UNA INSTANCIA. UNA INSTANCIA ES UN CONJUNTO DE REGISTROS DE DATOS RELACIONADOS, UNO DE LOS CUALES, LA CLASE, SE QUIERE PREDECIR. UNA DE LAS LINEAS DE INVESTIGACION ACTUALES EN EL AREA DEL APRENDIZAJE AUTOMATICO ES EL DESARROLLO DE METODOS PARA LA COMBINACION O AGRUPAMIENTO DE CLASIFICADORES. ESTOS METODOS SE CONOCEN COMO MULTICLASIFICADORES O ENSEMBLES. EN LOS ULTIMOS AÑOS HAY UN CONSENSO GENERALIZADO EN QUE ESTOS METODOS SON LA MEJOR TECNICA PARA TRATAR LOS PROBLEMAS MAS DIFICILES. LA IDEA DETRAS DE LOS MULTICLASIFICADORES ES QUE ES POSIBLE COMBINAR VARIOS CLASIFICADORES PARA OBTENER OTRO CUYO FUNCIONAMIENTO ES MEJOR QUE EL DE CADA UNO DE LOS CLASIFICADORES INDIVIDUALES EN EL MULTICLASIFICADOR. LOS MULTICLASIFICADORES SE OBTIENEN DE COMBINAR UNA SERIE DE CLASIFICADORES ENTRENADOS DE FORMA QUE EXISTA ENTRE ELLOS DIVERSIDAD (LOS CLASIFICADORES INDIVIDUALES FALLAN PARA DISTINTAS INSTANCIAS LO QUE HACE AL MULTICLASIFICADOR ROBUSTO).EN ESTE GRUPO DE INVESTIGACION TENEMOS UNA AMPLIA EXPERIENCIA EN EL DISEÑO DE NUEVO ALGORITMOS PARA LA CONSTRUCCION DE MULTICLASIFICADORES. HEMOS CONTRIBUIDO AL AUMENTO DE METODOS DISPONIBLES EN APRENDIZAJE AUTOMATICO CON VARIOS ALGORITMOS: ROTATION FOREST, NON LINEAR BOOSTING PROJECTIONS, DISTURBING NEIGHBOURS, RANDOM ORACLES AND RANDOM FEATURE WEIGHTS. ESTOS NUEVOS ALGORITMOS HAN DEMOSTRADO QUE OFRECEN UN DESEMPEÑO MEJOR QUE OTROS ALGORITMOS CLASICOS EN EL AREA, COMO SON BAGGING, RANDOM FOREST Y ADABOOST. MIENTRAS QUE EN LOS PROBLEMAS DE CLASIFICACION, EL VALOR A PREDICIR, LA CLASE, ES UNO ENTRE UN CONJUNTO DESCRETO DE VALORES, EN LOS PROBLEMAS DE REGRESION, EL VALOR A PREDECIR NO ES DISCRETO, SINO NUMERICO. PARA ESTE TIPO DE PROBLEMAS, EN VEZ DE USAR CLASIFICADORES, SE USAN REGRESORES. EXISTE UN INTERES CRECIENTE EN APLICAR LAS TECNICAS UTILIZADAS PARA LA CONSTRUCCION DE MULTICLASIFICADORES A LA COMBINACION DE REGRESORES. AL SER LA TAREA DE PREDICCION MAS GENERAL, EL NUMERO DE PROBLEMAS A LOS QUE SE PUEDEN APLICAR ESTAS TECNCIAS ES MAS AMPLIO. EL PRINCIPAL OBJETIVO DE ESTE PROYECTO SERA LA ADAPTACION Y EVALUACION DEL RENDIMIENTO DE LOS METODOS DE COMBINACION DE CLASIFICADORES A LA TAREA DE REGRESION Y PREDICCION DE VALORES NUMERICOS. SE PRETENDE DESARROLLAR VARIANTES, ENTRE OTROS, DE: ROTATION FOREST, NON LINEAR BOOSTING PROJECTIONS, DISTURBING NEIGHBOURS, RANDOM ORACLES AND RANDOM FEATURE WEIGHTS. ADEMAS, DE LA EXPERIENCIA ADQUIRIDA EN EL PROCESO, SE ESPERA PODER DESARROLLAR NUEVOS ALGORITMOS ESPECIFICAMENTE DISEÑADOS PARA LA REGRESION. FINALMENTE TENEMOS EN MENTE APLICAR LAS TECNICAS DESARROLLADAS A PROBLEMAS DE CARACTER INDUSTRIAL (YA TENEMOS EXPERIENCIA EN LA APLICACION DE MULTICLASIFICADORES PARA ESTOS PROBLEMAS). EL ENTORNO INDUSTRIAL ES MUY ADECUADO PORQUE ES DE LOS ENTORNOS DONDE ES MAS DIRECTO MODELAR LOS PROBLEMAS COMO TAREAS DE REGRESION. LOS OBJETIVOS DEL PROYECTO SE PUEDEN RESUMIR EN LOS SIGUIENTES PUNTOS PRINCIPALES:OBJETIVO 1. ADAPTAR VARIOS ALGORITMOS DE CONSTRUCCION DE MULTICLASIFICADORES A LA COMBINACION DE REGRESORES.OBJETIVO 2. DESARROLLAR NUEVOS ALGORITMOS PARA LA COMBINACION DE REGRESORES.OBJETIVO 3. EVALUAR, USANDO CONJUNTOS DE DATOS ESTANDAR, LA EFICIENCIA TANTO DE LOS ALGORITMOS ADAPTADOS COMO DE LOS DESARROLLADOS DESDE CERO.OBJETIVO 4. APLICAR TODOS LOS ALGORITMOS ANTERIORES A LA SOLUCION DE PROBLEMAS INDUSTRIALES. INERIA DE DATOS\REGRESION\CONSTRUCCION DE ENSEMBLES\APRENDIZAJE AUTOMATICO