Descripción del proyecto
LA CLASIFICACION ES UNO DE LOS PROBLEMAS MAS COMUNES EN LAS APLICACIONES ACTUALES DE APRENDIZAJE DE MAQUINAS, EN LOS ULTIMOS AÑOS SE HA PRODUCIDO UN CONSENSO GENERALIZADO EN EL HECHO DE QUE LA MEJOR TECNICA PARA TRATAR CON LOS PROBLEMAS DE CLASIFICACION DIFICILES SON LAS AGRUPACIONES DE CLASIFICADORES, DADO QUE SON CAPACES DE MEJORAR EL RENDIMIENTO DE CUALQUIER CLASIFICADOR EN LA MAYORIA DE LAS APLICACIONES, LAS AGRUPACIONES SE COMPONEN DE UN CIERTO NUMERO DE CLASIFICADORES ENTRENADOS DE FORMA QUE EXISTA ALGUN TIPO DE DIVERSIDAD ENTRE ELLOS,LOS METODOS DE BOOSTING CONSTRUYEN LOS CLASIFICADORES EN LA AGRUPACION SECUENCIALMENTE, ESTE PROYECTO ESTA DEDICADO AL DISEÑO DE AGRUPACIONES DE CLASIFICADORES USANDO LA FILOSOFIA DE BOOSTING DE UNA FORMA DIFERENTE, LOS METODOS DE BOOSTING CONSIDERAN UNA DISTRIBUCION SESGADA DE LOS PATRONES QUE ES USADA POR EL ALGORITMO DE APRENDIZAJE PARA CENTRARSE EN LAS INSTANCIAS DIFICILES, DE ESTA FORMA, EL METODO ASIGNA A CADA INSTANCIA DE ENTRENAMIENTO UN PESO QUE ES PEQUEÑO SI LA INSTANCIA ES CLASIFICADA CORRECTAMENTE POR LA MAYORIA DE LOS CLASIFICADORES Y GRANDE EN CASO CONTRARIO, NUESTRO TRABAJO DE INVESTIGACION HA MOSTRADO QUE LA DISTRIBUCION SESGADA PUEDE SER UTILIZADA VENTAJOSAMENTE DE VARIAS FORMAS, EN LUGAR DE USAR LOS PESOS DE LAS INSTANCIAS DIRECTAMENTE EN EL PROCESO DE APRENDIZAJE, SE PUEDEN DESARROLLAR DIFERENTES METODOS PARA MEJORAR EL ERROR PONDERADO DE FORMA MENOS AGRESIVA, CONSIDERAMOS EL PROBLEMA DE CONSTRUIR LA AGRUPACION COMO UN PROCESO DE OPTIMIZACION EN EL CUAL EL CRITERIO A OPTIMIZAR ES EL ERROR PONDERADO USANDO LOS PESOS ASIGNADOS POR EL METODO DE BOOSTING,EL PROBLEMA LO FORMULAREMOS COMO UN PROBLEMA DE OPTIMIZACION Y HAREMOS USO EXTENSIVO DE LAS TECNICAS DE COMPUTACION EVOLUTIVA DADO SU BUEN COMPORTAMIENTO EN TAREAS DE OPTIMIZACION,LOS OBJETIVOS BASICOS DE NUESTRO PROYECTO SE PUEDEN RESUMIR EN LOS SIGUIENTES PUNTOS:1,DESARROLLO DE UN MODELO DE PROYECCIONES LINEALES SUPERVISADAS BASADO EN OPTIMIZAR EL ERROR PONDERADO DADO POR LOS METODOS DE BOOSTING,2,DESARROLLO DE UN ALGORITMO DE BOOSTING BASADO EN PROYECCIONES NO LINEALES MEDIANTE UN ALGORITMO GENETICO CON CODIFICACION REAL, EL MAYOR PROBLEMA CON ESTA APROXIMACION ES SU COSTE COMPUTACIONAL, POR ELLO PLANEAMOS LA IMPLEMENTACION PARALELA DEL ALGORITMO,3,DESARROLLO DE UN MODELO BASADO EN LA BUSQUEDA DE PROYECCIONES EN SUBESPACIOS DEL ESPACIO DE ENTRADA, TANTO INDEPENDIENTES COMO SOLAPADOS, UNO DE LOS PROBLEMAS DE LAS APROXIMACIONES ANTERIORES ES LA OBTENCION DE UNA PROYECCION UTIL CUANDO HAY MUCHAS ENTRADAS, ESTE OBJETIVO TRATA CON ESTE CASO,4,CONSTRUCCION DE AGRUPACIONES DE CLASIFICADORES MEDIANTE LA APLICACION DEL BOOSTING A LA SELECCION DE INSTANCIAS, DADO QUE TAMBIEN APARECE UN PROBLEMA DE ESCALABILIDAD SE CONSIDERARA TAMBIEN LA IMPLEMENTACION PARALELA,5,APLICACION DE LOS METODOS DESARROLLADOS A CLASIFICADORES PARA LOS CUALES LOS METODOS ESTANDAR DE BOOSTING NO SON UTILES O NO SON APLICABLES, CONSIDERAMOS ENTRE OTROS EL METODO DE LOS K VECINOS Y LOS SISTEMAS DE APRENDIZAJE DE CLASIFICADORES,ESTOS OBJETIVOS PREVIOS ESTAN DEDICADOS AL DESARROLLO DE NUEVOS METODOS, LOS SIGUIENTES DOS OBJETIVOS TRATAN CON LA APLICACION A PROBLEMAS REALES:6,APLICACION DE LOS METODOS A LOS PROBLEMAS DE BIOINFORMATICA DESCRITOS EN EL DOCUMENTO, TRABAJAREMOS EN DOS PROBLEMAS: PREDICCION DE LOS PUNTOS DE INICIO DE TRADUCCION Y RECONOCIMIENTO DE LAS ESTRUCTURA DEL GEN,7,APLICACION DE LOS METODOS DESARROLLADOS A PROBLEMAS DE REGRESION, Agrupaciones de clasificadorescomputación evolutivaioinformática