Descripción del proyecto
ENTRE LAS DEFINICIONES QUE PODEMOS ENCONTRARNOS EN LA LITERATURA PODEMOS DESTACAR LA QUE DEFINE LA MINERIA DE DATOS (MD) COMO EL PROCESO DE EXTRAER CONOCIMIENTO UTIL Y COMPRENSIBLE, PREVIAMENTE DESCONOCIDO, DESDE GRANDES CANTIDADES DE DATOS DE DISTINTOS TIPOS Y ALMACENADOS EN DISTINTOS FORMATOS. ES DECIR, LA TAREA FUNDAMENTAL DE LA MD ES ENCONTRAR MODELOS INTELIGIBLES A PARTIR DE LOS DATOS. ESTOS MODELOS DESCUBIERTOS DEBEN AYUDAR A TOMAR DECISIONES QUE APORTEN ALGUN BENEFICIO AL SISTEMA. POR TANTO, SON DOS LOS RETOS DE LA MD: POR UN LADO, TRABAJAR CON GRANDES VOLUMENES DE DATOS, CON LOS PROBLEMAS QUE CONLLEVA (RUIDO, DATOS AUSENTES, VAGUEDAD, ETC.), Y POR EL OTRO USAR TECNICAS ADECUADAS PARA ANALIZAR LOS MISMOS Y EXTRAER CONOCIMIENTO NOVEDOSO Y UTIL. EN MUCHOS CASOS LA UTILIDAD DEL CONOCIMIENTO MINADO ESTA INTIMAMENTE RELACIONADA CON LA COMPRENSIBILIDAD DEL MODELO INFERIDO, POR TANTO, ES IMPORTANTE HACER QUE LA INFORMACION DESCUBIERTA SEA MAS COMPRENSIBLE (MEDIANTE REGLAS, ETC.)..SIN EMBARGO, LOS DATOS DISPONIBLES CON LOS QUE DEBE TRABAJAR LA MINERIA DE DATOS NO SON TODO LO PRECISOS Y EXACTOS COMO SERIA DESEABLE. EN ENTORNOS REALES (COMO LOS ABORDADOS EN ESTE PROYECTO) LA INFORMACION IMPERFECTA APARECE DE FORMA INEVITABLE. ERRORES INSTRUMENTALES O DATOS CORRUPTOS DEBIDO A RUIDO DURANTE LA REALIZACION DE EXPERIMENTOS PUEDE DAR LUGAR A INFORMACION INCOMPLETA CUANDO MEDIMOS UN ATRIBUTO ESPECIFICO. EN OTROS CASOS, LA EXTRACCION DE INFORMACION EXACTA PUEDE SER EXCESIVAMENTE COSTOSA O INVIABLE. ADEMAS, EN DETERMINADAS OCASIONES PUEDE SER UTIL USAR INFORMACION ADICIONAL PROVENIENTE DE EXPERTOS Y QUE USUALMENTE ESTA EXPRESADA MEDIANTE DATOS IMPERFECTOS (DATOS INTERVALARES, CONCEPTOS FUZZY,
). EN LA MAYORIA DE PROBLEMAS DEL MUNDO REAL, LOS DATOS TIENEN CIERTO GRADO DE IMPRECISION. A VECES, ESTA IMPRECISION ES SUFICIENTEMENTE PEQUEÑA PARA PODER IGNORARLA. EN OTRAS OCASIONES, LA IMPRECISION PUEDE SER MODELADA MEDIANTE DISTRIBUCIONES DE PROBABILIDAD. Y FINALMENTE, HAY UNA TERCERA CLASE DE PROBLEMAS DONDE LA IMPRECISION ES SIGNIFICANTE, Y UNA DISTRIBUCION DE PROBABILIDAD NO ES UN MODELO NATURAL. ES DECIR, HAY CIERTOS PROBLEMAS PRACTICOS DONDE LOS DATOS SON INHERENTEMENTE FUZZY.COMO LA IMPERFECCION VA A ESTAR PRESENTE EN LOS DATOS QUE DESCRIBAN LOS PROBLEMAS DE LOS DISTINTOS ENTORNOS TECNOLOGICOS ABORDADOS POR ESTE PROYECTO, NOS MOVEREMOS EN EL PARADIGMA DE LA SOFT COMPUTING. SE HACE NECESARIO INCORPORAR EL MANEJO DE INFORMACION CON ATRIBUTOS CON VALORES IMPERFECTOS EN LAS DISTINTAS FASES DE LA MD.POR LO TANTO, DE FORMA GENERAL, EN ESTE SUBPROYECTO PRETENDEMOS APLICAR LAS DISTINTAS FASES DE LA MINERIA DE DATOS EN LOS ENTORNOS PROPUESTOS EN EL PROYECTO GLOBAL. PARA ELLO SE DEBERA REALIZAR UN ANALISIS DE LA DISPONIBILIDAD Y CALIDAD DE LOS DATOS A LOS CUALES PODER APLICAR EL PROCESO EN CADA UNO DE LOS ENTORNOS. DADO QUE LA INFORMACION DISPONIBLE PUEDE SER ESCASA, TRATAREMOS DE PROFUNDIZAR EN TECNICAS DE MD QUE SEAN CAPACES DE OBTENER UN RENDIMIENTO OPTIMO DESDE INFORMACION LO MAS HETEROGENEA POSIBLE Y DE BAJA CALIDAD. ESTO NOS PERMITIRA PODER TRABAJAR CON INFORMACION PROPORCIONADA A PARTIR DE CUALQUIER FUENTE DE INFORMACION SIN DESCARTAR AQUELLAS QUE NO SE AJUSTEN A LOS PATRONES MAS COMUNES EMPLEADOS EN LA MINERIA DE DATOS. INERIA DE DATOS\IMPRECISION E INCERTIDUMBRE\DATOS IMPERFECTOS\ANALISIS INTELIGENTE DE DATOS