Descripción del proyecto
ESTE SUBPROYECTO SE BASARA EN UN CONJUNTO DE OBJETIVOS METODOLOGICOS Y ALGUNAS APLICACIONES, SE INCLUYE A CONTINUACION UN PEQUEÑO RESUMEN DE CADA UNA DE ELLAS,A) APROXIMACION EXPLICABLE A LA DETECCION DE ANOMALIAS (METODOLOGICO), LA DETECCION DE ANOMALIAS CONSISTE EN DETERMINAR QUE MUESTRAS, DE ENTRE LOS DATOS DISPONIBLES, SE CORRESPONDEN CON SITUACIONES ESPECIALES, QUE NO SE CORRESPONDEN CON EL COMPORTAMIENTO GENERAL DEL FENOMENO OBSERVADO, ESTA TAREA SE BASARA EN EL DESARROLLO DE METODOS BASADOS EN MODELOS PROBABILISTICOS, PARA CONSEGUIR ESTE OBJETIVO SE CONSIDERAN VARIAS TAREAS: DETECCION EN PROBLEMAS CON DATOS ESTATICOS, DETECCION CON DATOS TEMPORALES Y PROBLEMAS DE INFERENCIA ASOCIADOS (COMO COMPUTACION DE LA CONFIGURACION MAS PROBABLE (MAP)), EN LOS DOS PRIMEROS EL OBJETIVO SERA DETERMINAR UNA MODELIZACION EXPLICITA DE LOS MODELOS DE GENERACION DE ANOMALIAS, TENIENDO EN CUENTA QUE PUEDEN GENERARSE POR DIFERENTES RAZONES, EL CALCULO DE LA EXPLICACION MAS PROBABLE PUEDE USARSE PARA CALCULAR LAS PROBABILIDADES DE LAS DIFERENTES POSIBLES CAUSAS DE LAS ANOMALIAS, B) PERFILES DE ENTIDADES DE RECURSOS TEXTUALES MEDIANTE MODELOS EXPLICABLES (METODOLOGICO), EL GRAN VOLUMEN DE DATOS PROVENIENTES DE LA WEB PRECISAN DEL USO DE TECNICAS DE APRENDIZAJE AUTOMATICO QUE SEAN CAPACES DE GENERAR PERFILES UTILES PARA PERSONALIZACION DE APLICACIONES, RECUPERACION DE INFORMACION, SISTEMAS DE RECOMENDACION, FILTRADO DE INFORMACION, BUSQUEDA DE EXPERTOS O IDENTIFICACION DE AUTORIA, POR EJEMPLO, EN ESTE PROBLEMA EL TIEMPO ES UN ASPECTO BASICO, YA QUE LOS PERFILES NO SON ESTATICOS, SINO QUE EVOLUCIONAN A LO LARGO DEL TIEMPO, EN EL QUE SE PUEDEN PRODUCIR SITUACIONES DE CAMBIO DE CONCEPTO (CONCEPT DRIFT) QUE INDICAN CAMBIO EN LOS INTERESES DE LOS USUARIOS, OTRA CUESTION RELACIONADA CON ESTE PROBLEMA ES EL DE LA EVALUACION EN LOS PROBLEMAS DE RECOMENDACION, DONDE LOS PERFILES JUEGAN UN PAPEL ESENCIAL,C) MEJORA DE LA DETECCION DE RIESGO GENETICO MEDIANTE MODELIZACION DE COMPORTAMIENTO ANOMALO (APLICACION), LA CONSTRUCCION DE PREDICTORES DE ENFERMEDADES COMPLEJAS A PARTIR DE DATOS GENOMICOS PARECE HABER ALCANZADO UN MAXIMO LOCAL QUE PARECE ALEJADO DE LOS RESULTADOS ESPERADOS DE ACUERDO CON LA HERENCIA Y PREVALENCIA DE ENFERMEDADES, ESTE TRABAJO ESTA BASADO EN UN ESTUDIO PRELIMINAR QUE CONSIDERA LOS ALGORITMOS USUALES DE GENOTIPADO Y DETERMINA QUE SE OBTIENEN TASAS MAS ELEVADAS DE VALORES PERDIDOS EN INDIVIDUOS ENFERMOS QUE EN INDIVIDUOS SANOS, ESTE OBJETIVO INTENTA DETERMINAR CUAL ES LA RAZON DE ESTE HECHO,D) IDENTIFICACION DE AUTORIA EN BASE A MODELOS EXPLICABLES (APLICACION), ESTE OBJETIVO TRATARA EL DESARROLLO DE DIFERENTES MODELOS CAPACES DE REALIZAR IDENTIFICACION DE AUTORIA, CON EL OBJETIVO DE CONSEGUIR UN RENDIMIENTO COMPETITIVO EN RELACION CON OTROS MODELOS DEL ESTADO DEL ARTE, AUNQUE ESTE OBJETIVO ESTA ABIERTO A CUALQUIER FUENTE DE INFORMACION, SE CENTRARA ESPECIALMENTE EN EL USO DE DATOS PARLAMENTARIOS, DEL QUE SE DISPONE DE UNA COLECCION DE DOCUMENTOS DEL PARLAMENTO DE ANDALUCIA, QUE INCLUYEN INFORMACION TEXTUAL, DATOS DE PARTIDOS POLITICOS, COMITES, INFORMACION DEMOGRAFICA, PALABRAS CLAVE, ETC, APRENDIZAJE AUTOMATICO\EXPLICACION\DETECCION DE ANOMALIAS\MODELOS PROBABILISTICOS\RECUPERACION DE INFORMACION\SISTEMAS DE RECOMENDACION