Descripción del proyecto
EL OBJETIVO DE ESTE SUBPROYECTO ES EXPLOTAR EL PROCESAMIENTO DEL LENGUAJE NATURAL EN LAS TAREAS DE RECUPERACION DE INFORMACION DESDE UNA NUEVA PERSPECTIVA,NUESTRA VISION DEL USO DE PLN SE PUEDE CONDESAR EN CUATRO GRANDES AREAS INTERRELACIONADAS:- NUEVOS PARADIGMAS DE ACCESO A LA INFORMACION:EXPLOTAR EL PROCESAMIENTO DEL LENGUAJE NATURAL (P,E, EL RECONOCIMIENTO DE ENTIDADES, LA EXTRACCION DE RELACIONES O OPINION MINING ) TANTO EN LA SELECCION DE LOS RESULTADOS A MOSTRAR AL USUARIO COMO EN SU PRESENTACION, POR EJEMPLO MOSTRAR DIFERENTES VISTAS DE LA INFORMACION AL USUARIO, MOSTRAR EN UN MAPA LAS ENTIDADES RECONOCIDAS COMO LUGARES O LOS EVENTOS EN UNA LINEA DE TIEMPO, ETC,- CONTEXTUALIZACION DE LA INFORMACIONLA CONTEXTUALIZACION DE LOS RESULTADOS, ESPECIFICAMENTE, COMPRENDER, O EXPLOTAR MEDIANTE NUEVOS MODELOS DE INTERACCION, SI LA INFORMACION EXTRAIDA ES VALIDA EN GENERAL O SOLO PARA UNA DETERMINADA COMUNIDAD, UN SOLO AMBITO GEOGRAFICO, O SOLO PARA CIERTOS PERIODOS TEMPORALES, DADO EL CRECIMIENTO DE CONTENIDOS GENERADOS POR LOS USUARIOS EN LA WEB, E,G, WEBLOGS, TECNICAS COMO OPINION MINING POTENCIALMENTE PUEDEN CAPTURAR LA CONCEPCION INDIVIDUAL SOBRE PRODUCTOS, MARCAS, ETC, I VER COMO SE MODIFICA ESTAS OPINIONES EN EL TIEMPO,- CLUSTERING DE DOCUMENTOS EL OBJETIVO ES ESTABLECER QUE CANTIDAD Y QUE TIPO DE INFORMACION A EXTRAER ES NECESARIA PARA OBTENER, A PARTIR DE COLECCIONES DE DOCUMENTOS, GRUPOS QUE REFLEJEN SIMILITUDES EN CUANTO A CONTENIDO, OPINION O TOPICO, INVESTIGAR QUE CONTRIBUCIONES Y COMPROMISOS PUEDEN PROPORCIONAR INFORMACION CON UNA MAYOR GRANULARIDAD, COMO LOS ANALISIS SINTACTICOS Y SEMANTICOS (ANALISIS SINTACTICO DE DEPENDENCIAS, RECONOCIMIENTO Y CLASIFICACION DE ENTIDADES, POS, ETC,), Y COMO ESTO PUEDEN LLEVAR A UNA MEJOR COMPRENSION DE QUE MANERA SON REFERIDAS LAS PERSONAS Y ORGANIZACIONES, Y COMO SE REALIZA SU SEGUIMIENTO EN TEXTOS DE OPINION EN LINEA, Y CUALES OTRAS ENTIDADES Y CATEGORIAS CONCEPTUALES SE ASOCIAN GENERALMENTE A ELLOS,- BUSQUEDA/PREDICCION/MINERIA DEL FUTURO:EXPLOTAR LAS REFERENCIAS TEMPORALES DE LA WEB, MUCHOS DE LOS CONTENIDOS DE LA WEB (NOTICIAS, BLOGS) CONTIENEN REFERENCIAS A EVENTOS FUTUROS ASI COMO PREDICCIONES DE LO QUE SE CREE PUEDE PASAR UN FUTURO, EL ANALISIS DE ESTE TIPO DE INFORMACION PUEDE SERVIR P,E, PARA MOSTRAR LAS PREDICCIONES HECHAS POR DIFERENTES FUENTES EN EL TIEMPO,- WEB SEMANTICA - WEB DE LOS OBJETOS:EXPLOTAR LA VISION DE LA WEB COMO UNA COLECCION DE OBJETOS EN LUGAR DE SOLAMENTE PAGINAS WEB, EXPLOTAR LA WEB SEMANTICA (P,E RDF O MICROFORMATS) Y COMBINARLO CON LA INFORMACION EXTRAIDA CON METODOS DE PROCESAMIENTO DEL LENGUAJE,LA APLICACION DEL PLN A LA RECUPERACION DE INFORMACION AL WEB PLANTEA EN SI MUCHOS RETOS, LAS TECNOLOGIAS QUE PROPONEMOS USAR-EXPLOTAR FUNCIONAN RAZONABLEMENTE BIEN EN TEXTOS CONTROLADOS, PERO NO ASI AL USARLAS/ADAPTARLAS A LA CLASE DE TEXTO LIBRE QUE APARECE EN LA WEB (P,E, BLOGS), HACERLO DE MANERA EFICIENTE E INVESTIGAR METODOS ROBUSTOS PARA MANEJAR (INDEXAR, BUSCAR) Y FUSIONAR ESA CANTIDAD DE INFORMACION DE MANERA QUE SEA UTIL AL USUARIO ES OTRO RETO AUN MAYOR, PROCESAMIENTO DEL LENGUAJE\RECUPERACION DE INFOMACION\BUSQUEDA SEMANTICA