Descripción del proyecto
UNO DE LOS MAYORES DESAFIOS DE LA INGENIERIA LINGUISTICA ES CONSEGUIR ALMACENAR, ORGANIZAR Y ACTUALIZAR LA INFORMACION ENCICLOPEDICA, EN CONSTANTE Y DINAMICO CRECIMIENTO, LAS BASES LEXICAS MAS COMPLETAS (E,G,, WORDNET) NO HAN SIDO DISEÑADAS COMO REPOSITORIOS DE INFORMACION ENCICLOPEDICA Y NO DISPONEN DE EXHAUSTIVAS LISTAS DE NOMBRES DE EMPRESAS, PRODUCTOS, ESCRITORES, COMPOSITORES, OBRAS, ETC, ESTA INFORMACION SE ENCUENTRA DILUIDA EN FORMATO TEXTO EN DOCUMENTOS ACCESIBLES A PARTIR DE LA WEB, ESPECIALMENTE EN ENCICLOPEDIAS (WIKIPEDIA), DIARIOS DE INFORMACION GENERICA O ESPECIALIZADA, REVISTAS, ETC, NUESTRA PROPUESTA DISEÑA Y APLICA TECNICAS DE PROCESAMIENTO DEL LENGUAJE NATURAL Y EXTRACCION DE INFORMACION CON EL OBJETIVO DE ADQUIRIR, ORGANIZAR Y MANTENER AUTOMATICAMENTE GRANDES CANTIDADES DE INFORMACION ENCICLOPEDICA, EN CONCRETO, DISEÑAREMOS Y DESARROLLAREMOS UN SISTEMA PARA CLASIFICAR Y DEFINIR ENTIDADES CON NOMBRE, EXPLOTANDO CORPUS CON CONOCIMIENTO ENCICLOPEDICO EN CONSTANTE ACTUALIZACION: WIKIPEDIA Y PRENSA, LA BASE DE CONOCIMIENTO ADQUIRIDA SE INTEGRARA EN UN SISTEMA DE BUSQUEDA DE RESPUESTAS, YA DESARROLLADO POR MIEMBROS DEL EQUIPO, NOS CENTRAREMOS EN TEXTO ESCRITO EN TRES LENGUAS: ESPAÑOL, PORTUGUES Y GALLEGO, TODOS LOS RECURSOS Y HERRAMIENTAS GENERADOS A PARTIR DEL PROYECTO TENDRAN LICENCIA LIBRE (GENERAL PUBLIC LICENSE),