Innovating Works

RTC2019-007134-7

Financiado
Mejora de la calidad de los datos de la DBpedia del español (esDBpedia) mediante inteligencia colectiva humana (HcommonK) El proyecto HcommonK propone la mejora de los servicios de Text Analytics en la Nube, mediante el uso de procesamiento del lenguaje natural (NLP) y Deep Learning, utilizando esDBpedia high-Q como grafo de conocimiento, mejorada co... El proyecto HcommonK propone la mejora de los servicios de Text Analytics en la Nube, mediante el uso de procesamiento del lenguaje natural (NLP) y Deep Learning, utilizando esDBpedia high-Q como grafo de conocimiento, mejorada con la incorporación de nuevos datos estructurados obtenidos de textos (como los contenidos en Wikipedia y otros repositorios textuales) y la incorporación de conocimiento humano explícito mediante la figura del colaborador (revisor/curador), En ese sentido, el proyecto HcommonK explotará los beneficios que supone esDBpedia High-Q como fuente de grandes volúmenes de datos abiertos y recursos lingüísticos disponibles en la Web de Datos enlazados para mejorar la calidad de las herramientas de procesamiento de lenguaje natural de nuestra empresa, Las ventajas que proporciona frente a otros tipos de recursos cerrados como WordNet, que han sido utilizado como bases de conocimientos en numerosos tareas relacionadas con el procesamiento del lenguaje, son: su naturaleza abierta, su continua evolución de forma colaborativa, y su crecimiento incremental mediante la inclusión de nuevos recursos y la creación de enlaces con los ya existentes, Sin embargo, su uso tampoco está exento de riesgos, siendo necesaria la provisión de servicios capaces de diagnosticar la calidad del grafo de conocimiento generado, mediante controles de calidad que involucren a humanos, previo a su utilización en los procesos de análisis del lenguaje necesarios,La DBpedia del español (esDBpedia) es un servicio que el Ontology Engineering Group (OEG) de la UPM ofrece de forma gratuita a la comunidad hispano-hablante, Como resultado del proyecto anterio, disponemos de una esDBpedia mejorada (esDBpedia-HQ) con más datos y una medida de su fiabilidad, Para conseguir los objetivos del proyecto, el consorcio del proyecto está formado por TAIGER, una empresa con larga experiencia en el desarrollo de tecnología semántica desplegada en la Nube, que actuará como socio industrial y líder del proyecto, y que tiene como objetivo la realización de un prototipo que sirva para la comercialización del servicio de Text Analytics descrito, Y, por otro lado, el grupo OEG de la UPM, quienes lideran actualmente el proyecto de esDBpedia y desarrollaron esDBpedia High-Q,Finalmente, y dado el marcado interés comercial de este proyecto y el potencial comercializador de los resultados del mismo, el consorcio ha planteado un desarrollo basado en metodologías ágiles que permitan la interacción desde etapas tempranas del proyecto con usuarios y posibles clientes finales, Así, ha involucrado en la evaluación del mismo a distintas empresas objetivo comercial del servicio (por ejemplo, bigml) o que han expresado interés en las tecnologías del mismo (como la Biblioteca Nacional), Estos elementos innovadores son claves a la hora de sobrepasar las soluciones actuales y desbloquear el valor de negocio que supone el Text Analytics desde un punto de vista semántico, En la era de las grandes cantidades de datos (Big Data), son necesarios servicios avanzados que permitan a las empresas utilizar plenamente sus datos (doumentos en su mayoría) y tomar ventaja de las últimas innovaciones en las tecnologías del procesamiento del lenguaje en la Nube, ver más
01/01/2019
155K€

Línea de financiación: concedida

El organismo AGENCIA ESTATAL DE INVESTIGACIÓN notifico la concesión del proyecto el día 2019-01-01
AEI No se conoce la línea exacta de financiación, pero conocemos el organismo encargado de la revisión del proyecto.
Presupuesto El presupuesto total del proyecto asciende a 155K€
Líder del proyecto
TAIGER SPAIN No se ha especificado una descripción o un objeto social para esta compañía.