Mejora de la calidad de los datos de la DBpedia del español (esDBpedia) mediante...
Mejora de la calidad de los datos de la DBpedia del español (esDBpedia) mediante inteligencia colectiva humana (HcommonK)
El proyecto HcommonK propone la mejora de los servicios de Text Analytics en la Nube, mediante el uso de procesamiento del lenguaje natural (NLP) y Deep Learning, utilizando esDBpedia high-Q como grafo de conocimiento, mejorada co...
El proyecto HcommonK propone la mejora de los servicios de Text Analytics en la Nube, mediante el uso de procesamiento del lenguaje natural (NLP) y Deep Learning, utilizando esDBpedia high-Q como grafo de conocimiento, mejorada con la incorporación de nuevos datos estructurados obtenidos de textos (como los contenidos en Wikipedia y otros repositorios textuales) y la incorporación de conocimiento humano explícito mediante la figura del colaborador (revisor/curador), En ese sentido, el proyecto HcommonK explotará los beneficios que supone esDBpedia High-Q como fuente de grandes volúmenes de datos abiertos y recursos lingüísticos disponibles en la Web de Datos enlazados para mejorar la calidad de las herramientas de procesamiento de lenguaje natural de nuestra empresa, Las ventajas que proporciona frente a otros tipos de recursos cerrados como WordNet, que han sido utilizado como bases de conocimientos en numerosos tareas relacionadas con el procesamiento del lenguaje, son: su naturaleza abierta, su continua evolución de forma colaborativa, y su crecimiento incremental mediante la inclusión de nuevos recursos y la creación de enlaces con los ya existentes, Sin embargo, su uso tampoco está exento de riesgos, siendo necesaria la provisión de servicios capaces de diagnosticar la calidad del grafo de conocimiento generado, mediante controles de calidad que involucren a humanos, previo a su utilización en los procesos de análisis del lenguaje necesarios,La DBpedia del español (esDBpedia) es un servicio que el Ontology Engineering Group (OEG) de la UPM ofrece de forma gratuita a la comunidad hispano-hablante, Como resultado del proyecto anterio, disponemos de una esDBpedia mejorada (esDBpedia-HQ) con más datos y una medida de su fiabilidad, Para conseguir los objetivos del proyecto, el consorcio del proyecto está formado por TAIGER, una empresa con larga experiencia en el desarrollo de tecnología semántica desplegada en la Nube, que actuará como socio industrial y líder del proyecto, y que tiene como objetivo la realización de un prototipo que sirva para la comercialización del servicio de Text Analytics descrito, Y, por otro lado, el grupo OEG de la UPM, quienes lideran actualmente el proyecto de esDBpedia y desarrollaron esDBpedia High-Q,Finalmente, y dado el marcado interés comercial de este proyecto y el potencial comercializador de los resultados del mismo, el consorcio ha planteado un desarrollo basado en metodologías ágiles que permitan la interacción desde etapas tempranas del proyecto con usuarios y posibles clientes finales, Así, ha involucrado en la evaluación del mismo a distintas empresas objetivo comercial del servicio (por ejemplo, bigml) o que han expresado interés en las tecnologías del mismo (como la Biblioteca Nacional), Estos elementos innovadores son claves a la hora de sobrepasar las soluciones actuales y desbloquear el valor de negocio que supone el Text Analytics desde un punto de vista semántico, En la era de las grandes cantidades de datos (Big Data), son necesarios servicios avanzados que permitan a las empresas utilizar plenamente sus datos (doumentos en su mayoría) y tomar ventaja de las últimas innovaciones en las tecnologías del procesamiento del lenguaje en la Nube,ver más
Seleccionando "Aceptar todas las cookies" acepta el uso de cookies para ayudarnos a brindarle una mejor experiencia de usuario y para analizar el uso del sitio web. Al hacer clic en "Ajustar tus preferencias" puede elegir qué cookies permitir. Solo las cookies esenciales son necesarias para el correcto funcionamiento de nuestro sitio web y no se pueden rechazar.
Cookie settings
Nuestro sitio web almacena cuatro tipos de cookies. En cualquier momento puede elegir qué cookies acepta y cuáles rechaza. Puede obtener más información sobre qué son las cookies y qué tipos de cookies almacenamos en nuestra Política de cookies.
Son necesarias por razones técnicas. Sin ellas, este sitio web podría no funcionar correctamente.
Son necesarias para una funcionalidad específica en el sitio web. Sin ellos, algunas características pueden estar deshabilitadas.
Nos permite analizar el uso del sitio web y mejorar la experiencia del visitante.
Nos permite personalizar su experiencia y enviarle contenido y ofertas relevantes, en este sitio web y en otros sitios web.