APROXIMANDO LA COMPUTACION DE ALTAS PRESTACIONES A LAS TECNOLOGIAS BIG DATA: APL...
APROXIMANDO LA COMPUTACION DE ALTAS PRESTACIONES A LAS TECNOLOGIAS BIG DATA: APLICACION AL PROCESAMIENTO DEL LENGUAJE NATURAL
EN LA SOCIEDAD DIGITAL MODERNA, SE ESTIMA QUE CADA DIA CREAMOS ALREDEDOR DE 2,5 TRILLONES DE BYTES DE DATOS (2,5 EXABYTES), TANTO QUE EL 90% DE LOS DATOS EN TODO EL MUNDO FUERON CREADOS TAN SOLO EN LOS ULTIMOS DOS AÑOS [1], ESTOS...
EN LA SOCIEDAD DIGITAL MODERNA, SE ESTIMA QUE CADA DIA CREAMOS ALREDEDOR DE 2,5 TRILLONES DE BYTES DE DATOS (2,5 EXABYTES), TANTO QUE EL 90% DE LOS DATOS EN TODO EL MUNDO FUERON CREADOS TAN SOLO EN LOS ULTIMOS DOS AÑOS [1], ESTOS DATOS PROVIENEN DE TODO TIPO DE FUENTES: SENSORES UTILIZADOS PARA OBTENER INFORMACION SOBRE EL CLIMA, PUBLICACIONES EN REDES SOCIALES, BLOGS, IMAGENES DIGITALES Y VIDEOS, ETC, ASI POR EJEMPLO, TWITTER GENERA UNOS 8 TERABYTES DE DATOS AL DIA, MIENTRAS FACEBOOK CAPTURA UNOS 100 TERABYTES, ESTE GRAN CONJUNTO DE DATOS ES LO QUE SE CONOCE COMO BIG DATA, UNA DE LAS PRINCIPALES CARACTERISTICAS DE ESTA CANTIDAD DE INFORMACION ES QUE, EN MUCHOS CASOS, SE ENCUENTRA SIN ESTRUCTURAR,EL PROCESAMIENTO DEL LENGUAJE NATURAL (PLN) ESTA CONSIDERADA COMO UNA DE LAS METODOLOGIAS MAS APROPRIADAS PARA PODER ESTRUCTURAR Y ORGANIZAR LA INFORMACION TEXTUAL ACCESIBLE A TRAVES DE INTERNET, EL PROCESAMIENTO LINGUISTICO DE GRANDES CANTIDADES DE TEXTO ES UNA TAREA COMPLEJA QUE REQUIERE EL USO DE VARIAS SUBTAREAS ORGANIZADAS EN MODULOS INTERRELACIONADOS, UNO DE LOS MAYORES PROBLEMAS DE LAS TECNICAS DE PROCESAMIENTO LINGUISTICO ES SU ALTO COSTE COMPUTACIONAL Y SUS PROBLEMAS DE ESCALABILIDAD, LO QUE LAS HACEN INVIABLES PARA EL ANALISIS DE GRANDES VOLUMENES (GIGABYTES O TERABYTES) DE DOCUMENTOS, POR ESTA RAZON, CONSIDERAMOS QUE LA COMPUTACION DE ALTAS PRESTACIONES (HPC) Y EL USO DE ESTRATEGIAS ORIENTADAS A BIG DATA ENCAJAN DE FORMA NATURAL COMO SOLUCION A LA LIMITADA EFICIENCIA COMPUTACIONAL DE LOS MODULOS PARA EL PROCESAMIENTO LINGUISTICO, EL OBJETIVO PRINCIPAL DEL PROYECTO SERA EL DE DESARROLLAR UN CONJUNTO DE NUEVAS HERRAMIENTAS Y SOLUCIONES PARA PROCESAMIENTO BIG DATA, LO QUE VA A PERMITIR INTEGRAR EN UNA SUITE PARALELA Y ESCALABLE UN CONJUNTO DE MODULOS MULTILINGUES PARA EL PROCESAMIENTO DEL LENGUAJE NATURAL, ESTA SUITE DEBE PROCESAR GRANDES CANTIDADES DE TEXTO EN TIEMPOS DE EJECUCION REDUCIDOS Y, AL MISMO TIEMPO, HACER UN USO EFICIENTE DE LAS PLATAFORMAS HARDWARE DE ALTAS PRESTACIONES QUE SE CONSIDEREN, PRESTANDO ESPECIAL ATENCION A LAS ARQUITECTURAS HETEROGENEAS, EN CONCRETO, SE VAN A CONSIDERAR MODULOS PARA LA EXTRACCION DE TERMINOS MULTIPALABRA, ANALISIS SINTACTICO, EXTRACCION DE TRIPLETAS, ANALISIS DE CORREFERENCIA Y ANALISIS DE SENTIMIENTOS, DEBEMOS DESTACAR QUE LOS NUEVOS MODULOS PLN QUE SE VAN A DESARROLLAR EN ESTE PROYECTO PODRAN UTILIZARSE EN APLICACIONES LINGUISTICAS MAS COMPLEJAS Y DE ALTO NIVEL COMO LA TRADUCCION AUTOMATICA, LA RECUPERACION DE INFORMACION, SISTEMAS DE VIGILANCIA TECNOLOGICA, ETC, ASIMISMO, LAS HERRAMIENTAS GENERADAS COMO FRUTO DE LAS INVESTIGACIONES DEL PROYECTO SERAN DE PROPOSITO GENERAL Y, POR TANTO, PODRIAN APLICARSE A CODIGOS O APLICACIONES PROVENIENTES DE AREAS DIFERENTES A LA DEL PROCESAMIENTO DEL LENGUAJE NATURAL, POR LO TANTO, ESTAMOS HABLANDO DE UN PROYECTO MULTIDISCIPLINAR QUE SUPONE EL ACERCAMIENTO DE DOS AREAS DE INVESTIGACION TRADICIONALMENTE DISTANTES COMO SON EL HPC Y EL PLN, Y DONDE LOS RESULTADOS DE LAS INVESTIGACIONES QUE SE LLEVARAN A CABO TIENEN UN GRAN POTENCIAL PARA SER TRANSFERIDOS AL TEJIDO EMPRESARIAL, DEBEMOS DESTACAR QUE LOS PROBLEMAS QUE SE ABORDARAN EN EL PROYECTO ESTAN ALINEADOS CON LOS RETOS DE LA SOCIEDAD DESCRITOS TANTO EN LA "ESTRATEGIA ESPAÑOLA DE CIENCIA Y TECNOLOGIA E INNOVACION" COMO EN LA ESTRATEGIA HORIZONTE 2020 DE LA UNION EUROPEA, [1] IBM, BIG DATA AT THE SPEED OF BUSINESS: HTTP://WWW-01,IBM,COM/SOFTWARE/DATA/BIGDATA/ COMPUTACIÓN DE ALTAS PRESTACIONES\BIG DATA\PROCESAMIENTO DEL LENGUAJE NATURAL\PARALELISMOver más
Seleccionando "Aceptar todas las cookies" acepta el uso de cookies para ayudarnos a brindarle una mejor experiencia de usuario y para analizar el uso del sitio web. Al hacer clic en "Ajustar tus preferencias" puede elegir qué cookies permitir. Solo las cookies esenciales son necesarias para el correcto funcionamiento de nuestro sitio web y no se pueden rechazar.
Cookie settings
Nuestro sitio web almacena cuatro tipos de cookies. En cualquier momento puede elegir qué cookies acepta y cuáles rechaza. Puede obtener más información sobre qué son las cookies y qué tipos de cookies almacenamos en nuestra Política de cookies.
Son necesarias por razones técnicas. Sin ellas, este sitio web podría no funcionar correctamente.
Son necesarias para una funcionalidad específica en el sitio web. Sin ellos, algunas características pueden estar deshabilitadas.
Nos permite analizar el uso del sitio web y mejorar la experiencia del visitante.
Nos permite personalizar su experiencia y enviarle contenido y ofertas relevantes, en este sitio web y en otros sitios web.