Innovating Works

TIN2014-54565-JIN

Financiado
APROXIMANDO LA COMPUTACION DE ALTAS PRESTACIONES A LAS TECNOLOGIAS BIG DATA: APL...
APROXIMANDO LA COMPUTACION DE ALTAS PRESTACIONES A LAS TECNOLOGIAS BIG DATA: APLICACION AL PROCESAMIENTO DEL LENGUAJE NATURAL EN LA SOCIEDAD DIGITAL MODERNA, SE ESTIMA QUE CADA DIA CREAMOS ALREDEDOR DE 2,5 TRILLONES DE BYTES DE DATOS (2,5 EXABYTES), TANTO QUE EL 90% DE LOS DATOS EN TODO EL MUNDO FUERON CREADOS TAN SOLO EN LOS ULTIMOS DOS AÑOS [1], ESTOS... EN LA SOCIEDAD DIGITAL MODERNA, SE ESTIMA QUE CADA DIA CREAMOS ALREDEDOR DE 2,5 TRILLONES DE BYTES DE DATOS (2,5 EXABYTES), TANTO QUE EL 90% DE LOS DATOS EN TODO EL MUNDO FUERON CREADOS TAN SOLO EN LOS ULTIMOS DOS AÑOS [1], ESTOS DATOS PROVIENEN DE TODO TIPO DE FUENTES: SENSORES UTILIZADOS PARA OBTENER INFORMACION SOBRE EL CLIMA, PUBLICACIONES EN REDES SOCIALES, BLOGS, IMAGENES DIGITALES Y VIDEOS, ETC, ASI POR EJEMPLO, TWITTER GENERA UNOS 8 TERABYTES DE DATOS AL DIA, MIENTRAS FACEBOOK CAPTURA UNOS 100 TERABYTES, ESTE GRAN CONJUNTO DE DATOS ES LO QUE SE CONOCE COMO BIG DATA, UNA DE LAS PRINCIPALES CARACTERISTICAS DE ESTA CANTIDAD DE INFORMACION ES QUE, EN MUCHOS CASOS, SE ENCUENTRA SIN ESTRUCTURAR,EL PROCESAMIENTO DEL LENGUAJE NATURAL (PLN) ESTA CONSIDERADA COMO UNA DE LAS METODOLOGIAS MAS APROPRIADAS PARA PODER ESTRUCTURAR Y ORGANIZAR LA INFORMACION TEXTUAL ACCESIBLE A TRAVES DE INTERNET, EL PROCESAMIENTO LINGUISTICO DE GRANDES CANTIDADES DE TEXTO ES UNA TAREA COMPLEJA QUE REQUIERE EL USO DE VARIAS SUBTAREAS ORGANIZADAS EN MODULOS INTERRELACIONADOS, UNO DE LOS MAYORES PROBLEMAS DE LAS TECNICAS DE PROCESAMIENTO LINGUISTICO ES SU ALTO COSTE COMPUTACIONAL Y SUS PROBLEMAS DE ESCALABILIDAD, LO QUE LAS HACEN INVIABLES PARA EL ANALISIS DE GRANDES VOLUMENES (GIGABYTES O TERABYTES) DE DOCUMENTOS, POR ESTA RAZON, CONSIDERAMOS QUE LA COMPUTACION DE ALTAS PRESTACIONES (HPC) Y EL USO DE ESTRATEGIAS ORIENTADAS A BIG DATA ENCAJAN DE FORMA NATURAL COMO SOLUCION A LA LIMITADA EFICIENCIA COMPUTACIONAL DE LOS MODULOS PARA EL PROCESAMIENTO LINGUISTICO, EL OBJETIVO PRINCIPAL DEL PROYECTO SERA EL DE DESARROLLAR UN CONJUNTO DE NUEVAS HERRAMIENTAS Y SOLUCIONES PARA PROCESAMIENTO BIG DATA, LO QUE VA A PERMITIR INTEGRAR EN UNA SUITE PARALELA Y ESCALABLE UN CONJUNTO DE MODULOS MULTILINGUES PARA EL PROCESAMIENTO DEL LENGUAJE NATURAL, ESTA SUITE DEBE PROCESAR GRANDES CANTIDADES DE TEXTO EN TIEMPOS DE EJECUCION REDUCIDOS Y, AL MISMO TIEMPO, HACER UN USO EFICIENTE DE LAS PLATAFORMAS HARDWARE DE ALTAS PRESTACIONES QUE SE CONSIDEREN, PRESTANDO ESPECIAL ATENCION A LAS ARQUITECTURAS HETEROGENEAS, EN CONCRETO, SE VAN A CONSIDERAR MODULOS PARA LA EXTRACCION DE TERMINOS MULTIPALABRA, ANALISIS SINTACTICO, EXTRACCION DE TRIPLETAS, ANALISIS DE CORREFERENCIA Y ANALISIS DE SENTIMIENTOS, DEBEMOS DESTACAR QUE LOS NUEVOS MODULOS PLN QUE SE VAN A DESARROLLAR EN ESTE PROYECTO PODRAN UTILIZARSE EN APLICACIONES LINGUISTICAS MAS COMPLEJAS Y DE ALTO NIVEL COMO LA TRADUCCION AUTOMATICA, LA RECUPERACION DE INFORMACION, SISTEMAS DE VIGILANCIA TECNOLOGICA, ETC, ASIMISMO, LAS HERRAMIENTAS GENERADAS COMO FRUTO DE LAS INVESTIGACIONES DEL PROYECTO SERAN DE PROPOSITO GENERAL Y, POR TANTO, PODRIAN APLICARSE A CODIGOS O APLICACIONES PROVENIENTES DE AREAS DIFERENTES A LA DEL PROCESAMIENTO DEL LENGUAJE NATURAL, POR LO TANTO, ESTAMOS HABLANDO DE UN PROYECTO MULTIDISCIPLINAR QUE SUPONE EL ACERCAMIENTO DE DOS AREAS DE INVESTIGACION TRADICIONALMENTE DISTANTES COMO SON EL HPC Y EL PLN, Y DONDE LOS RESULTADOS DE LAS INVESTIGACIONES QUE SE LLEVARAN A CABO TIENEN UN GRAN POTENCIAL PARA SER TRANSFERIDOS AL TEJIDO EMPRESARIAL, DEBEMOS DESTACAR QUE LOS PROBLEMAS QUE SE ABORDARAN EN EL PROYECTO ESTAN ALINEADOS CON LOS RETOS DE LA SOCIEDAD DESCRITOS TANTO EN LA "ESTRATEGIA ESPAÑOLA DE CIENCIA Y TECNOLOGIA E INNOVACION" COMO EN LA ESTRATEGIA HORIZONTE 2020 DE LA UNION EUROPEA, [1] IBM, BIG DATA AT THE SPEED OF BUSINESS: HTTP://WWW-01,IBM,COM/SOFTWARE/DATA/BIGDATA/ COMPUTACIÓN DE ALTAS PRESTACIONES\BIG DATA\PROCESAMIENTO DEL LENGUAJE NATURAL\PARALELISMO ver más
01/01/2014
USC
204K€
Perfil tecnológico estimado

Línea de financiación: concedida

El organismo AGENCIA ESTATAL DE INVESTIGACIÓN notifico la concesión del proyecto el día 2014-01-01
Presupuesto El presupuesto total del proyecto asciende a 204K€
Líder del proyecto
UNIVERSIDAD DE SANTIAGO DE COMPOSTELA No se ha especificado una descripción o un objeto social para esta compañía.
Total investigadores 234