Innovating Works

TEC2017-83838-R

Financiado
APRENDIZAJE AUTOMATICO PARA ANALISIS BIG DATA DE FUENTES DOCUMENTALES HETEROGENE...
EXISTEN NUMEROSAS APLICACIONES DE BIG DATA EN LAS QUE SE PLANTEA LA NECESIDAD DE CARACTERIZAR GRANDES POBLACIONES DE ENTIDADES A PARTIR DE TEXTOS ASOCIADOS A ELLAS (AUTORES A PARTIR DE SUS ARTICULOS, EMPRESAS A PARTIR DE SUS SITIO... EXISTEN NUMEROSAS APLICACIONES DE BIG DATA EN LAS QUE SE PLANTEA LA NECESIDAD DE CARACTERIZAR GRANDES POBLACIONES DE ENTIDADES A PARTIR DE TEXTOS ASOCIADOS A ELLAS (AUTORES A PARTIR DE SUS ARTICULOS, EMPRESAS A PARTIR DE SUS SITIOS WEB, ETC), TANTO GLOBALMENTE (GENERANDO AUTOMATICAMENTE MODELOS GRAFICOS O AGRUPACIONES DE ENTIDADES CON CARACTERISTICAS SIMILARES) COMO LOCALMENTE (PREDICIENDO ATRIBUTOS INDIVIDUALES DE LAS ENTIDADES QUE PUEDAN INFERIRSE A PARTIR DE LOS TEXTOS), CON FRECUENCIA SE PLANTEA TAMBIEN LA NECESIDAD DE RELACIONAR ENTIDADES HETEROGENEAS DE POBLACIONES DIFERENTES A PARTIR DE TEXTOS ASOCIADOS A ELLAS (P,EJ, HABILIDADES MENCIONADAS EN OFERTAS DE EMPLEO CON TITULACIONES ACADEMICAS DESCRITAS EN PLANES DE ESTUDIOS), LA HIPOTESIS DE PARTIDA DE ESTE PROYECTO ES QUE ES POSIBLE FORMULAR Y ABORDAR ESTOS PROBLEMAS DE FORMA UNIFICADA MEDIANTE TECNOLOGIAS DE APRENDIZAJE AUTOMATICO (MACHINE LEARNING) Y PROCESAMIENTO DE LENGUAJE NATURAL, EN PARTICULAR, EL USO DE TECNICAS DE PROCESAMIENTO DISTRIBUIDO, ALGORITMOS DE APRENDIZAJE ESTADISTICO, REPRESENTACIONES VECTORIALES DE PALABRAS Y, EN SU CASO, DE UNA ETAPA DE SUPERVISION EFICIENTE, PUEDEN CONTRIBUIR A RESOLVER ESTOS PROBLEMAS DE PREDICCION LOCAL Y DESCRIPCION GLOBAL EN ESCENARIOS CON GRANDES FUENTES DE TEXTOS HETEROGENEAS, EL PROPOSITO DE ESTE PROYECTO ES EXPLORAR ESTA HIPOTESIS DE PARTIDA Y DESARROLLAR NUEVOS ALGORITMOS DE APRENDIZAJE AUTOMATICO QUE SUPEREN LAS LIMITACIONES DE ALGORITMOS EN EL ESTADO DEL ARTE PARA ESTE FIN, EN EL HORIZONTE DE ESTE PROYECTO SE CONCIBE LA IDEA DE CONSTRUIR UNA HERRAMIENTA UNIVERSAL DE ANALISIS DE GRANDES COLECCIONES DOCUMENTALES QUE PUEDA APLICARSE A ESCENARIOS MUY DIFERENTES SIN NECESIDAD DE INTERVENCION EXPERTA (EN LA TECNOLOGIA), Y CON MINIMA INTERVENCION MANUAL (DEL USUARIO FINAL O DEL EXPERTO EN EL DOMINIO DE APLICACION), LOS RESULTADOS ESPERADOS DEL PROYECTO ESTAN ORIENTADOS A ESTE OBJETIVO, UNA HERRAMIENTA DE PROPOSITO GENERAL PERMITIRIA ABORDAR PROBLEMAS MUY DIFERENTES DE ANALISIS DE DATOS WEB O DE FUENTES DE DATOS ABIERTAS, CON APLICACIONES EN EL AMBITO DE LAS ESTADISTICAS OFICIALES O EL ANALISIS DE POBLACIONES, DE INTERES PARA INSTITUCIONES, EMPRESAS E INCLUSO USUARIOS INDIVIDUALES, LA CONSTRUCCION DE UN PRIMER PROTOTIPO SOFTWARE ES OTRO DE LOS OBJETIVOS DEL PROYECTO, APRENDIZAJE AUTOMÁTICO\BIG DATA\MODELOS DE TÓPICOS\CLASIFICACIÓN\VECTORIZACIÓN DE PALABRAS\AGRUPAMIENTO\ESCALABILIDAD\HETEROGENEIDAD ver más
01/01/2017
151K€
Perfil tecnológico estimado

Línea de financiación: concedida

El organismo AGENCIA ESTATAL DE INVESTIGACIÓN notifico la concesión del proyecto el día 2017-01-01
Presupuesto El presupuesto total del proyecto asciende a 151K€
Líder del proyecto
UNIVERSIDAD CARLOS III DE MADRID No se ha especificado una descripción o un objeto social para esta compañía.
Total investigadores 1332