Descripción del proyecto
LINKED DATA ESTA GANANDO POPULARIDAD COMO LA REPRESENTACION DE DATOS MAS ADECUADA EN MUCHOS CAMPOS DE LA CIENCIA Y LA INDUSTRIA, ESTOS DATOS SE MODELAN COMO UN GRAFO DONDE LOS NODOS REPRESENTAN PERSONAS, DOCUMENTOS, IMAGENES, ETC Y LAS ARISTAS REPRESENTAN LAS RELACIONES ENTRE LAS ENTIDADES: RELACIONES DE AMISTAD, CITAS ENTRE DOCUMENTOS, RETWEETS, PERSONAS QUE APARECEN EN LAS IMAGENES, ETC, EL VOLUMEN DE DATOS ESTA CRECIENDO A UN RITMO MUY RAPIDO, Y LOS CONJUNTOS DE DATOS CON MILES DE DECENAS DE MILLONES DE RELACIONES YA NO SON EXTRAÑOS, SIN EMBARGO, LA TECNOLOGIA PARA LINKED DATA ACTUAL NO ES CAPAZ DE MANTENER EL RIMO DE CRECIMIENTO DE LOS DATOS, LA TECNOLOGIA DE GESTION DE GRAFOS Y RDF NO SON CAPACES DE RESOLVER CONSULTAS COMPLEJAS DE FORMA EFICIENTE PARA BIG DATA, LOS SISTEMAS DE ANALISIS DE GRAFOS EN LA NUBE TIENEN UNA ESCALABILIDAD LIMITADA O CARECEN DE CARACTERISTICAS TRANSACCIONALES, Y LA MAYORIA DE ALGORITMOS DE ANALISIS DE REDES SOCIALES NO ESTAN PREPARADOS PARA TRABAJAR SOBRE BIG DATA, DURANTE LOS PROXIMOS AÑOS SE PLANTEA COMO RETO EL ALMACENAR Y PROCESAR CONSULTAS COMPLEJAS SOBRE LINKED DATA CON BILLONES DE RELACIONES,BAT-GRAPH HACE FRENTE A ESTE RETO MEDIANTE LA DEFINICION DE TRES OBJETIVOS GENERALES: LA CREACION DE ALGORITMOS ANALITICOS ESCALABLES, EL DESARROLLO DE SISTEMAS PARA LINKED DATA AVANZADOS, Y EL DESARROLLO DE LOS PROCEDIMIENTOS DE BENCHMARKING, VALIDAREMOS NUESTROS RESULTADOS USANDO DATOS REALES PROCEDENTES DE LA WEB, REDES SOCIALES Y BASES DE DATOS BIBLIOGRAFICAS,EN PRIMER LUGAR, VAMOS A TRABAJAR EN ALGORITMOS ESCALABLES DE EXTRACCION DE CONOCIMIENTO SOBRE LINKED DATA, VAMOS A DESARROLLAR NUEVOS ALGORITMOS DE DETECCION DE COMUNIDADES, QUE HACEN LA COMPRENSION DE LA RED MAS FACIL MEDIANTE LA AGRUPACION DE ENTIDADES SIMILARES, ADEMAS, VAMOS A CREAR TECNICAS DE RECUPERACION DE INFORMACION QUE TIENEN LAS BASES DE CONOCIMIENTO LINKED DATA Y A EXTRAER CONCEPTOS RELEVANTES PARA LAS NECESIDADES DE LOS USUARIOS CON EL FIN DE UNIR CONCEPTOS QUE NO ESTAN CONECTADOS DIRECTAMENTE EN LA BASE DE CONOCIMIENTO, LO QUE MEJORARA LA PRECISION DE CONSULTA Y LA EXHAUSTIVIDAD,EN SEGUNDO LUGAR, VAMOS A DISEÑAR UN ALGEBRA PARA GRAFOS QUE SERA CAPAZ DE REPRESENTAR LAS CONSULTAS SOBRE LINKED DATA, ADEMAS, VAMOS A CONSTRUIR UN MOTOR DE CONSULTAS QUE IMPLEMENTARA UN OPTIMIZADOR, QUE REESCRIBIRA LOS PLANES DE CONSULTA COMO LOS FLUJOS DE TRABAJO MAS EFICIENTES, POR OTRA PARTE, IMPLEMENTAREMOS UNA BASE DE DATOS EN FORMA DE GRAFO TRANSACCIONAL QUE ALMACENARA LINKED DATA EN EL CLOUD Y PODRA DISTRIBUIR LA COMPUTACION CON EL FIN DE ESCALAR A SISTEMAS BIG DATA,EN TERCER LUGAR, PROPONDREMOS LINKED DATA BENCHMARKS QUE INCLUIRAN CONSULTAS Y GENERADORES DE DATOS REALISTAS, COMPRENSIBLES Y REPRESENTATIVOS, ESTAS PRACTICAS DE BENCHMARKING SE INCLUIRAN EN LAS GUIAS DE LA FUTURA ORGANIZACION LDBC, QUE REGULARA INTERNACIONALMENTE LAS MEJORES PRACTICAS DE BENCHMARKING EN EL MUNDO LINKED DATA,BAT-GRAPH ESTA BIEN ALINEADO CON LA EXPERIENCIA DE LOS MIEMBROS DE DAMA-UPC Y LOS OBJETIVOS FUTUROS DE ESPAÑA Y LA UE, EN RELACION CON LAS REDES SOCIALES Y LINKED DATA, ADEMAS, EL PROYECTO ESTA RESPALDADO POR LAS ACTIVIDADES DE INVESTIGACION DE DAMA-UPC EN DOS PROYECTOS FINANCIADOS POR EL FP7 DE LA UE, ESTO GARANTIZARA LA COLABORACION DE NUESTRO GRUPO DE INVESTIGACION CON LOS MEJORES CENTROS DE INVESTIGACION Y COMPAÑIAS EUROPEAS, Y LAS CREACION PUBLICACIONES COMPARTIDAS CON ELLOS, LO QUE DARA UNA AMPLIA DIFUSION DE LOS AVANCES DE NUESTRA INVESTIGACION, GESTIÓN DE GRAFOS\ TECNOLOGIA\ ANÁLISIS DE REDES SOCIALES\ BENCHMARKING\ OPTIMIZACIÓN DE CONSULTAS PARA GRAFOS\ GENERACIÓN DE DATOS