Innovating Works

PID2021-126808OB-I00

Financiado
RAZONAMIENTO EN GRAFOS PARA INTERPRETACION AUTOMATICA Y APRENDIZAJE. APLICACION...
RAZONAMIENTO EN GRAFOS PARA INTERPRETACION AUTOMATICA Y APRENDIZAJE. APLICACION A INTELIGENCIA DOCUMENTAL LA AUTOMATIZACION ROBOTICA DE PROCESOS (RPA) EN FINTECH, LEGALTECH, INSURTECH, ETC. REQUIERE GESTIONAR AUTOMATICAMENTE LA LECTURA E INTERPRETACION DE IMAGENES DE DOCUMENTOS EN VARIOS FORMATOS (FACTURAS, FORMULARIOS, CARTAS, FIGURA... LA AUTOMATIZACION ROBOTICA DE PROCESOS (RPA) EN FINTECH, LEGALTECH, INSURTECH, ETC. REQUIERE GESTIONAR AUTOMATICAMENTE LA LECTURA E INTERPRETACION DE IMAGENES DE DOCUMENTOS EN VARIOS FORMATOS (FACTURAS, FORMULARIOS, CARTAS, FIGURAS…). LA CAPACIDAD DE LEER E INTERPRETAR DOCUMENTOS, REFERIDO COMO DOCUMENT INTELLIGENCE (DI), ES UN DESAFIO DEBIDO A LA GRAN VARIEDAD INTERCLASE Y SIMILITUD INTRACLASE, HETEROGENEIDAD (IMPRESOS, ESCRITOS A MANO, GRAFICOS) Y AMBIGUEDAD (SIGNIFICADO DEPENDIENTE DEL DOMINIO, LENGUAJE). EN EL SECTOR CULTURAL, ESTAN SURGIENDO APLICACIONES INNOVADORAS RELACIONADAS CON EL ACCESO Y LA PRESERVACION DEL PATRIMONIO CULTURAL QUE REQUIEREN PROCESAMIENTO INTELIGENTE MASIVO DE DOCUMENTOS DE ARCHIVOS HISTORICOS Y BIBLIOTECAS. COMO OBJETOS DE COMUNICACION, LOS DOCUMENTOS SE PUEDEN ANALIZAR DE ACUERDO CON REGLAS DE COMPOSICION. LAS ARQUITECTURAS DE MODELOS DE LENGUAJE (ML) QUE EL NLP APLICA A ORACIONES DE TEXTO, SON UN PARADIGMA VALIDO PARA SER ADOPTADO POR DI. LOS LM EN DI PUEDEN ESTAR RESPALDADOS POR GRAFOS, QUE REPRESENTAN DE MANERA ROBUSTA OBJETOS Y RELACIONES. EL RAZONAMIENTO RELACIONAL PARA EL ANALISIS DE DOCUMENTOS IMPLICA LA MANIPULACION DE REPRESENTACIONES ESTRUCTURADAS DE OBJETOS DE DOCUMENTO SEMANTICAMENTE SIGNIFICATIVOS (TITULOS, TABLAS, FIGURAS ...) Y RELACIONES, UTILIZANDO REGLAS DE COMPOSICION. LOS ENFOQUES MODERNOS DE IA UTILIZAN UN BIAS INDUCTIVO RELACIONAL, IMPONIENDO RESTRICCIONES ENTRE ENTIDADES EN EL TIEMPO DE APRENDIZAJE. ES UNA TAREA FUNDAMENTAL EN LA SEGMENTACION SEMANTICA, CLASIFICACION DE DOCUMENTOS, RECONOCIMIENTO DE OBJETOS DE DOCUMENTOS, VISUAL Q&A DE DOCUMENTOS ... LAS REDES NEURONALES DE GRAFOS (GNN) OPERAN EN DATOS ESTRUCTURADOS EN GRAFOS QUE EXTIENDEN LAS CNN A LA GEOMETRIA NO EUCLIDEA. LOS TRANSFORMERS, CON MECANISMOS DE ATENCION Y CODIFICACION POSICIONAL, HAN REPRESENTADO UN AVANCE EN EL PROCESAMIENTO DE DATOS SECUENCIALES. SE HAN PROPUESTO EXTENSIONES A IMAGENES Y GRAFOS (VISION Y GRAPH TRANSFORMERS). GRAIL PROPONE QUE EL RAZONAMIENTO RELACIONAL, UTILIZANDO EL APRENDIZAJE DE REPRESENTACION DE GRAFICOS BASADO EN GNN Y GRAPH TRANSFORMERS (GT), PERMITE DEFINIR UN MARCO COMPUTACIONAL NOVEDOSO PARA ABORDAR LOS DESAFIOS DE LA COMPRENSION DE DOCUMENTOS. LOS OBJETIVOS SON: 1. RAZONAMIENTO RELACIONAL. INTEGRACION DE MODELOS DE GNN Y GT PARA APRENDER REPRESENTACIONES PARA EL LENGUAJE DE DOCUMENTOS. EL MODELO DE LENGUAJE DE DOCUMENTOS SE REFIERE A LA DESCRIPCION COMPOSITIVA EN TERMINOS DE OBJETOS DE CONSTRUCCION, RELACIONES Y SUS PROPIEDADES. 2. EMBEDDINGS MULTIMODALES. EVALUACION DEL RENDIMIENTO DE LA REPRESENTACION ESTRUCTURAL PROPUESTA CON RESPECTO A / EN COMBINACION CON OTRAS FUENTES DE DATOS, EN PARTICULAR DATOS TEXTUALES Y VISUALES. 3. APRENDIZAJE MULTITAREA. EVALUACION DEL RENDIMIENTO DEL MODELO DE LENGUAJE DE DOCUMENTOS PROPUESTO EN TAREAS DE DI: SEGMENTACION SEMANTICA, CLASIFICACION, RECONOCIMIENTO DE OBJETOS DE DOCUMENTOS E INFERENCIA DE RELACIONES. 4. MANEJO DE LA ESCASEZ DE DATOS DE ENTRENAMIENTO: APRENDIZAJE FEW-SHOT Y Y AUTO-SUPERVISADO PARA ALIVIAR EL PROBLEMA DE LA ANOTACION DE DATOS (GRAFOS) MEDIANTE CLASIFICADORES DE APRENDIZAJE QUE SE GENERALIZAN BIEN INCLUSO CUANDO SE ENTRENAN A PARTIR DE POCAS MUESTRAS. TAMBIEN PROPONDREMOS MODELOS GENERATIVOS PARA SINTETIZAR IMAGENES DE DOCUMENTOS. LOS RESULTADOS DE GRAIL SE EVALUARAN EN DOS ESCENARIOS: INTERPRETACION DE DOCUMENTOS VISUALES HISTORICOS Y ADMINISTRATIVOS, EN COLABORACION CON LAS EPO PUBLICAS Y PRIVADAS. NTELIGENCIA DOCUMENTAL\VISION POR COMPUTADOR\INTERPRETACION DE DOCUMENTOS\GENERACION DE DOCUMENTOS\APRENDIZAJE FEW-SHOT\TRANSFORMERS DE GRAFOS\APRENDIZAJE DE REPRESENTACIONES DE GRAFO\MODELOS DE LENGUAJE ver más
01/01/2021
186K€

Línea de financiación: concedida

El organismo AGENCIA ESTATAL DE INVESTIGACIÓN notifico la concesión del proyecto el día 2021-01-01
Presupuesto El presupuesto total del proyecto asciende a 186K€
Líder del proyecto
CENTRO DE VISIÓN POR COMPUTADOR No se ha especificado una descripción o un objeto social para esta compañía.
Perfil tecnológico TRL 4-5 866K