Descripción del proyecto
Hoy día, las empresas manejan extensísimas colecciones documentales escaneadas, en las que destacan por su importancia aquellos documentos que contienen información contable y aquellos que contienen información directamente relacionada con el negocio de la organización, Estarían aquí englobadas las facturas, tickets, balances de ingresos y gastos, cuentas de pérdidas y ganancias, etc ; así como los formularios,Existen características comunes a todos estos documentos, Una es que la información suele estar siempre estructurada, dentro de los documentos, en tablas, disponiendo en cada fila una serie de datos asociados a un determinado ítem o concepto, La segunda característica es que se suelen indicar una serie de datos fijos como emisor, fecha de emisión, cliente, etc, Finalmente, suelen contener una serie de cifras a modo de balance como subtotales y totales, Los formularios contienen una serie de datos esenciales y necesarios para distintos trámites, como una contratación o solicitud, Para un mismo tipo de formulario, los datos a cumplimentar son siempre los mismos, siendo datos críticos para la gestión y administración económica de cualquier organización o empresa, El coste en tiempo y recursos necesarios dentro de las organizaciones para manejar y estructurar la información efectiva que contienen todos estos tipos de documentos es, hoy en día, demasiado elevada, Los sistemas inteligentes de captura o análisis de documentos han tratado de minimizar estos costes mediante técnicas avanzadas de procesamiento de texto e imágenes para extraer la información de las imágenes escaneadas de los documentos, Sin embargo, en lo que se refiere a este tipo de documentos, los sistemas comerciales actuales tienen serias limitaciones para alcanzar un grado de automatización óptimo en los procesos de extracción de informaciónSurge así el proyecto HOLMS: Técnicas Avanzadas de Análisis de Imágenes para Categorización y Extracción de Información en Documentos, con el objetivo de automatizar al máximo los procesos de clasificación y extracción de datos en documentos de tipo contable y formularios, reduciendo también al máximo el esfuerzo humano necesario en la gestión de los mismos, Desde un punto de vista tecnológico, el objetivo del proyecto es ser capaces de convertir meras imágenes de documentos en una representación estructurada y codificada en un lenguaje de marcado basado en XML que sea posteriormente procesable y reusable por sistemas automáticos, De esta forma, la información contenida en los documentos sería más fácil de interpretar, compartir e incluso integrar con los sistemas finales de contabilidad o sistemas de información en general de los clientes finales,El proyecto, se articula en torno a un conjunto de aspectos innovadores con respecto al estado del arte que pueden enumerarse de la siguiente forma:· Document Understanding,· Nuevo enfoque en la detección y extracción de tablas y formularios, · Extracción de Metadatos mediante Análisis de Imágenes,Para conseguir los objetivos establecidos, se hará uso de técnicas de Deep Learning para el Análisis de Documentos y Reconocimiento de Layout, Segmentación de Documentos), Reconocimiento Automático de Tablas y Formularios, Extracción Automática de Metadatos y Modelado y Representación de Documentos, La tecnología resultante va a permitir resolver una serie de problemas concretos actuales: variedad de formatos utilizados en las facturas por los diferentes proveedores, problemas de OCR frente a diferentes factores, mejora del análisis de layout posicinamiento de los bloques de información,,,La solución propuesta beneficiará a diferentes sectores con una alta ineficiencia y sobrecostes en estos procesos: asesoramiento Legal, servicios financieros, servicios públicos, departamentos de RR,HH, gestión de la cadena de valor, operaciones o marketing
en los que esta solución va a suponer no únicamente una mejora en eficiencia sino también una reducción de costes