Descripción del proyecto
EL PROCESADO DE DOCUMENTOS MANUSCRITOS ES UNA TAREA DE AMPLIO INTERES PARA DIVERSOS PROPOSITOS, COMO AQUELLOS RELACIONADOS CON LA PRESERVACION DEL ACERVO CULTURAL, LAS TECNICAS DE RECONOCIMIENTO DE TEXTO MANUSCRITO SE HAN APLICADO CON EXITO EN LA ULTIMA DECADA PARA OBTENER TRANSCRIPCIONES DE DOCUMENTOS MANUSCRITOS, Y LAS TECNICAS DE DETECCION DE PALABRAS CLAVE SE HAN APLICADO EN LA BUSQUEDA DE TERMINOS ESPECIFICOS EN COLECCIONES DE IMAGENES CORRESPONDIENTES A TEXTOS MANUSCRITOS, SIN EMBARGO, LOS RESULTADOS DE TRANSCRIPCION E INDEXADO ESTAN LEJOS DE SER PERFECTOS, AUNQUE LOS MODELOS USADOS TANTO PARA EL RECONOCIMIENTO DE TEXTO MANUSCRITO COMO PARA LA DETECCION DE PALABRAS CLAVE HAN EXPERIMENTADO UNA SENSIBLE EVOLUCION Y LOS RESULTADOS ACTUALES HAN MEJORADO AMPLIAMENTE CON RESPECTO A LOS OBTENIDOS CON LAS PROPUESTAS INICIALES, EN ESTE MARCO, EL USO DE NUEVAS FUENTES DE DATOS SURGE COMO EL NUEVO PARADIGMA QUE DEBERIA PERMITIR UNA MEJOR TRANSCRIPCION E INDEXADO DE DOCUMENTOS MANUSCRITOS, EXISTEN TRES FUENTES PRINCIPALES DEDATOS DISTINTAS A CONSIDERAR: CONTEXTO DEL DOCUMENTO (ESTILO, ESCRITOR, EPOCA HISTORICA, TEMATICAS, ,,,), DATOS MULTIMODALES (REPRESENTACIONES DEL DOCUMENTO EN UNA MODALIDAD DISTINTA, COMO LA SEÑAL DE AUDIO DE UN DICTADO DEL TEXTO), Y LA REALIMENTACION DEL USUARIO (CORRECCIONES, ENMIENDAS, ,,,), EL PROYECTO COMUN-HAT SE ORIENTA A LA INTEGRACION DE ESTAS FUENTES DE DATOS EN LAS TAREAS DE TRANSCRIPCION E INDEXADO PARA DOCUMENTOS MANUSCRITOS, EL PROYECTO ESTUDIARA EL USO DEL CONTEXTO DERIVADO DEL ANA¡LISIS DE LOS DOCUMENTOS CON EL FIN DE MEJORAR LOS RESULTADOS DE RECONOCIMIENTO, QUE PODRAN SER USADOS PARA TRANSCRIPCION E INDEXADO, ADEMAS, EXPLORARA COMO LA MULTIMODALIDAD PUEDE AYUDAR EN EL PROCESO DE RECONOCIMIENTO PARRA OBTENER TRANSCRIPCIONES MAS PRECISAS, ADEMAS, EN EL CASO DE DOCUMENTOS ANTIGUOS PUEDE SER INTERESANTE OBTENER UNA TRANSCRIPCION AUTOMATICA EN UNAVERSION MODERNA DEL IDIOMA, O INCLUSO EN OTRO IDIOMA, ASI, EL OBJETIVO FINAL SERA LA INCLUSION DE CONTEXTO, MULTIMODALIDAD Y MODERNIZACION EN UN MARCO DE TRANSCRIPCION DE TEXTO ASISTIDO CON IMPLICACION DEL USUARIO, INCORPORANDO CAPACIDADES COMO LA CONTEXTUALIZACION DE DOCUMENTOS, ENTRADA MULTIMODAL, TRADUCCION DE TERMINOS Y REALIMENTACION DEL USUARIO, TODO ELLO SE REFLEJARA EN LA CONSTRUCCION DE UNA PLATAFORMA DE TRANSCRIPCION E INDEXADO USABLE TANTO POR PROFESIONALES COMO POR NO PROFESIONALES, PUDIENDO CONTRIBUIR EN ACTIVIDADES COLABORATIVAS DE PRESERVACION DE LA HERENCIA CULTURAL Y DE OBTENCION DE VERSIONES ACCESIBLES DE LOS CORPUS INVOLUCRADOS, FINALMENTE, EL ACCESO A LOS DATOS GENERADOS PODRA REALIZARSE TANTO POR PROFESIONALES DE UN AREA ESPECIFICA COMO POR NO PROFESIONALES CON DISTINTOS INTERESES, TRANSCRIPCIÓN-INDEXADO TEXTO MANUSCRITO\PROCESO DOCUMENTOS HISTÓRICOS\ANOTACIÓN COLABORATIVA\MULTIMODALIDAD