Descripción del proyecto
AUNQUE EN 2018 LA TRADUCCION AUTOMATICA (TA) DE CALIDAD SIGUE SIENDO UN RETO PARA LA MAYORIA DE PARES DE IDIOMAS, EL DESARROLLO DE ESTE CAMPO EN LOS ULTIMOS AÑOS HACE QUE ESTE CERCA DE SER UNA REALIDAD, LA CONJUNCION DENTRO DE NMT DEL APRENDIZAJE PROFUNDO (DEEP LEARNING), CON LA CLARA APORTACION DE LOS EMBEDDINGS, Y DE LAS TECNICAS NEURONALES HA CONSEGUIDO UNOS RESULTADOS QUE PARECIAN IMPENSABLES HACE TRES AÑOS, POR OTRO LADO LAS EMPRESAS USUARIAS Y LOS USUARIOS PARTICULARES SE HAN FAMILIARIZADO CON LAS VENTAJAS Y LIMITACIONES DEL USO DE ESTA TECNOLOGIA, MIENTRAS LAS PRIMERAS FOCALIZAN EN AUMENTAR LA PRODUCTIVIDAD, COMBINANDO LAS MEMORIAS DE TRADUCCION, LAS HERRAMIENTAS DE TA Y LOS ENTORNOS DE POSTEDICION; LOS SEGUNDOS LA USAN INTENSIVAMENTE A PESAR DE QUE EN MUCHOS CASOS, SOBRE TODO PARA IDIOMAS CON RECURSOS LIMITADOS, LA CALIDAD QUE OFRECEN NO ES COMPARABLE A LA TRADUCCION PROFESIONAL, ESTO HACE QUE LA DEMANDA, TANTO PROFESIONAL COMO SOCIAL (AGENDA DIGITAL), VAYA EN AUMENTO,APOYANDONOS EN LOS TRABAJOS PREVIOS DEL GRUPO DE INVESTIGACION Y RESULTADOS DEL PROYECTO TADEEP Y DE NUESTRA PARTICIPACION EN EL PROYECTO DEL GOBIERNO VASCO MODELA PROPONEMOS INVESTIGAR EN TECNICAS QUE MEJOREN EL ESTADO DEL ARTE DE LOS SISTEMAS DE TA DE APRENDIZAJE PROFUNDO Y NEURONALES, CENTRANDONOS EN TRES ASPECTOS MUY IMPORTANTES: MEJORA DE LA CALIDAD DE LA TRADUCCION NMT Y OBTENCION DE EVALUACIONES FIABLES, HAY DIVERSAS CARENCIAS, SOBRE TODO DE CARA A LA FIDELIDAD DEL TEXTO GENERADO, QUE DEBEN SER ESTUDIADAS Y SOLUCIONADAS: SEGMENTOS SIN TRADUCIR, PROBLEMAS CON TERMINOLOGIA, ENTIDADES NOMBRADAS, CANTIDADES Y ADJETIVOS, TAMBIEN ES IMPORTANTE MEJORAR LOS TIEMPOS DE APRENDIZAJE Y EJECUCION DE ESTOS SISTEMAS, NUEVAS APORTACIONES PARA TRADUCCION AUTOMATICA PARA IDIOMAS CON POCOS RECURSOS, DENTRO DE LOS RESULTADOS DEL PROYECTO TADEEP ES DE RESALTAR EL ALTO IMPACTO QUE HA OBTENIDO ESTA LINEA DE INVESTIGACION, CON PUBLICACIONES EN LOS FOROS MAS IMPORTANTES DEL AREA (ACL, EMNLP, AAAI, ICLR), PROFUNDIZAR EN ESTA LINEA ES UNA DE LAS CLAVES DE ESTE PROYECTO PARA CONSEGUIR PUBLICACIONES DE IMPACTO, MT ADAPTADO A DOMINIOS ESPECIFICOS Y TRANSFERENCIA AL ENTORNO EMPRESARIAL, ADEMAS DE LA APLICACION DEL PARADIGMA NMT A OTROS PROBLEMAS SEQ2SEQ (CORRECCION GRAMATICAL, POR EJEMPLO), ES LA PARTE MAS APLICADA DEL PROYECTO QUE SE PRESENTA PEO QUE INTENTA RESOLVER NECESIDADES REALES DE ENTORNO EMPRESARIALES Y SOCIALES CERCANOS,EL GRUPO IXA DE LA UPV/EHU TIENE EL KNOW-HOW Y LA EXPERIENCIA NECESARIA PARA HACER FRENTE A ESTE PROYECTO YA QUE ADEMAS DE LOS EXPERTOS EN DIVERSOS ASPECTOS DE TA DISPONEMOS DE EXPERTOS EN MORFOLOGIA, SINTAXIS, SEMANTICA Y APRENDIZAJE AUTOMATICO,CON LA BASE DEL GRUPO DE INVESTIGACION IXA LA COLABORACION CON LA FUNDACION ELHUYAR AÑADE UNAS CARACTERISTICAS IMPORTANTES AL PROYECTO, APORTANDO RECURSOS, SU CERCANIA DEL MERCADO Y SU EXPERIENCIA EN EVALUACION DE RESULTADOS, POR OTRO LADO LA PARTICIPACION DE LA UNIVERSIDAD DE SANTIAGO NOS PERMITE AUMENTAR EL IMPACTO DE LA LINEAS DE APRENDIZAJE PARA LENGUUAS CON POCOS RECURSOS Y LA MOTIVACION LINGUISTICA DE LOS RESULTADOS,SE PUEDEN CITAR VARIOS INDICADORES SOBRE EL INTERES QUE DESPIERTA LA TA EN EL AMBITO DE I+D+I: PLAN DE IMPULSO DE LAS TECNOLOGIAS DEL LENGUAJE (AGENDA DIGITAL PARA ESPAÑA) EN LA STRATEGIC RESEARCH AGENDA FOR MULTILINGUAL EUROPE 2020 DE METANET LA RESOLUCION DEL PARLAMENTO EUROPEO SOBRE EL LAS LENGUAS Y EL MERCADO DIGITAL (REPORT ON LANGUAGE EQUALITY IN THE DIGITAL AGE TRADUCCIÓN AUTOMÁTICA\APRENDIAJE PROFUNDO\APRENDIZAJE NO SUPERVISADO\TRADUCCIÓN AUTOAMÁTICA EN DOMINIO DE SAL