Descripción del proyecto
DURANTE LOS ULTIMOS AÑOS, GRACIAS AL APRENDIZAJE PROFUNDO (DEEP LEARNING), TANTO LA TRADUCCION AUTOMATICA COMO OTRAS DISCIPLINAS DE PROCESAMIENTO DEL LENGUAJE NATURAL HAN HECHO UN PROGRESO ESPECTACULAR, LOGRANDO RESULTADOS QUE ERAN INIMAGINABLES UNOS AÑOS ANTES. PERO LAS TECNICAS DE APRENDIZAJE PROFUNDO REQUIEREN GRANDES CANTIDADES DE DATOS ETIQUETADOS DONDE SER ENTRENADOS. PARA ALGUNOS IDIOMAS Y/O TAREAS ESTO NO ES UN PROBLEMA, YA QUE ES RELATIVAMENTE FACIL OBTENER TALES RECURSOS. POR EJEMPLO, EXISTEN ENORMES CANTIDADES DE TRADUCCIONES ENTRE EL INGLES Y EL ESPAÑOL A PARTIR DE LAS CUALES UNA RED NEURONAL PUEDE APRENDER A HACER NUEVAS TRADUCCIONES. PERO ESTE NO ES EL CASO DE TODOS LOS IDIOMAS O TAREAS, LO QUE LIMITA GRAN PARTE DE ESTE PROGRESO A UNOS POCOS IDIOMAS.CON EL OBJETIVO DE ELIMINAR ESTA DEPENDENCIA DE LOS DATOS PARALELOS, UNA LINEA DE INVESTIGACION RECIENTE HA CONSEGUIDO ENTRENAR SISTEMAS DE TRADUCCION AUTOMATICA NO SUPERVISADOS UTILIZANDO UNICAMENTE CORPUS MONOLINGUES [ARTETXE ET AL., 2018A] [LAMPLE ET AL., 2018A]. LA TRADUCCION AUTOMATICA PURAMENTE NO SUPERVISADA HA SIDO AMPLIAMENTE CRITICADA, YA QUE LA MAYOR PARTE DE LA INVESTIGACION SE HA LLEVADO A CABO EN ENTORNOS ARTIFICIALES, ESPECIALMENTE EN INGLES-FRANCES E INGLES-ALEMAN, DONDE NO SE UTILIZAN CORPUS PARALELOS, AUNQUE ESTEN DISPONIBLES. TRABAJOS POSTERIORES HAN ANALIZADO LA EFICACIA DE LOS METODOS DESARROLLADOS EN ENTORNOS REALMENTE POBRES EN RECURSOS [MARCHISIO ET AL., 2020] [GRAÇA ET AL,. 2020]. ESTOS ANALISIS HAN DEMOSTRADO QUE EL RENDIMIENTO DE LA MT NO SUPERVISADA SE VE GRAVEMENTE AFECTADO POR LA ESCASEZ DE DATOS MONOLINGUES, LA DISIMILITUD LINGUISTICA Y EL DESAJUSTE DE DOMINIO ENTRE LOS DATOS MONOLINGUES DE ORIGEN Y DE DESTINO. ESTAS CONDICIONES SON COMUNES EN LOS PARES DE LENGUAS CON POCOS RECURSOS, DONDE EL APRENDIZAJE NO SUPERVISADO FUNCIONA MAL. ENFOQUES RECIENTES COMO [CONNEAU, 2020] HAN COMENZADO A COMBINAR DATOS MONOLINGUES Y PARALELOS CON BUENOS RESULTADOS. PLANEAMOS EXPLORAR METODOS NOVEDOSOS PARA EXPLORAR TECNICAS DE APRENDIZAJE DE TRANSFERENCIA MULTILINGUE Y COMBINAR TECNICAS SUPERVISADAS Y NO SUPERVISADAS, RESPETANDO LAS RESTRICCIONES DE EFICIENCIA Y MODULARIDAD, PARA QUE LA TRADUCCION DE LENGUAS CON POCOS RECURSOS PUEDAN BENEFICIARSE DE ESTAS TECNICAS. ESTE SUBPROYECTO SE ENCARGARA DE DESARROLLAR TECNICAS CAPACES DE GENERAR MODELOS DE MT DE BUENA CALIDAD PARA LENGUAS DE MUY BAJOS RECURSOS. ESTAS TECNICAS SE PROBARAN EN ESCENARIOS REALES, INCLUYENDO LA TRADUCCION MULTIMODAL DE LA LENGUA DE SIGNOS ESPAÑOLA AL ESPAÑOL Y LA TRADUCCION ENTRE EL ESPAÑOL Y LAS LENGUAS MINORITARIAS PRESENTES EN ESPAÑA, CONTRIBUYENDO A LA INTEGRACION DE ESTAS MINORIAS EN LA SOCIEDAD. ROCESADO DEL LENGUAJE\LENGUA DE SIGNOS\APRENDIZAJE PROFUNDO\TRADUCCION AUTOMATICA