Descripción del proyecto
LA TRADUCCION AUTOMATICA NO SUPERVISADA ES UN PARADIGMA RECIENTE DE LA TRADUCCION AUTOMATICA (TA) QUE SE BASA UNICAMENTE EN RECURSOS MONOLINGUES. ESTO CONTRASTA CON LOS ENFOQUES MAS POPULARES EN TA, TANTO LA TRADUCCION AUTOMATICA NEURONAL COMO LA TRADUCCION AUTOMATICA ESTADISTICA, QUE NECESITAN DATOS PARALELOS PARA ENTRENAR EFICAZMENTE SUS MODELOS. AUNQUE ES POSIBLE ENCONTRAR UN GRAN NUMERO DE CORPUS PARALELOS EN ALGUNOS PARES DE LENGUAS, UN USO MAS AMPLIO ES PROBLEMATICO, YA QUE ESTOS RECURSOS SON ESCASOS PARA MUCHAS LENGUAS Y DOMINIOS. LOS CORPUS MONOLINGUES, EN CAMBIO, SON FRECUENTES, SE ENCUENTRAN EN MUCHOS DOMINIOS Y GENEROS TEXTUALES, Y ESTAN EN CONSTANTE CRECIMIENTO, INCLUSO EN EL CASO DE LENGUAS CON POCOS RECURSOS LINGUISTICOS. ADEMAS DE LA PREVALENCIA DE LOS DATOS MONOLINGUES FRENTE A LOS PARALELOS, EL USO DE CORPUS MONOLINGUES EN TRADUCCION AUTOMATICA PUEDE SER BENEFICIOSO POR OTROS DOS MOTIVOS: POR UN LADO, LOS DATOS MONOLINGUES EVITAN EL SESGO DE LAS TRADUCCIONES LITERALES Y, POR OTRO, SU USO COMO FUENTE DE TRADUCCION PERMITE SIMULAR CON MAYOR PRECISION LO QUE SE CONOCE COMO COMPETENCIA DE TRADUCCION EN INDIVIDUOS BILINGUES.ESTE PROYECTO SE CENTRA EN LA EXPLORACION, DEFINICION E IMPLEMENTACION DE ESTRATEGIAS DE TRADUCCION AUTOMATICA NO SUPERVISADAS Y MOTIVADAS LINGUISTICAMENTE QUE APROXIMAN LA TRADUCCION AUTOMATICA A UN PROCESO DE PARAFRASIS EN UN ENTORNO BILINGUE. LA TRADUCCION SE CONCIBE Y DISEÑA COMO UN PROCESO SEMANTICO DE PARAFRASIS CON DOS CODIGOS LINGUISTICOS: EL CANDIDATO DE TRADUCCION DE UNA FRASE EN LA LENGUA DE PARTIDA ES LA FRASE MAS PARECIDA, ES DECIR, LA MEJOR PARAFRASIS CANDIDATA EN LA LENGUA DE DESTINO. PARA ELLO, EXPLORAREMOS EL PAPEL DE DIFERENTES CONCEPTOS LINGUISTICOS EN LA TRADUCCION Y LA PARAFRASIS, COMO LA REFORMULACION, EL GRADO DE COMPOSICIONALIDAD SEMANTICA, LA COLOCABILIDAD, EL ANALISIS DE DEPENDENCIAS, EL SIGNIFICADO CONTEXTUALIZADO, LA SIMILITUD DISTRIBUCIONAL, LAS PREFERENCIAS DE SELECCION Y LAS CONSTRUCCIONES SINTACTICO-SEMANTICAS. EN ESTE PROYECTO NO HACEMOS USO DE LA INFORMACION LINGUISTICA PARA AFINAR Y ADAPTAR LA ENTRADA Y SALIDA DE UN SISTEMA DE TA, SINO PARA MODELAR EL PROPIO PROCESO DE TRADUCCION SIGUIENDO UNA ESTRATEGIA NO SUPERVISADA INSPIRADA EN EL COMPORTAMIENTO DE LOS INDIVIDUOS BILINGUES. INGUISTICA COMPUTACIONAL\PROCESAMIENTO DEL LENGUAJE NATURAL\SEMANTICA