Descripción del proyecto
EL PROCESAMIENTO DE VOZ, AUDIO Y LENGUAJE SE HA BENEFICIADO EN GRAN MEDIDA DE LAS ARQUITECTURAS DE APRENDIZAJE PROFUNDO PARA LOGRAR ALTOS NIVELES DE RENDIMIENTO, EL APRENDIZAJE PROFUNDO ES EL CONJUNTO DE ALGORITMOS QUE PERMITEN APRENDER DIFERENTES NIVELES DE ABSTRACCION DE DETERMINADOS DATOS, ESTOS ALGORITMOS HAN LOGRADO UN GRAN EXITO EN ENTORNOS SUPERVISADOS, SUPERVISADO SIGNIFICA QUE LOS SISTEMAS APRENDEN A BASE DE DATOS ETIQUETADOS, LAS DIFERENTES ARQUITECTURAS DE ESTOS ALGORITMOS SE COMBINAN Y CONCATENAN EN FUNCION DEL OBJETIVO DE LA TAREA, ESTOS PUEDEN INCLUIR REDES NEURONALES RECURRENTES QUE SOBRESALEN EN EL MODELADO DE SECUENCIAS DE LONGITUD VARIABLE Y REDES NEURONALES CONVOLUCIONALES QUE GENERALMENTE SE HAN UTILIZADO PARA EXTRAER PATRONES DE IMAGENES, SIN EMBARGO, HOY EN DIA EXISTEN ARQUITECTURAS MUCHO MAS COMPLEJAS, COMO EL TRANSFORMER, QUE COMBINAN MECANISMOS DE AUTO-ATENCION CON REDES NO-RECURRENTES, Y QUE SON TAN VERSATILES QUE PUEDEN TENER EXITO EN MULTIPLES TAREAS, EL PROPOSITO DE ESTE PROYECTO ES ENFOCARSE EN LOS DESAFIOS PENDIENTES DE LAS ARQUITECTURAS AVANZADAS DE APRENDIZAJE PROFUNDO EN EL CONTEXTO DEL PROCESAMIENTO DEL HABLA, AUDIO Y LENGUAJE DANDO CONTINUIDAD A LA INTENSA INVESTIGACION DE NUESTRO GRUPO, EL PROYECTO PROPONE ABORDAR GRANDES DESAFIOS EN LA TRADUCCION AUTOMATICA MULTILINGUE Y MULTIMODAL, EL RECONOCIMIENTO DEL HABLA, EL PROCESAMIENTO DEL LENGUAJE NATURAL Y LA REGENERACION DEL HABLA, EN LA TRADUCCION AUTOMATICA, EL PROYECTO ESTA DEDICADO A LA TRADUCCION AUTOMATICA NO SUPERVISADA Y MULTILINGUE, MIENTRAS QUE LA TRADUCCION AUTOMATICA SE HA ENTRENADO CLASICAMENTE USANDO DATOS PARALELOS A NIVEL DE ORACION, ES POSIBLE ENTRENAR USANDO SOLO DATOS MONOLINGUES, ASIMISMO, LA TRADUCCION AUTOMATICA MULTILINGUE SI SE TRATA POR PARES, PUEDE SER COMPUTACIONALMENTE MUY COSTOSA, ESTE PROYECTO PROPONE UTILIZAR CODIFICADORES Y DECODIFICADORES INDEPENDIENTES DEL LENGUAJE QUE PUEDEN SER ENTRENADOS USANDO EXCLUSIVAMENTE DATOS MONOLINGUES, PARA ESTE PROPOSITO, NECESITAMOS TRABAJAR HACIA UNA REPRESENTACION INDEPENDIENTE DEL LENGUAJE EXTRAIDA AUTOMATICAMENTE, MAS ALLA DE LA TRADUCCION AUTOMATICA, PROPONEMOS ENFRENTARNOS AL RECONOCIMIENTO DEL HABLA, A LA TRADUCCION DE VOZ Y AUDIO DE UNA MANERA INTEGRAL, EL ALTO RENDIMIENTO DEL APRENDIZAJE PROFUNDO SE VE ENSOMBRECIDO POR PROBLEMAS COMO LOS COMPORTAMIENTOS INJUSTOS, QUE GENERALMENTE SURGEN DE PREJUICIOS DEMOGRAFICOS (POR EJEMPLO, SHE IS A DOCTOR CUANDO SE TRADUCE AL TURCO Y LUEGO SE TRADUCE AL INGLES, SE CONVIERTE EN HE IS A DOCTOR), DEL MISMO MODO, LA FALTA DE GENERALIZACION SE OBSERVA CUANDO NUESTROS SISTEMAS PROPUESTOS SOLO APRENDEN COMPOSICIONES QUE SE HAN OBSERVADO EN LOS DATOS DE ENTRENAMIENTO, UNA FORMA DE ABORDAR ESTOS PROBLEMAS ES HACIENDO USO ADECUADO DE LA INFORMACION LINGUISTICA, ESTE PROYECTO PROPONE UTILIZAR DICCIONARIOS, ARBOLES DE DEPENDENCIA Y RECURSOS SEMANTICOS (WORDNET, BABELNET) PARA ADAPTAR ALGORITMOS DE APRENDIZAJE PROFUNDO, FINALMENTE, EL TRABAJO EN LA REGENERACION DEL HABLA INCLUYE REPRESENTACIONES AGNOSTICAS DE PROBLEMAS DEL HABLA SIN SUPERVISION, ASI COMO LA INTRODUCCION DE REDES DE CONFRONTACION GENERATIVAS PARA MEJORAR LA CALIDAD DE LA VOZ SINTETICA EN LAS APLICACIONES DE CONVERSION DE VOZ Y MEJORA DEL HABLA, DADO EL GRAN INTERES TANTO A NIVEL ACADEMICO COMO INDUSTRIAL, ESTE PROYECTO COMPARTIRA RESULTADOS Y SE BENEFICIARA DE MULTIPLES COOPERACIONES, INCLUIDAS UNIVERSIDADES Y EMPRESAS (TELEFONICA I + D, LUCYSOFTWARE, VERBIO, HERTA) TECNOLOGIAS DEL HABLA\APRENDIZAJE PROFUNDO\TRADUCCION AUTOMATICA\RECONOCIMIENTO DEL HABLA\RECONOCIMIENTO DEL LOCUTOR\CONVERSION DE TEXTO A VOZ\DETECCION DE EVENTOS ACUSTICOS\REDES NEURONALES PROFUNDAS