Descripción del proyecto
EL EXITO RECIENTE EN LA APLICACION DEL APRENDIZAJE PROFUNDO EN APLICACIONES DE PROCESAMIENTO DEL LENGUAJE NATURAL HA TENIDO UN GRAN IMPACTO EN EL CAMPO, LA TRADUCCION AUTOMATICA, LA RESPUESTA A PREGUNTAS, LA GENERACION DE TEXTO Y EL ANALISIS DE SENTIMIENTOS SON LAS AREAS EN LAS QUE EL AVANCE HA SIDO MAS ESPECTACULAR, PERO A COSTA DE REQUERIR GRANDES CANTIDADES DE DATOS PARA CADA TAREA, SE HA DEMOSTRADO QUE LOS METODOS DE APRENDIZAJE PROFUNDO MUESTRAN UNA SEVERA DEGRADACION DEL RENDIMIENTO CUANDO SE ENTRENAN CON CONJUNTOS DE DATOS PEQUEÑOS, INCLUYENDO LOS SISTEMAS DE TRANSFORMADORES MAS RECIENTES COMO EL BERT QUE FUE ENTRENADO CON UN CORPUS DE 3,300 MILLONES DE PALABRAS, SE HA CUESTIONADO SI LOS METODOS DE APRENDIZAJE PROFUNDO SON CAPACES DE ``COMPRENDER' EL LENGUAJE, SI SON CAPACES DE GENERALIZAR, ES DECIR, CAPTURAR LAS CARACTERISTICAS COMUNES INVARIABLES Y HACER CASO OMISO DE LA VARIACION NO SIGNIFICATIVA, DE MODO QUE DOS ORACIONES CON FORMA DIFERENTE, PERO CON EL MISMO SIGNIFICADO, OBTENGAN LA MISMA RESPUESTA DEL SISTEMA, EL OBJETIVO DE LUTEST ES LA CREACION DE CONJUNTOS DE PRUEBA, ASI COMO DE UNA METODOLOGIA DE EVALUACION QUE PROPORCIONE EVIDENCIAS SOBRE LAS CAPACIDADES DE GENERALIZACION LINGUISTICA DE LOS METODOS DE APRENDIZAJE PROFUNDO APLICADOS AL PROCESAMIENTO DEL LENGUAJE NATURAL, DURANTE LOS ULTIMOS AÑOS, HA HABIDO DIFERENTES TRABAJOS EN LA CONSTRUCCION DE CONJUNTOS DE PRUEBAS Y METODOS DE EVALUACION CON EL FIN DE EVALUAR LAS CAPACIDADES DE COMPRENSION DEL LENGUAJE DE LOS MODELOS NEURALES PROFUNDOS Y QUE INFORMACION SELECCIONAN Y CODIFICAN, SIN EMBARGO, AUN QUEDA MUCHO TRABAJO POR HACER, EN PARTICULAR DESDE UNA PERSPECTIVA LINGUISTICAMENTE MOTIVADA, LUTEST SE PROPONE LA EVALUACION DE LAS CAPACIDADES DE GENERALIZACION DEL MODELO DE LENGUAJE PROFUNDO BASANDOSE EN LA HIPOTESIS LINGUISTICA DE QUE, SI REALMENTE GENERALIZAN, CUALQUIER DIFERENCIA EN LAS REPRESENTACIONES DE DOS SIGNIFICADOS IGUALES, PERO DE ORACIONES CON DIFERENTE ESTRUCTURA, ESTA DIFERENCIA SE MOSTRARA IGUAL EN UN NUMERO SIGNIFICATIVO DE PARES DE ORACIONES QUE EXHIBEN EL MISMO FENOMENO, A PESAR DE CUALQUIER VARIACION LEXICA,NO OBSTANTE, ES MUY DIFICIL OBSERVAR QUE INFORMACION ABSTRACTA INDUCEN LAS REDES NEURONALES PROFUNDAS, LA INFORMACION SE REPRESENTA COMO MATRICES NUMERICAS SIN QUE HAYA UNA RELACION INTERPRETABLE CON EL INPUT, LA INTERPRETACION DEL COMPORTAMIENTO DE LAS REDES NEURALES PROFUNDAS REQUIERE CONJUNTOS DE PRUEBAS ESPECIALES Y METODOS DE EVALUACION DISTINTOS AL DE LA PRECISION CON RESPECTO A UNA TAREA FINALISTA, COMO EL ANALISIS DE SENTIMIENTOS, LA RESPUESTA A PREGUNTAS O LA INFERENCIA EN LENGUAJE NATURAL, ASI, LA DISPONIBILIDAD DE CONJUNTOS DE PRUEBAS Y METODOS DE EVALUACION QUE PUEDAN AYUDAR A DISTINGUIR EL COMPORTAMIENTO INTELIGENTE REAL DE LA DETECCION DE CORRELACIONES ESTADISTICAS SUPERFICIALES Y ESPURIAS VA A SER CRUCIAL, PRIMERO, PARA EVALUAR EL PROGRESO REAL EN LA COMPRENSION AUTOMATICA DEL LENGUAJE; SEGUNDO, PARA OBTENER PRUEBAS SOBRE LA CONSISTENCIA DE SUS RESULTADOS Y GANAR LA CONFIANZA DE LA SOCIEDAD EN ESTAS TECNOLOGIAS QUE PRETENDEN SER APLICADAS EN AREAS MUY SENSIBLES COMO LA SALUD O EL DERECHO Y, EN TERCER LUGAR, PARA APRENDER SOBRE LAS CAPACIDADES DE GENERALIZACION DE LOS METODOS MAS NOVEDOSOS Y, POR TANTO, DESARROLLAR METODOS QUE APRENDAN A PARTIR DE CONJUNTOS DE DATOS PEQUEÑOS, ASEGURANDO ASI SU APLICABILIDAD A LENGUAS CON MENOS RECURSOS QUE EL INGLES, IMPIDIENDO ASI LA EXTINCION DIGITAL DE LA MAYORIA DE ELLAS, PROCESAMIENTO DEL LENGUAJE NATURAL\RECURSOS LINGUISTICOS\MODELO DEL LENGUAJE\APRENDIZAJE PROFUNDO\REDES NEURONALES