Descripción del proyecto
EL PROYECTO PARTE DE LA FASE PREVIA DE DESARROLLO DEL CORPUS ESLORA Y PROPONE NUEVAS VIAS DE ENRIQUECIMIENTO Y EXPLOTACION QUE PERMITAN SEGUIR AVANZANDO TANTO EN EL TRATAMIENTO COMPUTACIONAL DE CORPUS ORALES COMO EN EL CONOCIMIENTO DE LA COMUNICACION ORAL Y EN LA ELABORACION DE MATERIALES Y HERRAMIENTAS DE INTERES PUBLICO,1, ENRIQUECIMIENTO DEL CORPUS, PARA MEJORAR LA TASA DE ACIERTO DEL ETIQUETADOR Y LA ANOTACION MORFOSINTACTICA EXISTENTE SE IMPLEMENTAN NUEVAS FUNCIONALIDADES DE RECONOCIMIENTO DE FORMAS (NUMERALES, UNIDADES MULTIPALABRA, SUFIJOS APRECIATIVOS), SE AMPLIAN EL CORPUS DE ENTRENAMIENTO Y EL LEXICON, Y SE INTRODUCEN RESTRICCIONES LINGUISTICAS QUE COMPLEMENTAN EL METODO ESTADISTICO A PARTIR DE UN ANALISIS CUALITATIVO DE LOS ERRORES SUBSISTENTES, LA ANOTACION MORFOSINTACTICA MEJORADA SIRVE TANTO PARA INCREMENTAR LA CALIDAD DEL CORPUS YA EXISTENTE COMO PARA SER UTILIZADA COMO BASE EN LA CREACION DE UN BANCO DE ARBOLES (TREEBANK) DISPONIBLE EN DOS FORMATOS Y NIVELES DE PROFUNDIDAD DISTINTOS: UNO CONSTITUTIVO MAS DETALLADO Y OTRO DEPENDENCIAL MENOS PORMENORIZADO, ESTE ULTIMO ENMARCADO EN EL PROYECTO COLABORATIVO INTERNACIONAL UNIVERSAL DEPENDENCIES, QUE TIENE COMO OBJETIVO DESARROLLAR SISTEMAS DE ANOTACION Y HERRAMIENTAS DE ANALISIS SINTACTICO MULTILINGUES, POR OTRA PARTE, EN RELACION CON LA EXTRACCION DE RECURSOS PREVISTA, SE REALIZA UNA APROXIMACION INICIAL A LA ANOTACION DE UNA PARTE DE LOS MATERIALES CON INDICACIONES RELEVANTES PARA SU EXPLOTACION EN ELE, COMO SON EL TEMA Y LA FUNCION COMUNICATIVA DE LAS SECUENCIAS DEL CORPUS, 2, ANALISIS LINGUISTICO DEL HABLA, CON LA ANOTACION Y METADATOS DE ESLORA Y LA APLICACION DE CONSULTA QUE FACILITA YA SU RECUPERACION MEDIANTE BUSQUEDAS COMBINADAS SE ABORDAN NUEVOS ANALISIS DE FENOMENOS RELEVANTES DE LA LENGUA ORAL, EN EL NIVEL LEXICO-GRAMATICAL, EL ADECUADO PROCESAMIENTO DE LOS MATERIALES PERMITE EXTRAER Y ANALIZAR LA DISTRIBUCION Y FRECUENCIA DE LEMAS Y CATEGORIAS GRAMATICALES PARA ELABORAR UN DICCIONARIO DE FRECUENCIAS BASADO ESPECIFICAMENTE EN DATOS DE LENGUA ORAL, POR OTRA PARTE, ADEMAS DE LOS ESTUDIOS SOBRE CONSTRUCCIONES Y FORMAS VERBALES YA EMPRENDIDOS, SE ANALIZA EL FENOMENO DE LA ALTERNANCIA O CAMBIO DE CODIGO ESPAÑOL-GALLEGO, LA PERSPECTIVA SOCIOLINGUISTICA Y PRAGMATICO-DISCURSIVA ESTA PRESENTE EN LOS ANALISIS LINGUISTICOS Y SE CONECTA CON EL ESTUDIO DE LAS REPRESENTACIONES, ACTITUDES E IDEOLOGIAS QUE SE DESARROLLA CONTRASTANDO EL HABLA REGISTRADA CON LOS DATOS RECOGIDOS A TRAVES DE CUESTIONARIOS EN EL PROCESO DE ELABORACION DEL CORPUS,3, EXTRACCION DE RECURSOS, CON EL OBJETIVO DE DESARROLLAR RECURSOS REUTILIZABLES DE INTERES PUBLICO GENERAL, SE ABORDA LA CREACION DE INSTRUMENTOS LINGUISTICOS UTILES EN DIFERENTES AMBITOS RELACIONADOS CON LA LENGUA ORAL, ADEMAS DE LAS HERRAMIENTAS COMPUTACIONALES YA CITADAS, DESTACA EL APROVECHAMIENTO DEL CORPUS PARA LA ENSEÑANZA DEL ESPAÑOL COMO LENGUA EXTRANJERA, TANTO EN LA ELABORACION DE MATERIALES PARA TRATAR EN EL AULA LOS FENOMENOS DE ESPECIAL DIFICULTAD EN LA INTERACCION ORAL, COMO EN EL DISEÑO DE ACTIVIDADES DE APRENDIZAJE DE LENGUAS ASISTIDO POR ORDENADOR QUE EJERCITEN EL CONJUNTO DE LAS DESTREZAS ORALES MEDIANTE LA PROPIA APLICACION DE CONSULTA, ASIMISMO, APROVECHANDO EL ALINEAMIENTO DE TEXTO Y AUDIO DEL CORPUS, EL DICCIONARIO DE FRECUENCIAS EN VERSION ELECTRONICA INCORPORA EL ACCESO INMEDIATO A LOS FRAGMENTOS TEXTUALES Y SONOROS CORRESPONDIENTES A LAS ENTRADAS LEXICAS, CORPUS ORALES\ESPAÑOL DE GALICIA\ETIQUETACIÓN MORFOSINTÁCTICA\BANCO DE ÁRBOLES\DICCIONARIO DE FRECUENCIAS\ELE