Innovating Works

PID2020-119200GB-I00

Financiado
DISEÑO E IMPLEMENTACION DE LA INTERSINTAXIS DE UN CORPUS PARALELO DE PROSA ANGLO...
DISEÑO E IMPLEMENTACION DE LA INTERSINTAXIS DE UN CORPUS PARALELO DE PROSA ANGLOSAJONA. ARQUITECTURA, AUTOMATIZACION Y ESTUDIOS LINGUISTICOS RELACIONADOS EL OBJETIVO PRINCIPAL DE ESTE PROYECTO ES DISEÑAR E IMPLEMENTAR LA INTERSINTAXIS DE UN CORPUS PARALELO DE PROSA ANGLOSAJONA (INGLES ANTIGUO-INGLES CONTEMPORANEO). LA INTERSINTAXIS SE CENTRARA EN LAS DIFERENCIAS ESTRUCTURALES O DE... EL OBJETIVO PRINCIPAL DE ESTE PROYECTO ES DISEÑAR E IMPLEMENTAR LA INTERSINTAXIS DE UN CORPUS PARALELO DE PROSA ANGLOSAJONA (INGLES ANTIGUO-INGLES CONTEMPORANEO). LA INTERSINTAXIS SE CENTRARA EN LAS DIFERENCIAS ESTRUCTURALES O DE DEPENDENCIA ENTRE LA VERSION EN INGLES ANTIGUO Y EN INGLES CONTEMPORANEO DE LOS TEXTOS SELECCIONADOS. SON OBJETIVOS ESPECIFICOS DE ESTE PROYECTO: (I) DISEÑAR UN MODELO DE INTERSINTAXIS PARA LA ANOTACION SINTACTICA DE UN CORPUS PARALELO, BASADO EN UN DIAGRAMA DE ARBOL DE DEPENDENCIAS, QUE DE CUENTA DE NIVELES ESTRUCTURALES, CATEGORIAS Y FUNCIONES, Y QUE ESTE PUESTO AL DIA DESDE EL PUNTO DE VISTA TEORICO; (II) IMPLEMENTAR LA INTERSINTAXIS EN UN CORPUS PARALELO INGLES ANTIGUO-INGLES CONTEMPORANEO DE 200.000 PALABRAS; (III) DISEÑAR UNA VISUALIZACION DE LA ANOTACION SINTACTICA POR MEDIO DE GRAFOS GENERADOS A PARTIR DE UNA HOJA DE CALCULO EXPORTADA DE LAS BASES DE DATOS RELACIONALES; Y (IV) LLEVAR A CABO ESTUDIOS LINGUISTICOS DEL INGLES ANTIGUO BASADOS EN EL PARALLEL CORPUS OF OLD ENGLISH PROSE. EN CUANTO A LA ARQUITECTURA, LA ANOTACION SINTACTICA SE LLEVARA A CABO POR MEDIO DE UNA INTERSINTAXIS CUYO ALCANCE ESTARA LIMITADO A LAS ASIMETRIAS DE MARCA, CONSTITUYENTES, ORDEN Y CONFIGURACION ENTRE LA LENGUA FUENTE (INGLES ANTIGUO) Y LA LENGUA META (INGLES CONTEMPORANEO). ASI DEFINIDA, LA INTERSINTAXIS CONSTITUIRA UNA MICROGRAMATICA HISTORICA QUE RESALTARA TANTO LOS CAMBIOS COMO LA ESTABILIDAD A LO LARGO DE LA EVOLUCION DIACRONICA. LA ARQUITECTURA DE LA INTERSINTAXIS COMPRENDERA UNA DESCRIPCION ESTRUCTURAL DE LA LENGUA FUENTE Y LA LENGUA META Y UN ARBOL DE DEPENDENCIAS. DADO QUE LA DESCRIPCION ESTRUCTURAL ESTARA BASADA EN LAS ETIQUETAS Y ARBOLES DE LOS TREEBANKS DE INGLES DISPONIBLES, LA INTERSINTAXIS DARA LUGAR A UN PROCEDIMIENTO PARA LA RELACION Y COMPARACION ENTRE TREEBANKS. LA INTERSINTAXIS SE DISTINGUIRA DE LOS TREEBANKS EXISTENTES EN TRES ASPECTOS FUNDAMENTALES: A DIFERENCIA DE LOS TREEBANKS DISPONIBLES, ESTARA LEMATIZADA, CONTENDRA UN ARBOL SEMANTICO-SINTACTICO DE DEPENDENCIAS, Y PERMITIRA BUSQUEDAS EN ABIERTO SOLO POR MEDIO DE UN NAVEGADOR. EN LA IMPLEMENTACION DE LA INTERSINTAXIS, SE MAXIMIZARA LA AUTOMATIZACION DE LA LEMATIZACION, LA NORMALIZACION, Y LAS BUSQUEDAS EN EL CORPUS Y EN LA ANOTACION SINTACTICA. SE DISEÑARAN PROCEDIMIENTOS ESPECIFICOS PARA GENERAR FORMAS GRAMATICALMENTE CANONICAS DE LOS LEMAS; INCORPORAR PATRONES DE NORMALIZACION A CONJUNTOS AMPLIOS DE FORMAS; BUSCAR EN LOS TREEBANKS LOS ARBOLES SINTACTICOS RECOGIDOS EN SUPERTAGS O SOBREETIQUETAS; Y ANOTAR CON RELACIONES DE DEPENDENCIA LOS FRAGMENTOS QUE CONTENGAN LA ESTRUCTURA DESCRITA POR LAS SOBREETIQUETAS. LA IMPLEMENTACION DE LA INTERSINTAXIS ESTA PREVISTA EN UN CORPUS DE 200.000 PALABRAS DE TEXTOS REPRESENTATIVOS DE PROSA ANGLOSAJONA. ESTO IMPLICA UNA AMPLIACION DEL CORPUS EXISTENTE, EN LA QUE EL ETIQUETADO Y ANOTACION SE LLEVARAN A CABO CON LA INFORMACION DISPONIBLE EN LAS BASES DE DATOS RELACIONALES, QUE SE IMPORTARA AUTOMATICAMENTE. LA INCORPORACION DE UNA INTERSINTAXIS QUE DESTAQUE LAS AREAS DE CAMBIO DIACRONICO A UN CORPUS PARALELO BASADO EN LA MODERNIZACION COMPLETARA UNA BASE DE CONOCIMIENTO DEL INGLES ANTIGUO DE DATOS ESTRUCTURADOS EN ACCESO ABIERTO; Y PERMITIRA LLEVAR A CABO ESTUDIOS BASADOS EN LENGUAJE REAL QUE PODRAN OFRECER PERSPECTIVAS TANTO SINCRONICAS COMO DIACRONICAS EN ASPECTOS TEORICOS QUE FORMAN PARTE DEL DEBATE LINGUISTICO ACTUAL COMO SON LA GRAMATICALIZACION, LAS CONSTRUCCIONES Y LA CONSTRUCCIONALIZACION. INGUISTICA HISTORICA\LINGUISTICA DE CORPUS\SINTAXIS\MORFOLOGIA\SEMANTICA\INGLES ANTIGUO ver más
01/01/2020
UR
40K€
Perfil tecnológico estimado

Línea de financiación: concedida

El organismo AGENCIA ESTATAL DE INVESTIGACIÓN notifico la concesión del proyecto el día 2020-01-01
Presupuesto El presupuesto total del proyecto asciende a 40K€
Líder del proyecto
UNIVERSIDAD DE LA RIOJA No se ha especificado una descripción o un objeto social para esta compañía.
Total investigadores 311