HIBRIDO-SINT: APROXIMACION HIBRIDA CON REGLAS Y MODELOS EMPIRICOS PARA ANALIZADO...
HIBRIDO-SINT: APROXIMACION HIBRIDA CON REGLAS Y MODELOS EMPIRICOS PARA ANALIZADORES SINTACTICOS. INTEGRACION EN UNA PLATAFORMA DE GESTION DE CORPUS BASADA EN ANOTACION XML.
EL OBJETIVO GENERAL DE ESTE PROYECTO ES LA EXPERIMENTACION EN EL AMBITO DEL ANALISIS SINTACTICO. NUESTRO PROPOSITO ES TRIPLE: I) ESTUDIAR LAS MEJORAS QUE PUEDE APORTAR LA HIBRIDACION DE TECNICAS BASADAS EN EL CONOCIMIENTO Y METODO...
ver más
Descripción del proyecto
EL OBJETIVO GENERAL DE ESTE PROYECTO ES LA EXPERIMENTACION EN EL AMBITO DEL ANALISIS SINTACTICO. NUESTRO PROPOSITO ES TRIPLE: I) ESTUDIAR LAS MEJORAS QUE PUEDE APORTAR LA HIBRIDACION DE TECNICAS BASADAS EN EL CONOCIMIENTO Y METODOS EMPIRICOS AL ANALISIS SINTACTICO COMPUTACIONAL; II) ESTUDIAR LAS MEJORAS QUE PUEDE PROPORCIONAR LA INTEGRACION DE TECNICAS DE ANALISIS SINTACTICO SUPERFICIAL Y ANALISIS SINTACTICO PROFUNDO AL ANALISIS SINTACTICO COMPUTACIONAL; III) INTEGRAR LOS RESULTADOS QUE OBTENGAN ESTOS PROCESADORES LINGUISTICOS (DE NATURALEZA VARIADA) EN LA CADENA DE ANALISIS DE TEXTOS, SIGUIENDO LAS DIRECTRICES DEL MODELO CONCEPTUAL DE REPRESENTACION DE INFORMACION LINGUISTICA DISEÑADO EN EL MARCO DEL PROYECTO IMLT- TIN2007-63173 (QUE CONCLUIRA A FINALES DE 2010 Y QUE HA OBTENIDO UNA EVALUACION ¿MUY SATISFACTORIA¿ EN SUS DOS PRIMEROS AÑOS). DE ESTE PROYECTO OBTENDREMOS, ADEMAS DE PROPUESTAS GENERALES DE MEJORAS EN LAS TECNICAS DE ANALISIS SINTACTICO, UNA SERIE DE ANALIZADORES SINTACTICOS PARA EL EUSKERA, ROBUSTOS Y DE PRECISION EQUIVALENTE A LA QUE PRESENTAN LOS ANALIZADORES PARA OTROS IDIOMAS. ADEMAS, LOS RESULTADOS QUE SE OBTENGAN EN ESTE PROYECTO SE PONDRAN A DISPOSICION DE LA COMUNIDAD CIENTIFICA Y DESARROLLADORES DE SOFTWARE. SE PREPARARA UNA APLICACION WEB, ORIENTADA A USUARIOS EN GENERAL, PARA PERMITIR EL ACCESO A CONSULTAS SOBRE LOS DIFERENTES ANALISIS DE NUESTROS ANALIZADORES.MEJORAR EL RESULTADO DE LOS PROCESADORES SINTACTICOS DE QUE DISPONEMOS PERMITIRA PODER REALIZAR APLICACIONES MAS AVANZADAS, MAS ROBUSTAS Y EFICIENTES QUE LAS ACTUALES EN EL AREA DEL PROCESAMIENTO DEL LENGUAJE NATURAL, POR EJEMPLO, EN EL DISEÑO DE APLICACIONES: BUSQUEDAS DE INFORMACION BASADAS EN EL CONOCIMIENTO SEMANTICO O TRADUCCION AUTOMATICA.EN LA ACTUALIDAD EN NUESTRO GRUPO DE INVESTIGACION DISPONEMOS DE CUATRO ANALIZADORES MORFO-SINTACTICOS QUE SE DIFERENCIAN ENTRE ELLOS EN FUNCION DE SI TRABAJAN A NIVEL DE SINTAXIS SUPERFICIAL O PROFUNDA Y EN FUNCION DE SI ESTAN BASADOS EN CONOCIMIENTO LINGUISTICO O EN METODOS EMPIRICOS. ADEMAS, RECIENTEMENTE HEMOS INCREMENTADO SIGNIFICATIVAMENTE EL NUMERO DE PALABRAS QUE CONTIENE EL CORPUS EPEC, CORPUS DE REFERENCIA PARA EL DESARROLLO DE APLICACIONES DE PLN PARA EL EUSKERA, Y EN ESTE MOMENTO DISPONEMOS DE ALREDEDOR DE 150.000 PALABRAS ANOTADAS A NIVEL DE DEPENDENCIAS SINTACTICAS Y SINTAGMAS (LAS ACTUALES VERSIONES DE NUESTROS ANALIZADORES HAN SIDO DISEÑADAS Y ENTRENADAS CON UNA VERSION REDUCIDA DE ENTRE 30.000 A 50.000 PALABRAS). EL USO POTENCIAL DE ESTE NUEVO CORPUS DE 150.000 PALABRAS PARA ENTRENAMIENTO Y VALIDACION POSIBILITARA EL PODER A-FRONTAR LA CREACION DE UNA SEGUNDA GENERACION DE ESOS CUATRO ANALIZADORES MORFOSINTACTICOS DURANTE LOS PROXIMOS TRES AÑOS.EL HECHO DE QUE EL EUSKARA SEA UNA LENGUA AGLUTINATIVA, CON UNA GRAN RIQUEZA DE RASGOS MORFOSINTACTICOS HACE QUE EL ANALISIS DEL EUSKARA SEA RELEVANTE, DEBIDO A QUE SU ESTUDIO PERMITIRA ABRIR VIAS QUE PUEDAN SER UTILES PARA EL GRAN GRUPO DE IDIOMAS QUE NO SE ENCUADRAN EN EL GRUPO DE LAS LENGUAS MAYORITARIAMENTE ANALIZADAS HASTA EL MOMENTO (HEBREO, TURCO, ¿). EL ESTUDIO SOBRE LA APORTACION DE RASGOS MORFOSINTACTICOS TALES COMO CASO, NUMERO, MORFEMAS DE SUBORDINACION ORACIONAL, ETC., PUEDE AYUDAR A DESPEJAR INTERROGANTES SOBRE EL POBRE RESULTADO OBTENIDO HASTA EL MOMENTO PARA ESTE TIPO DE LENGUAS.
Seleccionando "Aceptar todas las cookies" acepta el uso de cookies para ayudarnos a brindarle una mejor experiencia de usuario y para analizar el uso del sitio web. Al hacer clic en "Ajustar tus preferencias" puede elegir qué cookies permitir. Solo las cookies esenciales son necesarias para el correcto funcionamiento de nuestro sitio web y no se pueden rechazar.
Cookie settings
Nuestro sitio web almacena cuatro tipos de cookies. En cualquier momento puede elegir qué cookies acepta y cuáles rechaza. Puede obtener más información sobre qué son las cookies y qué tipos de cookies almacenamos en nuestra Política de cookies.
Son necesarias por razones técnicas. Sin ellas, este sitio web podría no funcionar correctamente.
Son necesarias para una funcionalidad específica en el sitio web. Sin ellos, algunas características pueden estar deshabilitadas.
Nos permite analizar el uso del sitio web y mejorar la experiencia del visitante.
Nos permite personalizar su experiencia y enviarle contenido y ofertas relevantes, en este sitio web y en otros sitios web.