Descripción del proyecto
PRETENDEMOS CONTINUAR CON LA PRIMERA FASE DEL PROYECTO (FFI-2017-83293) EN EL QUE DESARROLLAMOS UN DICCIONARIO ELECTRONICO DEL ESPAÑOL (DIRETES.ES). EN EL IMPLEMENTAMOS EL PRINCIPIO DE HERENCIA LEXICA (BARRIOS, 2010), QUE MUESTRA QUE MUCHAS RELACIONES LEXICAS SON PREDECIBLES Y POR TANTO AUTOMATIZABLES. EN EL MOMENTO ACTUAL HEMOS MULTIPLICADO LOS CONTENIDOS DE LA BASE DE DATOS INICIAL (DESARROLLADA POR LA IP EN SU TESIS), Y CONTAMOS CON 19.897 LEMAS (ERAN 4000) Y 102.191 RELACIONES LEXICO-SEMANTICAS (ERAN 24000), DE LAS CUALES 33.004 FUERON HEREDADAS AUTOMATICAMENTE Y 69.187 SE AÑADIERON MANUALMENTE. TODAS LAS RELACIONES SE PRESENTAN CON FUNCIONES LEXICAS, UNA FORMULA QUE REFLEJA DE MODO FORMAL Y SISTEMATICO EL TIPO DE RELACION. POR EJEMPLO, EN LA BASE DE DATOS SE FORMALIZA LA COLOCACION RAMO DE FLORES COMO MULT(FLOR) = RAMO (DONDE MULT SIGNIFICA CONJUNTO DE), FORMULA TAMBIEN USADA PARA RACIMO DE UVAS O RISTRA DE AJOS. LA COLOCACION AMOR APASIONADO SE REGISTRA COMO MAGN(AMOR) = APASIONADO (DONDE MAGN SIGNIFICA INTENSO), FORMULA USADA TAMBIEN PARA LLUVIA INTENSA O GRITO DESAFORADO. CADA ENTRADA DEL DICCIONARIO VA ASOCIADA A UN HIPERONIMO, LLAMADO ETIQUETA SEMANTICA, QUE A SU VEZ SE CLASIFICA EN UNA JERARQUIA DE NUEVE NIVELES. CUANTO MAS AVANZAMOS EN EL TRABAJO, MAYOR ES EL NIVEL DE PRECISION REQUERIDO POR LAS ETIQUETAS SEMANTICAS. ASI, POR EJEMPLO, EN LA PRIMERA FASE DEL PROYECTO CONTABAMOS CON UNA ETIQUETA SEMANTICA PARA DULCES Y POSTRES (HELADO, CHURROS, ETC.), ETIQUETA A SU VEZ CATALOGADA COMO ALIMENTOS PREPARADOS, QUE A SU VEZ ERA HIJA DE PRODUCTO DE CONSUMO, Y ESTA DE PRODUCTO. DURANTE LA PRIMERA FASE DEL PROYECTO AÑADIMOS MUCHOS NOMBRES NUEVOS DE DULCES, LO QUE CAUSO QUE DE LA ETIQUETA INICIAL DULCES Y POSTRES SURGIERAN CUATRO ETIQUETAS HIJAS (DULCES HELADOS, DULCES FRITOS, DULCES HORNEADOS Y DULCES COCIDOS). LOS DATOS HAN DEMOSTRADO QUE LA JERARQUIA DE ETIQUETAS CON LA QUE TRABAJAMOS CONTIENE DOS TIPOS DE RELACIONES: A) CONCEPTUALES, COMO LAS QUE SE DA ENTRE PRODUCTO Y EL VERBO PRODUCIR, PUESTO QUE NO TODOS LOS SUSTANTIVOS ETIQUETADOS CON ETIQUETAS HIJAS DE PRODUCTO SE PUEDEN COMBINAR CON PRODUCIR (TE VOY A HACER/*PRODUCIR UN TE); Y B) LEXICAS, COMO LA QUE SE DA ENTRE DULCES FRITOS Y EL VERBO FREIR, PORQUE TODOS LOS NOMBRES DE DULCES FRITOS SE COMBINAN CON EL VERBO FREIR (FREIR CHURROS, BUÑUELOS, ETC.). HEMOS COMPROBADO QUE SOLO A PARTIR DEL NIVEL 5 DE LA JERARQUIA SE PRODUCEN RELACIONES LEXICAS (Y POR TANTO HEREDABLES); LOS NIVELES ANTERIORES REFLEJAN RELACIONES CONCEPTUALES. ESTA JERARQUIA RESULTA ESENCIAL PARA LA HERENCIA DE RELACIONES LEXICAS Y SUPONE UN PASO EN GENERACION DE CONOCIMIENTO. EN LA PRIMERA FASE DEL PROYECTO HEMOS DESARROLLADO NOMBRES FUNCIONALES DE CINCO CAMPOS LEXICOS (EMOCIONES, VESTIMENTA, ALIMENTOS, VIVIENDA Y APARATOS). PRETENDEMOS AÑADIR PARTE DE LOS EJEMPLOS (NO SE PUDO HACER EN LA PRIMERA FASE) Y TERMINAR LA CORRECCION DE LAS NUEVAS FORMALIZACIONES CREADAS DURANTE LA PRIMERA FASE. NECESITAMOS DESCRIBIR MEJOR LAS RELACIONES ADJETIVALES, Y LAS RELACIONES TIPO DE, ABUNDANTISIMAS. HEMOS DE FORMALIZAR LAS LOCUCIONES NOMINALES Y LOS FORMULEMAS. QUEREMOS ABORDAR, POR ULTIMO, EL CAMPO LEXICO DE LA EVALUACION, Y HACER UNA PRUEBA PILOTO, EN LECTURA FACIL, DEL CAMPO DE LAS EMOCIONES. CALCULAMOS QUE AL FINAL DE LA SEGUNDA FASE ALCANZAREMOS UNAS 23.000 ENTRADAS Y 120.000 RELACIONES LEXICO SEMANTICAS, Y HABREMOS GENERADO NUEVOS TRABAJOS DE INVESTIGACION ACERCA DE LA COMBINATORIA LEXICA. EXICOGRAFIA\PROCESAMIENTO DE LENGUAJE NATURAL\PRAGMATICA\SEMANTICA\LEXICOLOGIA