Descripción del proyecto
EL EMPLEO DE DATOS DE COLOCACION LEXICA EN LAS DESCRIPCIONES SEMANTICAS OFRECE UNA IMPORTANTE VENTAJA CON RESPECTO A METODOS MAS TRADICIONALES BASADOS EN LA INTROSPECCION, YA QUE CONTRIBUYE A MINIMIZAR LOS EFECTOS DE UN SESGO SUBJETIVO EN LOS PROCESOS DE SELECCION DE EJEMPLOS Y DE ANALISIS DEL SIGNIFICADO. YA LAS PRIMERAS INVESTIGACIONES EN LEXICOLOGIA BASADA EN CORPUS SUBRAYARON LA POSIBILIDAD QUE EL FENOMENO DE LA COLOCACION NOS BRINDA PARA ACCEDER A LA IDENTIFICACION DE ENTIDADES NO OBSERVABLES, COMO SON LOS SIGNIFICADOS, POR MEDIO DE MANIFESTACIONES EN LA SUPERFICIE DISCURSIVA QUE SON SUSCEPTIBLES DE OBSERVACION EMPIRICA DIRECTA Y DE MEDICION ESTADISTICA (JONES AND SINCLAIR, 1974; RENOUF, 1996). POR ELLO, CABE AFIRMAR QUE EL ANALISIS DE COLOCACIONES BASADO EN CORPUS PUEDE REFORZAR LA FIABILIDAD CIENTIFICA DE LAS TECNICAS DE ANALISIS SEMANTICO. EL PRINCIPAL REQUISITO TEORICO PARA QUE ESTO SE CUMPLA CONSISTE EN ADOPTAR UN MODELO CONTEXTUALISTA DEL SIGNIFICADO LEXICO QUE ESPECIFIQUE CORRESPONDENCIAS ENTRE DATOS DE COOCURRENCIA Y RASGOS SEMANTICOS. DE ESTE MODO SE HACE POSIBLE MEDIR LA EXACTITUD DE LAS PREDICCIONES REALIZADAS ACERCA DEL POTENCIAL SEMANTICO DE UNA DETERMINADA UNIDAD LEXICA. NO OBSTANTE, LAS PERSPECTIVAS DE DESARROLLO DE UNA LEXICOLOGIA BASADA EN CORPUS NO ESTAN EXENTAS DE DIFICULTADES. UNA DE ELLAS, TAL VEZ LA PRINCIPAL EN EL ESTADO ACTUAL DE LA CUESTION, ES LA FALTA DE UNA RELACION BIUNIVOCA ENTRE SIGNIFICATIVIDAD ESTADISTICA Y RELEVANCIA SEMANTICA (HAUSMANN ****; MARTIN, 2008). ESTE HA SIDO EL MOTIVO DE LAS OBJECIONES QUE LOS MIEMBROS DEL GRUPO LACELL HAN PLANTEADO A LOS MODELOS CONVENCIONALES DE ANALISIS DE COLOCACIONES. LA ALTERNATIVA PROPUESTA ES EL MODELO DE CONSTELACIONES LEXICAS (MCL), QUE SUSTITUYE EL ANALISIS LINEAL, UNIDIMENSIONAL DE LAS COLOCACIONES POR UN SISTEMA DE REDES MULTIDIMENSIONAL. ESTA INNOVACION PERMITE DISTINGUIR DOS O MAS DOMINIOS DE ATRACCION LEXICA DENTRO DE UNA MISMA VENTANA COLOCACIONAL. HASTA EL MOMENTO, LA INVESTIGACION SOBRE EL MCL SE HA DIRIGIDO HACIA LOS SIGUIENTES OBJETIVOS: OPTIMIZAR LAS TECNICAS DE EXTRACCION DE COLOCADOS (CANTOS AND SANCHEZ, 2001; ALMELA, 2011A), INDAGAR EN LA UTILIDAD DEL MODELO PARA LA DESAMBIGUACION LEXICA (SANCHEZ ET AL., 2007) Y ANALIZAR IMPLICACIONES EN EL AMBITO DE LA LEXICOGRAFIA ELECTRONICA (ALMELA ET AL., 2011B). EL SIGUIENTE PASO QUE ASPIRAMOS A DAR CON ESTE PROYECTO ES EL DISEÑO Y DESARROLLO DE UN MODELO COMPLETO Y AVANZADO DE DESCRIPCION LEXICO-SEMANTICA BASADA EN EL MCL Y FUNDAMENTADO EMPIRICAMENTE POR LA UTILIZACION DEL MISMO PARA EL ANALSIS DE UN DETERMINADO AMBITO DEL VOCABULARIO. LAS PALABRAS ESCOGIDAS SON DOCE SUSTANTIVOS QUE EXPRESAN RELACIONES DE CAUSALIDAD Y EFECTO EN AL MENOS UNA DE SUS ACEPCIONES MAS FRECUENTES. EL DESARROLLO DEL MCL PLANIFICADO EN ESTE PROYECTO SE ORIENTA EN DOS DIRECCIOENS COMPLEMENTARIAS. EN PRIMER LUGAR, EXPLOTAREMOS LA CAPACIDAD DEL MODELO PARA DESCRIBIR PATRONES DE COOCURRENCIA CARACTERIZADOS EN DIFERENTES NIVELES DE ABSTRACCION. EL NIVEL MAS ABSTRACTO ESTA REPRESENTADO POR ESTRUCTURAS PURAMENTE CONCEPTUALES QUE SUBYACEN A UNA VARIEDAD DE REALIZACIONES LEXICAS MAS ESPECIFICAS. EN SEGUNDO LUGAR, TRATAREMOS DE DESCRIBIR LOS MECANISMOS DE INTERACCION ENTRE LAS CONSTELACIONES LEXICAS Y CONCEPTUALES, POR UN LADO, Y UN INVENTARIO DE CONSTRUCCIONES GRAMATICALES, POR EL OTRO, CON OBJETO DE IDENTIFICAR LAS DIVERSAS FORMAS EN QUE LAS CONSTELACIONES SE MANIFIESTAN EN EL DISCURSO.