Descripción del proyecto
EL PROYECTO SE CENTRA EN EL ESTUDIO, EVALUACION Y COMPARACION DE TECNICAS DE MINERIA AVANZADA DE TEXTO ESTANDAR O NO ESTANDAR COMO SOPORTE PARA LA CONSTRUCCION DE ONTOLOGIAS DE DOMINIO, HACIENDO ENFASIS EN EL USO DE TECNICAS DE APRENDIZAJE AUTOMATICO, TODO ELLO REQUIERE AVANCES EN MUCHAS DE LAS TAREAS DE PROCESAMIENTO DE LENGUAJE NATURAL, SE CREARA UN REPOSITORIO DE SEGMENTOS TEXTUALES PARAFRASICOS QUE SERA UTIL PARA LA INVESTIGACION EN RESOLUCION DE CORREFERENCIA Y DE RECONOCIMIENTO DE PARAFRASIS, ADEMAS SE ESTUDIARAN CONJUNTOS DE ATRIBUTOS SEMANTICOS (JERARQUICOS O NO) Y METODOS DE APRENDIZAJE AUTOMATICO PARA LA CLASIFICACION DE TEXTOS EN DIFERENTES DOMINIOS, SE ESTUDIARAN METODOS PARA LA INTERPRETACION SEMANTICA: DESDE EL RECONOCIMIENTO DE EXPRESIONES TEMPORALES Y DE ENTIDADES NOMBRADAS Y SUS REFERENTES, HASTA LA CREACION DE ANALIZADORES SEMANTICOS, PASANDO POR EL PARSING SINTACTICO Y EL ETIQUETADO DE ROLES SEMANTICOS, ESTOS PROCESADORES SINTACTICO-SEMANTICOS PODRAN SER USADOS PARA ENRIQUECER LINGUISTICAMENTE LOS TEXTOS CLASIFICADOS EN DOMINIOS MEDIANTE LOS METODOS EXPLORADOS EN EL PROYECTO, SE UTILIZARA DICHO ENRIQUECIMIENTO COMO BASE PARA INFERIR PATRONES DE EXTRACCION DE INFORMACION A PARTIR DE METODOS DE APRENDIZAJE AUTOMATICO, ESTOS PATRONES SERAN UTILES PARA LOCALIZAR Y EXTRAER CONOCIMIENTO DEL DOMINIO EXPRESADO EN TEXTO Y ENRIQUECER ONTOLOGIAS CON EL, SIN EMBARGO, POR UNA PARTE EL CONOCIMIENTO PUEDE EXPRESARSE EN COLECCIONES DE TEXTO DE FORMA REDUNDANTE, ESTA REDUNDANCIA DEBE SER LOCALIZADA Y FILTRADA PARA EXTRAER EL CONOCIMIENTO, PARA DICHO FIN, SE ESTUDIARAN METODOS DE RECONOCIMIENTO DE PARAFRASIS, POR OTRA PARTE, EL CONOCIMIENTO IMPLICACIONAL (A IMPLICA B) PUEDE ESTAR DESCRITO IMPLICITAMENTE EN LOS TEXTOS, CON EL FIN DE LOCALIZAR DICHO CONOCIMIENTO, SE ESTUDIARAN METODOS DE RECONOCIMIENTO DE IMPLICACION TEXTUAL BASADOS EN EL CONOCIMIENTO, EL CONOCIMIENTO DE DOMINIO PUEDE ESTAR TAMBIEN CONTENIDO EN DOCUMENTOS TEXTUALES NO ESTANDARES, COMO TRANSCRIPCIONES DE GRABACIONES DE AUDIO, TODO EL CONOCIMIENTO EXTRAIDO PUEDE SER UTIL PARA QUE LOS SISTEMAS DE PREGUNTA-RESPUESTA (PR) SEAN CAPACES DE EXTRAER RESPUESTAS MAS O MENOS COMPLEJAS A PREGUNTAS MAS O MENOS COMPLEJAS, LA UPC PRETENDE CONSTRUIR UN PROTOTIPO DE SISTEMA DE PR CAPAZ DE EXTRAER RESPUESTAS CONTENIDAS EN TRANSCRIPCIONES ORALES,TODA ESTA INVESTIGACION SERA EVALUADA EN MARCOS DE EVALUACION INTERNACIONALES EXISTENTES, Y EN SU DEFECTO, SE EVALUARAN EN MARCOS DE EVALUACION DESTACADOS EN EL ESTADO DEL ARTE, MINERIA DE TEXTO\MINERIA DE TEXTO ADAPTATIVA\APRENDIZAJE AUTOMATICO\PROCESAMIENTO DEL LENGUAJE NATURAL\INTERPRETACION SEMANTICA\RESOLUCION DE CO-REFERENCIAS\IMPLICACION TEXTUAL\EXTRACCION DE INFORMACION\PREGUNTA-RESPUESTA\CLASIFICACION DE DOCUMENTOS