Descripción del proyecto
EL "CORPUS DE DOCUMENTOS ESPAÑOLES ANTERIORES A 1800" (CODEA+ 2015) <HTTP://WWW,CORPUSCODEA,ES> ESTA INTEGRADO POR TRANSCRIPCIONES DIRECTAS DE 2500 DOCUMENTOS ARCHIVISTICOS PENINSULARES ANTERIORES DESDE LOS ORIGENES DEL ESPAÑOL AL S, XVIII INCLUSIVE, ES MUY UTILIZADO EN ESTUDIOS DE HISTORIA LINGUISTICA, Y SON NUMEROSAS LAS TESIS QUE LO INCORPORAN COMO FUENTE UNICA O PARCIAL, INCORPORA POR PRIMERA EN CUALQUIER LENGUA LA PROYECCION AUTOMATICA E INMEDIATA A UNA MAPA DE LOS RESULTADOS DE CUALQUIER BUSQUEDA, EL PRESENTE PROYECTO TIENE POR OBJETO LLEVAR EL CORPUS (CODEA+ 2015) HASTA EL ESTADIO CODEA+ 2020, ESTA ETAPA SUPONDRA UN AVANCE EN LOS SIGUIENTES ASPECTOS: (1) SE INCORPORARAN 1500 NUEVOS DOCUMENTOS, HASTA ALCANZAR EL NUMERO TOTAL DE 4000, (2) AMPLIACION DEL ARCO TEMPORAL DEL CORPUS, QUE PASARA A INCLUIR EL SIGLO XIX, DE ESTA CENTURIA SE TRANSCRIBIRAN 750 DOCUMENTOS; CON ELLOS, CODEA SE CONVIERTE EN UN CORPUS PRACTICAMENTE PANCRONICO, PUES ABARCARA DE LOS ORIGENES A 1900; (3) LOS OTROS 750 DOCUMENTOS CORRESPONDERAN A LOS PERIODOS Y PROVINCIAS PEOR REPRESENTADAS EN LA VERSION ACTUAL, CON LO QUE SE ALCANZARA GRAN REPRESENTATIVIDAD Y HOMOGENEIDAD CRONOLOGICA Y GEOGRAFICA; (4) CODEA+ 2020 INCORPORARA TECNOLOGIA DE WEB SEMANTICA, DE MANERA QUE TODOS EL VOCABULARIO ESTARA CLASIFICADO EN 100 CAMPOS REFERENCIALES O MATERIAS, QUE COMPONE LA ONTOLOGIA DEL CORPUS, Y SERA POSIBLE OBTENER, DE MANERA INMEDIATA Y SUCESIVAMENTE, LAS FAMILIAS LEXICAS REPRESENTADAS EN CADA MATERIA, LOS LEMAS, LAS FORMAS CRITICAS Y LAS FORMAS PALEOGRAFICAS, TAMBIEN SERA POSIBLE RECORRER ESTE CAMINO EN SENTIDO INVERSO, DE LA FORMA PALEOGRAFICA A LA MATERIA; (5) EL BUSCADOR SERA MUCHO MAS POTENTE, PUES PERMITIRA COMBINACIONES DE MATERIA Y LEMA, ASI COMO CATEGORIA LEXICO-GRAMATICAL (P, EJ,, ADJETIVOS CON SUSTANTIVOS DEL CAMPO REFERENCIAL "MONARQUIA" QUE PODRAN COMPARARSE CON LOS DE "RELIGION"); (6) MEDIANTE UN METODO COORDENADO SE ALINEARAN EL FACSIMIL (IMAGEN DE LA PALABRA = DOS ORDENADAS: VERTICAL O Nº DE LINEA, Y HORIZONTAL O LUGAR DENTRO DE LA LINEA), LA FORMA PALEOGRAFICA, LA FORMA CRITICA Y EL LEMA; (7) SI LA VERSION ACTUAL INCLUYE LA DATACION CONJETURAL DE DOCUMENTOSNO FECHADOS (CON UN ERROR MEDIO DE +- 14 AÑOS, COMPROBADO EN PRUEBAS CON DOCUMENTOS CON FECHA), AHORA SE APLICARA ESTA TECNOLOGIA A LA LOCALIZACION DE PIEZAS SIN "DATA TOPICA"; (8) SE INCORPORARA AUDIO, CON FUNCION DE MARCADO DEL PROGRESO DE LA LECTURA, DE UN 4% DE LOS DOCUMENTOS DEL CORPUS; (9) DE CADA DOCUMENTO SE INCORPORARA UN REGESTO EN INGLES; (10) COMO COLOFON DE LAS POSIBILIDADES DEL NUEVO CODEA 2020 SE ELABORARA UNA CRONOLOGIA POR REGIONES DE LOS PRINCIPALES HECHOS LINGUISTICOS DE LA HISTORIA DEL ESPAÑOL; (11) POR ULTIMO, SE POTENCIARA LA SELECCION DE DOCUMENTOS Y ESTUDIO DE MANOS INHABILES, MINORIAS Y ESCRITURA FEMENINA, EN CONSECUENCIA, LOS DOCUMENTOS INCORPORADOS Y LAS NUEVAS HERRAMIENTAS DE BUSQUEDA Y NAVEGACION, CONVERTIRAN A CODEA+ 2020 EN UN CORPUS PUNTERO EN EL PANORAMA MUNDIAL, IMPRESCINDIBLE PARA LA INVESTIGACION FILOLOGICA Y LINGUISTICA, PERO TAMBIEN EN OTROS CAMPOS COMO LA PALEOGRAFIA E HISTORIA DE ESCRITURA Y LA HISTORIA DE LAS MENTALIDADES Y DE LA VIDA PRIVADA, CORPUS LINGÜÍSTICOS\HISTORIA DE LA LENGUA ESPAÑOLA\DOCUMENTOS ARCHIVÍSTICOS\GEOGRAFÍA LINGÜÍSTICA DIACRÓNICA\ONTOLOGÍA