Descripción del proyecto
LOS MODELOS OCULTOS DE MARKOV (HMMS ¿ HIDDEN MARKOV MODELS) SON SIN DUDA LA TECNOLOGIA BASE PREPONDERANTE EN LOS SISTEMAS DE RECONOCIMIENTO DE HABLA, HABIENDOSE PUESTO CLARAMENTE DE MANIFIESTO SUS FORTALEZAS, PERO TAMBIEN SUS LIMITACIONES, EN ESTE PROYECTO SE PROPONEN TRES LINEAS DE TRABAJO QUE SIGUEN APOYANDOSE EN LOS HMMS Y TRATAN DE COMPLEMENTARLOS EN SUS ASPECTOS MAS DEBILES CON EL OBJETIVO DE MEJORAR LA ROBUSTEZ DE LOS SISTEMAS DE RECONOCIMIENTO:- MEJORA DE LA ESTIMACION DE LAS FUNCIONES DENSIDAD DE PROBABILIDAD QUE MODELAN EL PROCESO DE EMISION DE OBSERVACIONES: LOS ACTUALES SISTEMAS DE RECONOCIMIENTO AUTOMATICO DE HABLA EMPLEAN HABITUALMENTE MEZCLAS DE GAUSSIANAS (GMMS ¿ GAUSSIAN MIXTURE MODELS); SI BIEN SON MODELOS SUFICIENTEMENTE GENERICOS Y VERSATILES, NO RESULTAN SUFICIENTEMENTE ROBUSTOS EN PRESENCIA DE RUIDO, SE PRETENDE DE REPLANTEAR EL PROBLEMA CON EL OBJETIVO DE LOGRAR UNA ESTIMACION MENOS SENSIBLE AL DESAJUSTE ENTRE ENTRENAMIENTO Y TEST, VALORANDO OTRAS ALTERNATIVAS (KNNS, KERNEL PCA, O LARGE MARGIN HMMS),- SELECCION DE MUESTRAS PARA USO EFICIENTE DE MLPS Y SVMS EN SISTEMAS DE RECONOCIMIENTO DE HABLA: YA HACE ALGUNOS AÑOS QUE SE PROPUSIERON TANTO ESQUEMAS HIBRIDOS BASADOS EN MLPS COMO PARAMETRIZACIONES ALTERNATIVAS (PROBABILIDADES ¿A POSTERIORI¿) CALCULADAS CON MLPS, MAS RECIENTE ES LA PROPUESTA DE SVMS, AVALADAS POR SUS INDISCUTIBLES PRESTACIONES EN OTROS AMBITOS, NO OBSTANTE, EN CUALQUIERA DE LOS CASOS, EL PRINCIPAL INCONVENIENTE PARA UN USO EXTENDIDO DE DICHAS TECNOLOGIAS ES SU COSTE COMPUTACIONAL, RESULTA ALENTADOR, SIN EMBARGO, VERIFICAR QUE ESTAS ALTERNATIVAS OBTIENEN RESULTADOS COMPETITIVOS EMPLEANDO SOLO UN SUBCONJUNTO MUY REDUCIDO DE LA BASE DE DATOS DE TRABAJO; LA SELECCION DE TAL SUBCONJUNTO SERA DETERMINANTE,- PARAMETRIZACIONES ROBUSTAS: POR UNA PARTE, SE PROPONE EL USO DE ESTIMACION ESPECTRAL DE MAXIMO MARGEN MEDIANTE SVRS (SUPPORT VECTOR REGRESSORS), QUE HAN ACREDITADO SU ROBUSTEZ, ESPECIALMENTE EN PRESENCIA DE RUIDO NO GAUSSIANO; POR OTRA, DADO QUE A LO LARGO DEL PROYECTO SE EXTRAERAN DIFERENTES TIPOS DE PARAMETROS (MFCCS, MLPS, SVRS, ETC,), SE ENSAYARAN PARAMETRIZACIONES EN TANDEM (REDUCIENDO LA DIMENSIONALIDAD RESULTANTE) Y PROCEDIMIENTOS SELECCION Y/O PONDERACION, LAS TECNICAS ANTERIORMENTE DESCRITAS SE ENSAYARAN SOBRE TAREAS DE RECONOCIMIENTO DE HABLA HABITUALMENTE EMPLEADAS COMO ESTANDARES INTERNACIONALES PARA LA COMPARACION DE PRESTACIONES, POR OTRA PARTE, SE TENDRA ESPECIAL CONSIDERACION HACIA APLICACIONES DEL RECONOCIMIENTO DE HABLA PARA EL APOYO AL SUBTITULADO PARA SORDOS, Reconocimiento de habla robusto\parametrizaciones robustas\estimación de fdps\MLPs\SVMs\SVRs\estimación espectral de máximo margen\selección de muestras\tándem de parametrizaciones