Descripción del proyecto
LA TECNOLOGIA DEL HABLA PERMITE IMPLEMENTAR INTERFACES DE CONTROL QUE NO NECESITEN EL USO DE LAS MANOS (LO CUAL ES MUY BENEFICIOSO EN COCHES O EN ROBOTS AUTONOMOS EN CONTINUO MOVIMIENTO) O PERMITAN COMPLEMENTAR LAS INTERFACES GRAFICAS FACILITANDO TAREAS COMO SELECCIONAR DATOS DENTRO DE UN CONJUNTO MUY AMPLIO DE POSIBILIDADES (COMO LOS DESTINOS DE LA NAVEGACION), POR ELLO SE PLANTEAN 2 OBJETIVOS PRINCIPALES-OBJETIVO ESPECIFICO 6: RECONOCIMIENTO DE PASAJEROS: LA IDENTIFICACION DEL LOCUTOR POR MEDIO DE SU VOZ PERMITE PERSONALIZAR LOS SERVICIOS A TRAVES DE SU PERFIL DE USUARIO-OBJETIVO ESPECIFICO 7: INTERACCION CON LOS PASAJEROS: RECONOCIMIENTO Y SINTESIS DE HABLA CON CAPACIDAD PARA AYUDAR A CONTROLAR LA NAVEGACION DE COCHES Y ROBOTS Y CON UN BUEN RENDIMIENTO EN CONDICIONES ADVERSAS,SE PLANTEA UN NUEVO DOMINIO DE TRABAJO EN SINTESIS DE HABLA (COMO MEJORAR LA SINTESIS DE HABLA EN ENTORNOS RUIDOSOS, ESPECIALMENTE EN ENTORNO DE COCHE, IMITANDO EL LLAMADO EFECTO LOMBARD) Y COMO MEJORAR NO TANTO LA CALIDAD COMO LA INTELIGIBILIDAD EN ESTAS CONDICIONES ADVERSAS, A FIN DE ACELERAR Y OPTIMIZAR EL DESARROLLO DE ALGORITMOS, SE ENSAYARA LA INCORPORACION DE TECNICAS DE ESTIMACION OBJETIVA DE LA INTELIGIBILIDAD (OBJECTIVE QUALITY METRICS) Y DE CALIDAD (OBJECTIVE INTELLIGIBILITY MODELS) EN EL PROCESO DE DESARROLLO DE LA VOZ SINTETICA, PARA OPTIMIZAR LOS PARAMETROS DE SINTESIS EN BUCLE CERRADO OFF-LINE,EN CUANTO AL RECONOCIMIENTO, EL SUBOBJETIVO ES EL COMPLEMENTARIO: COMO MEJORAR EL RENDIMIENTO DEL RECONOCEDOR EN APLICACIONES DE DIALOGO PERSONA-MAQUINA EN LAS MISMAS CONDICIONES, SIN QUE EL USUARIO TENGA QUE RECURRIR DE MANERA EXTREMA AL EFECTO LOMBARD, PARA ELLO SE EMPLEARAN TECNICAS DE CORRUPCION DE BASES DE DATOS, ADAPTACION Y DE MEDIDAS DE CONFIANZA, INCLUSO REDES NEURALES PROFUNDAS SI FUESE NECESARIO,ADEMAS, ES NECESARIO DISEÑAR E IMPLEMENTAR UNA INTERFAZ DE DIALOGO PERSONA MAQUINA QUE PERMITA EL CONTROL DE LA NAVEGACION POR PARTE DEL USUARIO O USUARIOS DEL COCHE O DEL ROBOT,PARA TODOS ESTOS TRABAJOS SE PARTE DE LA EXPERIENCIA PREVIA DEL EQUIPO, QUE HA CONSEGUIDO EXCELENTES RESULTADOS EN LA MODIFICACION DE MODELOS DE SINTESIS DE HABLA PARA INCORPORAR Y MODULAR DIVERSOS TIPOS DE INFORMACION PARALINGUISTICA NO INCLUIDA EN LOS MODELOS "NEUTROS" PREVIOS A LA MODIFICACION, INFORMACION COMO POR EJEMPLO EMOCIONES (ALEGRIA, TRISTEZA, ENFADO
) O ESTILOS (NOTICIAS, RETRANSMISIONES DEPORTIVAS
), EMPLEANDO TECNICAS DE TRASPLANTE BASADAS EN ADAPTACION CRUZADA ENTRE LOCUTORES, SE HA BUSCADO MAXIMIZAR LA CALIDAD O IDENTIFICABILIDAD,IGUALMENTE EL EQUIPO POSEE AMPLIA EXPERIENCIA EN EN DISEÑO DE SISTEMAS DE DIALOGO PERSONA-MAQUINA, RECONOCIMIENTO DE HABLA, IDENTIFICACION Y DIARIZACION DEL LOCUTOR, Y EN PARTICULAR EN TECNICAS DE ADAPTACION PARA ROBUSTECER EL RECONOCIMIENTO EN ENTORNOS RUIDOSOS, HABIENDO TRABAJADO EN TECNICAS MULTI-MICROFONO DE FORMA ESPECIALMENTE BRILLANTE EN DIARIZACION DE LOCUTORES (IDENTIFICACION DE LOCUTOR NO SUPERVISADA),EN CASO DE PROBLEMAS DE INTELIGIBILIDAD Y CALIDAD DE LA SINTESIS, UNA ALTERNATIVA AL MODELADO OFF-LINE (APLICABLE A ENTORNOS ABIERTOS Y GRANDES COMO ESTACIONES U OTROS EDIFICIOS PUBLICOS) SERIA EL CONTROL ON-LINE DE LOS PARAMETROS DE SINTESIS EN TIEMPO REAL Y EN LAZO CERRADO (ESPECIALMENTE EN EL CASO DEL COCHE, AL TRATARSE DE UN ENTORNO REDUCIDO Y CERRADO, DONDE ES POSIBLE SITUAR ADECUADAMENTE TANTO MICROFONOS COMO ALTAVOCES) RECONOCIMIENTO DE HABLA\SÍNTESIS DE HABLA\RUIDO\CONDUCCIÓN AUTOMÁTICA\COCHE\ROBOT GUÍA