Innovating Works

PID2021-126061OB-C43

Financiado
DESCUBRIENDO EL SIGNIFICADO Y LA INTENCION MAS ALLA DE LA PALABRA HABLADA: HACIA...
DESCUBRIENDO EL SIGNIFICADO Y LA INTENCION MAS ALLA DE LA PALABRA HABLADA: HACIA UN ENTORNO INTELIGENTE PARA ABORDAR LOS DOCUMENTOS MULTIMEDIA UNO DE LOS RETOS PRINCIPALES DE LA SOCIEDAD DIGITAL ACTUAL ES EL PODER AYUDAR A LOS USUARIOS A ACCEDER RAPIDAMENTE A UNA GRAN CANTIDAD DE INFORMACION MULTIMEDIA, ASI COMO PERMITIR UNA FACIL INTERACCION HOMBRE-MAQUINA. POR SU PARTE... UNO DE LOS RETOS PRINCIPALES DE LA SOCIEDAD DIGITAL ACTUAL ES EL PODER AYUDAR A LOS USUARIOS A ACCEDER RAPIDAMENTE A UNA GRAN CANTIDAD DE INFORMACION MULTIMEDIA, ASI COMO PERMITIR UNA FACIL INTERACCION HOMBRE-MAQUINA. POR SU PARTE, EL LENGUAJE ESCRITO Y EL HABLADO SON LAS FORMAS MAS NATURALES DE COMUNICACION HUMANA, DONDE LOS AVANCES EN EL PROCESAMIENTO DEL HABLA Y EL TEXTO HAN PERMITIDO IMPORTANTES DESARROLLOS.LOS OBJETIVOS DE ESTE PROYECTO INCLUYEN ASPECTOS QUE VAN MAS ALLA DEL TRATAMIENTO DE SOLO SECUENCIAS DE PALABRAS, ENFOCANDOSE MAS BIEN EN EL SIGNIFICADO, LA INTERACCION, Y DIVERSOS ASPECTOS PARALINGUISTICOS. NUESTRO SUBPROYECTO SE ENFOCA EN LA ESFERA AFECTIVA QUE ES MUY RELEVANTE PARA TENER CONVERSACIONES NATURALES CON AGENTES CONVERSACIONALES, GENERAR VOZ CON EXPRESIVIDAD, SENSAR Y RECONOCER DE FORMA UBICUA LAS ACTIVIDADES HUMANAS, ASI COMO EN MEJORAR DIVERSAS TECNOLOGIAS BASE PARA LA INTERACCION COMO SON: LOS RECONOCEDORES DE TEXTO, IDIOMA Y DIARIZACION DE LOCUTORES.DE ESTA MANERA, CUANDO UNA PERSONA INTERACTUA CON UN SISTEMA DE DIALOGO MULTI-PROPOSITO, ESTE DEBE SER CAPAZ DE IDENTIFICAR EL IDIOMA DE LA INTERACCION, TRANSCRIBIR Y ADAPTARSE CORRECTAMENTE A NUEVOS TOPICOS Y ENTIDADES, DETECTAR EL CONTENIDO Y MOMENTO APROPIADO PARA PRESENTAR LA INFORMACION, ASI COMO DETECTAR CON QUE USUARIO Y CUANDO SE ESTA INTERACCIONANDO.BUSCAMOS AVANZAR EN CREAR SISTEMAS AUTONOMOS QUE PUEDAN PROCESAR LA INFORMACION RECOGIDA DE DIVERSAS FUENTES DE INFORMACION COMO INTERACCIONES HABLADAS O TEXTOS ESCRITOS, VIDEOS O INCLUSO SENSORES. ESTO NOS IMPLICA ENFRENTARNOS A VARIOS RETOS EN LOS CAMPOS DEL APRENDIZAJE SUPERVISADO Y NO SUPERVISADO, EN LA REPRESENTACION DE LA INFORMACION EN AREAS DEL PROCESAMIENTO DE VOZ, DETECCION DE EMOCIONES Y DE INTENCION. POR TANTO, PROPONEMOS DESARROLLAR SOLUCIONES TECNOLOGICAS NOVEDOSAS ENCAMINADAS A:INVESTIGAR NUEVOS ALGORITMOS QUE MEJOREN LAS TECNOLOGIAS DEL HABLA (MODULO 1): EN EL RECONOCIMIENTO DE VOZ MEDIANTE EL DESARROLLO DE TECNICAS AVANZADAS DE ADAPTACION RAPIDA AL CONTEXTO DEL DIALOGO USANDO UN MODELO DE LENGUAJE MULTINIVEL QUE PUEDA DAR SOLUCIONES A LA OCURRENCIA DE PALABRAS FUERA DE VOCABULARIO, EN EL RECONOCIMIENTO DE IDIOMA MEDIANTE LA COMBINACION DE INFORMACION ACUSTICA Y FONOTACTICA, ASI COMO TECNICAS DE COMPENSACION ACUSTICA PARA MEJORAR SU ROBUSTEZ, EN LA DIARIZACION DE LOCUTOR SELECCIONANDO CORRECTAMENTE LOS CANALES, VECTORES DE CARACTERISTICAS Y ESTIMACION DEL NUMERO DE LOCUTORES EN UNA GRABACION, EN LA DETECCION Y ADAPTACION AL TIPO DE MOVIMIENTOS Y CARACTERISTICAS DEL USUARIO USANDO DIVERSOS SENSORES UBICUOS.RESPECTO A LAS TECNOLOGIAS AUDIOVISUALES (TAREA 3.4), EL SISTEMA ESTIMARA EL IMPACTO DEL CONTENIDO OFRECIDO CUANDO SE INTERACCIONA CON EL AGENTE CONVERSACIONAL, UNIDO A UNA ADAPTACION EMOCIONAL CON EL FIN DE MEJORAR LA INTERACCION CON EL USUARIO MEDIANTE EL RECONOCIMIENTO DE EMOCIONES EN EL HABLA Y EL ROSTRO DEL USUARIO.RESPECTO A LA GENERACION DE SALIDA (TAREA 4.1), SE DESARROLLARAN TECNOLOGIAS QUE PERMITAN CREAR CHATBOTS DE DOMINIO ABIERTO QUE PRESENTEN CARACTERISTICAS EMOCIONALES Y PERSONALES ADAPTATIVAS, ASI COMO A LA EVALUACION AUTOMATICA DE LA CALIDAD DE LA INTERACCION MEDIANTE METRICAS QUE NO REQUIEREN REFERENCIAS Y EN EL QUE SE USEN TECNICAS DE AUTO-APRENDIZAJE. FINALMENTE, MEDIANTE LA INVESTIGACION EN NUEVOS ALGORITMOS PARA GENERAR VOZ SINTETICA CON EMOCIONES Y ESTILOS (TAREA 4.3) QUE SE PUEDAN ADAPTAR AL CONTENIDO, EMOCION E INTERACCION CON LOS USUARIOS FINALES. NALISIS DE SENTIMIENTOS\INTERACCION HOMBRE-MAQUINA\PROCESAMIENTO DE LENGUAJE NATURAL\CONVERSOR TEXTO-VOZ CON EMOCIONES\EVALUACION DE DIALOGOS\SENSADO DE USUARIOS\CHATBOT\RECONOCIMIENTO DE HABLA\RECONOCIMIENTO DE IDIOMA\DIARIZACION DE LOCUTORES ver más
01/01/2021
UPM
152K€
Perfil tecnológico estimado

Línea de financiación: concedida

El organismo AGENCIA ESTATAL DE INVESTIGACIÓN notifico la concesión del proyecto el día 2021-01-01
Presupuesto El presupuesto total del proyecto asciende a 152K€
Líder del proyecto
UNIVERSIDAD POLITÉCNICA DE MADRID No se ha especificado una descripción o un objeto social para esta compañía.
Total investigadores 3944