Innovating Works

TEC2015-65345-P

Financiado
DETECCION MULTIMEDIA Y MULTILINGUE DE INFORMACION SOBRE PERSONAS
EN TRACETHEM SE INVESTIGARA SOBRE TECNICAS ALGORITMICAS DE BUSQUEDA MULTIMEDIA Y MULTILINGUE QUE TRABAJEN EN ENTORNOS REALES, DONDE LAS TECNICAS ACTUALES FALLAN EN PRESTACIONES, GENERALIZACION O ESCALABILIDAD, APARTE DE LOS CONTEN... EN TRACETHEM SE INVESTIGARA SOBRE TECNICAS ALGORITMICAS DE BUSQUEDA MULTIMEDIA Y MULTILINGUE QUE TRABAJEN EN ENTORNOS REALES, DONDE LAS TECNICAS ACTUALES FALLAN EN PRESTACIONES, GENERALIZACION O ESCALABILIDAD, APARTE DE LOS CONTENIDOS AUDIOVISUALES TRADICIONALES (PROGRAMAS DE TELEVISION, INFORMATIVOS, PELICULAS, SERIES…) HAN SURGIDO EN LOS ULTIMOS AÑOS NUEVAS TIPOLOGIAS Y ESCENARIOS (MOOCS, VIDEOBLOGS, TUTORIALES…) EN LOS QUE LA AUTOMATIZACION DEL PROCESO DE BUSQUEDA PARA EL ACCESO A LOS CONTENIDOS ES UN ASPECTO PRIMORDIAL; EL PROCESADO DE ESTOS DOCUMENTOS MULTIMEDIA CONLLEVA LA DIFICULTAD AÑADIDA DE QUE, A MENUDO, LOS CONTENIDOS APARECEN EN IDIOMAS DIFERENTES, LO QUE SUPONE UN RETO TECNOLOGICO DE MAYOR CALIBRE, YA QUE SE NECESITAN HERRAMIENTAS ADAPTADAS A LOS DIFERENTES IDIOMAS, LO CUAL NO SIEMPRE ES POSIBLE DEBIDO A LA FALTA DE RECURSOS QUE PERMITAN INDEXAR CONTENIDOS DE FORMA TOTALMENTE INDEPENDIENTE DEL IDIOMA, LA INFORMACION QUE PRETENDEMOS EXTRAER VA SIEMPRE CENTRADA EN UN CONTEXTO COMUNICATIVO (“DE” ALGUIEN Y “PARA” ALGUIEN), CON LO QUE LA CARACTERIZACION DE LAS PERSONAS QUE INTERVIENEN DENTRO DE ESE CONTEXTO DESEMPEÑARA UN PAPEL PRINCIPAL, NOS CENTRAREMOS EN LA BUSQUEDA DE INFORMACION SOBRE PERSONAS Y EN SU MODO DE INTERACCIONAR (“QUIENES SON”, “QUE DICEN”, “COMO COMUNICAN”, “COMO ESTAN”), CON UN INTERES ESPECIAL EN DESCUBRIR PERSONAS Y CONTENIDOS, LA EXTRACCION DE INFORMACION RELATIVA A LAS PERSONAS SE VA A REALIZAR MEDIANTE PROCESADO DE AUDIO, PROCESADO DE VIDEO Y PROCESADO CONJUNTO DE AUDIO Y VIDEO, PARA ELLO NOS CENTRAREMOS EN LA BUSQUEDA DE TECNOLOGIAS Y NUEVAS SOLUCIONES PARA: ANALISIS DE CONTENIDO MULTIMEDIA, BIOMETRIA DE VOZ Y CARA, SEGMENTACION DE AUDIO Y DIARIZACION DE LOCUTOR, DETECCION DEL ESTADO EMOCIONAL Y DETECCION DE PERSONAS INTERACTUANDO, LA EXTRACCION DE CONTENIDOS SE REALIZARA PRIMORDIALMENTE MEDIANTE EL PROCESADO DE AUDIO, EMPLEANDO TECNICAS DE BUSQUEDA DE CONTENIDOS EN VOZ TANTO DE FORMA DEPENDIENTE COMO INDEPENDIENTE DEL IDIOMA, EL IMPACTO CIENTIFICO-TECNICO Y LA DIFUSION DE LOS RESULTADOS SE VERAN FAVORECIDOS POR LA PARTICIPACION EN EVALUACIONES COMPETITIVAS INTERNACIONALES RELACIONADAS CON LA TEMATICA DESCRITA, YA QUE ESTAS SERAN UNA ACTIVIDAD IMPORTANTE EN EL DESARROLLO DE ESTE PROYECTO, PUES PERMITEN UTILIZAR CONJUNTOS DE DATOS RELACIONADOS CON LAS TAREAS QUE CONSTITUYEN LOS DESAFIOS TECNOLOGICOS EN CADA MOMENTO, ADEMAS, EN ESTAS COMPETICIONES SE ESTABLECEN MARCOS EXPERIMENTALES COMUNES QUE POTENCIAN LA COLABORACION CON OTROS GRUPOS DE INVESTIGACION Y PERMITEN REALIZAR COMPARACIONES DE DIFERENTES ALGORITMOS, AYUDANDO ASI A DESCUBRIR LAS FORTALEZAS Y DEBILIDADES DE LOS ALGORITMOS Y SISTEMAS DESARROLLADOS, ANÁLISIS MULTIMEDIA\INDEXACIÓN\BIOMETRÍA DE CARAS Y VOZ\DIARIZACIÓN DE LOCUTOR\APRENDIZAJE MÁQUINA ver más
01/01/2015
71K€
Perfil tecnológico estimado

Línea de financiación: concedida

El organismo AGENCIA ESTATAL DE INVESTIGACIÓN notifico la concesión del proyecto el día 2015-01-01
Presupuesto El presupuesto total del proyecto asciende a 71K€
Líder del proyecto
UNIVERSIDADE DE VIGO No se ha especificado una descripción o un objeto social para esta compañía.
Total investigadores 410