Descripción del proyecto
EL ESTADO ACTUAL DE LAS TECNOLOGIAS DE PROCESAMIENTO DE AUDIO Y VIDEO PERMITE ABORDAR TAREAS CADA VEZ MAS COMPLEJAS Y CON MAYORES NIVELES DE PRECISION, LA COMUNIDAD CIENTIFICA INTERNACIONAL REALIZA IMPORTANTES ESFUERZOS PARA IR MAS ALLA DE LA SIMPLE EXTRACCION DE INFORMACION ACUSTICA O VISUAL, PARA OBTENER INFORMACION SEMANTICA, RELACIONADA CON LOS EVENTOS QUE ESTAN TENIENDO LUGAR EN UN ESPACIO DETERMINADO, EN EL CONTEXTO DE LO QUE SE HA DADO EN LLAMAR INTERPRETACION DE ESCENAS (SCENE UNDERSTANDING), CON ESPECIAL ENFASIS EN LAS TAREAS CENTRADAS EN EL RECONOCIMIENTO DE LA ACTIVIDAD HUMANA (HUMAN ACTIVITY RECOGNITION), LA MAYORIA DE LA LITERATURA SE CENTRA EN EL USO DE INFORMACION FUNDAMENTALMENTE VISUAL, EN MENOR MEDIDA USANDO INFORMACION ACUSTICA Y DE PROFUNDIDAD, Y CON MUY POCOS TRABAJOS ORIENTADOS AL APROVECHAMIENTO SIMULTANEO DE ESOS TIPOS DE INFORMACION,EL PROYECTO SPACES ES CONTINUACION DE UNA LARGA LINEA DE INVESTIGACION DE LOS GRUPOS PROPONENTES EN EL AREA DE ESPACIOS INTELIGENTES Y QUE HA RECIBIDO FINANCIACION PUBLICA DE MANERA ININTERRUMPIDA DESDE HACE MAS DE 15 AÑOS, MAS CONCRETAMENTE, SPACES TOMA COMO PUNTO DE PARTIDA IMPORTANTES RESULTADOS DE PROYECTOS RECIENTES (PROYECTOS SD-TEAM-UAH (TIN2008-06856-C05-05), VISNU (TIN2009-08984), RESELAI (TIN2006-14896-C02-01), MOVICON (TRA2005-08529-C02-02), (TIN2008-06815-C02-02) Y TIN2010-19654), CUYO OBJETIVO GLOBAL ES EL AVANZAR EN EL ESTUDIO DE ESTRATEGIAS DE APROVECHAMIENTO DE LA INFORMACION CAPTADA POR MULTIPLES SENSORES DE AUDIO Y VIDEO EN TAREAS DE EXTRACCION DE ATRIBUTOS VISUALES Y RECONOCIMIENTO DE LA ACTIVIDAD HUMANA, CON UNA CLARA ORIENTACION A LA GENERACION DE DEMOSTRADORES QUE COLOQUEN A LAS TECNOLOGIAS DESARROLLADAS EN EL PUNTO IDONEO PARA ABORDAR SU TRANSFERENCIA TECNOLOGICA,EN ESTA PROPUESTA EL ENFASIS SE COLOCA EN EL DESARROLLO DE TECNOLOGIAS DE PROCESAMIENTO DE SEÑALES MULTIMODALES Y ALGORITMOS DE ALTO NIVEL PARA RESOLVER DE MANERA SATISFACTORIA Y PRECISA EL RECONOCIMIENTO DE LA ACTIVIDAD HUMANA Y LA EXTRACCION DE ATRIBUTOS VISUALES EN ESCENARIOS EQUIPADOS CON MULTIPLES SENSORES, Y LA POSTERIOR REALIMENTACION DE LA INFORMACION RECONOCIDA A LOS SISTEMAS DE BAJO NIVEL PARA MEJORAR LAS PRESTACIONES DE ESTOS ULTIMOS, SE PLANTEAN TRABAJOS ORIENTADOS A REALIZAR APORTACIONES NOVEDOSAS EN EL NIVEL DE PERCEPCION (MODELADO DE SENSORES); EN EL DE IDENTIFICACION Y LOCALIZACION DE OBJETIVOS EN LA ESCENA (EXTRACCION DE INFORMACION MULTIMODAL); Y EN EL DE EXTRACCION DE ATRIBUTOS VISUALES Y SEMANTICA DE LA ACTIVIDAD HUMANA, CON EL OBJETIVO DE CONSEGUIR AVANCES EN CUATRO LINEAS PRINCIPALES: MODELADO DE SENSORES DE AUDIO, VIDEO Y PROFUNDIDAD (PROPONIENDO ESTRATEGIAS NOVEDOSAS DE DISEÑO OPTIMO DE AGRUPACIONES DE MICROFONOS, ELABORANDO MECANISMOS PRECISOS DE CORRECCION DE LA INFORMACION CAPTURADA POR CAMARAS DE TIEMPO DE VUELO Y DISEÑANDO SISTEMAS DE CALIBRACION CONJUNTA), ALGORITMOS DE ESTIMACION DE POSE Y EXTRACCION DE ATRIBUTOS FISICOS (PRESENCIA Y CARACTERIZACION DE USUARIOS Y OTROS ELEMENTOS/EVENTOS DE INTERES, ACUSTICOS O VISUALES), ALGORITMOS DE EXTRACCION DE ATRIBUTOS SEMANTICOS RELACIONADOS CON LA APARIENCIA O CON EL COMPORTAMIENTO HUMANO A PARTIR DE SENSORES DE AUDIO, VIDEO Y PROFUNDIDAD (CON ESPECIAL ENFASIS EN EL ANALISIS DEL COMPORTAMIENTO HUMANO, LA INTERACCION Y LA DETECCION DE ANOMALIAS), SON TAMBIEN OBJETIVOS CLAVES LA CONSTRUCCION DE DEMOSTRADORES REALISTAS DE LAS PROPUESTAS ALGORITMICAS DESARROLLADAS Y LA GENERACION DE BASES DE DATOS PARA LA TAREA PROPUESTA, ANÁLISIS MULTIMODAL DEL CUERPO\ ESTIMACIÓN DE ATRIBUTOS DEL CUERPO\ ESTIMACIÓN Y SEGUIMIENTO DE POSE\ RECONOCIMIENTO DE ACTIVIDAD\ DETECCIÓN DE ANOMALÍAS\ INTELIGENCIA AMBIENTAL\ FUSIÓN SENSORIAL