Descripción del proyecto
EL RECONOCIMIENTO DE OBJETOS, EL ANALISIS DEL GESTO, ACCIONES Y DETECCION DE EVENTOS, EL RECONOCIMIENTO DE ESCENAS, SON TODOS PROBLEMAS QUE CONTINUAN ABIERTOS DENTRO DE LA VISION POR COMPUTADOR, A PESAR DE LOS NOTABLES AVANCES DE LOS ULTIMOS AÑOS, LOS ORDENADORES ESTAN AUN MUY LEJOS DE ENTENDER LA INFORMACION VISUAL DEL MISMO MODO EN QUE LO HACEN LOS HUMANOS, LA INVESTIGACION EN VISION POR COMPUTADOR ESTA EN CONTINUA EVOLUCION Y ALGUNAS METODOLOGIAS HAN SIDO USADAS DE FORMA TRANSVERSAL EN DIFERENTES PROBLEMAS, LOS PRINCIPALES TRABAJOS, SE PUEDEN DIVIDIR EN: LA REPRESENTACION DE LA IMAGEN (DE MENOR A MAYOR NIVEL DE ABSTRACCION) Y LA APLICACION DE ALGORITMOS DE MACHINE LEARNING AL RECONOCIMIENTO VISUAL, AL PRINCIPIO, LA MAYOR PARTE DE LOS ALGORITMOS USABAN PIXELS COMO REPRESENTACION BASE, O APLICABAN ALGUN TIPO DE REDUCCION DE DIMENSIONALIDAD A ESTOS CONJUNTOS DE PIXELS (TIPICAMENTE UN PCA), DESPUES DE UN CIERTO TIEMPO DONDE SE HIZO ESPECIAL INCAPIE EN DESARROLLAR MEJORES ALGORITMOS DE APRENDIZAJE (SVM, ENSEMBLES, ETC,), EL FOCO DE ATENCION VOLVIO A PONERSE ENCIMA DE LOS DESCRIPTORES, Y SE DESARROLLARON ALGORITMOS ROBUSTOS COMO SIFT O HOG QUE MEJORARON SIGNIFICATIVAMENTE LOS BENCHMARKS PUBLICOS, SIN EMBARGO, ALGO HA CAMBIADO EN LOS ULTIMOS DOS AÑOS, CON EL INCREMENTO DE LA CAPACIDAD COMPUTACIONAL (Y EL USO GENERALIZADO DE GPUS), LAS TECNOLOGIAS DE APRENDIZAJE DE PRINCIPIO A FIN (END-TO-END) Y EL GRAN VOLUMEN DE DATOS HA ATRAIDO LA ATENCION DE LOS INVESTIGADORES EN VISION POR COMPUTADOR, ACTUALMENTE, LAS DEEP CONVOLUTIONAL NEURAL NETWORKS ENTRENADAS CON GRANDES VOLUMENES DE DATOS COMO IMAGENET O PLACES, HAN MOSTRADO UNA MEJORA RADICAL EN MUCHAS TAREAS DE RECONOCIMIENTO VISUAL, EL EXITO DE ESTAS TECNICAS SE ATRIBUYE FUNDAMENTALMENTE AL HECHO DE APRENDER SIMULTANEAMENTE EL MODELO DE REPRESENTACION Y EL CLASIFICADOR, EL APRENDIZAJE DE PRINCIPIO A FIN MODELA EL PROBLEMA DES DE LOS PIXELS A LA SALIDA, Y LOS DESCRIPTORES DE LA IMAGEN SE AJUSTAN A MEDIDA QUE SE VA CREANDO LA REGLA DE CLASIFICACION, EN TIEMPO DE APRENDIZAJE, SIENDO MAS EFICIENTES QUE LAS CARACTERISTICAS DEFINIDAS A MANO,ESTE PROYECTO PROPONE EL DISEÑO DE NUEVOS ALGORITMOS DE APRENDIZAJE DE PRINCIPIO A FIN PARA MEJORAR ALGUNOS DE LOS PROBLEMAS ABIERTOS EN ESTE CAMPO, NOS CENTRAREMOS EN: EL USO DEL GRAN VOLUMEN DE DATOS NO ETIQUETADOS DISPONIBLE PARA MEJORAR EL RENDIMIENTO DE LOS ALGORITMOS DE APRENDIZAJE, EL DISEÑO DE ARQUITECTURAS DE APRENDIZAJE DE PRINCIPIO A FIN QUE MODELEN LA DINAMICA TEMPORAL Y SECUENCIAL EN LOS DATOS, Y EL USO DE REPRESENTACIONES SPARSE EN EL APRENDIZAJE DE LOS PARAMETROS PARA REDUCIR NOTABLEMENTE EL TIEMPO DE ENTRENAMIENTO DE LAS DEEP CNNS, NUESTRO GRUPO PLANTEA LA APLICACION DE ALGORITMOS DE APRENDIZAJE DE PRINCIPIO A FIN DESARROLLADOS PARA RESOLVER PROBLEMAS ESPECIFICOS FRUTO DE NUESTRAS COLABORACIONES CON INSTITUCIONES DE PRESTIGIO INTERNACIONAL, ESPECIFICAMENTE, APLICAREMOS LA TEORIA DESARROLLADA A: (I) PROBLEMAS DE RECONOCIMIENTO DEL GESTO APLICADOS AL CUIDADO DE PERSONAS MAYORES CON MICROSOFT HEALTH, (II) RECONOCIMIENTO DE LAS EMOCIONES EN COLABORACION CON LAS UNIVERSIDADES DE PRINCETON Y UTRECHT, (III) EL DESARROLLO DE APLICACIONES ROBUSTAS DE RECONOCIMIENTO DE OBJETOS Y ESCENAS EN COLABORACION CON EL MIT (MASSACHUSETTS INSTITUTE OF TECHNOLOGY), (IV) EL DESARROLLO DE ALGORITMOS APLICADOS A LA MONITORIZACION DEL COMPORTAMIENTO ANIMAL EN COLABORACION CON EL INSTITUTO DE CIENCIAS DEL MAR (CSIC) Y EL PRINCETON NEUROSCIENCE INSTITUTE, VISION POR COMPUTADOR\APRENDIZAJE AUTOMÀTICO\APRENDIZAJE PROFUNDO\EXPRESSION FACIAL\RECONOCIMIENTO DEL GESTO\INTERPRETACIÓN DE ESCENAS