Innovating Works

TIN2008-04998

Financiado
TRATAMIENTO DEL TEXTO CONTENIDO EN IMAGENES DIGITALES MEDIANTE TECNICAS INSPIRAD...
TRATAMIENTO DEL TEXTO CONTENIDO EN IMAGENES DIGITALES MEDIANTE TECNICAS INSPIRADAS EN LA PERCEPCION HUMANA EN LA ULTIMA DECADA, LA COMUNICACION DE INFORMACION SE HA CONVERTIDO EN UNA PARTE IMPORTANTE DE LA VIDA COTIDIANA, APLICACIONES DE INTERNET COMO EL E-MAIL O LA WWW HAN PERMITIDO EL INTERCAMBIO MASIVO DE INFORMACION, INICIALMENTE,... EN LA ULTIMA DECADA, LA COMUNICACION DE INFORMACION SE HA CONVERTIDO EN UNA PARTE IMPORTANTE DE LA VIDA COTIDIANA, APLICACIONES DE INTERNET COMO EL E-MAIL O LA WWW HAN PERMITIDO EL INTERCAMBIO MASIVO DE INFORMACION, INICIALMENTE, LAS COMUNICACIONES ESTABAN BASADAS SOLO EN TEXTO, PERO CON CONEXIONES DE MAYOR CALIDAD, LAS IMAGENES SON UNA PARTE HABITUAL EN DOCUMENTOS ELECTRONICOS, DE GRAN IMPORTANCIA SON LAS IMAGENES DIGITALES QUE CONTIENEN INFORMACION TEXTUAL, YA SEA PUBLICIDAD, LOGOS, CABECERAS U OTRAS ENTIDADES DEL DOCUMENTO, AUNQUE EL TEXTO EN IMAGENES ES IMPORTANTE PARA LA COMPRENSION DE LOS DOCUMENTOS, LOS METODOS AUTOMATICOS DE INDEXACION, FILTRADO Y ANALISIS DE INFORMACION NO TIENEN FORMA ALGUNA DE EXTRAER DICHO TEXTO, LOS METODOS HABITUALES DE ANALISIS DE DOCUMENTOS (AD) SON INAPLICABLES A IMAGENES DIGITALES COMPLEJAS YA QUE ESTAN PENSADOS PARA DOCUMENTOS EN PAPEL, DE NATURALEZA COMPLETAMENTE DIFERENTE, DE HECHO, LA INDUSTRIA HA APROVECHADO ESTE ASPECTO PARA ADOPTAR LAS IMAGENES DIGITALES COMO PLATAFORMA DE IMPLEMENTACION DE CAPTCHA (TESTS AUTOMATICOS PARA DISTINGUIR HUMANOS DE COMPUTADORAS), CUYA META ES EVITAR EL ABUSO DE RECURSOS ELECTRONICOS POR PARTE DE AUTOMATAS, EN SU FORMA PREFERIDA, CONSISTEN EN UN TEXTO MANIPULADO INCRUSTADO EN UNA IMAGEN DIGITAL, LEERLO ES TRIVIAL PARA HUMANOS, PERO LAS COMPUTADORAS SON INCAPACES DE INTERPRETARLOS INCLUSO ANTE MANIPULACIONES SENCILLAS, PERO ESTA TENDENCIA TAMBIEN HA INSPIRADO A SPAMMERS, QUE AHORA ENVIAN SUS MENSAJES NO DESEADOS A TRAVES DE IMAGENES, POR ELLO, LOCALIZAR Y EXTRAER CONTENIDO TEXTUAL DE IMAGENES DIGITALES ES UN TEMA ATRACTIVO PARA UNA SERIE DE APLICACIONES COMERCIALES, PERO SE NECESITAN NUEVOS CONCEPTOS, DADA LA INAPLICABILIDAD DE LOS METODOS CLASICOS DE AD, Y ES QUE LAS IMAGENES DIGITALES CON TEXTO DIFIEREN DE OTRO TIPO DE IMAGENES EN QUE HAN SIDO PREPARADAS POR HUMANOS PARA SER VISUALIZADAS E INTERPRETADAS POR OTROS HUMANOS, CONSCIENTE O INCONSCIENTEMENTE, SU AUTOR EMPLEA CIERTOS PATRONES DE DISEÑO PARA RESALTAR EL TEXTO Y FACILITAR SU LECTURA, ES POR ELLO IMPORTANTE DIVISAR TECNICAS INSPIRADAS POR LA PERCEPCION HUMANA PARA LOCALIZAR Y RECONOCER TEXTO EN IMAGENES,A RAIZ DE ESTOS ASPECTOS, ESTA ACTIVIDAD INVESTIGADORA PROPONE AVANZAR EN LA EXTRACCION DE TEXTO DE IMAGENES DIGITALES EN COLOR TOMANDO INSPIRACION DEL CAMPO DE LA PERCEPCION HUMANA, SE INVESTIGARA LA APLICABILIDAD DE MODELOS COMPUTACIONALES PERCEPTUALES, DE PRINCIPIOS Y MECANISMOS INVOLUCRADOS EN LA LECTURA, MODELOS DE ATENCION, LEYES DE GESTALT Y COLOR PERCEPTUAL SON ALGUNOS DE LOS CONCEPTOS EN LOS QUE NOS CENTRAREMOS HACIA UN ENFOQUE QUE CUBRA TODOS LOS ASPECTOS DEL ANALISIS DE ESTE TIPO DE IMAGENES, INICIALMENTE, EL FOCO DE ATENCION SERAN TRES TIPOS DE IMAGENES ESPECIFICOS: IMAGENES WEB, ANUNCIOS DE SPAM Y CAPTCHAS, LAS DOS PRIMERAS TIENEN UN ALTO INTERES COMERCIAL, POR LA NECESIDAD PATENTE DE INDEXAR Y FILTRAR CONTENIDOS, LOS CAPTCHAS SON UN TIPO INTERESANTE DE IMAGENES, YA QUE SU EFECTIVIDAD PUEDE APORTARNOS CONOCIMIENTOS SOBRE LOS LIMITES DE LA VISION POR COMPUTADOR, EL GRUPO DE ANALISIS DE DOCUMENTOS (DAG) ES UN GRUPO LIDER EN EL CAMPO DE AD, Y LOS MIEMBROS DEL PROYECTO COMPARTEN EXPERIENCIA EN UNA DIVERSIDAD DE TEMAS, COMO SEGMENTACION DE COLOR, DETECCION DE TEXTO, PERCEPCION HUMANA, ETC, PARA ESTE PROYECTO, TAMBIEN SE COLABORARA CON COMPAÑEROS DEL GRUPO DE CIENCIAS COGNITIVAS Y NEUROCIENCIA (UNIVERSIDAD DE LIVERPOOL, REINO UNIDO), Análisis de documentos\percepción humana\imágenes digitales\análisis de documentos web\spam\CAPTCHAs\ciencia del color ver más
01/01/2008
50K€
Perfil tecnológico estimado

Línea de financiación: concedida

El organismo AGENCIA ESTATAL DE INVESTIGACIÓN notifico la concesión del proyecto el día 2008-01-01
Presupuesto El presupuesto total del proyecto asciende a 50K€
Líder del proyecto
CENTRO DE VISIÓN POR COMPUTADOR No se ha especificado una descripción o un objeto social para esta compañía.
Perfil tecnológico TRL 4-5 866K