Descripción del proyecto
EL DESARROLLO DEL COMERCIO ELECTRONICO HA HECHO FLORECER LA PRESENCIA DE OPINIONES ONLINE, CON UN IMPACTO IMPORTANTE EN LAS DECISIONES DE COMPRA DE LOS POTENCIALES CONSUMIDORES, NO OBSTANTE, LA PRESENCIA DE OPINIONES FALSAS PUEDE ALTERAR LAS PERCEPCIONES DE LOS CONSUMIDORES Y MANIPULAR SUS JUICIOS Y DECISIONES DE COMPRA, LAS OPINIONES FALSAS SE REFIEREN A TODAS LAS OPINIONES ENGAÑOSAS COMPARTIDAS EN UN ENTORNO DIGITAL QUE NO REFLEJAN LA OPINION GENUINA DE SU AUTOR, EN LA ACTUALIDAD, SIGUEN CRECIENDO RAPIDAMENTE CON UNA PRESENCIA AMPLIA EN MUCHOS AMBITOS DEL COMERCIO ELECTRONICO, COMO CONSECUENCIA, LA IDENTIFICACION DE OPINIONES FRAUDULENTAS SE HA CONVERTIDO EN UN CAMPO DE INVESTIGACION EMERGENTE,LA PROPUESTA SE CENTRA EN UNA APROXIMACION CENTRADA EN LA OPINION, ES DECIR, TRATA DE DISCRIMINAR EL CARACTER GENUINO O FALSO DE LA OPINION A PARTIR DE SU CONTENIDO, NUMEROSOS ESTUDIOS HAN PROPUESTO DIVERSOS CLASIFICADORES BASADOS EN TECNICAS DE MACHINE Y DEEP LEARNING, RECIENTEMENTE, LA UTILIZACION DE REDES NEURONALES PROFUNDAS (DEEP LEARNING) HA REVOLUCIONADO EL PROCESAMIENTO DEL LENGUAJE NATURAL MEDIANTE LA REPRESENTACION DE LOS TEXTOS CON TECNICAS DE WORD EMBEDDING Y LA UTILIZACION DE CLASIFICADORES BASADOS EN REDES NEURONALES CONVOLUCIONALES Y RECURRENTES, SU PRINCIPAL VENTAJA ES CONSIDERAR LA SECUENCIALIDAD DE LOS TEXTOS Y SUS DEPENDENCIAS TEMPORALES, NO OBSTANTE, LOS CLASIFICADORES DE TEXTOS PROPUESTOS AFRONTAN DOS PROBLEMAS IMPORTANTES: AUNQUE EXISTEN VARIOS DATASETS PUBLICOS DE OPINIONES FALSAS DISPONIBLES, NO SON DEMASIADOS Y SE CENTRAN EN DETERMINADOS AMBITOS (HOTELES, RESTAURANTES, ETC,) LOS ALGORITMOS PROPUESTOS SON, EN GENERAL, POCO ROBUSTOS FRENTE A LA GENERACION DE EJEMPLOS ADVERSARIOS, ES DECIR, EJEMPLOS DISEÑADOS ESPECIFICAMENTE PARA ENGAÑAR A LOS CLASIFICADORES (POR EJEMPLO, MEDIANTE EL USO DE BOTS),ESTOS PROBLEMAS LIMITAN LA RESPUESTA A ALGUNAS PREGUNTAS DE INVESTIGACION E HIPOTESIS PLANTEADAS EN TRABAJOS PREVIOS ¿COMO AFECTAN LOS EJEMPLOS ADVERSARIOS A LOS DIFERENTES METODOS PROPUESTOS? ¿COMO SE DISTRIBUYEN LAS REVISIONES FALSAS EN DIFERENTES CATEGORIAS DE PRODUCTOS? LA MAYORIA DE DATASETS DISPONIBLES SE CENTRAN EN PRODUCTOS DE EXPERIENCIA, VARIOS AUTORES SEÑALAN COMO UN PATRON CARACTERISTICO DE LAS REVISIONES FALSAS UNA EXAGERACION DE LOS SENTIMIENTOS POSITIVOS O NEGATIVOS QUE DAN LUGAR A OPINIONES EXTREMAS (MUY POSITIVAS O MUY NEGATIVAS), ¿SIGUE SIENDO CIERTA ESTA AFIRMACION CUANDO LAS OPINIONES SON GENERADAS POR ALGORITMOS DE INTELIGENCIA ARTIFICIAL? ESTA PROPUESTA DA RESPUESTA A ESTAS CUESTIONES MEDIANTE EL USO DE LAS DENOMINADAS REDES GENERATIVAS ANTAGONICAS, BASICAMENTE, SE TRATA DE DOS REDES NEURONALES ENFRENTADAS: UNA RED GENERADORA, EN ESTE CASO DE OPINIONES FALSAS (A MODO DE BOT AUTOMATICO), Y UNA RED DISCRIMINADORA, EN ESTE CASO UN CLASIFICADOR DE OPINIONES GENUINAS Y FALSAS, CON ELLO, LA RED GENERADORA RESUELVE EL PROBLEMA DE LOS DATASETS LIMITADOS, YA QUE PUEDEN GENERAR OPINIONES FALSAS EN UNA GRAN VARIEDAD DE AMBITOS, Y HACE MAS ROBUSTA AL CLASIFICADOR DE LA RED DISCRIMINADORA FRENTE A EJEMPLOS ADVERSARIOS, YA QUE AMBAS REDES COMPITEN EN UN JUEGO DE SUMA CERO,LA SOLUCION PROPUESTA ES DE INTERES PARA USUARIOS FINALES Y GESTORES DE PORTALES DE OPINION Y PLATAFORMAS DE COMERCIO ELECTRONICO, INTERESADAS EN NUEVAS HERRAMIENTAS PARA FILTRAR LOS COMPORTAMIENTOS FRAUDULENTOS Y CAPACES DE HACER FRENTE A UNA NUEVA GENERACION DE BOTS AUTOMATICOS, OPINIONES FALSAS\REDES GENERATIVAS ANTAGONICAS\EJEMPLOS ADVERSARIOS\MANIPULACION DE CLIENTES\SOCIAL MEDIA