FAIRTRANSNLP-LANGUAGE: ANALYSING TOXICITY AND STEREOTYPES IN LANGUAGE FOR UNBIAS...
FAIRTRANSNLP-LANGUAGE: ANALYSING TOXICITY AND STEREOTYPES IN LANGUAGE FOR UNBIASED, FAIR AND TRANSPARENT SYSTEMS
EL OBJETIVO DE FAIRTRANSNLP ES DESARROLLAR HERRAMIENTAS Y TECNICAS PARA ABORDAR DOS CUESTIONES CRITICAS EN EL DISEÑO Y USO DE APLICACIONES DE PROCESAMIENTO DEL LENGUAJE NATURAL (PLN): LA EQUIDAD Y LA TRANSPARENCIA. LAS APLICACIONE...
ver más
Financiación
concedida
El organismo AGENCIA ESTATAL DE INVESTIGACIÓN notifico la concesión del proyecto
el día 2021-01-01
No tenemos la información de la convocatoria
0%
100%
Información adicional privada
No hay información privada compartida para este proyecto. Habla con el coordinador.
¿Tienes un proyecto y buscas un partner? Gracias a nuestro motor inteligente podemos recomendarte los mejores socios y ponerte en contacto con ellos. Te lo explicamos en este video
Proyectos interesantes
FairER
Fairness in Language Models: Equally right for the right rea...
215K€
Cerrado
PID2021-124361OB-C31
FAIRTRANSNLP-STEREOTYPES: IDENTIFICACION DE ESTEREOTIPOS Y P...
117K€
Cerrado
PID2021-127641OB-I00
BIOMETRIA Y COMPORTAMIENTO PARA UNA IA IMPARCIAL Y CONFIABLE...
274K€
Cerrado
PID2019-105093GB-I00
EXPLICACIONES AUTOMATICAS TRANS-DOMINIO EN VISION POR COMPUT...
163K€
Cerrado
BES-2013-063851
INVESTIGACION AVANZADA EN TECNOLOGIAS DEL HABLA PARA LA INCL...
84K€
Cerrado
DIALECT
Natural Language Understanding for non-standard languages an...
2M€
Cerrado
Descripción del proyecto
EL OBJETIVO DE FAIRTRANSNLP ES DESARROLLAR HERRAMIENTAS Y TECNICAS PARA ABORDAR DOS CUESTIONES CRITICAS EN EL DISEÑO Y USO DE APLICACIONES DE PROCESAMIENTO DEL LENGUAJE NATURAL (PLN): LA EQUIDAD Y LA TRANSPARENCIA. LAS APLICACIONES DE INTELIGENCIA ARTIFICIAL (IA) A MENUDO PERPETUAN Y ACENTUAN INADVERTIDAMENTE SESGOS INJUSTOS QUE PUEDEN TENER SU ORIGEN EN MULTIPLES FUENTES, COMO LOS CORPUS DE ENTRENAMIENTO, EL PROCESO DE ETIQUETADO Y LA OBTENCION DE DATOS. LOS RESULTADOS SESGADOS PUEDEN BENEFICIAR A LA VISION MAYORITARIA (LA DEL HOMBRE BLANCO Y OCCIDENTAL), AFECTANDO NEGATIVAMENTE A CIERTOS GRUPOS DEMOGRAFICOS O MINORIZADOS DE USUARIOS (COMO LAS MUJERES) LLEVANDOLOS A LA DISCRIMINACION. UN SISTEMA DE IA DEBE OFRECER EXPLICACIONES TRANSPARENTES Y COMPRENSIBLES DE SUS DECISIONES. ESTE ES UN FACTOR CRUCIAL EN LAS APLICACIONES DE LA VIDA REAL, TANTO PARA QUE LOS DESARROLLADORES COMPRENDAN MEJOR EL COMPORTAMIENTO DE LOS SISTEMAS COMO PARA QUE LOS USUARIOS CONFIEN EN ELLOS. PARA ELLO, DESARROLLAREMOS ENFOQUES EQUITATIVOS DE MACHINE LEARNING (ML)/DEEP LEARNING (DL), QUE REFLEJEN MULTIPLES PERSPECTIVAS PARA NO MARGINAR LAS OPINIONES MINORITARIAS O MINORIZADAS, Y OPEREN SOBRE DATOS QUE TENGAN ETIQUETAS CONFLICTIVAS. MIENTRAS QUE LOS ENFOQUES PREDOMINANTES TRATAN EL DESACUERDO COMO RUIDO PARA OBTENER UNA UNICA OPINION MAYORITARIA (GROUND TRUTH), NUESTROS MODELOS EMPLEARAN EL PARADIGMA DE APRENDIZAJE CON DESACUERDO QUE SE PROPUSO EN LA TAREA SEMEVAL-2021 CON EL MISMO NOMBRE. EL OBJETIVO ES APRENDER A CLASIFICAR CON CORPUS QUE CONTENGAN INFORMACION SOBRE DESACUERDOS. ESTO CONTRIBUIRA A UN CAMBIO DE PARADIGMA QUE, EN ULTIMA INSTANCIA, DARA LUGAR A ALGORITMOS MAS EQUITATIVOS E INCLUSIVOS CON RESPECTO A MULTIPLES PERSPECTIVAS, EN LUGAR DE REPRESENTAR UNICAMENTE LA OPINION MAYORITARIA. LAS TECNICAS DE ML/DL SE CENTRARAN EN VARIAS APLICACIONES, P. EJ. LA DETECCION DEL LENGUAJE TOXICO, LA MISOGINIA Y EL SEXISMO. LA METODOLOGIA PROPUESTA PARA TAREAS DEL PLN EQUITATIVAS Y TRANSPARENTES GARANTIZARA SU APLICABILIDAD Y TRANSFERIBILIDAD A LAS TAREAS DE OTROS DOMINIOS, P. EJ. LOS SISTEMAS DE RECOMENDACION. SE HARA ESPECIAL HINCAPIE EN EL TRATAMIENTO DE LOS DATOS DE LAS REDES SOCIALES. LA CONTRIBUCION ESENCIAL Y TRANSVERSAL DE ESTE SUBPROYECTO, FAIRTRANSNLP-LANGUAGE, AL PROYECTO COORDINADO ES TRIPLE: (1) MODELAR EL LENGUAJE DE LA TOXICIDAD Y LOS ESTEREOTIPOS PARA MITIGAR LOS EFECTOS INDESEABLES DE LOS DATOS SESGADOS MEDIANTE EL ESTUDIO Y LA CARACTERIZACION DE LOS SESGOS PROCEDENTES DE LOS MEDIOS SOCIALES. (2) CREAR CORPUS NO SESGADOS Y EQUITATIVOS DE ALTA CALIDAD SIGUIENDO EL NUEVO PARADIGMA DEL APRENDIZAJE CON DESACUERDO: (I) EVITANDO EL SESGO EN EL RASTREO (CRAWLING) Y EL MUESTREO DE DATOS, Y (II) PROPONIENDO TECNICAS DE ETIQUETADO PARA INCLUIR EL DESACUERDO DEL ANOTADOR COMO GOLD STANDARD EN LUGAR DE INCLUIR LA VISION MAYORITARIA, COMO SE HACE TRADICIONALMENTE. ESTOS CORPUS SE UTILIZARAN EN CAMPAÑAS DE EVALUACION PARA EL ENTRENAMIENTO Y LA EVALUACION DE MODELOS, Y PARA FOMENTAR LAS TAREAS COMPETITIVAS DENTRO DE LA COMUNIDAD CIENTIFICA QUE TRABAJA EN ESTE CAMPO. (3) EVALUAR EL SESGO Y LA EQUIDAD EN LOS SISTEMAS DE IA Y EL DESARROLLO DE SISTEMAS DE RECOMENDACION EQUITATIVOS Y NO SESGADOS, QUE PROPORCIONEN EXPLICACIONES EFECTIVAS EN LENGUAJE NATURAL Y MITIGUEN SIMULTANEAMENTE LOS PROBLEMAS DE SESGO. ESTA TERCERA CONTRIBUCION ESTA ESTRECHAMENTE RELACIONADA CON EL TRABAJO REALIZADO EN LOS OTROS DOS SUBPROYECTOS. OXICIDAD\APRENDIZAJE CON DESACUERDOS\SISTEMAS JUSTOS\CORPUS SIN SESGO\ESTEREOTIPOS