Ciencias de la computación y tecnología informática
SIENDO EL LENGUAJE NATURAL EL SISTEMA MAS EFICIENTE PARA INTERCAMBIAR INFORMACION, EL PROCESAMIENTO DEL LENGUAJE NATURAL (PLN) ES UNA DE LAS MAS IMPORTANTES TECNOLOGIAS BASADAS EN INTELIGENCIA ARTIFICIAL (IA) DE LA TRANSFORMACION...
ver más
Financiación
concedida
El organismo AGENCIA ESTATAL DE INVESTIGACIÓN notifico la concesión del proyecto
el día 2023-01-01
No tenemos la información de la convocatoria
0%
100%
Información adicional privada
No hay información privada compartida para este proyecto. Habla con el coordinador.
¿Tienes un proyecto y buscas un partner? Gracias a nuestro motor inteligente podemos recomendarte los mejores socios y ponerte en contacto con ellos. Te lo explicamos en este video
Proyectos interesantes
TIN2016-81739-REDT
RED DE DINAMIZACION DE ACTIVIDADES EN TECNOLOGIAS DE PROCESA...
10K€
Cerrado
NG-NLG
Next-Generation Natural Language Generation
1M€
Cerrado
PID2021-126061OB-C42
DESCUBRIENDO EL SIGNIFICADO Y LA INTENCION MAS ALLA DE LA PA...
117K€
Cerrado
BroadSem
Induction of Broad Coverage Semantic Parsers
1M€
Cerrado
EUPHRASER
An AI powered Paraphraser based in Europe: disrupting lingui...
75K€
Cerrado
Descripción del proyecto
SIENDO EL LENGUAJE NATURAL EL SISTEMA MAS EFICIENTE PARA INTERCAMBIAR INFORMACION, EL PROCESAMIENTO DEL LENGUAJE NATURAL (PLN) ES UNA DE LAS MAS IMPORTANTES TECNOLOGIAS BASADAS EN INTELIGENCIA ARTIFICIAL (IA) DE LA TRANSFORMACION DIGITAL ACTUAL. COMPRENDER EL LENGUAJE ES FUNDAMENTAL PARA EL RENDIMIENTO DE APLICACIONES DE ANALISIS DE TEXTO Y ACCESO A LA INFORMACION QUE DEPENDEN DE LA CALIDAD DE LAS HERRAMIENTAS DE PROCESAMIENTO DE TEXTO SUBYACENTES.LOS GRANDES MODELOS DE LENGUAJE (LLMS) BASADOS IA HAN DEMOSTRADO SU INMENSO POTENCIAL REPETIDAMENTE DESDE SU INTRODUCCION HACE CINCO AÑOS. MAS RECIENTEMENTE, CHATGPT, LANZADO POR LA EMPRESA OPENAI A FINES DE 2022, HA DEMOSTRADO LA EXTREMA CAPACIDAD DISRUPTIVA DE ESTA TECNOLOGIA DE IA HA CAMBIADO EL PARADIGMA DE LA INVESTIGACION EN PLN. ESTOS MODELOS HAN SIDO SEGUIDOS POR MUCHOS OTROS, INCLUIDOS PALM DE GOOGLE O ERNIE DE BAIDU.GRACIAS A ESTOS AVANCES, EL CAMPO DE INVESTIGACION DEL PLN ESTA INMERSO EN UN CAMBIO DE PARADIGMA CENTRADO EN LA PRODUCCION Y EXPLOTACION DE ESTOS GRANDES MODELOS DE LENGUAJE. DE HECHO, LOS RESULTADOS ESTAN MEJORANDO TANTO QUE LOS SISTEMAS AFIRMAN OBTENER UN RENDIMIENTO A NIVEL HUMANO EN BENCHMARKS DE INVESTIGACION. COMO RESULTADO, MUCHOS EN LA INDUSTRIA LOS HAN COMENZADO A INTEGRAR EN PRODUCCION.A PESAR DE SUS IMPRESIONANTES RESULTADOS, ESTOS LLMS SE HAN DESARROLLADO PRINCIPALMENTE PARA INGLES, NO SON PUBLICOS Y HAN SIDO EVALUADOS CASI EXCLUSIVAMENTE BENCHMARKS DE EVALUACION UNICAMENTE PARA EL INGLES. ESTAS BENCHMARKS SON FUNDAMENTALES PARA COMPRENDER LAS LIMITACIONES Y POSIBILIDADES DEL USO DE ESTOS LLMS PARA MEJORAR EL ESTADO DEL ARTE EN EL PLN. POR LO TANTO, PARA LA GRAN MAYORIA DE IDIOMAS Y DOMINIOS, EL RENDIMIENTO DE LOS LLMS SIGUE SIENDO UNA INCOGNITA. ESTO SE DEBE AL HECHO DE QUE NO HAN SIDO ENTRENADOS PREVIAMENTE PARA IDIOMAS COMO EL EUSKERA O EL ESPAÑOL O DEBIDO A LA FALTA DE BENCHMARKS PUBLICAMENTE DISPONIBLES QUE PERMITAN EVALUAR LAS CAPACIDADES LOS MODELOS PARA LA COMPRENSION Y GENERACION DE LENGUAJE NATURAL PARA ESOS IDIOMAS.ESTE PROYECTO TIENE COMO OBJETIVO INVESTIGAR Y DESARROLLAR TECNICAS PARA GENERAR Y ADAPTAR LLMS MONOLINGUES Y MULTILINGUES A NUEVOS IDIOMAS, GENEROS DE TEXTO Y DOMINIOS. EN CONCRETO, ESTE PROYECTO SE CENTRARA EN LA ADAPTACION Y GENERACION DE MODELOS ESPECIALMENTE ADAPTADOS AL EUSKERA Y AL CASTELLANO (ADEMAS DEL INGLES), TANTO PARA TAREAS DE CLASIFICACION COMO DE GENERACION. TAMBIEN TRABAJAREMOS PARA LLENAR EL VACIO ACTUAL CON RESPECTO A LAS BENCHMARKS DE EVALUACION PARA TAREAS ESPECIFICAS EN DOMINIOS COMO LA SALUD O GENEROS COMO LAS REDES SOCIALES, PARA LOS CUALES HAY POCOS O NINGUN DATO ANOTADO MANUALMENTE PARA ESAS TAREAS E IDIOMAS.LAS CAPACIDADES DE LOS NUEVOS LLMS GENERADOS SE REALIZARA SOBRE NUEVAS BENCHMARKS PARA TAREAS DE COMPRENSION Y GENERACION DE LENGUAJE NATURAL PARA EUSKERA, ESPAÑOL E INGLES, CENTRANDONOS EN LA VERACIDAD Y FIABILIDAD DEL OUTPUT GENERADS POR LOS LLMS. ESTAS TAREAS INCLUIRAN GENERACION DE PREGUNTA-RESPUESTA, DE ARGUMENTOS EXPLICATIVOS Y TAREAS INFERENCIALES PARA LAS QUE SOLO EXISTEN DATOS ANOTADOS PARA EL INGLES. COMO RESULTADO FINAL ESPERAMOS MEJORAR SIGNIFICATIVAMENTE EL ESTADO DEL ARTE DE GRANDES MODELOS DE LENGUAJE BASADOS EN IA EN ESCENARIOS DE BAJOS RECURSOS PARA IDIOMAS COMO EL EUSKERA Y EL ESPAÑOL, CONTRIBUYENDO ASI AL AVANCE DE LA TECNOLOGIA DEL LENGUAJE Y SU PUESTA EN PRODUCCION PARA LA TRANSFORMACION DIGITAL ACTUAL. INTELIGENCIA ARTIFICIAL\MULTILINGUALISMO\RECURSOS LIMITADOS\FEW-SHOW LEARNING\GENERACION DE TEXTOS\MODELOS DE LENGUAJE\APRENDIZAJE POR TRANSFERENCIA\APRENDIZAJE PROFUNDO\PROCESAMIENTO DEL LENGUAJE NATURAL