MODEL-DRIVEN ENGINEERING FOR DATA SCIENCE PROJECTS
EL INCREMENTO DE LOS DATOS GENERADOS EN NUESTRAS VIDAS HA IMPULSADO LA DEMOCRATIZACION DE LAS PLATAFORMAS DE BIG DATA USADAS PARA EL ANALISIS DE DICHOS DATOS Y LA EXTRACCION DE CONOCIMIENTO A PARTIR DE ELLOS. A PESAR DE LA MADUREZ...
ver más
Fecha límite participación
Sin fecha límite de participación.
Financiación
concedida
El organismo AGENCIA ESTATAL DE INVESTIGACIÓN notifico la concesión del proyecto
el día 2021-01-01
No tenemos la información de la convocatoria
0%
100%
Características del participante
Este proyecto no cuenta con búsquedas de partenariado abiertas en este momento.
Información adicional privada
No hay información privada compartida para este proyecto. Habla con el coordinador.
¿Tienes un proyecto y buscas un partner? Gracias a nuestro motor inteligente podemos recomendarte los mejores socios y ponerte en contacto con ellos. Te lo explicamos en este video
Fecha límite de participación
Sin fecha límite de participación.
Descripción del proyecto
EL INCREMENTO DE LOS DATOS GENERADOS EN NUESTRAS VIDAS HA IMPULSADO LA DEMOCRATIZACION DE LAS PLATAFORMAS DE BIG DATA USADAS PARA EL ANALISIS DE DICHOS DATOS Y LA EXTRACCION DE CONOCIMIENTO A PARTIR DE ELLOS. A PESAR DE LA MADUREZ QUE HAN ALCANZADO ESTAS HERRAMIENTAS, EXISTEN AUN RETOS IDENTIFICADOS POR LA COMUNIDAD QUE DEBEN SER ABORDADOS EN ESTE CAMPO. UNO DE ELLOS SE CONOCE COMO LA CRISIS DE LA REPRODUCIBILIDAD Y REFERIDO A LA DIFICULTAD DE REPRODUCIR Y REPLICAR LOS EXPERIMENTOS DESARROLLADOS EN LOS PROYECTOS DE CIENCIA DE DATOS.AUNQUE EXISTEN DIVERSAS RAZONES QUE EXPLICAN EL PROBLEMA DE LA REPRODUCIBILIDAD Y LA REPLICABILIDAD (R&R), LA COMPLEJIDAD DE LA INFRAESTRUCTURA QUE DA SOPORTE A ESTOS PROYECTOS SE CONSIDERA UN FACTOR DETERMINANTE. EN ESTE SENTIDO, LA DEFINICION DE PROCESOS DE CIENCIA DE DATOS ABSTRAYENDO AL CIENTIFICO DE DATOS DE PLATAFORMAS CONCRETAS REDUCIRIA ESTE PROBLEMA, FACILITANDO A LOS DIFERENTES ROLES INVOLUCRADOS (E.G. CIENTIFICO E INGENIERO DE DATOS) HERRAMIENTAS QUE LES PERMITAN PONER EL FOCO SOLO EN SU RESPONSABILIDAD (COMO SUGIERE MLOPS).OTRAS RAZONES QUE DIFICULTAN LA R&R SON LA PROPIA COMPLEJIDAD DE LOS PROCESOS DE CIENCIAS DE DATOS Y LA FALTA DE ESTANDARES PARA SU DEFINICION (AL TRATARSE DE UN CAMPO DE INVESTIGACION RELATIVAMENTE JOVEN). ESTO HACE QUE LOS CIENTIFICOS Y LOS INGENIEROS DE DATOS TENGAN QUE DEFINIR ESTOS PROCESOS A MENUDO DE MANERA MANUAL, HACIENDO USO DE UN AMPLIO CONJUNTO DE TECNOLOGIAS Y DANDO LUGAR A PROCESOS PROPENSOS A ERRORES Y DIFICILES DE TRAZAR. ESTOS PROBLEMAS ESTAN RELACIONADOS CON OTROS RETOS ABIERTOS QUE LA COMUNIDAD HA IDENTIFICADO, COMO SON LA INTENCIONALIDAD (Y SU VERIFICACION), INCLUYENDO EL SESGO POR CUESTIONES COMO SEXO O LA RAZA, O LA TRAZABILIDAD DE LOS DATOS. LA DEFINICION SISTEMATICA DE ESTOS PROCESOS, SU EJECUCION AUTOMATICA EN LA INFRAESTRUCTURA QUE LOS SOPORTAN, ASI COMO LA POSIBILIDAD DE VERIFICAR LA CALIDAD DE LOS MISMOS PERMITIRIAN HACER FRENTE A ESTOS RETOS. ESTE PROYECTO PROPONE EL USO DE MODELADO DIRIGIDO POR MODELOS PARA EL DISEÑO DE PROCESOS DE CIENCIA DE DATOS PERMITIENDO SEPARAR SU DEFINICION EN 2 NIVELES DE ABSTRACCION DIFERENTES: LOGICO Y OPERACIONAL. EL PRIMERO FACILITARA A LOS CIENTIFICOS DE DATOS UN LENGUAJE CON EL QUE DEFINIR PROCESOS INDEPENDIENTES DE LA PLATAFORMA. EL SEGUNDO PERMITIRA A LOS INGENIEROS DE DATOS DEFINIR ENTORNOS DE EJECUCION CONCRETOS EN LOS QUE DESPLEGAR ESOS PROCESOS. MEDIANTE ESTA SEPARACION, EL CODIGO PARA EJECUTAR EL PROCESO PODRA SER GENERADO Y EJECUTADO EN UNA PLATAFORMA CONCRETA MEJORANDO LA R&R, YA QUE EL PROCESO PODRA SER DESPLEGADO UNA Y OTRA VEZ DE MANERA SISTEMATICA.ADEMAS, MEDIANTE ESTA DESCRIPCION DE ALTO NIVEL, EL CIENTIFICO DE DATOS PODRIA, ENTRE OTROS: (I) UTILIZAR TECNICAS DE VERIFICACION DE MODELOS PARA DETECTAR ERRORES O PROBLEMAS DE INTENCIONALIDAD; (II) TENER MECANISMOS PARA TRAZAR LOS DATOS; (III) COMPARAR PROCESOS COMPLEJOS DE MANERA SENCILLA; (IV) REUTILIZAR, TOTAL O PARCIALMENTE, ESTOS PROCESOS; (V) MEJORAR LA COLABORACION EN LA DEFINICION DE LOS PROCESOS. EL PROYECTO ESTA CLARAMENTE ENMARCADO DENTRO DE LA 4ª ACCION ESTRATEGICA (MUNDO DIGITAL, INDUSTRIA, ESPACIO Y DEFENSA) DEL PLAN ESTATAL DE INVESTIGACION CIENTIFICA, TECNICA Y DE INNOVACION 2021-2023. ESTA ACCION ESTA DIVIDIDA EN 4 EJES PRIORITARIOS, SIENDO EL PRIMERO TRANSFORMACION DIGITAL E INTELIGENCIA ARTIFICIAL, DIRECTAMENTE RELACIONADO CON LAS CONTRIBUCIONES DE ESTE PROYECTO. ODEL-DRIVEN DATA SCIENCE REPRODUCIBILIT