Descripción del proyecto
LA CIENCIA DE LOS DATOS ES LA DISCIPLINA QUE ESTUDIA DE DONDE PROVIENE LA INFORMACION, QUE REPRESENTA, COMO SE PREPARA, ANALIZA Y VISUALIZA Y COMO PUEDE CONVERTIRSE EN UN RECURSO VALIOSO EN LA CREACION DE ESTRATEGIA DE NEGOCIO, EL CAMPO DE LA CIENCIA DE DATOS ES UNA EVOLUCION INTERDISCIPLINAR DE LA MINERIA DE DATOS Y COMPRENDE LAS AREAS DE MATEMATICAS, ESTADISTICA, COMPUTACION, MACHINE LEARNING Y VISUALIZACION, ENTRE OTRAS,BIG DATA ES UN TERMINO GENERAL USADO PARA LAS ESTRATEGIAS Y TECNOLOGIAS NO TRADICIONALES NECESARIAS PARA REUNIR, ORGANIZAR, PROCESAR Y RECOGER INFORMACION DE GRANDES CONJUNTOS DE DATOS, QUE, POR SUS CARACTERISTICAS DE VOLUMEN, DIVERSIDAD Y COMPLEJIDAD, NO PUEDEN TRATARSE CON MEDIOS CONVENCIONALES, LA OMNIPRESENCIA, ESCALA Y VALOR DE SOLUCIONES BIG DATA SE HA AMPLIADO ENORMEMENTE EN LOS ULTIMOS AÑOS, EL SMART DATA APARECE A RAIZ DEL BIG DATA AL INCORPORAR LA PREOCUPACION POR EL PREPROCESAMIENTO DE LOS DATOS Y LA CALIDAD DE SU ANALISIS, EL CONCEPTO DE SMART DATA HACE REFERENCIA A LA TRANSFORMACION DE BIG DATA EN VALOR A PARTIR DE INFORMACION RELEVANTE, UTIL Y REVELADORA,LOS ALGORITMOS DE MACHINE LEARNING (ML) Y DEEP LEARNING (DL) SON LAS HERRAMIENTAS QUE NOS PERMITEN OBTENER MODELOS PREDICTIVOS O DESCRIPTIVOS A PARTIR DE LOS DATOS, AMBAS DISCIPLINAS HAN REVOLUCIONADO LA INTELIGENCIA ARTIFICIAL EN MUCHAS APLICACIONES REALES, PERO AUN ESTAMOS SUJETOS A LIMITACIONES IMPORTANTES, ENTRE ELLAS, CABE MENCIONAR LA FALTA DE TRANSPARENCIA Y ENTENDIMIENTO DE LOS MODELOS GENERADOS, POCA FIABILIDAD O APARICION DE SESGOS NO DESEABLES EN LAS SOLUCIONES GENERADAS PARA SER IMPLANTADAS EN EL MUNDO REAL Y ALTOS IMPACTOS ENERGETICOS EN SU UTILIZACION, DEBIDO A ESTO, RECIENTEMENTE HA SURGIDO EL AREA DE LA INTELIGENCIA ARTIFICIAL RESPONSABLE Y CONFIABILIDAD DE SOLUCIONES,ESTE PROYECTO SE ORIENTA EN EL DESARROLLO DE TECNICAS DE CIENCIA DE DATOS BAJO UN MARCO DE RESPONSABILIDAD Y CONFIABILIDAD, CON EL OBJETIVO DE OBTENER SMART DATA A PARTIR DE DATOS COMPLEJOS PROVENIENTES DE APLICACIONES REALES Y DISEÑANDO TECNICAS AVANZADAS DE ML, INCLUYENDO PARADIGMAS DE DL QUE CUMPLAN CON LOS PRINCIPIOS DE LA INTELIGENCIA ARTIFICIAL RESPONSABLE, ADEMAS, SE CONTEMPLA LA INTEGRACION DE ESTAS SOLUCIONES EN APLICACIONES EN CAMPOS DE LA VIDA REAL, ASI COMO EL DESARROLLO DE SOFTWARE ABIERTO Y LA PROVISION DE DATOS ABIERTOS, ASPECTOS A LOS QUE PRESTAMOS ESPECIAL ATENCION,EL PROYECTO SE PLANTEA EN 4 EJES INTERCONECTADOS: 1) OBTENCION DE DATOS COMPLEJOS PROVENIENTES DE PROBLEMAS REALES, 2) PREPROCESAMIENTO DE DATOS PARA OBTENER SMART DATA, 3) DISEÑO DE ALGORITMOS AVANZADOS DE ML Y DL Y 4) APLICACIONES REALES EN SEIS AREAS, TODOS ESTARAN SUPEDITADOS BAJOS LOS PRINCIPIOS DE RESPONSABILIDAD Y CONFIABILIDAD EN CIENCIA DE DATOS,PARA LA OBTENCION DE SMART DATA, SE RECOGEN LAS TECNICAS DE AUTOENCODERS, APRENDIZAJE METRICO, BIG DATA PREPROCESSING Y PROCESAMIENTO DE IMAGENES CON AUMENTACION DE DATOS Y GANS, LOS DISEÑOS DE ALGORITMOS DE ML ESTARAN CENTRADOS EN SISTEMAS DIFUSOS EXPLICABLES, ML AUTOMATICO Y DL EVOLUTIVO, OPTIMIZACION EVOLUTIVA A GRAN ESCALA, PROBLEMAS DE APRENDIZAJE SINGULARES, FEW-SHOT LEARNING, DETECCION DE OBJETOS Y CLASIFICACION DE IMAGENES, DETECCION DE ANOMALIAS EN SERIES TEMPORALES Y ANALISIS DE SENTIMIENTOS, LAS APLICACIONES DEL MUNDO REAL ESTAN ASOCIADOS A LOS CAMPOS: SALUD Y MEDICINA, INDUSTRIA 4,0 Y GEMELO DIGITAL, NOTICIAS FAKE, BIODIVERSIDAD Y CAMBIO GLOBAL, VIGILANCIA POR VIDEO Y OBJETIVOS DE DESARROLLO SOSTENIBLE, CIENCIA DE DATOS\SMART DATA\INTELIGENCIA ARTIFICIAL REPONSABLE Y CON\BIG DATA\DEEP LEARNING\DATOS COMPLEJOS\ALGORITMOS VERDES