Descripción del proyecto
EL ANALISIS DE REGRESION JUEGA UN PAPEL FUNDAMENTAL EN ESTADISTICA, EL OBJETIVO DE ESTA METODOLOGIA ES EVALUAR LA INFLUENCIA QUE UNA SERIE DE VARIABLES EXPLICATIVAS (O COVARIABLES) TIENEN SOBRE EL VALOR MEDIO DE UNA VARIABLE RESPUESTA DE INTERES, LA FORMA MAS HABITUAL DE REPRESENTAR LA DEPENDENCIA ENTRE UNA VARIABLE RESPUESTA Y LAS COVARIABLES ES A TRAVES DEL MODELO DE REGRESION LINEAL MULTIPLE (MRL), SIN EMBARGO, EN ALGUNAS CIRCUNSTANCIAS, LA SUPOSICION DE LINEALIDAD EN LA QUE SE BASA EL MRL PUEDE SER MUY RESTRICTIVA Y NO VERSE RESPALDADA POR LOS DATOS DISPONIBLES, PARA VENCER TAL LIMITACION, SE HAN PROPUESTO METODOS COMPLETAMENTE NO PARAMETRICOS, PERO SU APLICACION NO ES FACTIBLE CUANDO EL NUMERO DE COVARIABLES ES GRANDE O INCLUSO MODERADO, LOS MODELOS ADITIVOS GENERALIZADOS (GAM) REPRESENTAN UNA ALTERNATIVA A LA REGRESION NO PARAMETRICA MULTIVARIANTE SIN RESTRICCIONES, LOS GAM ASUMEN UN EFECTO ADITIVO DE LAS COVARIABLES PERO NO IMPONEN UNA FORMA PARAMETRICA FIJA PARA DICHOS EFECTOS, EN LOS ULTIMOS AÑOS, LOS GAM HAN ALCANZADO UNA GRAN POPULARIDAD EN LA INVESTIGACION TANTO ESTADISTICA COMO APLICADA, DESDE UN PUNTO DE VISTA ESTADISTICO, LA RAZON DE SU POPULARIDAD SE DEBE A SU APLICABILIDAD A DIVERSOS CAMPOS, DESDE EL ANALISIS DE SUPERVIVENCIA Y EL ANALISIS ESPACIAL Y ESPACIO-TEMPORAL A LA EVALUACION DE PRUEBAS DIAGNOSTICAS, DESDE EL PUNTO DE VISTA APLICADO, LOS AVANCES METODOLOGICOS ES ESTE AREA HAN PERMITIDO ANALIZAR Y COMPRENDER FENOMENOS BIOLOGICOS Y DE SALUD COMPLEJOS, LA CRECIENTE DISPONIBILIDAD DE BASES DE DATOS DE GRAN TAMAÑO, CON LA LLEGADA DE LOS LLAMADOS "BIG DATA", HA REPRESENTADO UN RETO EN LA INVESTIGACION ESTADISTICA, MAS AUN, LA POSIBILIDAD DE RECOGER UN GRAN NUMERO VARIABLES Y LA CRECIENTE COMPLEJIDAD DE LOS PROCESOS QUE SE ESTUDIAN REQUIERE DE ENFOQUES METODOLOGICOS NUEVOS Y GRUPOS DE INVESTIGACION MULTIDISCIPLINARES QUE PERMITAN COMPRENDER Y ABORDAR LA PREGUNTA DE INVESTIGACION DESDE DIFERENTES ANGULOS, ADEMAS, HOY EN DIA HAY UNA INNEGABLE NECESIDAD DE IMPLEMENTAR LAS NUEVAS PROPUESTAS EN SOFTWARE DE FACIL USO, EL PRESENTE PROYECTO TIENE COMO OBJETIVO CUBRIR ESTOS TRES ASPECTOS: DESDE (A) EL COMPONENTE COMPUTACIONAL, Y (B) EL DESARROLLO DE METODOS ESTADISTICOS INNOVADORES Y SU APLICACION A PROBLEMAS REALES, A (C) LA IMPLEMENTACION DE SOFTWARE LIBRE QUE SE PONDRA A DISPOSICION DE TODA LA COMUNIDAD CIENTIFICA, EN CONCRETO, EL OBJETIVO PRINCIPAL ES EL DESARROLLO DE ALGORITMOS EFICIENTES Y ESTABLES EN EL MARCO DE LOS MODELOS DE REGRESION GAM, ESTOS NUEVOS ALGORITMOS SERAN EMPLEADOS EN LA EVALUACION DEL VALOR DIAGNOSTICO Y/O PRONOSTICO DE BIOMARCADORES CLINICOS Y EN LA SELECCION DE PUNTOS DE CORTE OPTIMOS PARA LA CATEGORIZACION DE COVARIABLES CONTINUAS, EN EL CAMPO DE LA AGRICULTURA Y DE LA BIOLOGIA, LOS NUEVOS AVANCES BUSCAN PERMITIR EL MODELADO DE PROCESOS ESPACIALES Y ESPACIO-TEMPORALES, TANTO EN EL ANALISIS DE EXPERIMENTOS DE CAMPO AGRICOLAS COMO EN EL ESTUDIO DE LA DINAMICA DE ENFERMEDADES, EL FIN ULTIMO DEL PROYECTO ES PERMITIR EL USO DE LOS MODELOS ADITIVOS EN SITUACIONES EN LAS CUALES, DEBIDO A LA DIMENSION DEL PROBLEMA, A DIA DE HOY NO ES FACTIBLE, EL USO DE LOS NUEVOS AVANCES NO SE LIMITARA A LOS CAMPOS DE LA AGRICULTURA Y LA MEDICINA (EN LOS QUE CENTRAMOS EL PROYECTO), SINO QUE SERAN APLICABLES EN AREAS MUY DIVERSAS, LA IMPLEMENTACION DE LOS NUEVOS AVANCES EN PAQUETES DE R AYUDARA AL DESARROLLO DE ESTOS CAMPOS DE INVESTIGACION, MODELOS ADITIVOS GENERALIZADOS\BIOMARCADORES PROGNÓSTICOS\ENSAYOS DE CAMPO AGRÍCOLA\MODELOS PREDICTIVOS\SOFTWARE DE CÓDIGO ABIERTO.