Descripción del proyecto
EN LA ACTUALIDAD LA COMUNIDAD DE MADRID TIENE INTEGRADAS 5 MILLONES DE HISTORIAS CLINICAS ELECTRONICAS (HCE) DE PACIENTES DE LAS QUE SOLO SE PROCESAN LOS METADATOS ESTRUCTURADOS Y NO AQUELLOS NO ESTRUCTURADOS (DE TIPO TEXTO), POR TANTO ES CRUCIAL PROMOVER EL DESARROLLO DE TECNICAS AUTOMATICAS QUE PERMITAN OBTENER INFORMACION DE FORMA MAS AGIL, CONVIRTIENDO LA INFORMACION NO ESTRUCTURADA EN ESTRUCTURADA Y PROCESABLE POR LOS ALGORITMOS, Y FACILITANDO ASI LA TOMA DE DECISIONES ESTRATEGICAS,EL DESARROLLO DE TECNOLOGIA CAPAZ DE PROCESAR Y EXPLOTAR INFORMACION NO ESTRUCTURADA EN TEXTO LIBRE DE LA HCE EN EL CONTEXTO ACTUAL DE BIG DATA PUEDE TENER MUCHAS APLICACIONES TANTO EN LA MEJORA DE LA PRACTICA CLINICA (GENERACION AUTOMATICA DE RESUMENES DE EPISODIOS RELACIONADOS CON UN PACIENTE O GRUPO DE PACIENTES, SISTEMAS DE AYUDA A LA DECISION CLINICA PARA PERSONALIZAR DIAGNOSTICOS Y TRATAMIENTO DE ENFERMEDADES, ALERTAS DE ENFERMEDADES INFECCIOSAS, MEJORA DE LOS SISTEMAS DE FARMACOVIGILANCIA Y MEDICINA PERSONALIZADA, ETC,) COMO EN INVESTIGACION (SEMI-AUTOMATIZACION DE ESTUDIOS EPIDEMIOLOGICOS, POR EJEMPLO EN LA IDENTIFICACION DE LOS COHORTES DE PACIENTES), ESTA INFORMACION NO ESTRUCTURADA TAN VALIOSA, INCLUIDA EN NOTAS E INFORMES CLINICOS REDACTADOS POR EL PERSONAL MEDICO SE ALMACENAN EN LA HCE PERO NO SE PROCESA PARA DETECTAR HECHOS RELEVANTES QUE PUEDEN UTILIZARSE PARA REALIZAR INFERENCIAS Y AYUDAR EN LA TOMA DE DECISIONES COMO POR EJEMPLO EL DIAGNOSTICO DE ENFERMEDADES O LA PERSONALIZACION DE TRATAMIENTOS,EL OBJETIVO DE ESTE SUBPROYECTO ES APLICAR TECNICAS DE PROCESAMIENTO DE LENGUAJE NATURAL (PLN) PARA EXTRAER INFORMACION A PARTIR DE TEXTO LIBRE EN ESPAÑOL CONTENIDO EN LA HCE (EN PARTICULAR NOTAS CLINICAS) QUE UNA VEZ ALMACENA PUEDE UTILIZARSE EN DISTINTOS TIPOS DE ANALISIS, LOS RETOS A CONSIDERAR INCLUYEN DISTINTOS TIPOS DE PROCESADORES DEL LENGUAJE PARA TRATAR LAS PECULIARIDADES DE ESTE DOMINIO (USO DE ORACIONES COMPLEJAS Y SIN ESTRUCTURA GRAMATICAL EN MUCHOS CASOS, ABREVIATURAS PROPIAS DE CADA CENTRO Y PROFESIONAL, GRAN USO DE LA NEGACION, ETC,), LAS TAREAS EN LAS QUE SE TRABAJARA SON LA DETECCION DE CONCEPTOS, RELACIONES ESPECIFICAS, CLASIFICACION Y FILTRADO DE INFORMACION, TODAS ELLAS ENFOCADAS A FACILITAR EL MANEJO DE LOS GRANDES VOLUMENES DE DATOS QUE MANEJA UN HOSPITAL Y FOCALIZANDO LA INVESTIGACION EN TECNICAS DE DEEP LEARNING QUE PUEDEN HACER USO DE ESTE GRAN VOLUMEN DE DATOS, EN PARTICULAR, EL PROYECTO SERA EVALUADO EN RELACION A LA REALIZACION DE UN ESTUDIO EPIDEMIOLOGICO SOBRE LA INCIDENCIA DE LA ANAFILAXIA (SUBPROYECTO2), SE DISPONE EN LA ACTUALIDAD DE UN ACUERDO DE TRATAMIENTO DE DATOS FIRMADO CON EL HOSPITAL UNIVERSITARIO FUNDACION ALCORCON (HUFA) QUE PERMITE QUE EL SUBPROYECTO 1 TENGA UNA COLECCION DE DATOS CON LA QUE TRABAJAR CON MAS DE 300,000 NOTAS CLINICAS DEL SERVICIO DE URGENCIAS, PROCESAMIENTO DEL LENGUAJE NATURAL\HISTORIA CLÍNICA ELECTRÓNICA\APRENDIZAJE AUTOMÁTICO\DEEP LEARNING\EPIDEMIOLOGÍA