Descripción del proyecto
Este proyecto plantea soluciones de automatización y asistencia para la gestión de centros de datos con el propósito de hacer su operativa más ágil y eficiente, CAROL (Computer-Assisted Robotic Operator Layer) propone construir una plataforma de procesado inteligente de logs y variables de monitorización de sistemas, tales como los que se generan continuamente en las infraestructuras que sostienen servicios cloud de cualquier naturaleza y criticidad, Su objetivo es detectar problemas de manera eficiente (por tiempo de respuesta y exactitud de detección) y de proponer las acciones más eficaces de cara a su resolución,En un entorno donde los datos tienen cada vez una mayor presencia cuando se trata de tomar decisiones corporativas o de negocio, abundan las promesas acerca de los beneficios que un uso inteligente de los datos puede reportar a las organizaciones, La clave, y a la vez la gran dificultad, reside en ser capaces de extraer de dichos datos el valor que pueda hacernos más ágiles y competitivos,Las técnicas habituales de detección son típicamente no supervisadas, ya que la tarea de etiquetar manualmente el volumen de eventos producido en un centro de datos suele ser inabordable, Sin embargo, con demasiada frecuencia generan falsas alarmas, por lo que en muchos casos terminan siendo más un lastre que una ayuda para los operadores de sistemas, CAROL aborda el problema de la detección de anomalías aplicada a la resolución de incidencias desde un enfoque diferente, introduciendo el factor humano (human in the loop) como la clave para conseguir que los algoritmos sean más precisos, discriminando lo verdaderamente anómalo respecto al fondo de normalidad, y permitiendo al mismo tiempo que todo continúe siendo escalable, Incorporar conocimiento humano experto a un sistema automatizado siempre se ha considerado una tarea ardua, CAROL propone capturar y modelar esta información de manera indirecta a través un enfoque innovador,Otro de los aspectos en los que CAROL pretende destacar es a la hora de proporcionar información útil para conseguir mantener al sistema monitorizado dentro de los parámetros de normalidad, El analista humano solo tendrá que analizar o ajustar la operación del sistema a través de una serie de herramientas de análisis prescriptivo, las cuales le permitirán (1) hacer predicciones a partir del conocimiento actual, (2) obtener sugerencias de un conjunto de posibles acciones a tomar -o ejecutarlas automáticamente si cuenta con permisos suficientes-, y (3) estimar las implicaciones de llevar a cabo tales acciones,Existen dos elementos adicionales que CAROL va a considerar a la hora de proporcionar información con el mayor valor de utilidad posible:1) Ser capaz de identificar o inferir el origen de las incidencias, que son realmente los síntomas de un problema subyacente, Para ello se investigarán técnicas de detección de correlación de eventos en espacios de variables multidimensionales como base para efectuar análisis de causa raíz,2) Ofrecer los mejores resultados en el menor tiempo posible, La calidad de una plataforma de gestión automatizada de incidencias viene determinada en gran medida por su capacidad para detectar a tiempo que algo no funciona correctamente, incluso de anticiparse a un problema antes de que sus efectos sean percibidos por el usuario final del servicio,Por último, pero no menos importante, CAROL dispondrá de un asistente virtual que proporcionará un servicio automatizado de gestión de incidencias estableciendo un diálogo con usuarios autorizados por medio de una interfaz a modo de chat, El objetivo es ofrecer un sistema que responde ágilmente cada vez que un usuario experimenta una merma en la calidad percibida del servicio, Este asistente guiará a los usuarios y tratará de recabar toda la información necesaria para que la incidencia se resuelva lo más pronto posible,