Candidatura

MoniRacK- Universidad de Guadalaja México

La Universidad de Guadalajara de México ha renovado sus infraestructuras de cálculo científico (High Performance Computing, HPC). Para ello ha creado un nuevo DataCenter en el que ha instalado el superordenador.

El propósito de la Universidad de Guadalajara es que la nueva instalación sea referencia en eficiencia energética, pues de todos es sabido que los grandes clústeres para HPC son muy intensivos en consumo de energía.

Para conseguir la eficiencia, la Universidad de Guadalajara optó por la implantación de MoniRacK como sistema de control estratégico de la eficiencia del superordenador.

El sistema adquiere cientos de parámetros en tiempo real obtenidos de dispositivos IoT y aplica técnicas de machine learning para el control del sistema y la mejora continua de la eficiencia.

Indicadores y procesos de mejora

Indicadores y procesos de mejora

El proceso de mejora de la eficiencia de un superordenador no difiere de cualquier otro proceso de toma de decisiones en business intelligence:

• Es necesario capturar la información adecuada con la periodicidad necesaria y almacenarla de forma correcta. Esto es lo que hace MoniRacK con la red de sensores IoT desplegada. Esta red está compuesta por un total de 172 sensores, y cada uno de ellos proporciona uno o varios datos: el conjunto de 172 sensores proporcionan un total de 1.877 datos en cada medida. La periodicidad de muestreo es programable, y para hacerse una idea del volumen de información recopilada, con una frecuencia de muestreo de cinco minutos se obtienen 22.524 datos por hora y 540.576 datos por día. Casi 200 millones de datos por año.

• Los datos no sirven de nada si no son correctamente estructurados y almacenados. Debido a la diferente naturaleza de los procesos que se realizarán con ellos, el desarrollo realizado contempla dos almacenes de información: una base de datos relacional y una base de datos no relacional, sincronizadas bidireccionalmente. Esto brinda una flexibilidad sin precedentes, pudiendo abordar procesos utilizando la tecnología más adecuada en cada caso.

• El siguiente paso es obtener de los datos el conocimiento necesario para una mejor comprensión del funcionamiento del datacenter y los sistemas de alberga. El datacenter y los sistemas TIC que contiene deben ser tratados como un todo, pues los parámetros de funcionamiento del contenido afectan al continente y viceversa.

A la enorme cantidad de información recopilada se le aplican técnicas avanzadas de machine learning que ayudan a una mejor comprensión de la instalación.

• Por último, el conocimiento generado permite diseñar y aplicar las mejoras necesarias al sistema, entrando en un proceso de mejora continua.

El sistema no sólo permite obtener métricas clásicas como PUE, PUEr, Thermal Conformance y similares. Permite establecer métricas indicadoras, así como el uso de algoritmos especializados de minería de datos.

Cuantificación/Estimación reducción consumo

Cuantificación/Estimación reducción consumo

El nuevo superordenador de la UdG y sus instalaciones necesitan de una potencia de 100kW para su funcionamiento. Las medidas implantadas no sólo permiten ahorros significativos (superiores al 20%). También permiten establecer parámetros como el Idle Energy.

Existen otros parámetros dinámicos especialmente útiles para la gestión de la explotación.

Por ejemplo, la autonomía del sistema de alimentación varía en gran medida con la carga del superordenador (hasta un factor cinco).

MoniRacK tiene en cuenta este tipo de parámetros para la gestión de la explotación.

Cuantificación/Estimación reducción emisiones CO2

Cuantificación/Estimación reducción emisiones CO2

La reducción de emisiones de CO2 es acorde a la reducción de consumo obtenida.

Innovación aplicada y buenas prácticas

Innovación aplicada y buenas prácticas

El responsable del equipo de desarrollo de MoniRack es miembro de The Green Grid, y ha formado parte de los comités que han definido las buenas prácticas y algunas de las métricas más utilizadas para la eficiencia de datacenter: OSDA, Performance Indicator, PUEr, etc.

Por eso, la adaptación de MoniRacK a la UdG incluye las mejores prácticas en gestión energética de datacenter. Además, el proyecto ha requerido la incorporación de tecnologías innovadoras:

• Utilización de una red de sensores IoT aplicados al DataCenter para recabar la información necesaria.

• Desarrollo de un sistema de gestión de colas de eventos para adquisición en tiempo real con sello de tiempo los datos de los sensores.

• Diseño de un sistema ad hoc para el almacenamiento de la información utilizando bases de datos relacionales y bases de datos NoSQL.

• Aplicación de modelos avanzados de minería de datos para generación del conocimiento de la instalación mediante algoritmos de clustering, árboles de decisión, redes neuronales y regresión múltiple.

• Establecer el modelo matemático de la instalación para generar las condiciones de explotación necesarias para obtener los resultados deseados.

Usabilidad de Tecnologías de la Información y Comunicaciones

Usabilidad de Tecnologías de la Información y Comunicaciones

Descripción de las principales tecnologías empleadas o promovidas:

• Sensores IoT para monitorización en tiempo real de parámetros IT y no IT.

• Gestión de colas de eventos para la adquisición de datos de series temporales.

• Utilización de sistemas de almacenamiento basados en bases de datos relacionales y bases de datos NoSQL sincronizadas para generar un data lake utilizable para diferentes propósitos y por cualquier tecnología.

• Utilización de modelos avanzados de minería de datos e inteligencia artificial para el análisis de datos (machine learning).

• Creación de un sistema distribuido, en el que pueden analizarse en un sistema centralizado los datos provenientes de diferentes recolectores y bases de datos.

Implementado en:

Universidad de Guadalajara - México

Periodo de ejecución:

01/10/2018 - 01/06/2019

Socio tecnológico destacado:

PUE Control

Otros socios tecnológicos:

Fujitsu España, Fujitsu México