Entrevista
02 octubre 2012

Entrevista a Javier García Tobío. Director del Centro de Supercomputación de Galicia (CESGA)

En el CESGA, los tres conceptos de coste más importantes son energía eléctrica, personal y mantenimiento de equipos. Por esta razón la eficiencia energética es un aspecto de máxima atención en nuestro centro. La política de optimización de la eficiencia energética implantada en el CESGA implica a toda la cadena del proceso de cálculo, empezando por el usuario de nuestros servicios e incluyendo a la totalidad de los subsistemas involucrados

Como centro de supercomputación para la comunidad científica gallega, la eficiencia energética es un objetivo irrenunciable para el CESGA. Apoyándose en las TIC, en 2010 el centro puso en marcha un plan estratégico que le ha permitido en dos años reducir el PUE (Power Usage Effectiveness) del 1,9 al 1,61, y el gasto en energía eléctrica en un 20%.

1. Como centro de supercomputación con un consumo intensivo de energía, ¿qué importancia se concede en CESGA a la eficiencia energética y en qué áreas fundamentalmente?

En el CESGA, los tres conceptos de coste más importantes son energía eléctrica, personal y mantenimiento de equipos. Por esta razón la eficiencia energética es un aspecto de máxima atención en nuestro centro. La política de optimización de la eficiencia energética implantada en el CESGA implica a toda la cadena del proceso de cálculo, empezando por el usuario de nuestros servicios e incluyendo a la totalidad de los subsistemas involucrados: comunicaciones, computación, almacenamiento de datos, climatización, seguridad interna y periférica, etc. A esta política de mejora continua de la eficiencia energética, contribuye de forma activa y decidida la totalidad de la plantilla de personal del centro, de acuerdo con las normas y recomendaciones establecidas.  

2. El Centro tiene en marcha un Plan de Eficiencia y Consumo Energético. En concreto, ¿qué objetivos persigue?

Ante el permanente incremento de los recursos de cálculo del centro, las subidas continuas del coste del kilovatio hora y la necesidad de atenerse a las disponibilidades presupuestarias, así como de contribuir a la reducción de emisión de CO2, en el año 2009 el CESGA elaboró un plan con el objetivo de mejorar la eficiencia energética del centro hasta valores similares a los de los centros de supercomputación más eficientes. Este plan, que se implantó en 2010 y todavía sigue en vigor, ha producido ya enormes mejoras en la optimización del consumo de energía eléctrica.
 
3. ¿Cuáles son las principales líneas de actuación del plan?

El plan establece unas líneas de trabajo generales a desarrollar en el período 2010-2015, que a su vez se desglosan en actuaciones específicas. Las líneas de trabajo principales del plan son múltiples, desde realizar un estudio inicial que identifique las acciones prioritarias de actuación inmediata en climatización y sistema de alimentación eléctrica, y realizar informes periódicos de auditoría y seguir sus recomendaciones, a realizar campañas formativas y de concienciación sobre buenas prácticas en el ámbito de la eficiencia energética. Asimismo se contempla la inclusión de la eficiencia energética como valor ponderable en los procesos de adquisición de equipamiento (no sólo informático) y la renovación de equipos críticos por otros más eficientes energéticamente mediante, por ejemplo, la consolidación de servidores. Igualmente se persigue la optimización del uso de tecnologías Free Cooling y de recuperación de calor, la sustitución de ventiladores de la sala CPD por otros de velocidad variable con un consumo cinco veces menor, el cerramiento de pasillos fríos para conseguir una mejor distribución térmica, la disminución del consumo eléctrico en refrigeración y la optimización de la ejecución de tareas en función de requerimientos energéticos y coste del kilovatio por mes y hora del día. Otros objetivos incluyen incluso la implantación de tecnología cloud para conseguir un menor consumo de energía eléctrica y el desarrollo de actividades de I+D+I en esta materia. Y por supuesto se persigue la implantación de forma efectiva del cumplimiento de la norma sobre condiciones de temperatura en edificios públicos (21º en invierno y 26 º en verano).

4. ¿Qué métricas utilizan? ¿Qué logros más relevantes se han conseguido?

Las principales métricas que se utilizan son PUE (Power Usage Effectiveness), kilovatios/hora, rendimiento computacional (Gflops) por kilovatio y temperatura en nodos de cálculo y en circuitos de agua, así como humedad relativa en sala; también se tiene en cuenta el presupuesto mensual para energía eléctrica. En términos prácticos y aplicando tales métricas, hemos conseguido reducir el PUE medio del 1,9 en 2010 al 1,61 en la actualidad; hay que tener en cuenta que una reducción de 0,1 del PUE le supone al CESGA un ahorro anual de 45.000 euros al año. También hemos logrado reducir el número de kilovatios en un 30% desde 2010, al tiempo que la capacidad de cálculo se ha ampliado en un 40%. En cuanto a contención del gasto en energía eléctrica, de 2010 a 2012, pese a que el coste del Kilovatio/hora se ha incrementado en un 15%, el pago efectuado por el CESGA se ha reducido en un 20%.

5. CESGA, HP y varias universidades de Galicia han elaborado mecanismos que permiten evaluar el rendimiento de las aplicaciones para lograr un mejor uso del procesador y reducir el consumo energético. ¿En qué consisten concretamente? ¿Están siendo utilizados ya por el CESGA?

Los procesadores modernos proporcionan información detallada sobre cómo se están utilizando en aspectos como, por ejemplo, el número de veces que se cargan datos desde la memoria, el número de operaciones que se están haciendo y de qué tipo, etc. Lo que se ha desarrollado en este proyecto es la posibilidad de utilizar la información estadística proporcionada por el procesador para optimizar el acceso a la memoria RAM, reordenando la forma en que se almacenan los datos para incrementar la eficiencia en el acceso a esos datos. En el trabajo desarrollado se ha visto que se puede mejorar la eficiencia en la ejecución de programas hasta un 30% al aumentar la localidad. La optimización en la localidad conlleva dos mejoras desde el punto de vista de eficiencia energética: por un lado se deja de perder energía en los recorridos por los circuitos, y por otro la propia reducción en el tiempo de cálculo supone una reducción directa del consumo energético. Estos trabajos de investigación están ahora en fase de adaptación al entorno de producción, por lo que todavía no están disponibles.

6. En general, ¿qué valor aportan las TIC para conseguir mayores niveles de eficiencia energética en los grandes centros de supercomputación?

Las TIC son fundamentales para conseguir mayor eficiencia energética en un centro como CESGA. El primer paso fundamental para ser eficiente es disponer de una monitorización adecuada que nos dé una imagen global y precisa de los consumos energéticos de las instalaciones. Así, podemos conocer en qué parte del sistema estamos consumiendo más energía y en consecuencia concentrar nuestros esfuerzos en mejorar esos puntos. Aunque las mejoras más apreciables se obtienen actuando sobre los sistemas de acondicionamiento como la climatización o los sistemas de alimentación ininterrumpida, el uso de las TIC es fundamental para una buena monitorización, gestión y tomas de decisión automáticas en algunos casos. Son también importantes los sistemas de gestión capaces de reaccionar ante la carga de trabajo. La situación habitual de un centro de supercomputación es que la demanda de cálculo de los usuarios sea superior a la capacidad de computación disponible, originándose como consecuencia colas de espera de trabajos. La gestión eficiente de los recursos requeridos por estos trabajos en cola reduce el tiempo de espera y, en ciertos casos, permite el apagado temporal de algunos servidores, con el consecuente ahorro energético.

7. ¿Cree que las organizaciones son conscientes de esta aportación de las TIC?

En los centros de supercomputación sí, porque el consumo energético se ha disparado exponencialmente y, debido al tamaño de los centros, se perciben inmediatamente las ventajas de su optimización. En otros centros más generalistas es quizás más difícil porque muchas veces el departamento de TIC conoce las medidas pero no percibe el gasto, y los que perciben el gasto no son conscientes de las posibles medidas. Sin embargo en los últimos tiempos, la situación está cambiando.

8. ¿Es suficiente el esfuerzo que está haciendo la industria TIC en cuanto a innovación y soporte en este campo?

Este es un esfuerzo permanente que viene realizando la investigación y la industria, y que cobra una muy especial relevancia en las próximas arquitecturas exaflops. Se ha trabajado mucho en la reducción del PUE, y en medidas para minorar los consumos de los equipos, lo que ayuda si podemos seguir resolviendo los problemas de la misma manera, es decir, sin cambios en su programación. Sin embargo, quizás el ahorro más importante consiste en realizar las tareas de otra manera más eficiente desde el punto de vista energético, y no sólo computacional. Aquí todavía hay mucho que investigar y es preciso que los sistemas hardware y software aporten más información sobre los consumos energéticos directos de los programas.

¿Te ha parecido útil este contenido?

 
Javier García Tobío
Director del Centro de Supercomputación de Galicia (CESGA)