En junio del año pasado tuvimos la oportunidad de conocer los detalles más importantes del superordenador Aurora, un sistema desarrollado en colaboración con HPE que tenía como objetivo superar la barrera del ExaFLOP, y que prometía alcanzar un pico máximo de hasta 2 ExaFLOPs.
Para conseguirlo Aurora cuenta con una configuración simplemente impresionante, ya que está equipado con 63.744 GPUs Intel Data Center Max Series, que a su vez están acompañadas de nada más y nada menos que 21.248 procesadores Intel Xeon CPU Max Series. La potencia que arroja una configuración de este tipo es impresionante, pero hacer que todo funcione bien y que esos componentes puedan trabajar de forma conjunta es lo más complicado.
Al final Intel y HPE lo han conseguido. El superordenador Aurora funciona a la perfección, y ya ha empezado a conseguir los primeros récords del mundo. Uno de ellos lo ha conseguido en la prueba de precisión mixta LINPACK, donde ha alcanzado un resultado de 1,012 ExaFLOPs, lo que lo coloca en la primera posición del ránking mundial, y lo mejor es que para conseguir ese resultado no tuvo que utilizar toda su potencia, ya que solo se emplearon 9.234 nodos, lo que equivale a un 87% del total.
El superordenador Aurora también se hizo con el tercer puesto en el el benchmark HPCG con una puntuación de 5,612 teraflops por segundo (TF/s) utilizando únicamente un 39% del equipo, es decir, menos de la mitad de sus nodos, una cifra que sin duda resulta espectacular y muestra el potencial que tienen este tipo de equipos.
Si te preguntas por qué se utilizan resultados con niveles de uso inferiores al 100% del equipo la respuesta es sencilla, porque estos permiten apreciar las puntuaciones y los valores obtenidos en escenarios más realistas, y también son vitales para evaluar mejor aspectos clave como los patrones de comunicación entre nodos y el acceso a la memoria, entre otros. LINKPACK ofrece una visión más integral de su potencia, aunque tampoco llega a una saturación plena.
Intel ha confirmado que el resultado obtenido en la prueba de precisión mixta bajo IA será fundamental para la GPU de próxima generación de Intel para IA y HPC, cuyo nombre en clave es Falcon Shores. Esta aprovechará la arquitectura Intel Xe de próxima generación, que incorpora lo mejor de Intel Gaudi, y permitirá una interfaz de programación unificada gracias a su alto grado de integración.
Por otro lado, los primeros resultados de rendimiento obtenidos con los procesadores Intel Xeon 6 con núcleos P y memoria de rangos combinados multiplexores (MCR) a 8.800 MT/s muestran una mejora de rendimiento de hasta 2,3 veces en aplicaciones HPC del mundo real, siempre en comparación con la generación anterior.