Durante la celebración del SIGGRAPH de este año NVIDIA ha aprovechado el escenario para presentar un nuevo e impresionante superchip, el GH200 con memoria HBM3e, una solución rompedora que sigue las pautas del modelo Grace Hopper GH100 que vimos hace cosa de un año, y que reafirma la posición de NVIDIA como una de las compañías más grandes, más punteras y más importantes en el mundo de la computación de alto rendimiento especializada en IA y datos.
El GH200 es el primer superchip de NVIDIA que cuenta con memoria HBM3e de alto ancho de banda. Este tipo de memoria ofrece un aumento de hasta el 50% en velocidad frente al estándar HBM3, y le permite ofrecer un ancho de banda de hasta 5 TB/s por chip y 10 TB/s por sistema. A efectos comparativos, una aceleradora NVIDIA H100 en formato SMX con 80 GB de HBM3 ofrece un ancho de banda de hasta 1,68 TB/s.
La diferencia es abrumadora, pero no debemos olvidarnos de la capacidad total de la memoria. Cuando tenemos que trabajar con grandes modelos de IA, o con procesos asociados a esta, la cantidad total de memoria disponible puede afectar de forma drástica al rendimiento. NVIDIA lo sabe, y por eso ha confirmado que el GH200 puede ofrecer hasta 282 GB de memoria HBM3e por sistema.
NVIDIA ha confirmado también que este superchip contará con una CPU ARM con 72 núcleos Neoverse de alto rendimiento (144 núcleos por sistema), y que en total será capaz de ofrecer una potencia en IA de 8 PETAFLOPs por sistema. Sí, es simplemente impresionante, y según ha confirmado el gigante verde podrá trabajar con modelos 3,5 veces más grandes que la generación anterior. Estará disponible a partir del segundo trimestre de 2024.
Saltamos ahora a hablar de las nuevas NVIDIA RTX Ada Lovelace que también han sido presentadas en el SIGGRAPH 2023. En total, el gigante verde ha presentado tres modelos que se colocan directamente en la gama alta y gama media, las NVIDIA RTX 5000 con 32 GB de memoria gráfica, RTX 4500 con 24 GB de memoria gráfica y RTX 4000 con 20 GB de memoria gráfica.
La RTX 5000 es la más potente de las tres, ya que tiene 12.800 shaders, 400 unidades de texturizado, 100 núcleos RT de tercera generación, 400 núcleos tensor de cuarta generación, bus de 256 bits, 32 GB de memoria GDDR6 a 18 GHz y tiene una potencia en FP32 de 65,3 TFLOPs. Por su parte, la RTX 4500 es un modelo de gama media con 7.680 shaders, 240 unidades de texturizado, 60 núcleos RT de tercera generación, 240 núcleos tensor de cuarta generación, bus de 192 bits, 24 GB de memoria GDDR6 a 18 GHz y tiene una potencia en FP32 de 39,6 TFLOPs.
La RTX 4000 es la más modesta de las tres, ya que viene configurada con 6.144 shaders, tiene 192 unidades de texturizado, 48 núcleos RT de tercera generación, 192 núcleos tensor de cuarta generación, bus de 160 bits, 20 GB de memoria GDDR6 a 18 GHz y una potencia en FP32 de 26,7 TFLOPs. Todas estas tarjetas gráficas integran ECC (tecnología de corrección de errores en memoria), y tienen un precio respectivamente de 4.000 dólares, 2.250 dólares y 1.250 dólares.