La gran estrella de la GDC 2024 ha sido, sin duda, NVIDIA Blackwell, la nueva arquitectura GPU que el gigante verde lanzará este mismo año, y que permitirá la ejecución de IA generativa con billones de parámetros reduciendo hasta en 25 veces el consumo energético y los costes, en comparación con la generación anterior.
Estamos ante un núcleo gráfico enorme que cuenta con la friolera de 208.000 millones de transistores, y utiliza memoria HBM3e para ofrecer un ancho de banda de hasta 8 TB por segundo, con una capacidad máxima de 192 GB.
Con la GPU B200 NVIDIA ha dado el salto, por primera vez, a un diseño de tipo chiplet. En este caso tenemos dos chiplets interconectados que permiten crear un súper chip. Los diseños multi-chiplet ofrecen una serie de ventajas importantes, entre las que podemos destacar una reducción de costes y de la complejidad de traslación de diseños con una alta densidad de transistores a la oblea de silicio.
Cada chiplet suma 104.000 millones de transistores, y estos están integrados en el mismo encapsulado e interconectados a través de un sistema de comunicación que ofrece un ancho de banda total de 10 TB/s. Esto es muy importante, porque al tener ambos silicios en el mismo encapsulado se eliminan problemas derivados de la latencia que se produce en cuando colocamos esos chiplets en encapsulados diferentes, aunque estos compartan el mismo empaquetado.
Especificaciones y claves de la GPU B200
-Fabricada en el nodo de 4NP de TSMC.
-Diseño multichip con dos chiplets en el mismo encapsulado.
-208.000 millones de transistores.
-160 unidades SM.
-20.480 shaders.
-8 chips de memoria HBM3e con un total de 192 GB.
-Bus de 8.192 bits y un ancho de banda de 8 TB/s.
-Compatible con PCIe Gen6.
-TGP máximo de 1.000 vatios.
NVIDIA también ha anunciado la GPU B100, que es una solución menos potente y con menor pico de consumo (hasta 700 vatios) que mantendrá la capacidad de memoria y el ancho de banda de la misma. Esta versión llegará al mercado al mismo tiempo que la GPU B200, y posicionará como una opción más asequible.
Blackwell incorpora también nuevas tecnologías que representan un importante salto generacional, entre las que podemos destacar:
-Motor de transformación de segunda generación, impulsado por nuevos tipos de precisión, incluyendo los nuevos nuevos formatos de microescala definidos por la comunidad. Este nuevo motor utiliza técnicas de escalado de grano fino conocidas como escalado de microtensor, que permite optimizar el rendimiento y la precisión, y abre las puertas a las operaciones de IA de coma flotante de 4 bits (FP4). Gracias a esto es posible duplicar el rendimiento y el tamaño de los modelos de próxima generación manteniendo un alto grado de precisión.
-IA segura: Blackwell incluye la Computación Confidencial de NVIDIA, que tiene como objetivo proteger los datos confidenciales y los modelos de IA de accesos no autorizado utilizando seguridad de alto rendimiento basada en hardware. Esto permitirá a las empresas adoptar modelos de LLM de forma segura.
-Motor de descompresión de nueva generación, que mejora el rendimiento y acelera todo el ciclo de trabajo que se produce al consultar bases de datos complejas, y también en tareas relacionadas con el análisis y la ciencia de datos. Tiene, además, soporte de los últimos formatos de compresión, como LZ4 y Snappy, entre otros.
-Motor de Confiabilidad, Disponibilidad y Capacidad de Servicio (RAS), que ofrece resiliencia inteligente y está dedicado a identificar fallos en potencia que pueden ocurrir en cualquier momento, todo para maximizar los tiempos de actividad y reducir el riesgo de entrar en un periodo de inactividad. Este motor ofrece también información de diagnóstico detallada que puede identificar áreas conflictivas y planificar el mantenimiento necesario, lo que ayuda a reducir el tiempo de respuesta.
Rendimiento de NVIDIA Blackwell frente a Hopper
NVIDIA ha dado algunos datos de rendimiento de Blackwell para que nos hagamos una idea de lo que podemos esperar de esta nueva arquitectura, y no ha dudado en compararla de forma directa con Hopper. Los números que tenemos son impresionantes, como vamos a ver a continuación, y no hacen más que reafirmar el liderazgo de NVIDIA.
Según NVIDIA, Blackwell tiene 128.000 millones más transistores que Hopper, rinde hasta 5 veces más en IA y tiene cuatro veces más memoria. Un sistema GB200, que integra dos GPUs B200 y una súper CPU Grace, es capaz de ofrecer los siguientes valores de rendimiento comparado con otro basado en dos GPUs GH100 y una súper CPU Grace:
-20 PFLOPs en FP8, supera en 2,5 veces el rendimiento de Hopper.
-20 PFLOPS en FP6, superando también en 2,5 veces el rendimiento de Hopper.
-40 PFLOPS en FP4, superando en 5 veces el rendimiento de Hopper.
-Puede trabajar con modelos de hasta 740.000 parámetros, lo que supera en 6 veces el rendimiento de Hopper.
-90 TFLOPs en FP64, cifra que supera en 3 veces el rendimiento de Hopper.
-NVLINK All Reduce con SHARP ofrece un ancho de banda de 7,2 TB/s, cuatro veces más que Hopper.
Disponibilidad y fecha de lanzamiento
Se espera que NVIDIA lance sus GPUs B100 y B200, así como el «súper chip» GB200, que integra dos GPUs B200 y una súper CPU Grace, a finales de este mismo año, aunque todavía no tenemos detalles concretos en este sentido más allá de lo dicho.
Todavía no está confirmado si Blackwell será la arquitectura que NVIDIA utilizará en sus tarjetas gráficas de consumo general de próxima generación, las GeForce RTX 50, pero en caso de que así sea creo que es probable que en este caso nos encontremos únicamente con diseños totalmente monolíticos.