Cientos de APU de AMD se pusieron en funcionamiento el jueves cuando el Centro de Computación de Alto Rendimiento (HLRS) de la Universidad de Stuttgart de Alemania anunció la finalización de su última supercomputadora denominada Hunter.

Los 15 millones de euros sistemafinanciado por el Ministerio de Ciencia, Investigación y Arte de Baden-Württemberg y el Ministerio Federal de Educación e Investigación de Alemania apoyará una variedad de esfuerzos de investigación públicos y privados que van desde ingeniería y modelado meteorológico hasta investigación biomédica, ciencia de materiales y, sí, de Por supuesto, IA.

Construido por Hewlett Packard Enterprise, Hunter se basa en una plataforma Cray EX4000 y funciona con una combinación de unidades de procesamiento acelerado (APU) AMD Instinct MI300A y CPU Epyc Genoa.

Si esa configuración le suena vagamente familiar, es porque la máquina se basa en los mismos componentes básicos que el exaFLOP 1.74. el capitan supercomputadora, sólo que mucho, mucho más pequeña.

Mientras que El Capitan funciona con 44.544 APU, Hunter características 752 repartidos en 188 nodos refrigerados por líquido. Cada uno de estos aceleradores se jacta 24 núcleos Zen 4, seis mosaicos de GPU CDNA 3 y 128 GB de HBM3 coherente. Las APU se complementan con 512 procesadores Epyc de 32 núcleos adicionales.

Combinado, HLRS estima un rendimiento teórico máximo de doble precisión de 48,1 petaFLOPS, casi el doble que su predecesor Hawk. Sin embargo, eso es para cargas de trabajo científicas de alta precisión. La Universidad también planea poner el sistema a funcionar en una variedad de aplicaciones de IA, incluido el entrenamiento de modelos, donde los tipos de datos BF16 y FP8 del MI300A deberían ofrecer un rendimiento máximo entre 736 petaFLOPS y 1,47 exaFLOPS, dependiendo de la precisión.

De hecho, en el marco de una asociación público-privada, HLRS dice que la startup alemana de inteligencia artificial Seedbox.ai ya está utilizando el sistema para entrenar modelos abiertos de lenguaje grande (LLM) en 24 idiomas europeos.

«El rápido desarrollo de la IA y un mayor enfoque en la sostenibilidad en la supercomputación significan que la computación de alto rendimiento está atravesando actualmente un período de transformación emocionante», dijo Michael Resch, director de HLRS, en un comunicado.

Hablando de sostenibilidad, una de las características únicas de Hunter es una nueva funcionalidad de «limitación de potencia dinámica» desarrollada en colaboración con HPE. La capacidad está diseñada para optimizar la eficiencia energética del sistema mediante el monitoreo continuo de las aplicaciones y el ajuste de la distribución de energía según la demanda. Las primeras pruebas en la supercomputadora Hawk mostraron una reducción del 20 por ciento en el consumo de energía sin compensaciones significativas en el rendimiento.

De cazador a pastor

Si bien 48 petaFLOPS no acercarán a Hunter al top 10 del Top500, nunca fue su intención. En cambio, Hunter es un sistema de transición diseñado para ayudar a los investigadores a preparar y optimizar su código para APU y GPU en anticipación de la supercomputadora Herder más grande.

Al igual que Hunter, Herder será construido por la división Cray de HPE y contará con una arquitectura basada en GPU capaz de producir «varios cientos de petaFLOPS» de lo que asumimos es un rendimiento de doble precisión. El coste combinado de ambos sistemas es de 115 millones de euros.

Se espera que la construcción de la estructura y las instalaciones eléctricas de Herder comience en un futuro próximo, y la instalación del sistema completo está prevista para 2027. ®

Source link