Intel y HPE completan el armado del super computador Aurora

0
22

Intel Corp. ha anunciado hoy que se han instalado todos los módulos de cálculo de Aurora, un superordenador a exaescala que está ayudando a construir para el Departamento de Energía de Estados Unidos.

El sistema es fruto de la colaboración entre el Departamento de Energía, Intel y Hewlett Packard Enterprise Co. Se encuentra en el Laboratorio Nacional de Argonne. Los científicos utilizarán el sistema para ejecutar modelos de inteligencia artificial, simulaciones y aplicaciones de análisis de datos a gran escala.

Se espera que Aurora alcance un rendimiento máximo teórico de más de 2 exaflops a finales de este año. Esto lo convertirá en casi el doble de rápido que el superordenador operativo más rápido del mundo, otro sistema del Departamento de Energía llamado Frontier. Un exaflops equivale a mil millones de millones de cálculos por segundo.

«Mientras trabajamos en las pruebas de aceptación, vamos a utilizar Aurora para entrenar algunos modelos de IA generativa de código abierto a gran escala para la ciencia», explica Rick Stevens, director asociado de laboratorio en el Argonne National Laboratory. «Aurora, con más de 60.000 GPU Intel Max, un sistema de E/S muy rápido y un sistema de almacenamiento masivo totalmente de estado sólido, es el entorno perfecto para entrenar estos modelos».

Aurora consta de 10.624 módulos de cálculo conocidos como blades. Estos módulos, que pesan 18 kilos cada uno, se alojan en 166 armarios del tamaño de un frigorífico. El sistema completamente montado ocupa el mismo espacio que dos canchas de baloncesto profesionales.

Cada blade Aurora incluye dos unidades centrales de procesamiento de la línea de chips de CPU Xeon Max Series de Intel. También hay seis tarjetas gráficas Intel Max Series GPU. Los procesadores se apoyan en chips de memoria, equipos de red y equipos de refrigeración integrados en cada blade.

Los chips CPU Xeon Max Series de Intel se basan en una arquitectura de 10 nanómetros. Están optimizados para cargas de trabajo como los modelos de IA que requieren la capacidad de mover datos con frecuencia desde y hacia la memoria. Para acelerar estas cargas de trabajo, las CPU incluyen un tipo de memoria de alta velocidad denominada HBM que no estaba disponible en los anteriores chips de Intel.

Las GPU de la serie Max de Intel, que constituyen el otro componente básico de Aurora, también están optimizadas para las cargas de trabajo de IA. El lenguaje en el que una tarjeta gráfica expresa los cálculos se conoce como conjunto de instrucciones. El conjunto de instrucciones de las GPU de la serie Max de Intel está específicamente orientado a las multiplicaciones matriciales, las operaciones matemáticas que los modelos de IA utilizan para procesar datos.

Los chips también incluyen hasta 128 unidades de trazado de rayos. El trazado de rayos es un método de renderizado de efectos de iluminación y sombras. Según Intel, esta tecnología acelera las funciones de visualización de datos de las aplicaciones científicas.

En total, Aurora cuenta con 21.248 CPU y 63.744 tarjetas gráficas. Esto lo convierte en el mayor clúster de GPU del mundo. Los chips se apoyan en un conjunto de 220 petabytes de almacenamiento de objetos que Aurora utilizará para almacenar los datos de las aplicaciones científicas.

Para aprovechar al máximo las prestaciones de Aurora es necesario que los investigadores optimicen específicamente sus aplicaciones para el sistema. Para facilitar la tarea, el Departamento de Energía ha creado una versión en miniatura de Aurora llamada Sunspot. Proporciona un entorno en el que los investigadores pueden probar distintos métodos de optimización del software.

A principios de este año, más de una docena de equipos de investigación utilizaban el sistema. Una vez que Aurora esté operativo, los equipos empezarán a trasladar el código de Sunspot. Los primeros usuarios de Aurora se centrarán en identificar los problemas técnicos que haya que resolver antes de desplegar las primeras aplicaciones de producción.

Fuente WEB | Editado por CambioDigital OnLine

Custom Text
Artículo anteriorLenovo entrega 1 millón de estaciones de trabajo y servidores desde sus instalaciones en Europa
Artículo siguienteSybven en SAP Sapphire 2023 llevó a la Región ideas de innovación tecnológica