Meta Platforms Inc., matriz de Facebook, ha desvelado cómo será su infraestructura de inteligencia artificial de próxima generación, mostrando su acelerador de entrenamiento e inferencia(*) más reciente y otros elementos de hardware futurista en su evento AI Infra @Scale recién celebrado.
Santosh Janardhan, responsable de infraestructura global de Meta, ha explicado que se espera que las necesidades de computación de la IA de la empresa aumenten drásticamente durante la próxima década. Necesitará aumentar considerablemente su capacidad de procesamiento para respaldar su investigación en IA, sus aplicaciones y experiencias de vanguardia dentro de su familia de aplicaciones y sus ambiciones metaversales.
«Nos enfrentamos a otro punto de inflexión para la infraestructura», dijo en la apertura del evento. «La IA no es solo una carga de trabajo, es la carga de trabajo. Estamos transformando todo en nuestra infraestructura».
Con ese fin, la compañía ha estado ejecutando un plan para construir la próxima generación de su columna vertebral de infraestructura, y hoy está compartiendo su progreso más reciente. Entre las actualizaciones se encuentran el primer chip personalizado de la empresa para ejecutar modelos de IA, un nuevo diseño de centro de datos optimizado para IA y la segunda fase de su nuevo superordenador para investigación de IA, que contará con la friolera de 16.000 unidades de procesamiento gráfico.
El Meta Training and Inference Accelerator anunciado hoy es la última familia de chips aceleradores personalizados de Meta diseñados para potenciar las cargas de trabajo de inferencia de IA. Conocido como MTIA, el nuevo procesador proporciona una capacidad de cálculo y una eficiencia mucho mayores que las unidades centrales de procesamiento tradicionales, ya que está personalizado para cargas de trabajo internas muy específicas, explicó Janardhan. Meta planea desplegar los chips MTIA junto con potentes GPU para ofrecer un mejor rendimiento, menor latencia y una eficiencia superior para todo tipo de cargas de trabajo de IA.
Meta también ha presentado un diseño de centro de datos renovado para dar soporte a futuras generaciones de hardware de IA tanto para cargas de trabajo de entrenamiento como de inferencia. Según Janardhan, el nuevo centro de datos se basa en un diseño optimizado para la IA que soportará hardware de IA refrigerado por líquido y una red de IA de alto rendimiento que conecta miles de sus chips MTIA. La idea es crear clústeres de entrenamiento de IA a escala de «centro de datos», explicó Janardhan. El nuevo diseño garantiza una construcción más rápida y rentable, al tiempo que da cabida a nuevo hardware, como el primer circuito integrado MSVP de Meta para aplicaciones específicas de transcodificación de vídeo, diseñado para gestionar cargas de trabajo de vídeo.
Por último, Meta presentó la segunda fase de su superordenador de IA Research SuperCluster, del que se dice que es una de las máquinas de este tipo más rápidas jamás construidas. RSC, como se le conoce, está diseñado para entrenar una nueva generación de grandes modelos de IA que soportarán realidad aumentada, sistemas de comprensión de contenidos, traducción en tiempo real y otras cargas de trabajo avanzadas.
El superordenador cuenta con 16.000 GPU conectadas a través de una nueva estructura de red Clos de tres niveles. Según Janardhan, el RSC ya lleva un tiempo en funcionamiento y se utiliza en proyectos de investigación como LLaMA, un gran proyecto de lang
(*) A grandes rasgos, la inferencia consiste en poner en práctica lo que la IA ha aprendido en el entrenamiento. Una vez que la IA aprende el modelo, crea un modelo de inferencia que utilizará para resolver y / o clasificar el problema
Fuente WEB | Editado por CambioDigital OnLine








































