Meta muestra su infraestructura de IA de próxima generación

...en su evento AI Infra @Scale.

Por

19 mayo 2023

112

Meta Platforms Inc., matriz de Facebook, ha desvelado cómo será su infraestructura de inteligencia artificial de próxima generación, mostrando su acelerador de entrenamiento e inferencia(*) más reciente y otros elementos de hardware futurista en su evento AI Infra @Scale recién celebrado.

Santosh Janardhan, responsable de infraestructura global de Meta, ha explicado que se espera que las necesidades de computación de la IA de la empresa aumenten drásticamente durante la próxima década. Necesitará aumentar considerablemente su capacidad de procesamiento para respaldar su investigación en IA, sus aplicaciones y experiencias de vanguardia dentro de su familia de aplicaciones y sus ambiciones metaversales.

«Nos enfrentamos a otro punto de inflexión para la infraestructura», dijo en la apertura del evento. «La IA no es solo una carga de trabajo, es la carga de trabajo. Estamos transformando todo en nuestra infraestructura».

Con ese fin, la compañía ha estado ejecutando un plan para construir la próxima generación de su columna vertebral de infraestructura, y hoy está compartiendo su progreso más reciente. Entre las actualizaciones se encuentran el primer chip personalizado de la empresa para ejecutar modelos de IA, un nuevo diseño de centro de datos optimizado para IA y la segunda fase de su nuevo superordenador para investigación de IA, que contará con la friolera de 16.000 unidades de procesamiento gráfico.

El Meta Training and Inference Accelerator anunciado hoy es la última familia de chips aceleradores personalizados de Meta diseñados para potenciar las cargas de trabajo de inferencia de IA. Conocido como MTIA, el nuevo procesador proporciona una capacidad de cálculo y una eficiencia mucho mayores que las unidades centrales de procesamiento tradicionales, ya que está personalizado para cargas de trabajo internas muy específicas, explicó Janardhan. Meta planea desplegar los chips MTIA junto con potentes GPU para ofrecer un mejor rendimiento, menor latencia y una eficiencia superior para todo tipo de cargas de trabajo de IA.

Meta también ha presentado un diseño de centro de datos renovado para dar soporte a futuras generaciones de hardware de IA tanto para cargas de trabajo de entrenamiento como de inferencia. Según Janardhan, el nuevo centro de datos se basa en un diseño optimizado para la IA que soportará hardware de IA refrigerado por líquido y una red de IA de alto rendimiento que conecta miles de sus chips MTIA. La idea es crear clústeres de entrenamiento de IA a escala de «centro de datos», explicó Janardhan. El nuevo diseño garantiza una construcción más rápida y rentable, al tiempo que da cabida a nuevo hardware, como el primer circuito integrado MSVP de Meta para aplicaciones específicas de transcodificación de vídeo, diseñado para gestionar cargas de trabajo de vídeo.

Por último, Meta presentó la segunda fase de su superordenador de IA Research SuperCluster, del que se dice que es una de las máquinas de este tipo más rápidas jamás construidas. RSC, como se le conoce, está diseñado para entrenar una nueva generación de grandes modelos de IA que soportarán realidad aumentada, sistemas de comprensión de contenidos, traducción en tiempo real y otras cargas de trabajo avanzadas.

El superordenador cuenta con 16.000 GPU conectadas a través de una nueva estructura de red Clos de tres niveles. Según Janardhan, el RSC ya lleva un tiempo en funcionamiento y se utiliza en proyectos de investigación como LLaMA, un gran proyecto de lang

(*) A grandes rasgos, la inferencia consiste en poner en práctica lo que la IA ha aprendido en el entrenamiento. Una vez que la IA aprende el modelo, crea un modelo de inferencia que utilizará para resolver y / o clasificar el problema

Fuente WEB | Editado por CambioDigital OnLine

Digitel expresa su solidaridad ante el sismo registrado en el país…

Bancaribe transforma su sede de Altamira en un centro de innovación…

Transformación Digital Inteligente: Cómo ABSIDE se convirtió en el motor de…

Los agentes de IA de los clientes están llegando… ¿Están preparados?

IBM introduce la arquitectura “nanostack” y abre una nueva etapa en…

La industria de semiconductores entra en una fase de integración más…

Proveedores de chips de Japón sufren caída histórica de ventas en…

El mercado global de almacenamiento externo repunta con fuerza en 2026

Las redes sociales se llenan de rostros creados por IA que…

Del hype al portafolio: Cinco formas como Wall Street está redefiniendo…

Kunal Shah asume la dirección global de WhatsApp tras la salida…

IA en la oficina: Zoom busca cerrar la brecha entre reuniones…

El smartphone global alcanzará un precio promedio histórico de US$565 en…

Más de 3.000 millones de suscripciones 5G y el tráfico de…

Android 17 avanza hacia un sistema más contextual

La apuesta de Qualcomm por una realidad extendida con inteligencia local

Bots maliciosos, casi tan numerosos como compradores reales

Alerta por Argamal, un nuevo software malicioso camuflado en videojuegos para…

Filtraciones de datos que podrían ser una trampa

Pasos esenciales de Kaspersky para proteger los datos ante la pérdida…

Red Hat actualiza su plataforma empresarial con capacidades poscuánticas y mejoras…

Apple soluciona el fallo que permitía leer mensajes eliminados en el…

Apple unifica sus servicios empresariales en una nueva plataforma

SUSE incorpora IA y virtualización avanzada para unificar la gestión de…

Meta muestra su infraestructura de IA de próxima generación

OTROS ARTÍCULOS RELACIONADOS

Anthropic presenta Claude Tag, un nuevo enfoque para integrar agentes de...

NVIDIA amplía su ecosistema para ciencias de la vida con agentes...

De la investigación a la política de Estado: EE.UU. convierte la...

La Linux Foundation avanza hacia una identidad verificable para agentes de...

La IA entra en la etapa de solucionar fallos a escala

La cuota de mercado de ChatGPT cae por debajo del 50%...

Gobernanza y transparencia: los pilares de la IA soberana según IBM

¡SÍGUENOS EN LAS REDES SOCIALES!

NOTICIAS MÁS VISTAS

macOS Catalina: ¿qué hacer con las aplicaciones de 32 bits?

Inter comienza 2021 con nuevos planes de servicio

Historia de Android: todas las versiones desde la 1.0 hasta Android...

CATEGORÍAS MÁS CONSULTADAS

IBM introduce la arquitectura “nanostack” y abre una nueva etapa en...