Tomahawk 6: Redefiniendo las Redes para la Próxima Generación de IA

Broadcom introduce un conmutador diseñado para clústeres de IA de gran escala, optimizando el rendimiento y la flexibilidad con soporte CPO.

0
9

Broadcom Inc. ha anunciado el inicio de los envíos de su nueva serie de conmutadores Tomahawk 6. Este desarrollo introduce un chip con una capacidad de conmutación de 102.4 Terabits por segundo (Tbps), duplicando el ancho de banda de los conmutadores Ethernet disponibles actualmente en el mercado. El Tomahawk 6 está diseñado para sustentar la próxima generación de redes de inteligencia artificial (IA), tanto a escala vertical (scale-up) como horizontal (scale-out), ofreciendo flexibilidad mediante el soporte para SerDes de 100G/200G y ópticas co-empaquetadas (CPO).

La compañía señala que este chip incorpora un conjunto de características de enrutamiento y opciones de interconexión optimizadas para IA, orientadas a satisfacer las demandas de clústeres de IA que superan el millón de unidades de procesamiento (XPUs).

Ram Velaga, vicepresidente sénior y gerente general del Core Switching Group de Broadcom, indicó que el Tomahawk 6 representa un avance en el diseño de la infraestructura de IA, al integrar alto ancho de banda, eficiencia energética y capacidades de enrutamiento adaptativo en una sola plataforma. Se ha reportado una demanda notable por parte de clientes y socios, lo que sugiere un impacto significativo en el despliegue de grandes clústeres de IA.

Kunjan Sobhani, analista principal de semiconductores en Bloomberg Intelligence, comentó que los clústeres de IA están escalando de decenas a miles de aceleradores, lo que convierte a la red en un posible cuello de botella. Según Sobhani, al superar la barrera de los 100 Tbps y unificar el Ethernet para las configuraciones scale-up y scale-out, el Tomahawk 6 de Broadcom proporciona a los proveedores de hiperescala una estructura abierta y basada en estándares, que ofrece un camino flexible para la evolución de la infraestructura de IA.

Conectividad Flexible y Eficiencia Energética
Las innovaciones del Tomahawk 6 se extienden más allá del chip, buscando ofrecer eficiencia energética a nivel de sistema completo y ahorro de costos. Esto se logra gracias al soporte para SerDes de 200G, que permite un mayor alcance para la interconexión de cobre pasivo. Esta característica facilita un diseño de sistema con alta eficiencia, baja latencia, mayor fiabilidad y un costo total de propiedad reducido. La familia Tomahawk 6 incluye una opción para 1,024 SerDes de 100G en un solo chip, lo que permite el despliegue de clústeres de IA con un alcance extendido de cobre y un uso eficiente de XPUs y ópticas con interfaces nativas de 100G.

Para sistemas que requieren conectividad óptica, el Tomahawk 6 también estará disponible con ópticas co-empaquetadas (CPO). Esta opción está diseñada para ofrecer el menor consumo de energía y la menor latencia, al tiempo que reduce las fluctuaciones de enlace y mejora la fiabilidad a largo plazo. La solución CPO de Tomahawk 6 se basa en la tecnología ya implementada por Broadcom en las versiones CPO de Tomahawk 4 y 5.

Enrutamiento Optimizado para IA y Escalabilidad de Redes
La arquitectura del Tomahawk 6 permite la creación de redes unificadas para el entrenamiento y la inferencia de IA a una escala notable. La función Cognitive Routing 2.0 en el Tomahawk 6 incorpora telemetría avanzada, control dinámico de la congestión, detección rápida de fallos y recorte de paquetes. Estas capacidades están orientadas a permitir el balanceo de carga global y un control de flujo adaptativo, características esenciales para las cargas de trabajo modernas de IA, incluyendo modelos como mixture-of-experts, fine-tuning, aprendizaje por refuerzo y modelos de razonamiento.

Con soporte tanto para redes scale-out como scale-up, el Tomahawk 6 está diseñado para satisfacer las demandas de redes de clústeres de IA que van desde 100,000 hasta un millón de XPUs. La utilización de Ethernet para ambas interfaces, scale-out y scale-up, ofrece a los operadores de red ventajas al permitirles emplear una pila de tecnología unificada y herramientas operacionales consistentes a lo largo de toda la infraestructura de IA. Esta flexibilidad también permite que los operadores de la nube particionen dinámicamente sus activos de XPU en la configuración óptima para distintas cargas de trabajo de clientes. Se han reportado planes de despliegue que involucran más de 100,000 XPUs utilizando Tomahawk 6 para la interconexión tanto scale-out como scale-up.

Innovación Abierta con el Marco SUE y Plataforma de IA Integral
El Tomahawk 6 está concebido para integrarse en un ecosistema abierto de Ethernet scale-up. Con este fin, Broadcom está impulsando el sector con especificaciones abiertas para interfaces eficientes en configuraciones scale-up para XPUs y NICs. El Marco SUE (Scale Up Ethernet) fue presentado por Broadcom en el Open Compute Project (OCP) Dublin en abril de 2025. Esta tecnología está disponible públicamente y será compartida con organizaciones de desarrollo de estándares abiertos, incluyendo el OCP.

La plataforma Ethernet de extremo a extremo de Broadcom para IA abarca las familias de conmutadores Tomahawk y Jericho, NICs Thor, retimers Agera, DSPs ópticos Sian, ópticas co-empaquetadas y kits de desarrollo de software, proporcionando una solución integral para la infraestructura de IA de próxima generación. El Tomahawk 6 es un ejemplo del compromiso de Broadcom con la habilitación de Ethernet para las configuraciones scale-up y scale-out. Es compatible con el Ultra Ethernet Consortium y soporta transportes modernos de IA, señalización de congestión y telemetría para entornos de entrenamiento distribuidos a gran escala. También ofrece soporte para topologías de red variadas, incluyendo scale-up, Clos, rail-only, rail-optimized y torus.

  • Beneficios Clave de la Serie Tomahawk 6:
    Capacidad de conmutación Ethernet de 102.4 Tbps en un solo chip.
  • Tamaño de clúster scale-up de hasta 512 XPUs.
  • Soporte para más de 100,000 XPUs en una red scale-out de dos niveles a 200 Gbps por enlace.
  • SerDes PAM4 de 200G o 100G con soporte para cobre pasivo de largo alcance.
  • Opción para ópticas co-empaquetadas.
  • Cognitive Routing 2.0.
  • Eficiencia energética y de sistema optimizada para
  • entrenamiento e inferencia de IA.
  • Compatibilidad con cualquier NIC o punto final Ethernet XPU.
  • Soporte para diversas topologías, incluyendo scale-up, Clos, rail-only, rail-optimized y torus.
  • Cumplimiento con las especificaciones del Ultra Ethernet Consortium.

Fuente Nota de prensa Broadcom | Editado por CambioDigital Online

Custom Text
Artículo anteriorPionero de la IA crea una organización sin fines de lucro para una IA «honesta»
Artículo siguienteLa retención de talento: un tema clave para las ESN