
Google Cloud ha anunciado la disponibilidad general de sus TPUs Ironwood, junto con nuevas máquinas virtuales basadas en procesadores Axion, diseñadas para responder a las crecientes demandas de cómputo en la era de la inferencia y los flujos de trabajo con agentes inteligentes. Esta evolución refleja un cambio en el enfoque de muchas organizaciones, que pasan de entrenar modelos de IA a servirlos de forma eficiente y escalable.
Ironwood, la séptima generación de TPUs desarrollada por Google, ofrece mejoras significativas en rendimiento y eficiencia energética. Según datos internos, proporciona 10 veces más rendimiento máximo que TPU v5p y más de 4 veces el rendimiento por chip en comparación con TPU v6e (Trillium), tanto para entrenamiento como para inferencia. Estas unidades están diseñadas para escalar hasta 9.216 chips por superpod, conectados mediante una red Inter-Chip Interconnect (ICI) de 9,6 Tb/s, lo que permite superar cuellos de botella en el acceso a memoria compartida de alta velocidad (HBM), que alcanza 1,77 petabytes.
Empresas como Anthropic, Lightricks y Essential AI ya están utilizando Ironwood para acelerar el entrenamiento y despliegue de modelos de lenguaje y generación multimodal. Anthropic, por ejemplo, planea acceder a hasta un millón de TPUs para escalar sus modelos Claude, mientras que Lightricks destaca el potencial de Ironwood para mejorar la generación de imágenes y video de alta fidelidad.
En paralelo, Google Cloud ha ampliado su portafolio de instancias Axion con dos nuevas opciones: N4A, ya disponible en vista previa, y C4A metal, una instancia bare metal que estará disponible próximamente. Ambas están basadas en CPUs Arm Neoverse diseñadas por Google, optimizadas para eficiencia energética y rendimiento en cargas generales como microservicios, bases de datos, entornos de desarrollo y preparación de datos para IA.
La instancia N4A ofrece hasta 64 vCPU, 512 GB de memoria DDR5 y 50 Gbps de red, con soporte para tipos de máquina personalizados y almacenamiento Hyperdisk. Por su parte, C4A metal está orientada a cargas especializadas como desarrollo Android, sistemas automotrices y software con requisitos de licencia estrictos, con hasta 96 vCPU, 768 GB de memoria y 100 Gbps de red.
Clientes como ZoomInfo, Vimeo y Rise han reportado mejoras en eficiencia y reducción de costos al migrar sus cargas a instancias Axion. ZoomInfo observó un 60% de mejora en precio-rendimiento en sus pipelines de datos, mientras que Vimeo registró un 30% de mejora en transcodificación de video.
La combinación de TPUs Ironwood y CPUs Axion forma parte del enfoque de diseño de sistema completo de Google Cloud, que integra hardware, software y redes para maximizar el rendimiento y la confiabilidad. Esta arquitectura, denominada AI Hypercomputer, permite a las organizaciones escalar sus aplicaciones de IA con flexibilidad, desde el entrenamiento hasta el servicio en producción.
Fuente: blog Google Cloud | Editado por CDOL







































