La IA requiere de siempre más potencia de calculo

IBM dice que la respuesta está en este nuevo chip

0
30
IBM AI Unit chip - Foto IBM

IBM Research ha presentado la nueva Unidad de Inteligencia Artificial, diseñada para ejecutar modelos de aprendizaje profundo para casi cualquier aplicación empresarial.

Con bombos y platillos sugiere que la inteligencia artificial (IA) ya está en todas partes, pero en realidad la tecnología que la impulsa aún está en desarrollo. Muchas aplicaciones de IA se alimentan con chips que no fueron diseñados para la IA, sino que se basan en CPUs de uso general y GPUs creadas para videojuegos. Este desajuste ha provocado una oleada de inversiones -de gigantes tecnológicos como IBM, Intel y Google, así como de empresas emergentes y sociedades de capital riesgo- en el diseño de nuevos chips expresamente diseñados para las cargas de trabajo de la IA.

A medida que la tecnología mejore, la inversión de las empresas seguramente seguirá. Según Gartner, los ingresos por chips de IA ascendieron a más de 34.000 millones de dólares en 2021 y se espera que crezcan hasta los 86.000 millones de dólares en 2026. Además, según la firma de investigación, menos del 3% de los servidores de centros de datos en 2020 incluían aceleradores de carga de trabajo, mientras que se espera que más del 15% lo haga en 2026.

IBM Research, por su parte, acaba de presentar la Unidad de Inteligencia Artificial (AIU), un prototipo de chip especializado en IA.

«Nos estamos quedando sin potencia de cálculo. Los modelos de IA están creciendo exponencialmente, pero el hardware para entrenar a estos monstruos y ejecutarlos en servidores en la nube o en dispositivos de borde como teléfonos inteligentes y sensores no ha avanzado tan rápido», dijo IBM.

La AIU es el primer sistema en un chip (SoC) completo del IBM Research AI Hardware Center diseñado expresamente para ejecutar modelos de aprendizaje profundo de IA en empresas.

IBM argumenta que el «caballo de batalla de la informática tradicional», también conocido como CPU, se diseñó antes de que llegara el aprendizaje profundo. Mientras que las CPU son buenas para aplicaciones de propósito general, no son tan buenas para entrenar y ejecutar modelos de aprendizaje profundo que requieren operaciones de IA masivamente paralelas.

«No tenemos ninguna duda de que la IA va a ser un motor fundamental de las soluciones de TI durante mucho, mucho tiempo», dijo a ZDNET Jeff Burns, director de AI Compute para IBM Research. «Se va a infundir en todo el panorama informático, en estas complicadas infraestructuras y soluciones informáticas empresariales de una manera muy amplia y difusa».

Para IBM, lo más sensato es construir soluciones completas que sean efectivamente universales, dijo Burns, «de modo que podamos integrar esas capacidades en diferentes plataformas de computación y dar soporte a una variedad muy, muy amplia de requisitos empresariales de IA.»

La AIU es un circuito integrado de aplicación específica (ASIC), pero puede programarse para ejecutar cualquier tipo de tarea de aprendizaje profundo. El chip cuenta con 32 núcleos de procesamiento construidos con tecnología de 5 nm y contiene 23.000 millones de transistores. La disposición es más sencilla que la de una CPU, diseñada para enviar los datos directamente de un motor de cálculo al siguiente, lo que lo hace más eficiente energéticamente. Está diseñada para ser tan fácil de usar como una tarjeta gráfica y puede conectarse a cualquier ordenador o servidor con una ranura PCIe.

Para conservar la energía y los recursos, la AIU aprovecha la computación aproximada, una técnica desarrollada por IBM para cambiar la precisión de los cálculos por la eficiencia. Tradicionalmente, la computación se ha basado en la aritmética de coma flotante de 64 y 32 bits, para ofrecer un nivel de precisión que resulta útil para las finanzas, los cálculos científicos y otras aplicaciones en las que la precisión detallada es importante. Sin embargo, ese nivel de precisión no es realmente necesario para la gran mayoría de las aplicaciones de IA.

«Si pensamos en trazar la trayectoria de un vehículo de conducción autónoma, no hay una posición exacta en el carril donde el coche tiene que estar», explica Burns. «Hay un rango de lugares en el carril».

Las redes neuronales son fundamentalmente inexactas: producen una salida con una probabilidad. Por ejemplo, un programa de visión por ordenador podría decirle con un 98% de certeza que está viendo la foto de un gato. Aun así, las redes neuronales se entrenaban inicialmente con aritmética de alta precisión, lo que consumía mucha energía y tiempo.

La técnica de cálculo aproximado de la AIU permite pasar de la aritmética de coma flotante de 32 bits a formatos de bits que contienen una cuarta parte de información.

Para garantizar que el chip sea realmente universal, IBM se ha centrado en algo más que en las innovaciones de hardware. IBM Research ha puesto un gran énfasis en los modelos de base, con un equipo de entre 400 y 500 personas trabajando en ellos. A diferencia de los modelos de IA que se construyen para una tarea específica, los modelos de base se entrenan con un amplio conjunto de datos sin etiquetar, creando un recurso parecido a una gigantesca base de datos. Luego, cuando se necesita un modelo para una tarea específica, se puede volver a entrenar el modelo base utilizando una cantidad relativamente pequeña de datos etiquetados.

Con este enfoque, IBM pretende abordar diferentes verticales y diferentes casos de uso de la IA. Hay un puñado de dominios para los que la empresa está construyendo modelos de base: esos casos de uso abarcan áreas como la química y los datos de series temporales. Los datos de series temporales, que se refieren simplemente a los datos recogidos a lo largo de intervalos regulares de tiempo, son fundamentales para las empresas industriales que necesitan observar el funcionamiento de sus equipos. Después de crear modelos básicos para un puñado de áreas clave, IBM puede desarrollar ofertas más específicas y verticales. El equipo también se ha asegurado de que el software de la AIU sea totalmente compatible con la pila de software de Red Hat, propiedad de IBM.

Fuente WEB | Editado por CambioDigital OnLine

Custom Text
Artículo anteriorLa Casa Blanca es sede de la segunda cumbre internacional para combatir el ransomware
Artículo siguienteGasto mundial de los usuarios finales de la nube pública alcanzará casi US$600.000 millones en 2023