La plataforma MultiRay de Meta agrega entrenamiento para modelos de IA de alta calidad y a gran escala

0
34

La empresa matriz de Facebook, Meta Platforms Inc., ha presentado su última innovación en materia de formación de inteligencia artificial. Se trata de MultiRay, una nueva plataforma para ejecutar los modelos de IA más potentes a gran escala, con más eficiencia y menos costes.

Meta ha explicado en un blog que, hasta ahora, muchas empresas se han visto obligadas a hacer concesiones en sus sistemas de IA. Para obtener los mejores resultados posibles, un sistema de IA que procesa texto, imágenes y otras modalidades debe ser entrenado en un inmenso conjunto de datos, y luego especializado para una tarea específica como la identificación del discurso de odio.

El resultado es un sistema de alta calidad pero extremadamente caro: el modelo puede ser excelente para detectar el discurso de odio, pero eso es todo lo que puede hacer. Así que el proceso se vuelve prohibitivo para los equipos que quieren utilizar la IA para resolver múltiples problemas. Como resultado, los modelos de IA más capaces rara vez se utilizan en el mundo real, y las empresas suelen confiar en algoritmos más pequeños, más simples y menos capaces.

MultiRay cambia esta situación al hacer posible la reutilización de los resultados del entrenamiento de la IA para múltiples tareas diferentes. Numerosos modelos de IA entrenados para tareas específicas pueden ejecutarse con la misma entrada, compartiendo así los costes de procesamiento entre ellos. El resultado es un coste de procesamiento por modelo mucho menor cuando se crean modelos de IA más potentes.

«Hacer esto nos ayuda a optimizar el coste total de la realización de estas tareas de IA», escribió el equipo de IA de Meta en una entrada del blog. «Podemos introducir más fácilmente aceleradores de IA debido a la concentración de la computación de toda la empresa en un solo modelo, y también podemos intercambiar entre la potencia de cálculo y el almacenamiento a nivel de la empresa».

MultiRay crea lo que Meta denomina «modelos universales», que han sido entrenados para obtener buenos resultados en una amplia gama de tareas y dominios. Estos modelos universales han demostrado ofrecer resultados de mayor calidad, lo que permite a los equipos de Meta mejorar e iterar rápidamente todo tipo de modelos de aprendizaje automático para numerosos tipos de aplicaciones, como el etiquetado de temas para publicaciones, la detección de discursos de odio, las noticias falsas, etc. El primer modelo de este tipo de Meta se llama TextRay, y lleva funcionando desde 2020 para dar soporte a diversas aplicaciones de comprensión de textos.

Meta está utilizando MultiRay para crear sistemas de IA en torno a más modalidades que el texto solo. Por ejemplo, algunas publicaciones de Facebook pueden contener texto, imágenes y un vídeo. En ese caso, sus sistemas de IA necesitan analizar esos elementos por separado y evaluarlos en el contexto de los demás. Normalmente, esto implicaría la combinación de varios modelos de cálculo intensivo en un modelo mucho más grande e incluso más intensivo.

«El aumento resultante de la computación y el consumo de energía ralentiza nuestros esfuerzos para poner en producción los modelos ML más avanzados para nuestros productos y servicios», explica Meta.

Para resolver este problema, Meta creó PostRay, que reúne las capacidades de comprensión de textos e imágenes en un único modelo. Como los modelos PostRay incorporan múltiples capacidades en un solo modelo, son más complejos de entrenar, desplegar y mantener. Sin embargo, al utilizar MultiRay, Meta dijo que sólo tiene que realizar estas tareas una vez, y ese modelo puede ser reutilizado por docenas de equipos diferentes dentro de la empresa.

«Un sistema centralizado al servicio de un modelo «jack-of-all-trades» nos permite trabajar directamente con los equipos de investigación de vanguardia y llevar su trabajo a la producción poco después de su publicación», dijeron los investigadores de Meta.

Meta afirma que la centralización de los modelos de IA tiene dos ventajas fundamentales: la primera es la amortización entre varios equipos. Normalmente, el entrenamiento de modelos potentes supone una enorme demanda de recursos, como las unidades de procesamiento gráfico, y cada modelo debe entrenarse por separado. Con MultiRay, los equipos pueden entrenar varios modelos a la vez y dividir la factura entre ellos, ya que todos pueden beneficiarse de los mismos recursos.

Una segunda ventaja es que MultiRay permite un proceso de desarrollo y operaciones más sencillo. «MultiRay da servicio a un pequeño número de grandes modelos centralizados, lo que permite que un solo equipo se encargue de la mayor parte de las operaciones y la optimización», explica la empresa. «Los equipos de los clientes poseen modelos más pequeños y específicos para cada tarea, que son más fáciles de gestionar. Esto permite que muchos equipos que no tenían el ancho de banda para entrenar, desplegar y gestionar la IA de vanguardia puedan utilizar esa tecnología.»

Meta admitió que la implementación de MultiRay dio lugar a muchos nuevos desafíos en torno a la gestión de clientes, cuotas y atribución de costes que antes se habían resuelto. Dado que el tamaño de las consultas y las tasas de éxito de la caché influyen en la energía necesaria para procesar las consultas, aspectos como las cuotas se vuelven más complejos.

Fuente WEB | Editado por CambioDigital OnLine

Custom Text
Artículo anteriorMozilla aporta 35 millones de dólares para salvar la esencia  de la tecnología de punta
Artículo siguienteLa policía española desmantela una red de streaming de televisión pirata con 500.000 usuarios