Jalapeño y la nueva arquitectura de la IA generativa

El chip, fruto de la colaboración entre OpenAI y Broadcom, refleja una tendencia del sector: adaptar el hardware a las necesidades específicas de los LLM.

0
9
La entrega física de las primeras muestras a los máximos directivos de OpenAI, Sam Altman y Greg Brockman - Foto OpenAI

OpenAI y Broadcom dieron a conocer Jalapeño, un chip de inferencia desarrollado de manera conjunta que marca un movimiento estratégico hacia una infraestructura más integrada para la ejecución de modelos de lenguaje. La presentación llega en un momento en el que la demanda global de cómputo para IA continúa creciendo y en el que los grandes desarrolladores de modelos buscan alternativas que reduzcan la dependencia de aceleradores generalistas y permitan ajustar el hardware a patrones reales de uso. Jalapeño se concibe como el primer paso de una plataforma de cómputo de varias generaciones, diseñada para acompañar la evolución de los modelos de OpenAI y responder a las necesidades de inferencia que surgen a medida que estos se vuelven más complejos y más utilizados en productos de consumo y entornos empresariales.

El chip fue diseñado desde cero con un enfoque en la eficiencia energética y en la reducción del movimiento de datos, dos factores que suelen limitar el rendimiento real de los aceleradores actuales. Según ambas compañías, las primeras muestras ya ejecutan cargas internas, incluido GPT‑5.3‑Codex‑Spark, con frecuencias y consumos alineados con los objetivos de producción. Aunque OpenAI continúa evaluando el rendimiento final, las pruebas iniciales apuntan a mejoras relevantes en eficiencia frente a soluciones existentes, un aspecto que podría traducirse en respuestas más rápidas, menor costo por consulta y una mayor capacidad para sostener picos de demanda en servicios como ChatGPT o la API.

El desarrollo se completó en nueve meses, un plazo poco habitual para un ASIC de este tipo, y que ambas empresas atribuyen a una colaboración estrecha entre equipos de ingeniería y al uso de modelos de OpenAI para acelerar partes del proceso de diseño y optimización. Broadcom aporta su experiencia en silicio y redes, apoyándose en tecnologías que ya utiliza en centros de datos a gran escala, mientras que Celestica participa en la integración de placas, racks y sistemas, un componente clave para llevar el chip a despliegues reales.

El anuncio se inscribe en una estrategia más amplia de OpenAI para controlar más capas de su infraestructura, desde los modelos hasta el hardware. La compañía sostiene que la optimización conjunta de modelos, kernels, sistemas de servicio, redes y aceleradores permite mejorar la eficiencia del cómputo y, con ello, habilitar modelos más avanzados sin que los costos crezcan de manera desproporcionada. Ese ciclo, según su planteamiento, facilita que capacidades de IA más potentes lleguen a estudiantes, desarrolladores, pequeñas empresas y organizaciones que dependen de estas herramientas para crear, investigar o automatizar procesos.

La colaboración con Broadcom se proyecta hacia despliegues a gran escala a partir de 2026, en centros de datos operados junto a Microsoft y otros socios. Este tipo de despliegue refleja una tendencia más amplia en la industria: empresas que desarrollan modelos de gran tamaño están explorando hardware propio o codesarrollado para asegurar disponibilidad, reducir costos y adaptar la infraestructura a sus necesidades específicas. En paralelo, fabricantes como NVIDIA y AMD continúan ampliando su oferta de aceleradores, mientras que proveedores de nube experimentan con diseños internos para cargas de trabajo de IA.

En ese contexto, Jalapeño representa un movimiento que combina pragmatismo y anticipación. No se presenta como un reemplazo inmediato de los aceleradores existentes, sino como una pieza dentro de una estrategia de largo plazo para sostener el crecimiento de la IA generativa. La inferencia es el punto donde los usuarios interactúan con los modelos, y cualquier mejora en eficiencia o estabilidad tiene un impacto directo en la experiencia final. Para OpenAI, avanzar en esta dirección significa reforzar su capacidad para ofrecer servicios más accesibles y fiables, al tiempo que construye una infraestructura capaz de acompañar la próxima generación de modelos.

Fuente: OpenAI | Editado por CDOL

Custom Text
Artículo anteriorLos agentes modifican la distribución de habilidades necesarias en entornos laborales