Nemotron 3 Super: la nueva apuesta de NVIDIA para una IA agentica más eficiente

Un modelo abierto que busca sostener procesos largos y reducir el costo del razonamiento en sistemas autónomos.

0
36
Foto NVIDIA

El anuncio de NVIDIA sobre Nemotron 3 Super llega en un momento en el que la industria de la inteligencia artificial está redefiniendo cómo deben funcionar los sistemas autónomos que operan durante largos periodos, coordinan múltiples tareas y mantienen coherencia a lo largo de procesos extensos. La compañía presenta este modelo de 120.000 millones de parámetros como una pieza diseñada para aliviar dos problemas que se han vuelto recurrentes en los entornos agenticos: el crecimiento descontrolado del contexto y el coste acumulado del razonamiento continuo. En los flujos de trabajo donde varios agentes colaboran, cada paso exige reenviar historiales completos, resultados intermedios y trazas de razonamiento, lo que multiplica el volumen de tokens y eleva el coste computacional. A ello se suma la necesidad de que cada agente razone en cada subproceso, algo que, si se ejecuta siempre con modelos de gran tamaño, ralentiza la operación y la hace poco viable para despliegues empresariales.

Nemotron 3 Super intenta responder a estas limitaciones con una arquitectura híbrida que combina capas Mamba para mejorar la eficiencia en memoria y cómputo, capas transformer para sostener el razonamiento avanzado y un sistema de expertos latentes que activa solo una fracción del total de parámetros en cada inferencia. Este enfoque permite que el modelo mantenga la capacidad de análisis profundo sin incurrir en el coste de activar todos sus componentes, una estrategia que se ha vuelto habitual en modelos de gran escala que buscan equilibrar rendimiento y eficiencia. La incorporación de predicción multi‑token añade un elemento adicional de velocidad, ya que permite anticipar varias palabras simultáneamente y reducir el tiempo de inferencia. En conjunto, estas técnicas buscan ofrecer un modelo capaz de sostener procesos largos sin degradación, algo que se vuelve esencial cuando los agentes deben mantener en memoria estados completos de trabajo, como bases de código extensas, informes financieros voluminosos o grandes conjuntos de documentos científicos.

La compatibilidad con la arquitectura Blackwell refuerza esta orientación hacia la eficiencia, ya que permite ejecutar el modelo en formatos de precisión reducida sin pérdida de exactitud, lo que disminuye los requisitos de memoria y acelera la inferencia. Este tipo de optimización se ha convertido en un elemento central en la estrategia de NVIDIA, que combina hardware especializado con modelos diseñados para aprovecharlo al máximo. La compañía destaca que Nemotron 3 Super puede manejar contextos de hasta un millón de tokens, lo que reduce el riesgo de que los agentes pierdan el hilo de sus objetivos iniciales, un fenómeno conocido como goal drift y que se ha observado con frecuencia en sistemas que deben gestionar interacciones prolongadas.

El modelo se publica con pesos abiertos bajo una licencia permisiva, una decisión que encaja con la tendencia creciente hacia modelos que pueden auditarse, adaptarse y desplegarse en entornos controlados. NVIDIA acompaña esta apertura con la publicación de los datos sintéticos utilizados en el entrenamiento, los entornos de refuerzo y las recetas de evaluación, lo que facilita que investigadores y empresas puedan reproducir o extender el proceso. Esta transparencia se ha vuelto especialmente relevante en sectores donde la trazabilidad del modelo es un requisito, como la ciberseguridad, la ingeniería de software o la investigación científica. Plataformas que trabajan con orquestación de modelos ya han comenzado a integrarlo como una opción más dentro de sus catálogos, combinándolo con modelos propietarios para equilibrar coste y precisión según la tarea.

El uso del modelo en sistemas agenticos se ilustra con ejemplos que abarcan desde agentes de desarrollo capaces de cargar un código completo en memoria para generar y depurar sin fragmentación, hasta agentes financieros que pueden analizar miles de páginas de informes sin necesidad de reconstruir el contexto en cada interacción. En ámbitos como la ciberseguridad, la capacidad del modelo para realizar llamadas a herramientas con alta precisión se presenta como un elemento clave para evitar errores en entornos donde las decisiones automatizadas pueden tener consecuencias críticas. Esta orientación hacia la fiabilidad operativa refleja una tendencia más amplia en la industria, que busca modelos capaces de actuar con autonomía sin comprometer la coherencia del proceso.

La disponibilidad del modelo a través de múltiples socios tecnológicos, desde proveedores de nube hasta plataformas de inferencia y servicios de consultoría, sugiere que NVIDIA está apostando por una adopción amplia que abarque tanto despliegues locales como entornos distribuidos. La integración en microservicios NIM facilita que las empresas puedan incorporarlo en sus infraestructuras sin necesidad de rediseñar sus sistemas, un enfoque que se ha vuelto habitual en la transición hacia arquitecturas basadas en contenedores y servicios modulares.

En conjunto, Nemotron 3 Super se presenta como un modelo que intenta responder a las necesidades emergentes de una inteligencia artificial que ya no se limita a generar texto, sino que debe sostener procesos largos, coordinar agentes y mantener coherencia en tareas que requieren razonamiento continuo. Su apertura, su orientación a contextos extensos y su diseño híbrido lo sitúan en un espacio donde la eficiencia y la capacidad de adaptación se han convertido en factores determinantes para la adopción empresarial. El lanzamiento refleja una etapa en la que la industria está consolidando modelos capaces de operar como componentes centrales de sistemas autónomos más amplios, y en la que la combinación de hardware optimizado y modelos abiertos se perfila como una estrategia que podría marcar la evolución de los próximos años.

Fuente: nota de prensa NVIDIA | Editado por CDOL

 

Custom Text
Artículo anteriorLa evolución de la cartografía digital: Google Maps integra inteligencia artificial generativa
Artículo siguienteMeta amplía su capacidad de cómputo con chips propios