NVIDIA aprovechó el escenario de Computex 2026 para presentar Nemotron 3 Ultra, un modelo que amplía su estrategia en torno a los pesos abiertos y que se sitúa como la propuesta más ambiciosa de la compañía en este ámbito. Con 550.000 millones de parámetros totales y una arquitectura de Mezcla de Expertos (MoE), el sistema activa solo una fracción —55.000 millones por token— durante la inferencia, lo que permite mantener un coste operativo similar al de modelos densos de menor tamaño. Esta aproximación, que ya se ha consolidado en la industria como una vía para equilibrar capacidad y eficiencia, se integra en una familia que supera los 50 millones de descargas acumuladas y que NVIDIA ha ido ampliando de forma progresiva en los últimos meses.
El rendimiento declarado sitúa a Nemotron 3 Ultra en una posición destacada dentro del ecosistema estadounidense de modelos abiertos. La puntuación de 48 en el Artificial Analysis Intelligence Index lo coloca por encima de alternativas como Gemma 4 31B o Nemotron 3 Super, lo que refuerza la idea de que los modelos de gran escala con activación parcial pueden competir en tareas de razonamiento y análisis sin incurrir en los costes habituales de los sistemas densos. La mejora en throughput —más de 300 tokens por segundo, cinco veces más que versiones previas— y la reducción del coste de inferencia en torno al 30% respecto a competidores directos apuntan a un esfuerzo por optimizar tanto el rendimiento como la viabilidad económica en despliegues empresariales.
La disponibilidad del modelo en plataformas como Hugging Face, ModelScope, OpenRouter y como microservicio NIM en build.nvidia.com facilita su adopción en entornos donde la integración rápida es un factor determinante. Empresas como Accenture, CrowdStrike, Palantir o Perplexity ya lo están utilizando en producción, un indicador de que la demanda de modelos abiertos con capacidades avanzadas continúa creciendo en sectores que requieren trazabilidad, personalización y control sobre el ciclo de vida del modelo. Este tipo de despliegues también refleja una tendencia más amplia: la coexistencia de modelos propietarios y abiertos en arquitecturas híbridas donde cada uno cumple funciones específicas.
Aun así, el liderazgo no es absoluto. En el mismo índice que posiciona a Nemotron 3 Ultra como el modelo open más avanzado de origen estadounidense, el sistema chino Kimi K2.6, desarrollado por Moonshot AI, alcanza una puntuación de 54. La diferencia de seis puntos evidencia que la competencia global en modelos abiertos sigue siendo intensa y que los avances no se producen de manera homogénea entre regiones. China ha acelerado el desarrollo de modelos de gran escala con arquitecturas optimizadas para razonamiento prolongado, un área en la que varias compañías asiáticas están invirtiendo de forma sostenida.
El anuncio de NVIDIA se enmarca en un momento en el que la industria está redefiniendo el papel de los modelos abiertos dentro de ecosistemas cada vez más complejos. La expansión de agentes autónomos, la necesidad de manejar contextos extensos y la presión por reducir costes de inferencia están impulsando a los proveedores a explorar arquitecturas que combinen escalabilidad y eficiencia. Nemotron 3 Ultra se inserta en esa dinámica como una pieza más dentro de una estrategia que abarca hardware, software y modelos, y que busca responder a un mercado donde la demanda de sistemas capaces de sostener procesos largos y encadenados continúa en aumento.
Fuente: NVIDIA | Editado por CDOL






































