MiniMax lanzó recientemente M3 con ambición de competir en codificación agéntica

El modelo alcanza 59 % en SWE‑Bench Pro y 83,5 en BrowseComp según pruebas internas. Su llegada refuerza la competencia en tareas autónomas de programación y navegación.

0
11
Foto MiniMax

MiniMax presentó recientemente (pricipios de junio 2026) M3, un lanzamiento que la empresa describió como un intento de acercar capacidades de frontera a un costo sensiblemente inferior al de los modelos cerrados más utilizados en el mercado. El anuncio llegó en un momento en el que los laboratorios compiten por ampliar ventanas de contexto, mejorar el rendimiento en tareas agénticas y reducir los costos de operación para cargas de trabajo prolongadas.

Según la compañía, M3 combina una ventana de contexto de un millón de tokens con comprensión nativa de texto, imagen y vídeo, y un rendimiento que, en sus propias pruebas, se sitúa en niveles comparables a los de modelos de gama alta. MiniMax introdujo además un nuevo esquema de suscripción basado en tokens, con un precio inicial de 20 dólares al mes, una estrategia que busca atraer a desarrolladores y equipos técnicos que requieren modelos de gran capacidad sin asumir los costos habituales de los sistemas cerrados.

La arquitectura central del modelo, denominada MiniMax Sparse Attention (MSA), es un diseño de atención dispersa que permite manejar contextos extensos con complejidad sublineal. Este tipo de aproximación se ha convertido en una línea de investigación relevante en la industria, ya que los modelos con ventanas amplias suelen enfrentar limitaciones de memoria y costo computacional. MiniMax afirma que MSA permite a M3 mantener rendimiento estable incluso en secuencias largas, un aspecto que otros laboratorios también están explorando mediante variantes de atención eficiente.

En los benchmarks publicados por la empresa, M3 alcanza un 59 % en SWE-Bench Pro, una evaluación centrada en codificación agéntica autónoma, y un 83,5 en BrowseComp, orientada a navegación web autónoma. MiniMax sostiene que estos resultados superan a los de GPT‑5.5 y Gemini 3.1 Pro en indicadores clave. Sin embargo, como ocurre con otros lanzamientos recientes, los datos provienen de pruebas internas del proveedor, por lo que su interpretación requiere cautela. En el momento del anuncio, los pesos del modelo aún no estaban disponibles; la empresa se comprometió a publicarlos en Hugging Face y GitHub en un plazo de diez días, un gesto que, de cumplirse, permitiría una verificación independiente del rendimiento.

El contexto regulatorio también forma parte de la noticia. MiniMax tiene su sede en Shanghái y está sujeta a la Ley de Inteligencia Nacional china de 2017, que obliga a organizaciones y ciudadanos a colaborar con los servicios de seguridad del Estado. Además, una investigación conjunta del Congreso estadounidense anunciada el 29 de abril de 2026 incluye a MiniMax entre los laboratorios bajo escrutinio, en un escenario en el que la procedencia de los modelos y la jurisdicción aplicable se han convertido en factores determinantes para empresas que manejan datos sensibles.

Para equipos que evalúan cargas de trabajo de codificación autónoma sin información crítica, M3 puede resultar adecuado para pruebas de concepto, especialmente por su relación entre capacidad y costo. En entornos regulados o con activos de código propietario, las consideraciones de cumplimiento y soberanía tecnológica pesan más que el precio por token. El lanzamiento, en cualquier caso, refuerza la tendencia de 2026: modelos cada vez más capaces, ventanas de contexto más amplias y una competencia creciente por reducir los costos de acceso a capacidades de frontera.

Fuente MiniMax | Editado por CDOL

Custom Text
Artículo anteriorEl sector de las memorias impulsa los ingresos por semiconductores sobre los US$300.000 millones
Artículo siguienteAnthropic anuncia el lanzamiento de Claude Fable 5 y Mythos 5