Microsoft lanza la IA que cabe en su dispositivo: Fara-7B, la nueva generación de agentes locales

Un modelo de 7B parámetros que automatiza tareas sin depender de la nube

0
12
Foto Microsoft

Microsoft Research presentó Fara-7B, un modelo de lenguaje pequeño (SLM, por sus siglas en inglés) diseñado específicamente para actuar como agente computacional, capaz de ejecutar tareas directamente sobre interfaces gráficas como navegadores web. A diferencia de los modelos tradicionales que generan texto, Fara-7B interactúa con el entorno digital mediante acciones como hacer clic, escribir o desplazarse, utilizando únicamente lo que aparece en pantalla, sin depender de estructuras internas como árboles de accesibilidad.

Con solo 7 mil millones de parámetros, Fara-7B logra un rendimiento competitivo frente a modelos mucho más grandes, lo que permite su ejecución local en dispositivos personales. Esto reduce la latencia, mejora la privacidad y abre la puerta a aplicaciones más accesibles. El modelo está disponible en Microsoft Foundry, Hugging Face y puede instalarse en PCs con Windows 11 equipadas con Copilot+.

Para entrenar Fara-7B, Microsoft desarrolló una infraestructura de generación de datos sintéticos basada en tareas reales de usuarios en la web. Esta metodología, construida sobre el marco Magentic-One, permite simular actividades como reservar boletos, comparar precios o buscar información, sin necesidad de anotaciones manuales. El conjunto de entrenamiento incluye más de 145.000 trayectorias con un millón de pasos, abarcando diversos tipos de sitios y niveles de dificultad.

En evaluaciones como WebVoyager, Online-Mind2Web y DeepShop, Fara-7B superó a modelos como UI-TARS-1.5-7B y versiones adaptadas de GPT-4o, mostrando una tasa de éxito del 73,5% en tareas web. Además, se introdujo un nuevo benchmark llamado WebTailBench, centrado en tareas subrepresentadas como reservas de restaurantes, postulaciones laborales y compras complejas. En este entorno, Fara-7B alcanzó un 38,4% de éxito, por encima de modelos más grandes.

En términos de seguridad, el modelo incorpora mecanismos para detenerse en “puntos críticos”, es decir, momentos donde se requiere consentimiento del usuario antes de realizar acciones sensibles como enviar datos personales o completar transacciones. También fue sometido a pruebas de red teaming y mostró una tasa de rechazo del 82% ante tareas maliciosas, en línea con las políticas de IA responsable de Microsoft.

Fara-7B se integra con Magentic-UI, una interfaz experimental que permite observar y auditar cada paso del agente. Las acciones se registran y pueden ser revisadas por el usuario, lo que refuerza la transparencia y el control. Aunque el modelo aún presenta limitaciones en tareas complejas y puede incurrir en errores de interpretación, Microsoft lo considera una base sólida para el desarrollo de agentes más seguros y eficientes.

Este lanzamiento forma parte de una estrategia más amplia para democratizar el uso de agentes computacionales, facilitando la automatización de tareas cotidianas como completar formularios, gestionar cuentas o realizar búsquedas. Al ofrecer un modelo abierto y optimizado para hardware local, Microsoft busca fomentar la experimentación y el desarrollo de soluciones prácticas en entornos reales.

Fuente: nota de prensa Microsoft | Editado por CDOL

Custom Text
Artículo anteriorClaude Opus 4.5: una nueva etapa en el desarrollo de agentes inteligentes