Microsoft introduce Web IQ dentro de su estrategia de agentes

Una infraestructura de recuperación diseñada para alimentar modelos de lenguaje con evidencia reciente, estructurada y optimizada para flujos de razonamiento automatizados.

0
12

Microsoft presentó Web IQ, un conjunto de API de grounding diseñado para conectar sistemas de inteligencia artificial con información reciente y verificable de la web abierta. La compañía lo describe como un motor de búsqueda orientado a agentes y modelos de lenguaje, no a usuarios humanos, y lo sitúa en el centro de una transición más amplia hacia arquitecturas donde el razonamiento automático depende de ciclos continuos de recuperación, análisis y síntesis de evidencia.

La propuesta parte de una premisa que Microsoft repite desde hace meses: un sistema de IA solo puede razonar con la calidad de la información que recibe. En ese marco, Web IQ busca ofrecer datos actualizados y estructurados —páginas web, noticias, imágenes y vídeos— en un formato que los modelos puedan procesar sin incurrir en un coste elevado de tokens. La compañía sostiene que la utilidad de un agente no depende únicamente de su modelo subyacente, sino de cómo se conecta con el mundo, especialmente con información generada después del entrenamiento de ese modelo.

Una arquitectura reconstruida para flujos de trabajo agénticos
Aunque Web IQ se apoya en el índice global de Bing, Microsoft explica que el sistema ha sido reestructurado desde la base para responder a patrones de uso distintos a los de un buscador convencional. Los agentes no realizan una única consulta, sino múltiples llamadas sucesivas que deben resolverse dentro de presupuestos estrictos de latencia y eficiencia. Para ello, la compañía ha alineado todas las capas del sistema —índice, recuperación distribuida, ranking, selección de pasajes y orquestación— con las necesidades de la inferencia en tiempo real.

El sistema utiliza un modelo de embeddings que Microsoft describe como competitivo en benchmarks públicos, aunque subraya que su valor reside en su integración con el resto de la pila. La representación semántica determina qué vecindarios de información se exploran y condiciona el rendimiento de los módulos posteriores. Junto a este modelo, Web IQ incorpora componentes especializados en comprensión de contenido y ranking, entrenados para comportarse de manera coherente dentro de cadenas de razonamiento impulsadas por modelos de lenguaje.

En la capa de recuperación, Microsoft extiende el trabajo previo realizado con DiskANN, un sistema que permite operar sobre espacios vectoriales residentes en disco sin sacrificar latencia. En Web IQ, esta tecnología se integra en una infraestructura distribuida que enruta consultas a través de particiones globales y optimiza la ejecución para minimizar ineficiencias acumuladas en flujos de trabajo con múltiples pasos. Según datos internos, el sistema opera con una latencia p95 inferior a 165 milisegundos y alcanza velocidades casi 2,5 veces superiores a las de alternativas comparables en condiciones similares .

Pasajes como unidad de evidencia
Uno de los cambios más visibles respecto a un buscador tradicional es la unidad de información que Web IQ devuelve. En lugar de documentos completos, el sistema entrega pasajes y objetos de evidencia estructurados. Microsoft argumenta que los modelos no necesitan páginas enteras, sino información relevante, y que operar a nivel de pasaje permite concentrar señal útil y reducir el número de tokens necesarios para alcanzar un nivel de comprensión determinado. La compañía resume este enfoque con una idea operativa: menos tokens de entrada, mayor precisión en el razonamiento y menor coste por llamada.

Para evaluar la calidad del grounding, Microsoft utiliza una métrica propia denominada GDSAT, que mide si la evidencia recuperada satisface la intención del usuario en términos de completitud, actualidad y autoridad. En sus pruebas internas, Web IQ obtiene puntuaciones superiores a las de otros sistemas en configuraciones equivalentes, un aspecto que la compañía vincula directamente con la fiabilidad del razonamiento posterior .

Gobernanza y relación con el ecosistema web
El anuncio también aborda la cuestión del acceso de los sistemas de IA al contenido de la web abierta, un debate que ha ganado relevancia a medida que los modelos de lenguaje dependen cada vez más de datos recientes. Microsoft afirma que Web IQ hereda el compromiso de Bing con los protocolos de exclusión de robots, las preferencias de los editores y los estándares de acceso establecidos. La compañía señala que participa en foros como el IETF para contribuir a la definición de normas interoperables para la era agéntica, con la intención declarada de actuar como un participante responsable dentro del ecosistema web .

Un componente dentro de una estrategia más amplia
Aunque Web IQ se presenta como un servicio independiente, forma parte de una visión más amplia sobre cómo deben operar los agentes de IA en entornos reales. Microsoft sostiene que la utilidad de un sistema no depende solo de la capacidad del modelo, sino de cómo se conecta con el mundo: información reciente, datos demasiado extensos para ser codificados en pesos y señales que cambian con rapidez. En ese marco, Web IQ se posiciona como la capa de grounding que permite a los agentes razonar sobre la web tal como es: dinámica, heterogénea y en constante evolución.

La compañía ha habilitado un formulario de expresión de interés para desarrolladores y organizaciones que quieran acceder al servicio, aunque no ha detallado precios ni disponibilidad general. Con este lanzamiento, Microsoft refuerza su apuesta por una infraestructura de IA donde la recuperación de información, la eficiencia de tokens y la latencia se convierten en factores estructurales del diseño de sistemas.

Fuente: Blog de Bing | Editado por CDOL

Custom Text
Artículo anteriorLa IA avanzada de la serie HONOR 600 llega al mercado local
Artículo siguienteMajorana 2 marca un nuevo capítulo en la apuesta cuántica de Microsoft