Un reciente análisis de Gartner proyecta que, para el año 2028, una proporción significativa, el 80%, de las aplicaciones empresariales basadas en inteligencia artificial generativa (GenAI) se construirá sobre plataformas de gestión de datos ya establecidas. Esta tendencia anticipa una notable optimización en los procesos de desarrollo, estimándose una reducción del 50% en la complejidad y el tiempo requeridos para la entrega de estas soluciones.
El fundamento de esta predicción radica en la naturaleza inherente de los modelos de lenguaje de gran escala (LLM). Si bien los LLM son potentes herramientas entrenadas con vastos conjuntos de datos públicos, su utilidad para resolver problemáticas empresariales específicas es limitada cuando operan de forma aislada. La verdadera capacidad de la GenAI para generar valor en un entorno corporativo emerge cuando estos modelos se integran de manera efectiva con los datos internos y propietarios de una organización. Es la combinación del conocimiento general de los LLM con la información específica y contextual de la empresa lo que permite la creación de aplicaciones relevantes y precisas.
La Función Crítica de la Generación Aumentada por Recuperación (RAG)
En este escenario, la Generación Aumentada por Recuperación (RAG, por sus siglas en inglés) se presenta como una tecnología habilitadora fundamental. RAG es un marco que permite a los LLM acceder y recuperar información de fuentes de datos externas en tiempo real antes de generar una respuesta. Esto significa que, en lugar de depender únicamente de su conocimiento preexistente, el LLM puede consultar una base de datos interna, un archivo de documentos o un repositorio empresarial para obtener los datos más actualizados y específicos para la consulta. Este enfoque no solo mejora la precisión y relevancia de las respuestas generadas por la GenAI, sino que también ofrece una mayor flexibilidad en la implementación, una trazabilidad mejorada de las fuentes de información y una mayor capacidad de composición para las aplicaciones de GenAI, permitiendo a las empresas construir soluciones más robustas y adaptadas a sus necesidades.
Implicaciones y Adaptación de las Plataformas de Gestión de Datos
La adopción de este modelo tiene implicaciones directas para las plataformas de gestión de datos. Estas deberán evolucionar para integrar nuevas capacidades y servicios que soporten de manera eficiente el ciclo de vida de desarrollo de GenAI. Esto implica una preparación integral de la infraestructura de datos para la era de la inteligencia artificial, asegurando una implementación exitosa y escalable.
Entre las capacidades técnicas clave que se espera que las plataformas de datos incorporen o refuercen se encuentran:
Búsqueda vectorial: Esencial para indexar y consultar embeddings (representaciones numéricas) de texto e imágenes, lo que facilita la búsqueda de similitudes conceptuales y contextuales dentro de los datos empresariales para alimentar los LLM.
Tecnologías de grafos: Permiten representar y consultar relaciones complejas entre entidades de datos, lo cual es vital para aplicaciones GenAI que requieren comprender contextos intrincados o la estructura de la información.
Técnicas de fragmentación (chunking): Necesarias para dividir grandes volúmenes de texto en segmentos manejables que pueden ser procesados eficientemente por los LLM y utilizados en sistemas RAG.
Además de las capacidades técnicas, un aspecto crucial será la gestión y el aprovechamiento de los metadatos. Tanto los metadatos técnicos (que describen la estructura y el origen de los datos) como los operativos (que registran el uso y el rendimiento de los datos) serán vitales. Su adecuada utilización puede servir como una capa de protección adicional para las aplicaciones de GenAI, ayudando a mitigar riesgos asociados con el uso indebido, la protección de la privacidad de los datos y la prevención de fugas de propiedad intelectual. La gobernanza de datos, ya importante, adquiere una relevancia aún mayor en el contexto de la GenAI, donde la calidad, la seguridad y la procedencia de los datos son determinantes para el éxito y la fiabilidad de las aplicaciones.
En resumen, la convergencia de la GenAI con las infraestructuras de datos existentes no es solo una tendencia tecnológica, sino una estrategia que promete optimizar el desarrollo de aplicaciones, potenciar la relevancia empresarial de la IA y asegurar una gestión de datos más robusta y preparada para el futuro. Este enfoque fue uno de los temas centrales abordados en el Gartner Data & Analytics Summit en Mumbai.
Fuente Nota de Prensa Gartner | Editado por CambioDigital OnLine








































