La arquitectura de datos, la infraestructura corporativa que conecta las estrategias de negocio y de datos, se enfrentará a prioridades contrapuestas en 2024.
Por un lado, casi la mitad de las organizaciones se inclinarán por modernizar sus arquitecturas de datos para aumentar la analítica operativa en tiempo real y habilitar las capacidades de IA y ML (machine learning). Simultáneamente, con las preocupaciones sobre los impactos de la IA, alrededor del 80% priorizará la seguridad y la Gobernanza de Datos en 2024.
Mientras que los arquitectos de datos han tenido que encontrar un compromiso entre la seguridad y la analítica, 2024 promete ser un equilibrio más delicado entre ambas, dependiendo del estado de la Calidad de Datos de una empresa. La calidad de los datos de una empresa marcará el ritmo de adaptación a las tendencias de la arquitectura de datos de 2024.
Los problemas de Calidad de Datos han aumentado en 15 horas entre 2022 y 2023. A partir de 2023, el 25% o más de los ingresos estarán sujetos a problemas de Calidad de Datos.
Con presupuestos ajustados debido a la incertidumbre económica, objetivos para capitalizar los proyectos de IA y un enfoque en la Calidad de Datos, las organizaciones procederán cuidadosamente para establecer e implementar las siguientes tendencias de Arquitectura de Datos:
Aplicación de una gobernanza de datos responsable
Modernización de la infraestructura técnica para gestionar datos en tiempo real.
Implementar arquitecturas distribuidas con cautela.
Aumento del interés por los clientes automáticos o custobots.
Inclusión de datos de terceros en el ecosistema de datos de una organización.
Aplicar una gobernanza de datos responsable
La conexión entre una buena Gobernanza de Datos y la Arquitectura de Datos no es ningún secreto. Alrededor del 54% de los ejecutivos han hecho de la Gobernanza de Datos una de sus principales prioridades para 2024 a 2025, según Donna Burbank, una reconocida experta del sector con más de 25 años de experiencia. En cambio, los directivos se enfrentan al reto de impulsar una Gobernanza de Datos responsable que sirva a la infraestructura de datos de la organización.
William McKnight, asesor de muchas de las organizaciones más conocidas del mundo, subraya que la gobernanza de datos, para ser útil, debe establecer responsabilidades y resultados tangibles. Esta gobernanza de datos responsable también debe alinearse con las necesidades de calidad de datos de una organización para avanzar en su arquitectura de datos.
La evolución de las herramientas de Gobierno de Datos ha hecho avanzar los procesos de Calidad de Datos dentro de los componentes de la Arquitectura de Datos, y esto continuará. Gartner observa que la adopción de metadatos activos, gestionados a través de la Gobernanza de Datos, será vital para modernizar la Arquitectura de Datos en la década de 2020.
No obstante, si se hace hincapié únicamente en las herramientas de gobierno de datos, no se conseguirá que la arquitectura de datos adquiera una ventaja significativa. El Dr. Peter Aiken, una reconocida autoridad en Gestión de Datos (DM), define la Arquitectura de Datos como una estructura de activos basados en datos que apoyan la implementación de una estrategia organizativa.
Para abordar este vacío, la Gobernanza de Datos responsable es un puente crítico para que las organizaciones utilicen sus Arquitecturas de Datos de forma más efectiva, requiriendo una buena Calidad de Datos para apoyar la implementación de estrategias. Por lo tanto, a medida que las organizaciones avanzan hacia un Gobierno de Datos responsable en 2024, tendrá sentido implementar un marco sólido vinculado a las estrategias organizativas para avanzar en la Arquitectura de Datos.
Modernización para manejar datos en tiempo real
Un mercado creciente de dispositivos IoT, como sensores, dispositivos domésticos inteligentes, fuentes de redes sociales, etc., promete atraer a las empresas para que obtengan información más eficiente de los análisis en tiempo real a través de sus arquitecturas de datos. Las empresas que lo hagan entrarán en un sector que crece a una tasa anual compuesta del 21,5%.
Además, los datos no estructurados, incluidas las redes sociales, representan menos del 33% de los datos gestionados en la actualidad. Esta cifra indica la necesidad de modernizar la arquitectura de datos, por ejemplo utilizando de forma más eficiente la computación en nube para obtener información rápida y relevante en tiempo real.
En consecuencia, las organizaciones deben gestionar y escalar las integraciones de datos y actualizar sus conductos para un procesamiento y entrega de datos suficientes. Según una encuesta de Komprise 2023, el 47% de los departamentos de TI y las empresas identificaron el principal reto de los datos no estructurados: mover los datos sin interrumpir a los usuarios. Por lo tanto, el estado de la Calidad de Datos marcará el ritmo y la disponibilidad de recursos para implementar componentes de Arquitectura de Datos para manejar datos en tiempo real.
Con el aumento de la IA y las herramientas de aprendizaje automático fundamentales para procesar datos en tiempo real, la presión para utilizar estas tecnologías aumentará a medida que las organizaciones destinen más del 40% de su gasto en TI central a la IA para 2025. Este impulso para modernizar la arquitectura de datos y controlar la calidad de los datos provocará turbulencias en la infraestructura y resultados mixtos en el manejo de datos en tiempo real en 2024.
Implementar con cautela las arquitecturas distribuidas
Las arquitecturas de datos distribuidas, que utilizan múltiples plataformas, no sólo manejan datos en tiempo real, sino que también reducen el tiempo de acceso a los datos, ofrecen redundancia y aumentan la flexibilidad. Estas ventajas impulsarán su implantación en las organizaciones a lo largo de 2024.
A medida que las empresas consideren qué arquitecturas distribuidas aplicar, procederán con cautela. Dado que los problemas de calidad de datos suponen una proporción significativa de los presupuestos tecnológicos y afectan a la aceptación empresarial de los proyectos de TI, muchas empresas investigarán opciones de arquitecturas distribuidas más consolidadas y comprendidas.
En consecuencia, el almacén de datos en la nube seguirá encabezando la lista, con un crecimiento interanual del 52% en el volumen de almacenes de datos en la nube. Gartner considera que en 2027 el 35% de la infraestructura de un centro de datos se gestionará desde un plano de control basado en la nube.
Además de los almacenes de datos en la nube, el 43% de las empresas considerará el data lakehouse. Esta implementación de data lakehouse proporcionará un punto de entrada a las arquitecturas distribuidas.
Las empresas que necesiten menos recursos para gestionar y tengan menos problemas de calidad de datos investigarán combinaciones de data fabric, algoritmos que unifican datos dispares entre sistemas, y data mesh, un enfoque de microservicios para la gestión de datos empresariales.
Para cualquier arquitectura distribuida, el éxito de la implantación en 2024 dependerá de contar con un marco sólido de arquitectura de datos que funcione bien con otros componentes del programa de gestión de datos para garantizar la calidad de los datos. Sin confianza en los datos, cualquier arquitectura distribuida funcionará como una joya de la corona para ser «admirada y analizada, pero no procesable». Este resultado es un mal presagio para conseguir financiación futura de Arquitectura de Datos para la modernización.
Un creciente interés por los clientes máquina o CustoBots
Gartner ha identificado actores económicos no humanos, clientes máquina o «custobots», que pueden negociar y adquirir bienes y servicios. Gartner predice que las empresas generarán más del 21% de sus ingresos en 2030 a través de estos algoritmos.
Aunque los algoritmos ya interactúan con las API de los sistemas de datos, los custobots cambiarán significativamente los resultados, comportamientos y actividades de la Arquitectura de Datos.Microsoft Bing afirma:
«Los clientes máquina desafían los paradigmas tradicionales de la Arquitectura de Datos… A medida que los custobots sean más frecuentes, los arquitectos de datos estarán a la vanguardia de la configuración de ecosistemas de datos que atiendan a participantes humanos y no humanos».
Aunque este escenario de la IA cobrando dinero de una cuenta bancaria puede parecer muy remoto, es probable que las empresas empiecen a probar la IA generativa para ayudar con las compras. Google ya ha incorporado un servicio de IA generativa que compara los precios de la ropa para los compradores navideños de 2023.
Anticipe que los robots de compras, como los de Google, generarán exponencialmente más datos y algoritmos a través de la IA generativa. Microsoft Bing señala: «La escalabilidad se vuelve crucial para acomodar el creciente número de custobots y sus interacciones». Por lo tanto, las empresas querrán observar esta tendencia emergente en 2024 y planificar infraestructuras de datos que ofrezcan una Calidad de Datos fiable dado el aumento del número de clientes.
Inclusión de datos de terceros en el ecosistema de datos de una organización
En 2024, el mercado empezará a ver cómo se amplían los ecosistemas de datos desde los activos críticos de una organización hasta la inclusión de una o más fuentes de datos de terceros. McKnight ha identificado aspectos de esta tendencia a través de la nube de datos, una arquitectura de datos que permite a las organizaciones compartir e intercambiar datos con filiales, socios, terceros o usuarios en Internet.
El mundo académico ya ha visto el inicio de esta tendencia a través de la Research Data Alliance (RDA), con 13.900 miembros individuales que desarrollan y adoptan una infraestructura que promueve el intercambio de datos.
En 2023, las empresas han estado investigando el uso de datos de terceros para gestionar el rápido aumento de los volúmenes de datos y en busca de nuevas oportunidades. Se prevé que esta tendencia sea lucrativa y alcance los 3.500 millones de dólares en 2028.
Esta evolución afecta a las organizaciones al menos de tres maneras:
Las empresas deben contar con arquitecturas de datos que ya tengan y ofrezcan una buena Calidad de Datos para integrar datos de terceros y enriquecer los propios.
A las empresas con una Calidad de Datos deficiente les resultará más difícil hacer avanzar su infraestructura de datos para explotar un ecosistema de datos más amplio y compartido con múltiples socios.
Las empresas que comparten una nube de datos deben prestar mucha atención a la Calidad de los Datos y coordinar entre sí los componentes de la Arquitectura de Datos a medida que comparten sus recursos de datos.
Teniendo en cuenta estos requisitos, las organizaciones deben anticipar que 2024 traerá resultados mixtos, con algunas organizaciones alcanzando logros asombrosos y conocimientos de este intercambio de datos, mientras que otros pueden tener dificultades con los procesos e implementaciones apresuradas de Arquitectura de Datos.
Conclusión
Las organizaciones se enfrentan a complejas prioridades de Arquitectura de Datos para modernizar y aumentar los ingresos a partir de oportunidades con datos en tiempo real, custobots y datos de terceros. Las empresas quieren lograr este objetivo al mismo tiempo que gestionan los riesgos y hacen frente a amenazas cada vez más potenciales, como los impactos de la IA.
El alcance de la Calidad de Datos marcará el ritmo de las implementaciones de Arquitectura de Datos y sus éxitos. Esta tendencia se hará evidente a medida que las organizaciones modernicen su infraestructura técnica y adopten arquitecturas distribuidas.
Aquellas que sigan sin abordar los problemas de Calidad de Datos acomodarán su Arquitectura de Datos a un ritmo más lento. Para remediar esta situación, es más probable que las empresas adopten una Gobernanza de Datos responsable.
Incluso aquellas con Arquitecturas de Datos intrincadas y elegantes mejorarán su Gobernanza de Datos responsable para presupuestar e implementar mejor las actualizaciones de la infraestructura de datos en 2024.
Fuente: PressWire