Datos e IA: la arquitectura Lakehouse de Google se fortalece

Con un enfoque en la gobernanza unificada y herramientas potenciadas por Gemini, Google busca optimizar el desarrollo y análisis de datos.

Por

Prensa CambioDigital OnLine

3 junio 2025

Google ha implementado una serie de innovaciones significativas diseñadas para expandir y perfeccionar su arquitectura lakehouse dentro de Google Data Cloud. Estas mejoras responden a la creciente necesidad de las organizaciones de gestionar y analizar volúmenes masivos de datos de manera más integrada y eficiente. La arquitectura lakehouse, que combina la flexibilidad y el bajo costo de un data lake con la estructura y las capacidades de rendimiento de un data warehouse, busca ofrecer lo mejor de ambos mundos para el procesamiento de datos a gran escala.

Entre las innovaciones centrales se encuentra el almacenamiento nativo de BigLake Iceberg, que se apoya en Google Cloud Storage. Esta funcionalidad es relevante porque adopta el formato abierto Iceberg, el cual permite una gestión de datos más robusta y una interoperabilidad mejorada con diversas herramientas y plataformas. Al basarse en estándares abiertos, las organizaciones pueden tener un mayor control sobre sus datos, evitando el bloqueo tecnológico y facilitando el acceso y la manipulación de la información desde múltiples sistemas, lo que es fundamental para construir una base de datos unificada y adaptable.

Unificación de Motores Operativos y Analíticos para un Flujo de Trabajo Cohesivo
Un pilar fundamental de estas extensiones es la unificación de los motores operativos y analíticos. Tradicionalmente, las cargas de trabajo operacionales (que requieren acceso rápido y transaccional a datos) y las analíticas (que implican consultas complejas sobre grandes conjuntos de datos para generar informes y insights) se manejaban en sistemas separados, lo que a menudo resultaba en duplicación de datos y complejidades en la sincronización. Con esta unificación, Google permite una interoperación fluida sobre una misma base de datos abierta en formato Iceberg. Esto significa que BigQuery, la solución de Google para cargas de trabajo analíticas de alto rendimiento, puede trabajar directamente con AlloyDB para PostgreSQL, diseñado para necesidades operacionales que demandan baja latencia y alta concurrencia. Esta combinación elimina la necesidad de mover o copiar datos entre diferentes sistemas, simplificando la arquitectura, reduciendo costos y garantizando la coherencia de los datos en tiempo real.

Impulso al Rendimiento y la Agilidad en el Procesamiento de Datos
La eficiencia en el procesamiento de datos es crucial para las organizaciones modernas, especialmente con el auge de la inteligencia artificial generativa y el análisis en tiempo real. En este sentido, Google ha trabajado en la aceleración del rendimiento para BigQuery SQL. Esta optimización permite que las consultas analíticas se ejecuten con mayor rapidez, lo que se traduce en una toma de decisiones más ágil y en la capacidad de procesar volúmenes de datos aún mayores en menos tiempo. Paralelamente, se ha introducido el Lightning Engine para Apache Spark. Este motor de alto rendimiento está específicamente diseñado para potenciar las capacidades de Apache Spark, una de las plataformas de procesamiento de datos distribuidos más utilizadas en la industria. La mejora del rendimiento de Spark es vital para cargas de trabajo de ingeniería de datos, aprendizaje automático y análisis de streaming.

Gobernanza de Datos y Herramientas Potenciadas por IA
En el ámbito de la gobernanza y la inteligencia de datos, el Dataplex Universal Catalog representa un avance significativo. Esta herramienta extiende la inteligencia impulsada por IA y la gobernanza unificada a través de todo el entorno de datos de Google Cloud. El catálogo centraliza metadatos, linaje y políticas de seguridad, lo que facilita el descubrimiento de datos, asegura el cumplimiento normativo y mejora la calidad de los mismos en un entorno de datos cada vez más diverso y distribuido. La integración de capacidades de IA en Dataplex mejora la automatización de la curación de metadatos y la identificación de relaciones entre conjuntos de datos.

Finalmente, el blog también hace referencia a los notebooks y herramientas nativas de IA, que buscan enriquecer la experiencia de los desarrolladores. Estos incluyen notebooks impulsados por Gemini, la familia de modelos de IA de Google, y extensiones de código. El objetivo es proporcionar entornos de desarrollo más intuitivos y potentes que permitan a los ingenieros y científicos de datos interactuar directamente con modelos de IA, experimentar con algoritmos de manera más fluida y acelerar la incorporación de capacidades de inteligencia artificial directamente en sus flujos de trabajo de datos. Esto es fundamental para la creación y despliegue de aplicaciones de IA generativa.

En suma, estas extensiones en la arquitectura lakehouse de Google Data Cloud representan un esfuerzo continuo por proporcionar a las organizaciones soluciones de datos más integradas, eficientes, escalables y, fundamentalmente, preparadas para las complejas demandas del análisis de datos moderno y las aplicaciones avanzadas de inteligencia artificial.

Fuente Nota de Prensa Google Cloud | Editado por CambioDigital Online

Nueva etapa en seguridad para agentes de IA tras la adquisición…

Bancaribe fortalece la gestión financiera de las Pymes con la Mastercard…

Gartner proyecta un aumento significativo en los ingresos por memoria hasta…

Amazon apuesta por el espacio con la compra de Globalstar por…

Envíos globales de PCs crecieron 3% en el 1T26 a medida…

EssilorLuxottica y Meta apuestan por los lentes con IA ahora también…

El seguro de vida de tus datos: ¿Por qué el backup…

Dell actualiza su ecosistema profesional con equipos más portátiles y orientados…

Instagram permite editar comentarios en las publicaciones

YouTube permite crear avatares de IA para sus videos cortos

La era del Bitcoin en las tesorerías latinoamericanas llegó para quedarse

Box introduce Box Agent para impulsar la automatización basada en contenido

El mercado mundial de teléfonos inteligentes crece un 1% pese a…

El mercado de soluciones de ciberseguridad para telecomunicaciones en 2026 protege…

Avaya presenta Nexus para entornos donde la fiabilidad es esencial

Inversión en redes de núcleo 5G aumentó un 83% en el…

Incidente de ciberseguridad en Booking.com expone datos de clientes

Panorama del ransomware en Centroamérica y el Caribe

La infraestructura de Cloudflare evoluciona para sostener agentes de IA persistentes…

Commvault amplía su plataforma con herramientas para una IA agentica segura

Apple unifica sus servicios empresariales en una nueva plataforma

SUSE incorpora IA y virtualización avanzada para unificar la gestión de…

SAP presenta Engagement Cloud Enterprise Edition para organizaciones con múltiples marcas…

Secure Boot se actualiza: una transición coordinada en el ecosistema Windows

Datos e IA: la arquitectura Lakehouse de Google se fortalece

OTROS ARTÍCULOS RELACIONADOS

El gasto en infraestructura en la nube subió un 29% por...

El almacenamiento de datos en nubes personales eleva el riesgo de...

El 67% de los latinoamericanos prefiere la nube para proteger su...

Liberty Latin America y AWS impulsan la nube y la IA...

La adopción masiva del almacenamiento en la nube en América Latina...

Nuevos horizontes para la seguridad y escalabilidad en la nube hacia...

El gasto global en infraestructura de nube alcanza los US$102.6 mil...

¡SÍGUENOS EN LAS REDES SOCIALES!

NOTICIAS MÁS VISTAS

macOS Catalina: ¿qué hacer con las aplicaciones de 32 bits?

Inter comienza 2021 con nuevos planes de servicio

Historia de Android: todas las versiones desde la 1.0 hasta Android...

CATEGORÍAS MÁS CONSULTADAS

Omdia advierte sobre las deficiencias de infraestructura de red en las...