Si la revolución de la IA ha dado paso a una verdad universal en materia de gestión de datos, esa es la necesidad de apertura e interoperabilidad en todo el conjunto de datos. Al fin y al cabo, la IA solo es tan buena como los datos a los que realmente puede acceder.
Las empresas ya no están dispuestas a invertir en tecnologías antiguas desconectadas. El coste de los silos, que antes se medía solo en la infraestructura, es ahora exponencialmente más alto si se mide en términos de tiempo perdido en relación con la rentabilidad y la incapacidad de ejecutar la IA a escala. Teniendo en cuenta este panorama, las empresas no pueden darse el lujo de no replantearse sus arquitecturas de datos.
En Cloudera, definimos la apertura como una arquitectura de gestión de datos de tres capas (véase la Figura 1):
Computación abierta: la capacidad de usar cualquier motor independientemente de dónde se almacenen los datos
Catálogo abierto: la capacidad de intercambiar e interoperar entre diferentes capas de acceso a datos, garantizando que el esquema y el gobierno sean consistentes independientemente del motor de visualización.
Datos abiertos: la capacidad de mover y acceder a los activos de datos dondequiera que se encuentren.
En términos más generales, la apertura está en el corazón de lo que somos en Cloudera:
Primer defensor de Apache Iceberg: Cloudera comenzó a admitir Iceberg en nuestro Lakehouse en la nube pública en 2021. Otros proveedores siguieron rápidamente su ejemplo, reconociendo implícitamente a Iceberg como el ganador de la guerra de formatos de tabla abierta. En 2024, Databricks adquirió Tabular, en parte debido a su gobierno abierto y sus sofisticadas funcionalidades. En 2025, tanto Snowflake como Amazon Web Services (AWS) invirtieron en ampliar el soporte y las funciones de Iceberg.
Base y ecosistema de código abierto: profundamente arraigada en la comunidad de código abierto desde su fundación en 2008, Cloudera fue la primera empresa en comercializar tecnología de lagos de datos de código abierto y sigue contribuyendo y apoyando más de 50 proyectos de código abierto. Nuestra fundación de código abierto ofrece libertad de elección al permitir a nuestros clientes optar por las distribuciones de Cloudera de forma mucho más sencilla en comparación con los proveedores cuyos recubrimientos propietarios los bloquean. Los clientes de Cloudera no tienen que quedarse; eligen quedarse.
Interoperabilidad en todo el sistema de gestión de datos: el suministro de datos, catálogos y procesamiento abiertos garantiza la interoperabilidad en cada nivel del sistema de gestión de datos para que nuestros clientes puedan ganar realmente en la era de la IA sin tener que crear desde cero. Además, Cloudera ofrece la flexibilidad de usar cualquier motor de cómputo o datos terrestres en cualquier proveedor de servicios en la nube (CSP), y proporciona acceso completo a las funcionalidades independientemente de dónde residan los datos o qué motor de cómputo se utilice. Por el contrario, algunos proveedores restringen el acceso a las funciones en función de si todas las capas de la pila se ejecutan en la misma plataforma. Posee tus datos. Controla tus datos. Usa tus datos: esa es la promesa de Cloudera.
Para profundizar en la importancia de la apertura en la era de la IA, lee nuestro blog: The Future Delivered Today: The AI-Powered Data Lakehouse.
This may have been caused by one of the following: