Descripción
¿Por qué Apache Iceberg?
Apache Iceberg es un formato de tabla abierta diseñado específicamente para el análisis a gran escala. Ofrece la fiabilidad y simplicidad de las tablas SQL, proporcionando capacidades similares a las de un almacén de datos, directamente en el almacenamiento del lago de datos.
Apache Iceberg no es un almacenamiento, ni una base de datos, ni un motor de computación. Es una capa de gestión de metadatos que se asienta sobre sus archivos de datos, almacenados donde usted quiera. Iceberg hace que los datos sean accesibles a varios motores de computación de forma concurrente, a la vez que garantiza la fiabilidad y coherencia de los datos.
Razones para adoptar Iceberg.
Apertura
Iceberg es totalmente abierto, independiente del proveedor y del motor. Cuenta con el apoyo más amplio de la comunidad, tanto de proveedores como de no proveedores, lo que acelera la innovación imparcial.
Funcionalidad moderna de almacén de datos
Las características de Iceberg, como la coherencia transaccional, la partición oculta, la evolución del esquema y el viaje en el tiempo, facilitan las operaciones con los datos.
Análisis a escala de petabytes
Iceberg se creó desde cero, eliminando los cuellos de botella de los formatos de tabla anteriores al mantener su propia capa de metadatos.
Apache Iceberg en Cloudera.
Integramos Iceberg como ciudadano de primera clase, directamente en nuestro data lakehouse.
Ejecute análisis de alto rendimiento, ingeniería de datos, ciencia de datos e IA, mientras lleva el motor adecuado para el trabajo adecuado a sus datos in situ, eliminando el movimiento y las copias de datos.
Separe el almacenamiento de la computación. Obtenga un acceso unificado a los datos estructurados, semiestructurados y no estructurados en el lago de datos. Utilice chatbots de IA integrados para explorar y aprovechar todos sus datos.
¿Por qué ejecutar Apache Iceberg en Cloudera?
El único data lakehouse híbrido abierto impulsado por Iceberg
Implemente en cualquier lugar, en cualquier nube o en su centro de datos, dondequiera que residan sus datos
Compatibilidad multimotor
Obtenga el conjunto más amplio de servicios y capacidades de datos previamente integrados para la ingesta, el procesamiento, el análisis y la IA, con el fin de respaldar todo el ciclo de vida de sus datos.
Reduzca el TCO hasta en un 75 %
Estándar común para los datos con seguridad y gobernanza unificados, elimina el ETL, los silos de datos y las copias de datos, reduciendo el TCO hasta en un 75 %.
Beneficios del data lakehouse abierto de Cloudera, impulsado por Apache Iceberg
Democratice los datos: permita que todo el mundo acceda a información basada en datos con lenguaje natural
Acelere los análisis y la IA: implemente aplicaciones y paneles de control de IA generativa en sus datos
Mantenga los datos abiertos e interoperables: sea dueño de sus datos y aproveche las herramientas que elija
Clientes
Apache Iceberg garantiza la plena propiedad de sus datos
Participe
Blogs
Empower Your Cyber Defenders with Real-Time Analytics
Cloudera Lakehouse Optimizer Makes it Easier Than Ever to Deliver High-Performance Iceberg Tables
Databricks Follows Cloudera by Adopting Iceberg, While Snowflake Mulls Open Source Approach
Documentación
Primeros pasos con Apache Iceberg
¿Listo para empezar?