small image Libro electrónico: Apache NiFi for Dummies
Descripción

La flexibilidad de un lago de datos y el rendimiento de un almacén de datos en una única plataforma.

Un lago de datos abierto ayuda a las empresas a realizar análisis rápidos de todos los datos, tanto estructurados como no estructurados, a gran escala. Elimina los silos de datos y permite a los equipos de datos colaborar en los mismos datos, con las herramientas que prefieran, en cualquier nube pública y privada.

Esta arquitectura de datos moderna proporciona datos de confianza y permite una gestión fácil de los datos.  Aplique BI, IA, aprendizaje automático y análisis de flujos de datos en tiempo real en los mismos datos sin tener que moverlos ni bloquearlos en ningún momento.

Cloudera Data Platform (CDP) ofrece el único lago de datos abierto del mundo que tiene las siguientes ventajas:

Arquitectura abierta

El lago de datos de Cloudera, con tecnología de Apache Iceberg, es 100 % abierto: código abierto, basado en estándares abiertos ampliamente adoptados. Puede almacenar múltiples formatos de datos y permite que varios motores trabajen con los mismos datos.

Facilidad de adopción

Al integrar Iceberg directamente en Shared Data Experience (SDX), Cloudera ofrece la forma más fácil de implementar un lago de datos. Otras funcionalidades, como la evolución del esquema, la partición oculta, etc., simplifican la gestión de datos para grandes conjuntos de datos.

Multinube

Cree un lago de datos en cualquier lugar, en cualquier nube pública o en su propio centro de datos. Créelo una vez y ejecútelo donde quiera sin tener que preocuparse más. Cloudera ofrece los mismos servicios de datos con portabilidad total en todas las nubes.

Seguridad y gobernanza

La integración de las tablas de Iceberg en CDP con SDX permite una seguridad unificada, políticas detalladas, gobernanza, linaje y gestión de metadatos de múltiples nubes, para que pueda centrarse en analizar sus datos mientras nosotros nos encargamos del resto.

El lakehouse de datos abierto de Cloudera ya está disponible en la nube privada.
Componentes esenciales
 

Potencie sus datos con un lago de datos abierto

Análisis multifunción

Cloudera Data Platform proporciona una amplia gama de servicios de datos para aplicar IA, aprendizaje automático, BI, análisis de flujos de datos en tiempo real e ingeniería de datos en su lago de datos. Los servicios de datos potentes y escalables brindan importantes funciones analíticas, desde la ingesta y la transmisión de datos hasta el procesamiento y la persistencia, la orquestación, la detección y el acceso a datos. Además, puede usar las herramientas de su elección.

Análisis multifunción

Cloudera Data Platform proporciona una amplia gama de servicios de datos para aplicar IA, aprendizaje automático, BI, análisis de flujos de datos en tiempo real e ingeniería de datos en su lago de datos. Los servicios de datos potentes y escalables brindan importantes funciones analíticas, desde la ingesta y la transmisión de datos hasta el procesamiento y la persistencia, la orquestación, la detección y el acceso a datos. Además, puede usar las herramientas de su elección.

 

 


Formato de tabla abierta: Apache Iceberg

Apache Iceberg es la clave del lago de datos abierto. Se trata de un formato de tabla abierta de alto rendimiento para grandes tablas de análisis que aporta la fiabilidad de las tablas de SQL a big data, al tiempo que hace posible que varios motores de procesamiento funcionen simultáneamente. Ofrece funciones avanzadas como viajes en el tiempo, aislamiento de instantáneas, evolución del esquema, partición oculta y mucho más.


Formato de tabla abierta: Apache Iceberg

Apache Iceberg es la clave del lago de datos abierto. Se trata de un formato de tabla abierta de alto rendimiento para grandes tablas de análisis que aporta la fiabilidad de las tablas de SQL a big data, al tiempo que hace posible que varios motores de procesamiento funcionen simultáneamente. Ofrece funciones avanzadas como viajes en el tiempo, aislamiento de instantáneas, evolución del esquema, partición oculta y mucho más.

 

 

Shared Data Experience (SDX)

SDX es una parte fundamental de CDP que ofrece tecnologías de seguridad y gobernanza unificadas basadas en metadatos. Al proporcionar una gestión completa de datos y análisis en todas las infraestructuras y en cualquier lugar, SDX reduce el riesgo y los costes operativos. El departamento de IT puede implementar lagos de datos seguros y gobernados más rápido, dando a más usuarios acceso a más datos, sin concesiones.

Shared Data Experience (SDX)

SDX es una parte fundamental de CDP que ofrece tecnologías de seguridad y gobernanza unificadas basadas en metadatos. Al proporcionar una gestión completa de datos y análisis en todas las infraestructuras y en cualquier lugar, SDX reduce el riesgo y los costes operativos. El departamento de IT puede implementar lagos de datos seguros y gobernados más rápido, dando a más usuarios acceso a más datos, sin concesiones.

 

 

Catálogo de datos sólido

Encuentre, seleccione y etiquete datos en cualquier lugar y en todas las infraestructuras, y genere información estratégica relevante con Cloudera Data Catalog para lograr lo siguiente: 

  • Buscar, visualizar y acceder a todos sus datos desde un solo lugar 

  • Comprender, documentar y supervisar los datos y su uso

  • Colaborar y compartir datos responsablemente con toda la información

Catálogo de datos sólido

Encuentre, seleccione y etiquete datos en cualquier lugar y en todas las infraestructuras, y genere información estratégica relevante con Cloudera Data Catalog para lograr lo siguiente: 

  • Buscar, visualizar y acceder a todos sus datos desde un solo lugar 

  • Comprender, documentar y supervisar los datos y su uso

  • Colaborar y compartir datos responsablemente con toda la información

 

 

 

 

Logotipo de Hello Fresh

NEW YORKER usa información estratégica para identificar tendencias y reducir el desabastecimiento. El lago de datos ayuda al minorista global NEW YORKER a anticipar las necesidades de los clientes para mejorar su experiencia de compra en la tienda.

 

"La reputación, la fiabilidad, la escalabilidad, la velocidad y la excelente atención al cliente de Cloudera Data Platform fueron los factores clave que nos llevaron a su elección".

—Steffen Minz, director de Ciencia de datos, NEW YORKER

Logotipo de Hello Fresh

NEW YORKER usa información estratégica para identificar tendencias y reducir el desabastecimiento. El lago de datos ayuda al minorista global NEW YORKER a anticipar las necesidades de los clientes para mejorar su experiencia de compra en la tienda.

 

"La reputación, la fiabilidad, la escalabilidad, la velocidad y la excelente atención al cliente de Cloudera Data Platform fueron los factores clave que nos llevaron a su elección".

—Steffen Minz, director de Ciencia de datos, NEW YORKER

Miniatura del informe de Forrester

Utilice la IA a través de un lakehouse de datos de extremo a extremo para aumentar la eficiencia del ciclo de vida de los datos

Recursos
 

Descubra más información sobre la gestión de datos en cualquier lugar

Webinar

Cómo el lakehouse de datos abierto posibilita la IA empresarial

Whitepaper

Serie de arquitecturas de datos: lago de datos abierto

Formación, asistencia técnica y servicios de primera clase

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.