Descripción
Implemente una amplia variedad de análisis en la nube pública de forma rápida y sencilla.
CDP Data Hub es un potente servicio de análisis en Cloudera Data Platform (CDP) Public Cloud que simplifica y agiliza la obtención de análisis Edge to AI de gran valor en un modelo de clúster en la nube con el que está familiarizado. Con la más amplia gama de cargas de trabajo analíticas (para transmisión, ETL, data marts, bases de datos y aprendizaje automático, entre otros), CDP Data Hub le permite trasladar fácilmente sus cargas de trabajo existentes del entorno local a la nube, o bien crear nuevas cargas de trabajo directamente en la nube.
Esta solución integral basada en la nube cuenta con Cloudera Runtime, un conjunto de tecnologías integradas de código abierto, y se basa en SDX. Además, ofrece una amplia variedad de formas de clúster, tipos de cargas de trabajo, plantillas prediseñadas y opciones de configuración, lo que proporciona una experiencia intuitiva y personalizable para los usuarios acostumbrados a las arquitecturas tradicionales.
Casos de uso de Data Hub
Simplifique su migración a la nube
Realoje fácilmente las cargas de trabajo locales de Cloudera en la nube pública gracias a una plataforma que abarca tanto nubes públicas como privadas y que, además, le proporciona:
- El rendimiento mejorado, el gobierno sólido y la disponibilidad propios de la nube pública
- Flexibilidad para optimizar sus cargas de trabajo en ambos modelos de implementación
- Las ventajas de un factor de forma conocido con un modelo de clúster tradicional que facilita su migración a la nube
- Un proceso de migración fluido hacia las experiencias en contenedores de CDP
Implemente cargas de trabajo complejas con varios análisis de forma rápida
Agilice la implementación de cargas de trabajo complejas en la nube pública en todo el ciclo de vida de los datos gracias a lo siguiente:
- Una arquitectura basada en la nube que le permite implementar una amplia variedad de cargas de trabajo de análisis flexibles y personalizadas
- Una experiencia intuitiva mediante clústeres basados en nodos con los que está familiarizado, independientemente de si usa plantillas prediseñadas o crea sus propias cargas de trabajo
- Un alto grado de personalización, el cual le permite implementar cargas de trabajo adaptadas a sus necesidades empresariales específicas
Selección de cargas de trabajo
Data marts en tiempo real
Ingeniería de datos para canalizaciones complejas
Transmisión en la nube híbrida
Base de datos operacional
Data marts en tiempo real
Permita el análisis de grandes volúmenes de datos que cambian rápidamente.
La plantilla de data marts en tiempo real de Data Hub le permite ingerir millones de registros por segundo, con actualizaciones puntuales según sea necesario. Los datos están disponibles al instante en un formato óptimo para realizar consultas. Este modelo es ideal para aplicaciones de series temporales, análisis de eventos, conciliación de datos modificados y canalizaciones de procesamiento de datos en tiempo real. La plantilla cuenta con el motor de almacenamiento analítico Apache Kudu, Apache Impala para una ejecución rápida de SQL, HUE para el desarrollo y análisis de SQL, y Apache Spark Streaming para el procesamiento y análisis de flujos de datos.
Ingeniería de datos para canalizaciones complejas
Enriquezca, transforme y cargue sus datos.
Data Hub le permite enriquecer, transformar y, también, limpiar los datos para crear, ejecutar y gestionar canalizaciones de datos de extremo a extremo con un alto nivel de flexibilidad y personalización. Con la plantilla de ingeniería de datos, Data Engineering, puede ejecutar una amplia variedad de cargas de trabajo de tratamiento de datos, incluido el procesamiento de flujos de datos en tiempo real y por lotes mediante Apache Spark y Hive.
Transmisión en la nube híbrida
Recopile, procese y genere análisis en tiempo real.
DataFlow para CDP Data Hub es una plataforma integral de datos en transmisión del perímetro a la nube, la cual aborda algunos de los desafíos de los datos en transmisión en entornos híbridos con Apache NiFi y Kafka. Permite a los usuarios extender la misma experiencia de transmisión local de Cloudera DataFlow a la nube sin requerir gran cantidad de recursos para el desarrollo, la configuración y el mantenimiento.
Base de datos operativa
Cree aplicaciones de nivel empresarial altamente fiables.
Data Hub le permite ejecutar bases de datos de NoSQL de alto rendimiento compatibles con ANSI SQL. Esto proporciona una escala y un rendimiento incomparables para las aplicaciones operativas cruciales para la empresa con Apache Hbase. La base de datos operacional admite un esquema evolutivo que permite a los desarrolladores aprovechar los datos al máximo y, a su vez, mantener la flexibilidad en el diseño de las aplicaciones. También ofrece funciones de escalado automático en función del uso de cargas de trabajo del clúster para optimizar la utilización y los costes de la infraestructura.