ClouderaNOW24     Vea las últimas innovaciones de Cloudera

Ver ahora
  • Cloudera Cloudera
  • Descripción

    Implemente una amplia variedad de análisis en la nube pública de forma rápida y sencilla.

    CDP Data Hub es un potente servicio de análisis en Cloudera Data Platform (CDP) Public Cloud que simplifica y agiliza la obtención de análisis Edge to AI de gran valor en un modelo de clúster en la nube con el que está familiarizado. Con la más amplia gama de cargas de trabajo analíticas (para transmisión, ETL, data marts, bases de datos y aprendizaje automático, entre otros), CDP Data Hub le permite trasladar fácilmente sus cargas de trabajo existentes del entorno local a la nube, o bien crear nuevas cargas de trabajo directamente en la nube.

    Esta solución integral basada en la nube cuenta con Cloudera Runtime, un conjunto de tecnologías integradas de código abierto, y se basa en SDX. Además, ofrece una amplia variedad de formas de clúster, tipos de cargas de trabajo, plantillas prediseñadas y opciones de configuración, lo que proporciona una experiencia intuitiva y personalizable para los usuarios acostumbrados a las arquitecturas tradicionales.

    Casos de uso de Data Hub

    Simplifique su migración a la nube

    Realoje fácilmente las cargas de trabajo locales de Cloudera en la nube pública gracias a una plataforma que abarca tanto nubes públicas como privadas y que, además, le proporciona:

    • El rendimiento mejorado, el gobierno sólido y la disponibilidad propios de la nube pública
    • Flexibilidad para optimizar sus cargas de trabajo en ambos modelos de implementación
    • Las ventajas de un factor de forma conocido con un modelo de clúster tradicional que facilita su migración a la nube 
    • Un proceso de migración fluido hacia las experiencias en contenedores de CDP 
    Implemente cargas de trabajo complejas con varios análisis de forma rápida

    Agilice la implementación de cargas de trabajo complejas en la nube pública en todo el ciclo de vida de los datos gracias a lo siguiente: 

    • Una arquitectura basada en la nube que le permite implementar una amplia variedad de cargas de trabajo de análisis flexibles y personalizadas 
    • Una experiencia intuitiva mediante clústeres basados en nodos con los que está familiarizado, independientemente de si usa plantillas prediseñadas o crea sus propias cargas de trabajo
    • Un alto grado de personalización, el cual le permite implementar cargas de trabajo adaptadas a sus necesidades empresariales específicas

    Selección de cargas de trabajo

    • Data marts en tiempo real
    • Ingeniería de datos para canalizaciones complejas
    • Transmisión en la nube híbrida
    • Base de datos operacional

    Data marts en tiempo real


    Permita el análisis de grandes volúmenes de datos que cambian rápidamente. 

    La plantilla de data marts en tiempo real de Data Hub le permite ingerir millones de registros por segundo, con actualizaciones puntuales según sea necesario. Los datos están disponibles al instante en un formato óptimo para realizar consultas. Este modelo es ideal para aplicaciones de series temporales, análisis de eventos, conciliación de datos modificados y canalizaciones de procesamiento de datos en tiempo real. La plantilla cuenta con el motor de almacenamiento analítico Apache Kudu, Apache Impala para una ejecución rápida de SQL, HUE para el desarrollo y análisis de SQL, y Apache Spark Streaming para el procesamiento y análisis de flujos de datos.

     

    Ingeniería de datos para canalizaciones complejas


    Enriquezca, transforme y cargue sus datos. 

    Data Hub le permite enriquecer, transformar y, también, limpiar los datos para crear, ejecutar y gestionar canalizaciones de datos de extremo a extremo con un alto nivel de flexibilidad y personalización. Con la plantilla de ingeniería de datos, Data Engineering, puede ejecutar una amplia variedad de cargas de trabajo de tratamiento de datos, incluido el procesamiento de flujos de datos en tiempo real y por lotes mediante Apache Spark y Hive.

    Transmisión en la nube híbrida



    Recopile, procese y genere análisis en tiempo real.

    DataFlow para CDP Data Hub es una plataforma integral de datos en transmisión del perímetro a la nube, la cual aborda algunos de los desafíos de los datos en transmisión en entornos híbridos con Apache NiFi y Kafka. Permite a los usuarios extender la misma experiencia de transmisión local de Cloudera DataFlow a la nube sin requerir gran cantidad de recursos para el desarrollo, la configuración y el mantenimiento.

    Más información sobre los servicios de DataFlow en la nube

    Base de datos operativa


    Cree aplicaciones de nivel empresarial altamente fiables. 

    Data Hub le permite ejecutar bases de datos de NoSQL de alto rendimiento compatibles con ANSI SQL. Esto proporciona una escala y un rendimiento incomparables para las aplicaciones operativas cruciales para la empresa con Apache Hbase. La base de datos operacional admite un esquema evolutivo que permite a los desarrolladores aprovechar los datos al máximo y, a su vez, mantener la flexibilidad en el diseño de las aplicaciones. También ofrece funciones de escalado automático en función del uso de cargas de trabajo del clúster para optimizar la utilización y los costes de la infraestructura.

    Características

    Data Hub es aconsejable para usuarios que buscan flexibilidad, escalabilidad y facilidad de uso. Le permite redistribuir los roles de los empleados, configurar la compatibilidad con GPU, ajustar los valores de gestión de recursos y personalizar los clústeres para implementar casos de uso complejos y multifunción a escala.

    Los clústeres de Data Hub se pueden aprovisionar y quitar rápidamente con opciones de configuración prediseñadas o personalizadas para la infraestructura. Las definiciones de clústeres preconfiguradas con ajustes específicos del proveedor de servicios en la nube, así como las plantillas de clúster con configuraciones de servicio de Cloudera Runtime, le permiten aprovisionar rápidamente clústeres de carga de trabajo para casos de uso prescriptivos. También puede guardar sus propias definiciones de clúster y sus propias plantillas para volver a usarlas en el futuro.

    Data Hub le permite migrar fácilmente sus cargas de trabajo heredadas a un modelo en la nube en un factor de forma conocido. La arquitectura basada en la nube es independiente de la infraestructura de procesamiento, y la capa de distribución de datos se extrae de los datos sin procesar. Esta arquitectura independiente mejora considerablemente la flexibilidad, la agilidad, la protección de datos y la escalabilidad.

    Es fácil asignar varios clústeres a datos compartidos, de modo que los clientes puedan lanzar nuevas aplicaciones completamente aisladas con la seguridad y el gobierno adecuados, y sin interrumpir sus aplicaciones de producción en uso.

    Data Hub está respaldado por Cloudera SDX, que le permite proteger y administrar los datos y los metadatos de la plataforma, además de controlar y gestionar las capacidades con interfaces específicas e integradas. Las políticas de seguridad, gobierno y control de los datos se configuran una sola vez y se aplican de forma coherente, lo que permite reducir los costes operativos y los riesgos empresariales, así como disfrutar de flexibilidad y diversas opciones de infraestructura.

    Data Hub está integrado en Cloudera Runtime, la distribución principal de software de código abierto de CDP que incluye aproximadamente 50 proyectos de código abierto. Runtime le permite utilizar el conjunto adecuado de herramientas de código abierto para crear cargas de trabajo y aplicaciones.

    ¿Necesita analizarlo en detalle?


    Experimente por sí mismo Data Hub en Cloudera Data Platform

    Datasheet

    CloudSmart: Inicie su proceso de adopción de los análisis en la nube

    Webinar

    Escale el análisis en la nube pública con confianza

    Ebook

    3 pasos para migrar con éxito a la nube pública

    Solution Brief

    Consiga mejores resultados en el sector sanitario con Cloudera e IQVIA

    Formación, asistencia técnica y servicios de primera clase

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.