Enseñamos al mundo el valor del Big Data con el código abierto, y nuestra firme creencia en el valor del código abierto, los estándares abiertos y los mercados abiertos están impulsando la próxima ola de innovación.
Innovar el mundo del código abierto
Algunos proveedores consumen la actividad de la comunidad de código abierto; otros ayudan a impulsarla. Cloudera lidera la influencia en la evolución de la plataforma Hadoop mediante la creación, contribución y soporte de nuevas capacidades que satisfacen sus requisitos de seguridad, escalabilidad y facilidad de uso.
Tradición de código abierto
Cloudera lleva muchos años identificando, seleccionando y promoviendo los estándares de código abierto —incluyendo Apache HBase, Apache Spark y Apache Kafka—, que proporcionan la arquitectura principal a largo plazo sobre la cual se crean nuevos casos de uso para los clientes.
Los más altos requerimientos empresariales
Para garantizar la mejor experiencia del cliente, Cloudera invierte muchos recursos para testear a nivel multidimensional cargas de trabajo reales antes de publicar cada versión, así como para comprobar la compatibilidad de toda la plataforma a través de una amplia participación en la comunidad de código abierto.
Nuestras contribuciones a la comunidad de código abierto garantizan que recibamos a cambio las últimas innovaciones
Más de
200
puestos de committers de Apache
65
puestos de PMC en 22 proyectos
>35
proyectos
Nuestro ecosistema de código abierto
Apache Hadoop es una plataforma de software de código abierto para el almacenamiento y procesamiento distribuidos de grandes conjuntos de datos en clústeres informáticos construidos del hardware de productos básicos. Los servicios de Hadoop son fundamentales para el almacenamiento de datos, el procesamiento de datos, el acceso a los datos, la gobernanza de datos, la seguridad y las operaciones.
Apache Accumulo
Un almacén de valores clave ordenado y distribuido con acceso a base de células.
Apache Atlas
Cumplimiento normativo empresarial ágil a través de metadatos.
Apache Flink
Un marco de procesamiento de flujos en tiempo real para aplicaciones y análisis de Big Data.
Apache Hadoop
Un marco de procesamiento y almacenamiento distribuido para tareas de procesamiento de datos a gran escala.
Apache HBase
Una base de datos no relacional (NoSQL) que funciona sobre HDFS.
Apache Hive
El estándar predeterminado para las consultas SQL en Hadoop.
Apache Iceberg
Un formato de tabla abierta para análisis a gran escala, que ofrece la fiabilidad y la simplicidad de las tablas SQL.
Apache Impala
La base de datos de MPP de análisis de código abierto para Apache Hadoop que ofrece información estratégica en tiempo récord.
Apache Kafka
Un sistema de mensajería rápido, escalable y tolerante a fallos
Apache Knox Gateway
Un punto de entrada seguro para clústeres Hadoop.
Apache Kudu
Almacenamiento para casos de uso que requieren un análisis rápido de datos que cambian con rapidez.
Apache Nifi
Una plataforma de logística de datos integrados en tiempo real y de procesamiento de eventos sencillos.
Apache Oozie
El proyecto para Hadoop empresarial, incluidas sus capas originales de almacenamiento y procesamiento de datos.
Apache Phoenix
Un motor de base de datos relacional masivamente paralelo que soporta OLTP para Hadoop utilizando Apache HBase.
Apache Ranger
Seguridad integral para Enterprise Hadoop.
Apache Solr
Indexación rápida y búsqueda en Hadoop.
Apache Spark
Spark incorpora cálculo en memoria para ETL, aprendizaje automático y cargas de trabajo de ciencia de datos a Hadoop.
Apache Sqoop
Transferencia eficiente de datos masivos entre Apache Hadoop y almacenes de datos estructurados.
Apache Tez
Un marco para aplicaciones de procesamiento de datos basadas en YARN en Hadoop.
Apache YARN
El centro arquitectónico de Enterprise Hadoop.
Apache Zeppelin
Un cuaderno basado en web completamente abierto que permite hacer análisis de datos interactivos.
Apache ZooKeeper
Un servidor de código abierto que coordina procesos distribuidos de forma fiable.
HDFS
Un sistema de archivos distribuido diseñado para almacenar y gestionar una gran cantidad de datos.
HUE
Un banco de trabajo de SQL de código abierto para almacenes de datos.