Enseñamos al mundo el valor del Big Data con el código abierto, y nuestra firme creencia en el valor del código abierto, los estándares abiertos y los mercados abiertos están impulsando la próxima ola de innovación.
Innovación de código abierto
Algunos proveedores consumen la actividad de la comunidad de código abierto; otros ayudan a impulsarla. Cloudera lidera la evolución de las plataformas de datos, análisis e IA mediante la creación, contribución y soporte de capacidades nuevas y diferenciadas que satisfacen tus requisitos de seguridad, escala y usabilidad.
Tradición de código abierto
Cloudera cuenta con una larga y probada trayectoria en la identificación, selección y apoyo de estándares abiertos (entre los que se incluyen Apache Iceberg, Apache Nifi y Apache Ozone) que proporcionan la arquitectura principal y a largo plazo sobre la que se basan los casos de uso empresariales nuevos y existentes.
Las más altas exigencias empresariales
Para garantizar la mejor experiencia del cliente, Cloudera invierte muchos recursos en realizar pruebas multidimensionales con cargas de trabajo reales antes de los lanzamientos, implementa y mantiene políticas de seguridad basadas en las mejores prácticas del sector y los requisitos normativos, y respalda la plataforma mediante una amplia participación en la comunidad de código abierto.
Cloudera Data Flow
impulsado por Apache NiFi
Cloudera Data Flow es un servicio de datos nativo en la nube basado en Apache NiFi que facilita la distribución universal de datos agilizando el proceso integral de movimiento de datos.
Cloudera Object Store
impulsado por Apache Ozone
En el centro de datos, Cloudera Object Store ofrece almacenamiento de objetos nativo en la nube y de alta densidad, para el almacenamiento de datos a gran escala y con gran eficiencia gracias a Apache Ozone.
Cloudera Open Data Lakehouse
con tecnología Apache Iceberg
El lakehouse de datos de Cloudera se basa en Iceberg, el formato de tabla abierta estándar del sector, que ofrece un alto rendimiento a cualquier escala y se integra con el ecosistema más amplio de motores de computación.
Cloudera está comprometida con la ética del código abierto, incluido el éxito de los proyectos y comunidades de código abierto.
Más de 200
puestos de committers de Apache
Más de 50
puestos de PMC
>55
proyectos en curso
Nuestro ecosistema de código abierto
La plataforma Cloudera aprovecha un gran ecosistema de proyectos y tecnologías de código abierto que se unen para crear una verdadera plataforma híbrida de datos, análisis e IA. Cloudera cuenta con una amplia y probada trayectoria en la creación, contribución y apoyo a la innovación de código abierto para su aplicación en entornos empresariales.
Apache Accumulo
Un almacén de valores clave ordenado y distribuido con acceso a base de células.
Apache Airflow
Plataforma de gestión de flujos de trabajo para canalizaciones de ingeniería de datos.
Apache Arrow
Marco de software para el desarrollo de análisis de procesamiento de datos en columnas.
Apache Atlas
Cumplimiento normativo empresarial ágil a través de metadatos.
Apache Avro
Marco de serialización de datos y llamadas a procedimientos remotos orientado a filas.
Apache Calcite
Marco para la creación de bases de datos y sistemas de gestión de datos.
Apache Flink
Un marco de procesamiento de flujos en tiempo real para aplicaciones y análisis de Big Data.
Apache Hadoop
Un marco de procesamiento y almacenamiento distribuido para tareas de procesamiento de datos a gran escala.
Apache HBase
Una base de datos no relacional (NoSQL) que funciona sobre HDFS.
Apache Hive
El estándar predeterminado para las consultas SQL en Hadoop.
Apache Iceberg
Un formato de tabla abierta para análisis a gran escala, que ofrece la fiabilidad y la simplicidad de las tablas SQL.
Apache Impala
La base de datos de MPP de análisis de código abierto para Apache Hadoop que ofrece información estratégica en tiempo récord.
Apache Kafka
Un sistema de mensajería rápido, escalable y tolerante a fallos
Apache Knox Gateway
Un punto de entrada seguro para clústeres Hadoop.
Apache Kudu
Almacenamiento para casos de uso que requieren un análisis rápido de datos que cambian con rapidez.
Apache Livy
Interfaz REST para clústeres de Spark.
Apache Nifi
Una plataforma de logística de datos integrados en tiempo real y de procesamiento de eventos sencillos.
Apache Oozie
El proyecto para Hadoop empresarial, incluidas sus capas originales de almacenamiento y procesamiento de datos.
Apache Orc
Formato de almacenamiento de datos orientado a columnas optimizado para operaciones de lectura.
Apache Ozone
Almacén de objetos distribuidos altamente escalable con API compatibles con S3.
Apache Parquet
Formato de almacenamiento de datos orientado a columnas optimizado para el funcionamiento WORM.
Apache Phoenix
Un motor de base de datos relacional masivamente paralelo que soporta OLTP para Hadoop utilizando Apache HBase.
Apache Ranger
Seguridad integral para Enterprise Hadoop.
Apache Solr
Indexación rápida y búsqueda en Hadoop.
Apache Spark
Spark añade a Hadoop computación en memoria para ETL, IA y cargas de trabajo de ciencia de datos.
Apache Sqoop
Transferencia eficiente de datos masivos entre Apache Hadoop y almacenes de datos estructurados.
Apache Tez
Un marco para aplicaciones de procesamiento de datos basadas en YARN en Hadoop.
Apache YARN
El centro arquitectónico de Enterprise Hadoop.
Apache Zeppelin
Un cuaderno basado en web completamente abierto que permite hacer análisis de datos interactivos.
Apache ZooKeeper
Un servidor de código abierto que coordina procesos distribuidos de forma fiable.
Docker
Contenerización mediante virtualización a nivel de sistema operativo.
HUE
Un banco de trabajo de SQL de código abierto para almacenes de datos.
Tensorflow
Biblioteca de software para aprendizaje automático e inteligencia artificial.
