small image Libro electrónico: Apache NiFi for Dummies

Enseñamos al mundo el valor del Big Data con el código abierto, y nuestra firme creencia en el valor del código abierto, los estándares abiertos y los mercados abiertos están impulsando la próxima ola de innovación.

Innovar el mundo del código abierto

Algunos proveedores consumen la actividad de la comunidad de código abierto; otros ayudan a impulsarla. Cloudera lidera la influencia en la evolución de la plataforma Hadoop mediante la creación, contribución y soporte de nuevas capacidades que satisfacen sus requisitos de seguridad, escalabilidad y facilidad de uso.

Tradición de código abierto

Cloudera lleva muchos años identificando, seleccionando y promoviendo los estándares de código abierto —incluyendo Apache HBase, Apache Spark y Apache Kafka—, que proporcionan la arquitectura principal a largo plazo sobre la cual se crean nuevos casos de uso para los clientes.

Los más altos requerimientos empresariales

Para garantizar la mejor experiencia del cliente, Cloudera invierte muchos recursos para testear a nivel multidimensional cargas de trabajo reales antes de publicar cada versión, así como para comprobar la compatibilidad de toda la plataforma a través de una amplia participación en la comunidad de código abierto.

Nuestras contribuciones a la comunidad de código abierto garantizan que recibamos a cambio las últimas innovaciones

 

Más de

200

puestos de committers de Apache

65

puestos de PMC en 22 proyectos

>35

proyectos

Nuestro ecosistema de código abierto 

Apache Hadoop es una plataforma de software de código abierto para el almacenamiento y procesamiento distribuidos de grandes conjuntos de datos en clústeres informáticos construidos del hardware de productos básicos. Los servicios de Hadoop son fundamentales para el almacenamiento de datos, el procesamiento de datos, el acceso a los datos, la gobernanza de datos, la seguridad y las operaciones.

Apache Accumulo

Un almacén de valores clave ordenado y distribuido con acceso a base de células.

Apache Atlas

Cumplimiento normativo empresarial ágil a través de metadatos.

Apache Flink

Un marco de procesamiento de flujos en tiempo real para aplicaciones y análisis de Big Data.

Apache Hadoop

Un marco de procesamiento y almacenamiento distribuido para tareas de procesamiento de datos a gran escala.

Apache HBase

Una base de datos no relacional (NoSQL) que funciona sobre HDFS.

Apache Hive

El estándar predeterminado para las consultas SQL en Hadoop.

Apache Impala

La base de datos de MPP de análisis de código abierto para Apache Hadoop que ofrece información estratégica en tiempo récord.

Apache Kafka 

Un sistema de mensajería rápido, escalable y tolerante a fallos

Apache Knox Gateway 

Un punto de entrada seguro para clústeres Hadoop.

Apache Kudu

Almacenamiento para análisis ágiles de datos rápidos.

Apache Nifi

Una plataforma de logística de datos integrados en tiempo real y de procesamiento de eventos sencillos.

Apache Oozie

El modelo para Enterprise Hadoop incluye las capas de procesamiento y almacenamiento de datos originales de Apache Hadoop.

Apache Phoenix

Un motor de bases de datos relacionales, altamente paralelizado y de código abierto compatible con procesamiento de transacciones en línea (OLTP) para Hadoop que utiliza Apache HBase.

Apache Ranger

Seguridad integral para Enterprise Hadoop.

Apache Solr

Indexación rápida y búsqueda en Hadoop.

Apache Spark

Spark incorpora cálculo en memoria para ETL, aprendizaje automático y cargas de trabajo de ciencia de datos a Hadoop.

Apache Sqoop

Transferencia eficiente de datos masivos entre Apache Hadoop y almacenes de datos estructurados.

Apache Tez 

Un marco para aplicaciones de procesamiento de datos basadas en YARN en Hadoop.

Apache YARN

El centro arquitectónico de Enterprise Hadoop.

Apache Zeppelin

Un cuaderno basado en web completamente abierto que permite hacer análisis de datos interactivos.

Apache ZooKeeper 

Un servidor de código abierto que coordina procesos distribuidos de forma fiable.

HDFS 

Un sistema de archivos distribuido diseñado para almacenar y gestionar una gran cantidad de datos.

HUE

Un banco de trabajo de SQL de código abierto para almacenes de datos.

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.