Innovar el mundo del código abierto
Algunos proveedores son consumidores de la actividad de la comunidad de código abierto; otros son sus creadores. Cloudera lidera la evolución e influencia de la plataforma Hadoop mediante la creación, contribución y soporte para ofrecer a los clientes soluciones conformes a los requisitos de seguridad, escalabilidad y facilidad de uso.
Tradición de código abierto
Cloudera lleva muchos años identificando, seleccionando y promoviendo los estándares de código abierto —incluyendo Apache HBase, Apache Spark y Apache Kafka—, que proporcionan la arquitectura principal a largo plazo sobre la cual se crean nuevos casos de uso para los clientes.
Lea sobre nuestro compromiso con el código abierto
Los más altos requerimientos empresariales
Para garantizar la mejor experiencia del cliente, Cloudera invierte muchos recursos para testear a nivel multidimensional cargas de trabajo reales antes de publicar cada versión, así como para comprobar la compatibilidad de toda la plataforma a través de una amplia participación en la comunidad de código abierto.
Big Data de código abierto: un ecosistema de proyectos
Apache Hadoop es una plataforma de software de código abierto para el almacenamiento distribuido y procesamiento distribuido de grandes conjuntos de datos en clústeres informáticos construidos del hardware de productos básicos. Los servicios de Hadoop proporcionan almacenamiento de datos, procesamiento de datos, acceso a los datos, gestión de datos, seguridad y operaciones.
Procesamiento de datos
Apache Accumulo
Un almacén de valores clave ordenado y distribuido con acceso a base de células.
Apache Ambari
Una plataforma de gestión completamente de código abierto para el aprovisionamiento, la gestión, la supervisión y la protección de los clústeres de Apache Hadoop.
Apache Crunch
Una biblioteca Java ofrece un marco de trabajo para escribir, probar y ejecutar procesos de MapReduce.
Apache Nifi
Una plataforma de logística de datos integrados en tiempo real y de procesamiento de eventos sencillos
Seguridad, gobernanza y metadatos
Data Warehouse
Apache Phoenix
Un motor de bases de datos relacionales, altamente paralelizado y de código abierto compatible con procesamiento de transacciones en línea (OLTP) para Hadoop que utiliza Apache HBase
Apache Sqoop
Transferencia eficiente de datos masivos entre Apache Hadoop y almacenes de datos estructurados
Docker
Diseñe, comparta y ejecute con seguridad cualquier aplicación en cualquier parte
Ingeniería de datos
Apache Druid
Un almacén de datos de análisis de código abierto para consultas de inteligencia empresarial (OLAP) sobre datos de eventos.
Apache Oozie
El modelo para Enterprise Hadoop incluye las capas de procesamiento y almacenamiento de datos originales de Apache Hadoop.
Apache Pig
Una plataforma de secuencias de comandos para procesar y analizar grandes conjuntos de datos
Apache Slider
Un marco para las aplicaciones basadas en YARN de larga ejecución en Hadoop
Apache Spark
Spark incorpora cálculo en memoria para ETL, aprendizaje automático y cargas de trabajo de ciencia de datos a Hadoop
Apache Tez
Un marco para aplicaciones de procesamiento de datos basadas en YARN en Hadoop
Apache ZooKeeper
Un servidor de código abierto que coordina procesos distribuidos de forma fiable
Operaciones
Apache Arrow
Una plataforma de desarrollo en distintos lenguajes para datos en memoria
Apache Impala
La base de datos de MPP de análisis de código abierto para Apache Hadoop que ofrece información estratégica en tiempo récord.
Apache Mahout
Para crear aplicaciones de aprendizaje automático eficientes y escalables
Apache Zeppelin
Un cuaderno basado en web completamente abierto que permite hacer análisis de datos interactivos
TensorFlow
Una plataforma de aprendizaje automático de código abierto y de extremo a extremo
Credenciales de código abierto de Cloudera
- Cloudera es la primera fuente original de la distribución de Hadoop (CDH), 100 % de código abierto y compatible, que se ha descargado más que todas las demás juntas.
- Cloudera ha contribuido con más código y funcionalidades al ecosistema de Hadoop que cualquier otro competidor.
- En la plantilla de Cloudera, se halla la mayor cantidad de contribuyentes de código y committers de los estándares de código abierto para todo el ecosistema, no solo su núcleo.
- Los empleados de Cloudera han fundado más proyectos exitosos de ecosistemas de Hadoop (más de 20) que cualquier otro competidor, incluyendo el proprio Apache Hadoop.
- Para los componentes que son compatibles con múltiples proveedores —como en el caso de estándares—, más de la mitad de todas las JIRAs de Apache que se asignan a los empleados de los proveedores de la plataforma las cierran/resuelven los empleados de Cloudera.
- Actualmente, en todos los proyectos en los que colaboramos, más de 100 ingenieros de Cloudera son committers de Apache y ocupan más de 80 escaños en el comité de gestión de proyectos.
El mejor soporte para el éxito del cliente
El equipo mundial de soporte de Cloudera para committers de proyectos en todo el ecosistema de Hadoop representa el recurso de ingeniería más grande y experimentado disponible que se dedica a tiempo completo al éxito del cliente.