• Cloudera Cloudera
  • Apache ZooKeeper

    Un servidor de código abierto que coordina procesos distribuidos de forma fiable

    Apache ZooKeeper ofrece servicios operacionales para un clúster Hadoop. ZooKeeper proporciona un servicio de configuración distribuido, un servicio de sincronización y un registro de nomenclatura para sistemas distribuidos. Las aplicaciones distribuidas utilizan Zookeeper para almacenar y coordinar las actualizaciones de información sobre configuración importante.

    Finalidad de ZooKeeper

    ZooKeeper ofrece una interfaz y unos servicios muy sencillos. ZooKeeper aporta estas ventajas clave:

    • Rapidez: ZooKeeper es especialmente rápido con cargas de trabajo en las cuales se leen datos con más frecuencia que se escriben. La relación ideal de lectura/escritura se sitúa alrededor de 10:1.
    • Fiable: ZooKeeper se replica en una serie de hosts (lo que se conoce como conjunto) y los servidores trabajan de manera coordinada. Siempre y cuando haya disponible una masa crítica de servidores, el servicio de ZooKeeper estará disponible. No hay ningún punto de fallo.
    • Sencillez: ZooKeeper mantiene un espacio de nombres jerárquico estándar, similar al de los archivos y los directorios.
    • Ordenado: el servicio lleva un registro de todas las transacciones, que se pueden usar para abstracciones de nivel superior, como las primitivas de sincronización.

    Cómo funciona ZooKeeper

    ZooKeeper permite que los procesos distribuidos se coordinen entre sí a través de un espacio de nombres jerárquico compartido de registros de datos, denominados znodes. Todos los nodos znode tienen una ruta que los identifica, en la cual los elementos se separan mediante barras (“/”). Salvo el raíz, todos los znodes tienen un primario y no se pueden borrar si tienen secundarios.

    En este sentido, es muy similar a los sistemas de archivos normales, pero ZooKeeper ofrece un nivel de fiabilidad superior gracias a los servicios redundantes. Un servicio se replica a través de un conjunto de equipos y cada uno mantiene una imagen en memoria del árbol de datos y los registros de transacciones. Los clientes se conectan a un único servidor de ZooKeeper y mantienen una conexión TCP a través de la cual envían solicitudes y reciben respuestas.

    Esta arquitectura permite a ZooKeeper ofrecer un elevado rendimiento y fiabilidad con latencia baja, aunque el tamaño de la base de datos que puede gestionar ZooKeeper está limitado por la memoria.

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.