• Cloudera Cloudera
  • Apache Zeppelin

    Un cuaderno basado en web completamente abierto que permite hacer análisis de datos interactivos

    Apache Zeppelin es un nuevo cuaderno multifunción basado en web en proceso de desarrollo que ofrece funciones de colaboración y uso compartido, exploración e ingesta de datos a Hadoop y Spark.

    Finalidad de Zeppelin

    Los cuadernos interactivos basados en navegador permiten a los ingenieros de datos, los analistas de datos y los científicos de datos aumentar su productividad al permitirles desarrollar, organizar, ejecutar y compartir código, y visualizar los resultados sin recurrir a la línea de comandos y sin necesitar los detalles del clúster. Los cuadernos permiten a estos usuarios, no solo ejecutar, sino también trabajar interactivamente con flujos de trabajo largos. En Spark hay varios cuadernos disponibles. iPython sigue siendo una opción consolidada y un gran ejemplo de cuaderno para ciencia de datos. La Hortonworks Gallery proporciona una definición de pila de Ambari para ayudar a nuestros clientes a configurar iPython rápidamente en sus clústeres Hadoop.  

    Apache Zeppelin es un nuevo cuaderno basado en web que incorpora funciones de colaboración y uso compartido, visualización y exploración de datos a Spark.   Es compatible con Python, pero también con una lista cada vez mayor de lenguajes de programación, como Scala, Hive, SparkSQL, Shell y Markdown.

    zeppelin_medical

    La compatibilidad con los distintos lenguajes se logra gracias a los intérpretes de lenguajes de Zeppelin.  

    La detección de datos, la exploración, la elaboración de informes y la visualización de datos son componentes clave del flujo de trabajo de la ciencia de datos. Zeppelin es una moderna plataforma de ciencia de datos compatible de serie con Spark y Hive. De hecho, Zeppelin puede trabajar con back-ends que admiten varios lenguajes, por lo que es compatible con un ecosistema de fuentes de datos cada vez mayor. Los cuadernos de Zeppelin ofrecen a los científicos de datos una experiencia interactiva con snippets en fragmentos comprensibles. En la Hortonworks Gallery se puede consultar una recopilación de cuadernos de Zeppelin.


    Asimismo, si ha finalizado un cuaderno y encuentra información estratégica que le gustaría compartir, puede crear fácilmente un informe e imprimirlo o enviarlo.

    zeppelinReport

    En Cloudera, creemos que Spark y Hadoop hacen muy buena pareja. Además, creemos que Zeppelin es un componente esencial para acelerar las soluciones de ciencia de datos.

     

    Mejoras recientes de los cuadernos basados en web

    El proceso de discusión de datos sigue planteando dificultades, incluso con cuadernos. Los científicos de datos suelen encontrar dificultades a la hora de diseñar características; seleccionar algoritmos; adaptar su trabajo y compartirlo con otros, e implementar su trabajo en la producción.

    Trabajamos para mejorar el cuaderno de Zeppelin para la comunidad. Hemos incorporado un intérprete de Hive en Zeppelin y estamos mejorando el editor para tratar de que sea más estable.  Nos estamos implicando con mayor profundidad en la comunidad de Zeppelin para ayudar a ofrecer funciones de seguridad, estadísticas de resúmenes y sensibilidad al contexto para intentar mejorar el proceso de desarrollo de datos.

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.