一、Apache Zeppelin 介绍

Apache Zeppelin是一种开源的Web笔记本类型交互式数据分析工具,它提供了基于浏览器的界面,允许数据工程师和科学家通过各种语言和工具,如Scala, Python, SQL, R,等等,交互式地进行数据分析、可视化以及分享。它通过解释器插件架构与不同的数据处理系统(如Apache Spark,Flink,Hive等等)进行集成,使用户能够轻松地使用和切换不同的数据处理引擎。

其主要功能包括:

1. 笔记本界面:提供了一个交互式的Web界面,用户可以轻松地编写和运行代码,查看结果,进行数据可视化,以及方便地管理和分享笔记本。

2. 多语言支持:Zeppelin支持多种语言,比如Scala, Python, R, SQL等等,让用户可以选择最适合任务的编程语言。

3. 解释器插件系统:Zeppelin通过解释器插件来支持不同的数据处理引擎,如Apache Spark,Flink,Hive等。用户可以根据需求安装不同的解释器。

4. 数据可视化:内置了一系列数据可视化工具,无需导出数据到其他平台即可进行各种图表的生成,例如柱状图、饼图、折线图和表格等。

5. 实时协作和共享:支持多人实时协作并共享笔记本,便于团队成员之间的沟通和共享分析结果。 6. 安全性:提供了基于用户和角色的访问控制系统,可以限制对笔记本和解释器的访问,确保数据安全。

总的来说,Apache Zeppelin是一款功能强大的交互式数据分析工具,它适用于数据探索、模型开发、可视化和分享等场景,为数据工程师和科学家提供了一个灵活、高效的分析平台。

ps:也可以看官网上的介绍:Zeppelin

二、快速安装(基于docker)

docker run -d --name zeppelin0.9 -p 8888:8080 apache/zeppelin:0.10.1

三、使用

安装完成之后进入页面:localhost:8888

zeppelin配置查询hive apache zeppelin教程_开发语言

 配置Interpreters

1.jdbc配置连接mysql

zeppelin配置查询hive apache zeppelin教程_java_02

zeppelin配置查询hive apache zeppelin教程_开发语言_03

2.新建notebook 选择jdbc Interpreter,运行sql 即可查询出来数据库中的数据

zeppelin配置查询hive apache zeppelin教程_linux_04

Zeppelin一些概念解释:

Interpreter:执行器,执行代码执行器,比如:jdbc、spark、python、shell、markdown等等

Notebook:可以理解为页面

Paragraph:运行的内容

一个Notebook 下可以有多个Paragraph(如下截图所示,一个Notebook两个Paragraph)

zeppelin配置查询hive apache zeppelin教程_linux_05