Apache Zeppelin在Apache Trafodion上的可视化

在旅途

2019-06-30

介绍

Apache Trafodion和EsgynDB（Esgyn的商业版）支持数据可视化工具（例如，Apache Zeppelin和Tableau），具有标准JDBC/ODBC连接。本文重点介绍如何实现Apache Zeppelin在Trafodion上的可视化。

Apache Zeppelin基于web，数据专家可以通过该工具进行大规模数据挖掘和可视化的协作。大规模数据分析的工作流包括多个步骤，例如数据获取、预处理、可视化……。通过Zeppelin，用户可以在不同的执行块/段中创建这些步骤。这一套步骤/工作流称为Notebook。各段由解释器进行处理。Zeppelin具有几个默认的解释器。我们可以使用shell解释器、PostgreSQL解释器或JDBC解释器实现Trafodion或EsgynDB与Zepplin的集成。

架构

Zeppelin UI（客户端）连接到Zeppelin Server，然后与一个或多个解释器进行交互，以执行段落中的命令。

对于Trafodion/EsgynDB集成，我们可以使用JDBC解释器或Postgres解释器运行SQL命令，使用shell解释器在Trafodion/EsgynDB实例上运行shell命令。

Apache Zeppelin在Apache Trafodion上的可视化

为Trafodion/EsgynDB配置Zeppelin

1.将Trafodion T4 JDBC驱动器（jdbcT4.jar）复制到Zeppelin安装文件夹下的lib目录。
2.将jdbcT4.jar的所有权更改为zeppelin的用户id。使用HDP/Ambari时，会单独创建一个Zeppelin用户id。在您的系统上，检查zeppelin lib文件夹中其他jar文件的所有权，将这些所有权设置为与jdbcT4.jar相同。
3.重启Zeppelin。如果您使用Ambari安装Zeppelin，则可以使用Ambari Web控制台进行重启。
4.打开浏览器，登录http://myhost:9995。在默认情况下，Zeppelin在9995端口上运行。查看您的Ambari配置，了解详细信息。
5.您应该可以看到欢迎页面，状态应显示为已连接。

Apache Zeppelin在Apache Trafodion上的可视化

6.首先，配置JDBC解释器，连接到Trafodion/EsgynDB。单击菜单中的Interpreter。

Apache Zeppelin在Apache Trafodion上的可视化

7.单击Create。
8.根据显示的内容，填写详细信息。单击Save，创建解释器。
1) 输入您解释器的名称。
2) 在解释器的下拉菜单中，选择JDBC。
3) 填写Trafodion JDBC驱动器的详细信息，指定与您Trafodion实例匹配的JDBC URL。

default.driver org.trafodion.jdbc.t4.T4Driver
default.url jdbc:t4jdbc://myhost:23400/:
default.user trafodion
default.password traf123

Apache Zeppelin在Apache Trafodion上的可视化

9.通过Notebook -> Create new note菜单，创建一个新的notebook。
10.选择新创建的notebook。
11.单击notebook右上角的Interpreter Binding图标。
12.选择您添加的新Trafodion解释器，拖动到解释器列表的顶部，单击Save。

Apache Zeppelin在Apache Trafodion上的可视化

13.输入一个sql命令（例如，get schemas），单击Run。您应该可以看见您的Trafodion/EsgynDB数据库所有可用的schema列表。

Apache Zeppelin在Apache Trafodion上的可视化

14.如果执行失败，出现连接错误或套接字错误：

查看HBase和Trafodion/EsgynDB是否正常启动并运行。
查看用户名和密码是否正确。
如果解释器超时一段时间，可能出现套接字连接错误。重启解释器，修复该错误。

15.如果依然存在异常，您可以检查zeppeliln的log文件夹中的zeppelin server和jdbc解释器的日志消息。
注意：
在默认情况下，如果没有执行查询（或Zeppelin UI闲置），解释器会关闭与数据库的连接。再次运
行查询之前，请重启解释器。

示例DDL/获取/报告工作流

您可以使用一系列段落，在Zeppelin中创建工作流，每个段落分别负责执行您工作流中的一个步骤。下例使用SQL DDL语句创建一个新表，然后加载数据，最后运行一个已加载数据的报告。这些步骤分别使用notebook中的不同段落。

1.创建目标Trafodion表。
使用JDBC解释器运行CREATE DDL语句。

Apache Zeppelin在Apache Trafodion上的可视化

2.使用HBase Shell命令，查看表的HBase属性。
使用shell解释器，运行hbase shell命令。

Apache Zeppelin在Apache Trafodion上的可视化

3.使用ODB和CSV文件，将数据加载到表。
使用shell解释器，在EsgynDB实例上运行ODB工具。

Apache Zeppelin在Apache Trafodion上的可视化

4.运行已加载数据的报告。
使用JDBC解释器，运行SQL查询。

Apache Zeppelin在Apache Trafodion上的可视化

zeppelin 可视化 apache jdbc

安科网

Apache Zeppelin在Apache Trafodion上的可视化

在旅途

介绍

架构

为Trafodion/EsgynDB配置Zeppelin

示例DDL/获取/报告工作流

在旅途

相关推荐

Apache Zeppelin UI

Data Solution 2019(3)Run Zeppelin in Single Docker

Spark/Hadoop/Zeppelin Upgrade(1)

Apache Zeppelin(2)Zeppelin and Spark Yarn Cluster

Apache Zeppelin(1)Build and Installation

zeppelin 配置 spark

Zeppelin0.7.2结合hive解释器进行报表展示

CentOS 6.5中部署Zeppelin并配置账号密码验证

Cittio推出首款云计算管理客户端Zeppelin

在旅途