Apache Zeppelin在Apache Trafodion上的可视化

介绍
Apache Trafodion和EsgynDB（Esgyn的商业版）支持数据可视化工具（例如，Apache Zeppelin和Tableau），具有标准JDBC/ODBC连接。本文重点介绍如何实现Apache Zeppelin在Trafodion上的可视化。
Apache Zeppelin基于web，数据专家可以通过该工具进行大规模数据挖掘和可视化的协作。大规模数据分析的工作流包括多个步骤，例如数据获取、预处理、可视化……。通过Zeppelin，用户可以在不同的执行块/段中创建这些步骤。这一套步骤/工作流称为Notebook。各段由解释器进行处理。Zeppelin具有几个默认的解释器。我们可以使用shell解释器、PostgreSQL解释器或JDBC解释器实现Trafodion或EsgynDB与Zepplin的集成。
架构
Zeppelin UI（客户端）连接到Zeppelin Server，然后与一个或多个解释器进行交互，以执行段落中的命令。
对于Trafodion/EsgynDB集成，我们可以使用JDBC解释器或Postgres解释器运行SQL命令，使用shell解释器在Trafodion/EsgynDB实例上运行shell命令。

为Trafodion/EsgynDB配置Zeppelin

将Trafodion T4 JDBC驱动器（jdbcT4.jar）复制到Zeppelin安装文件夹下的lib目录。
将jdbcT4.jar的所有权更改为zeppelin的用户id。使用HDP/Ambari时，会单独创建一个Zeppelin用户id。在您的系统上，检查zeppelin lib文件夹中其他jar文件的所有权，将这些所有权设置为与jdbcT4.jar相同。
重启Zeppelin。如果您使用Ambari安装Zeppelin，则可以使用Ambari Web控制台进行重启。
打开浏览器，登录http://myhost:9995。在默认情况下，Zeppelin在9995端口上运行。查看您的Ambari配置，了解详细信息。
您应该可以看到欢迎页面，状态应显示为已连接。

6.首先，配置JDBC解释器，连接到Trafodion/EsgynDB。单击菜单中的Interpreter。

7.单击Create。8.根据显示的内容，填写详细信息。单击Save，创建解释器。1) 输入您解释器的名称。2) 在解释器的下拉菜单中，选择JDBC。3) 填写Trafodion JDBC驱动器的详细信息，指定与您Trafodion实例匹配的JDBC URL。

default.driver org.trafodion.jdbc.t4.T4Driver

default.url jdbc:t4jdbc://myhost:23400/:

default.user trafodion

default.password traf123

9.通过Notebook -> Create new note菜单，创建一个新的notebook。10.选择新创建的notebook。11.单击notebook右上角的Interpreter Binding图标。12.选择您添加的新Trafodion解释器，拖动到解释器列表的顶部，单击Save。

13.输入一个sql命令（例如，get schemas），单击Run。您应该可以看见您的Trafodion/EsgynDB数据库所有可用的schema列表。

14.如果执行失败，出现连接错误或套接字错误：

查看HBase和Trafodion/EsgynDB是否正常启动并运行。
查看用户名和密码是否正确。
如果解释器超时一段时间，可能出现套接字连接错误。重启解释器，修复该错误。

15.如果依然存在异常，您可以检查zeppeliln的log文件夹中的zeppelin server和jdbc解释器的日志消息。注意：在默认情况下，如果没有执行查询（或Zeppelin UI闲置），解释器会关闭与数据库的连接。再次运行查询之前，请重启解释器。
示例DDL/获取/报告工作流
您可以使用一系列段落，在Zeppelin中创建工作流，每个段落分别负责执行您工作流中的一个步骤。下例使用SQL DDL语句创建一个新表，然后加载数据，最后运行一个已加载数据的报告。这些步骤分别使用notebook中的不同段落。
1.创建目标Trafodion表。使用JDBC解释器运行CREATE DDL语句。

2.使用HBase Shell命令，查看表的HBase属性。使用shell解释器，运行hbase shell命令。

3.使用ODB和CSV文件，将数据加载到表。使用shell解释器，在EsgynDB实例上运行ODB工具。

4.运行已加载数据的报告。使用JDBC解释器，运行SQL查询。

Apache Zeppelin在Apache Trafodion上的可视化

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

Apache Zeppelin在Apache Trafodion上的可视化

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复