简介: Kettle是一款开源的ETL工具,纯java实现,能够运行于Windows, Unix, Linux上运行,提供图形化的操作界面,能够通过拖拽控件的形式,不便地定义数据传输的拓扑。Kettle反对丰盛的数据输入输出源,数据库反对Oracle,MySql,DB2等,也反对业界各种开源的大数据系统,例如HDFS, HBase, Cassandra, MongoDB等。本文将介绍如何利用MaxCompute的插件无缝对接阿里云的大数据计算平台——MaxCompute。
本示例应用的工具及驱动版本
Setup
- 下载并装置Kettle
- 下载MaxCompute JDBC driver
- 将MaxCompute JDBC driver置于Kettle装置目录下的lib子目录(data-integration/lib)
- 启动spoon
Job
咱们能够通过Kettle + MaxCompute JDBC driver来实现对MaxCompute中工作的组织和执行。
首先须要执行以下操作:
- 新建Job
- 新建Database Connection
JDBC连贯串格局为:jdbc:odps:<maxcompute_endpoint>?project=<maxcompute_project_name>
JDBC driver class为:com.aliyun.odps.jdbc.OdpsDriver
Username为阿里云AccessKey Id
Password为阿里云AccessKey Secret
JDBC更多配置见:https://help.aliyun.com/docum...
之后,能够依据业务须要,通过SQL节点拜访MaxCompute。上面咱们以一个简略的ETL过程为例:
Create table节点的配置如下:
须要留神:
这里Connection须要抉择咱们配置好的
不要勾选Send SQL as single statement
Load from OSS节点配置如下:
须要留神的点同Create table节点。无关更多Load的用法,见:https://help.aliyun.com/docum...
Processing节点配置如下:
须要留神的点同Create table节点。
原文链接
本文为阿里云原创内容,未经容许不得转载。