可视化开源ETL工具——kettle
1 简介Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle...
1 简介
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。
Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。
Kettle这个ETL工具集,它允许管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。
Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
2 安装过程
kettle是由Java语言开发的,所以其运行过程需要jdk,这里选择jdk1.8(选择过高版本的jdk可能与kettle不兼容)。
第一步:先安装jdk
http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
下载mac版的,下载好后,直接安装,直到最后一步就可以了
打开终端,输入 java -version,查看是否安装成功,如图为安装成功的图
第二步:下载kettle
https://community.hds.com/docs/DOC-1009931-downloads或者https://sourceforge.net/projects/pentaho/?source=typ_redirect
下载好后,解压即可,如图解压得到data-integration文件夹。
第三步:下载mysql连接器
连接mysql数据库时会报错提示需要安装驱动,需要下载mysql连接器,这里选择的是mysql-connector-java-8.0.14.tar.gz,下载链接如下
https://link.jianshu.com/?t=https://dev.mysql.com/downloads/file/?id=468318%20
下载好后,将安装包解压,然后将mysql-connector-java-8.0.14中的mysql-connector-java-8.0.14.jar文件拷贝到data-integration/lib目录下。
第四步:启动kettle
在data-integraion/lib路径下,运行sh spoon.sh命令打开spoon图形化界面。
3 简单使用
使用kettle跨库同步表数据:https://blog.csdn.net/fantasic_van/article/details/77864517
详解kettle数据同步-图文:https://blog.csdn.net/qq_35092224/article/details/79994171
遇到问题
https://stackoverflow.com/questions/11634181/pentaho-data-integration-sql-connection
https://blog.csdn.net/love666666shen/article/details/87936645
https://community.hitachivantara.com/thread/13062-kettle-data-integration-unable-to-create-a-database-connection-xulexception-javalangreflectinvocationtargetexception
https://bbs.csdn.net/topics/390184735
https://blog.csdn.net/philip502/article/details/17763323
4 参考资料
kettle安装过程:https://blog.csdn.net/sinat_30316741/article/details/80054580
kettle安装以及运行注意事项:https://blog.csdn.net/weinierzui/article/details/77931346
使用kettle跨库同步表数据:https://blog.csdn.net/fantasic_van/article/details/77864517
详解kettle数据同步-图文:https://blog.csdn.net/qq_35092224/article/details/79994171
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐



所有评论(0)