下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922

kettle入门教程:kettle介绍以及安装

作者:课课家教育     来源: http://www.kokojia.com点击数:4661发布时间:2019-03-22 10:13:52

标签: kettle教程数据库界面设计操作系统

      一、kettle的介绍

      kettle是一款开源的ETL(Extract 抽取, Transform 转换, Load 载入)工具,由纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。Kettle家族包括4个产品:Spoon、Pan、CHEF、Kitchen。kettle这个名称也很有趣:水壶。按项目负责人Matt的说法:把各种数据放到一个壶里,然后以一种你希望的格式流出。

      在数据仓库项目中,ETL工具的使用非常频繁。在以下的场景中通常可以应用到kettle:

      1.数据清洗;

      2.在不同应用或数据库之间整合数据;

      3.把数据库中的数据导出到文本文件;

      4.集成应用相关项目是个使用;

      5.大批量数据载入数据库。

      kettle的使用非常简单,通过图形界面设计实现做什么业务,无需写代码去实现,因此,kettle是以面向元数据来设计。

      kettle支持多种输入和输出格式,包括文本文件、数据表,以及商业和免费的数据库引擎。另外,kettle强大的转换功能非常便于操纵数据。

kettle入门教程:kettle介绍以及安装_界面设计_spoon_操作系统_课课家

      二、kettle的安装

      1.首先在官网上搜到kettle,并下载好;

      2.环境部署:kettle需要jre1.5及以上版本,可以通过Oracle官网免费下载;

      3.kettle安装:kettle无需安装,直接解压zip文件到指定的文件夹。在类Unix操作系统上,需执行以下脚本:

      cd Kettle

      chmod +x *.sh

      运行

      kettle中的一个图形用户界面叫spoon,spoon可以设计转换、运行转换和作业。

      三、kettle设计工具以及spoon介绍

      Spoon是一个图形设计工具,可用来设计和测试数据交换处理流程,也可以通过命令行(终端)执行处理流程。

      在spoon中设计作业和转换,kettle提供两种方式存储:资源库和文件。①如果选择资源库,spoon第一次启动时需要创建资源库;②如果选择文件,作业保存文件是的扩展名是KJB,转换文件的扩展名是KTR。为了简化学习,下面教程中采用第二种方式。

      启动spoon

      在Windows中执行spoon.bat,在类unix系统中执行spoon.sh;启动时出现一个对话框窗口提示选择资源库及输入连接信息,点击取消按钮。

资源库链接      这时,你可以看到一个欢迎窗口,点击“工具”菜单下的“选项”,在弹出的窗口中可以进行一些全局设置,如语言、日志等信息,设置后需重启才能生效。

kettle入门教程

  Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。作为Pentaho的一个重要组成部分,kettle在国内项目应用上也逐渐增多。

赞(3)
踩(0)
分享到:
评论 (0)
您需要登录后才可以评论请 [登录] [注册]
最新评论
暂无评论~
大数据课程