開源etl工具 kettle
v5.1.0 免費(fèi)Spoon版- 軟件大?。?span itemprop="fileSize">579.60 MB
- 軟件語言:中文
- 軟件類型:國產(chǎn)軟件 / 數(shù)據(jù)庫類
- 軟件授權(quán): 免費(fèi)軟件
- 更新時(shí)間:2017-08-02 11:43:58
- 軟件等級(jí):
- 軟件廠商: -
- 應(yīng)用平臺(tái):WinAll, WinXP, Win7
- 軟件官網(wǎng): http://www.pentaho.com/
相關(guān)軟件
phpMyAdmin For Linux(MySQL server數(shù)據(jù)庫管理)v5.1.2 官方版
12.00 MB/多國語言[中文]/10.0
microsoft access 2013免費(fèi)完整版
140.00 MB/中文/4.0
SQLite數(shù)據(jù)庫管理(Navicat for SQLite)v15.0.23 企業(yè)注冊版
57.98 MB/中文/10.0
HeidiSQL(MySQL圖形化管理工具)v11.2.0.6219 綠色中文版
5.77 MB/中文/10.0
mysql數(shù)據(jù)庫管理工具(navicat for mysql)v11.2.6 綠色中文版
20.34 MB/中文/10.0
軟件介紹人氣軟件精品推薦相關(guān)文章網(wǎng)友評論下載地址
kettle5.1是生產(chǎn)環(huán)境使用的開源工具,用于文本文件,數(shù)據(jù)表,以及商業(yè)和免費(fèi)的數(shù)據(jù)庫引擎的輸入和輸出,功能非常齊全,使用面廣,需要的用戶歡迎來IT貓撲下載~
開源etl工具kettle簡介
Pentaho Data Integration (Kettle)是Pentaho生態(tài)系統(tǒng)中默認(rèn)的ETL工具。Kettle是一款國外開源的etl工具,純java編寫,綠色無需安裝,數(shù)據(jù)抽取高效穩(wěn)定(數(shù)據(jù)遷移工具)。Kettle中有兩種腳本文件,transformation和job,transformation完成針對數(shù)據(jù)的基礎(chǔ)轉(zhuǎn)換,job則完成整個(gè)工作流的控制。
通過非常直觀的圖形化編輯器(Spoon),您可以定義以XML格式儲(chǔ)存的流程。在Kettle運(yùn)行過程中,這些流程會(huì)以不同的方法編譯。用到的工具包括命令行工具(Pan),小型服務(wù)器(Carte),數(shù)據(jù)庫存儲(chǔ)庫(repository)(Kitchen)或者直接使用IDE(Spoon)。
一款國外開源的etl工具,純java編寫,綠色無需安裝,數(shù)據(jù)抽取高效穩(wěn)定(數(shù)據(jù)遷移工具)。Kettle中有兩種腳本文件,transformation和job,transformation完成針對數(shù)據(jù)的基礎(chǔ)轉(zhuǎn)換,job則完成整個(gè)工作流的控制。
kettle清理數(shù)據(jù)庫連接的方法:
1:清理shared.xml中的不用的數(shù)據(jù)庫連接。(他的保存位置一般在用戶主目錄下邊的.kettle目錄中)
2:用文本編輯軟件打開kjb,ktr文件刪除用戶到的connection項(xiàng),保存。
Kettle使用教程:
Kettle自己有三個(gè)主要組件:Spoon,Kitchen,Pan。其中Spoon是一個(gè)圖形化的界面,用于windows的時(shí)候,先設(shè)置環(huán)境變量:pentaho_java_home,例如:C:\Program Files\Java\jdk1.7.0_25,其實(shí)就是你的java安裝目錄,1.6以上即可。windows下雙擊Spoon.bat就可以了,界面如下:
這里我建立了資源庫,其實(shí)可以用文件形式存儲(chǔ),存儲(chǔ)的結(jié)構(gòu)都是xml,但是我還是覺得建立一個(gè)資源庫比較好,以后看job等情況也比較簡單,因?yàn)閿?shù)據(jù)表的可讀性比xml要好得多。建立資源庫和文件資源庫只需要把右上角的小加號(hào)點(diǎn)一下,就會(huì)出現(xiàn)如下如的界面:
選擇第一個(gè)就是建立數(shù)據(jù)庫版的資源庫,之后:
之后:
測試通過之后點(diǎn)擊OK就回到最開始的界面,這時(shí)候選擇test數(shù)據(jù)庫連接,然后出入你的工程(我是這么叫的)ID和name,這里要記住,因?yàn)橐院髃itchen調(diào)度的時(shí)候要輸入這個(gè)參數(shù)。
在接下來彈出的框中都點(diǎn)“是”,然后會(huì)出現(xiàn)這個(gè)界面:
這步會(huì)在你的用戶下建立很多表,所以最好單獨(dú)給資源庫建立一個(gè)用戶,當(dāng)然這是在oracle下,mysql下和DB2下最好也采用同樣的方式,把資源庫和其他庫分開。檢查一下:
SQL> conn wings/wings@prism
已連接。
SQL> select count(1) from r_repository_log;COUNT(1)
----------
0SQL>
表已經(jīng)建好了?;氐阶铋_始的界面,選擇test,點(diǎn)擊確定,然后就會(huì)出現(xiàn)登錄對話框,用戶密碼默認(rèn)都是admin,以后可以自己改。
接下來就可以開始用這個(gè)工具了。
其實(shí)對于簡單的數(shù)據(jù)庫數(shù)據(jù)的抽取,基本只需要轉(zhuǎn)換和作業(yè)這兩種東西。下面就是建立一個(gè)轉(zhuǎn)換的步驟:
1 點(diǎn)擊文件-->新建-->轉(zhuǎn)換。
2 在左側(cè)的樹狀列表中選“主對象樹”,新建DB連接。步驟和上面建資源庫一樣。一個(gè)目標(biāo)庫一個(gè)源庫。
3 在核心對象-->輸入這個(gè)地方拖出一個(gè)表輸入,在“輸出”目錄下拖出“表輸出”,在“轉(zhuǎn)換”處拖出一個(gè)字段選擇來,如圖:
每一個(gè)對象都可以雙擊修改屬性,下面以抽取world數(shù)據(jù)庫的city表為例。
雙擊表輸入,選擇數(shù)據(jù)庫連接,選擇源數(shù)據(jù)庫,然后點(diǎn)擊“獲取SQL查詢語句”,在彈出的對話框里進(jìn)行選擇即可,之后會(huì)變成這樣:
下面點(diǎn)擊表輸出:
點(diǎn)擊字段選擇:
這樣,一個(gè)簡單的抽取數(shù)據(jù)的轉(zhuǎn)換就完成了。執(zhí)行之,點(diǎn)擊上面的綠色開始按鈕。
我也處在學(xué)習(xí)中,希望可以把我的經(jīng)驗(yàn)分享給和我一樣的入門者。
下面是補(bǔ)充部分:
在一個(gè)Job或者一個(gè)trans建立好之后,就可以建立定時(shí)任務(wù)了。如果是DS,那么DS客戶端本身就支持schedule,但是Kettle因?yàn)闆]有服務(wù)端和客戶端的概念,因此只有使用linux的crontab,其實(shí)Job本身也支持定時(shí),但是你必須保證圖形界面一直開著,這樣并不如crontab那么好。在命令行里使用kettle很簡單,Job用kitchen調(diào)度,trans用pan調(diào)度。
下面是一個(gè)kitchen的調(diào)度命令:
bash /home/kettle/data-integration/kitchen.sh /rep kettle_demo /user username /pass passwd /level Minimal /dir /dirname /job jobname
rep那里寫自己的資源庫名稱。
trans和上面一樣,略有不同:
bash /home/kettle/data-integration/pan.sh /rep kettle_demo /user username /pass passwd /level Minimal /dir /dirname /trans transname
Kettle項(xiàng)目介紹:
Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上運(yùn)行,綠色無需安裝,數(shù)據(jù)抽取高效穩(wěn)定。
Kettle 中文名稱叫水壺,該項(xiàng)目的主程序員MATT 希望把各種數(shù)據(jù)放到一個(gè)壺里,然后以一種指定的格式流出。
Kettle 將 ELT 流程編譯為 XML 格式,學(xué)起來十分簡單,Pentaho Data Integration (Kettle) 使用 Java (Swing)開發(fā)。Kettle 作為編譯器對 XML 格式書寫的流程進(jìn)行編譯。這些功能和組件比起 Talend 在豐富性方面稍遜一些,但是您建立復(fù)雜 ETL 流程需要的一切元素。Kettle 的 JavaScript 引擎(和 Java 引擎)可以深層地控制對數(shù)據(jù)的處理。
全球數(shù)千家機(jī)構(gòu)依賴于Pentaho的,作出更快,更好的業(yè)務(wù)決策產(chǎn)生積極影響他們的底線。
運(yùn)行 Spoon.bat 開始軟件。
需要JRE支持,JRE(Java Runtime Environment) v6.0 Update 26 安裝版
提取密碼: nhau
更多>> 軟件截圖
推薦應(yīng)用
navicat for mysql 64位 25.05 MB
下載/中文/2.0 v16.0.110 中文免費(fèi)版microsoft access 2013 140.00 MB
下載/中文/4.0 免費(fèi)完整版HeidiSQL(MySQL圖形化管理工具) 5.77 MB
下載/中文/10.0 v11.2.0.6219 綠色中文版Oracle 11g 64位/32位 2.05 GB
下載/中文/2.0 v11.2.0.1.0 官方第二版sqlyog ultimate 64位 7.50 MB
下載/中文/7.0 v13.1.1 官方中文注冊版Navicat for Oracle 16.70 MB
下載/中文/10.0 v12.0.29 中文版Access數(shù)據(jù)庫查詢分析器 6.74 MB
下載/中文/10.0 v2.4 免費(fèi)中文版dbc2000 win7 64位 16.10 MB
下載/中文/10.0 中文漢化版
其他版本下載
精品推薦 數(shù)據(jù)庫管理
- 更多 (49個(gè)) >> 數(shù)據(jù)庫管理 數(shù)據(jù)庫管理軟件不僅可以對數(shù)據(jù)庫信息的儲(chǔ)存和維護(hù),而且可以幫助開發(fā)者解決各種各樣的開發(fā)問題,Mysql、sql數(shù)據(jù)庫、excel數(shù)據(jù)庫都有相配套的管理系統(tǒng),本專題向用戶推薦了一些十分實(shí)用的數(shù)據(jù)庫管理工具。不知道數(shù)據(jù)庫管理工具有哪些?沒關(guān)系,下面都是一些免費(fèi)開源的數(shù)據(jù)庫管理工具,用戶
Oracle 11g 64位/32位 2.05 GB
/中文/2.0microsoft access 2013 140.00 MB
/中文/4.0HeidiSQL(MySQL圖形化管理工具) 5.77 MB
/中文/10.0sqlyog ultimate 64位 7.50 MB
/中文/7.0DB Commander 2000 Pro 8.00 MB
/中文/10.0SQLite Expert Professional(可視化SQL數(shù)據(jù)庫管理) 11.45 MB
/英文/10.0SQLite數(shù)據(jù)庫管理(Navicat for SQLite) 57.98 MB
/中文/10.0mysql數(shù)據(jù)庫管理工具(navicat for mysql) 20.34 MB
/中文/10.0
相關(guān)文章
下載地址
開源etl工具 kettle v5.1.0 免費(fèi)Spoon版
查看所有評論>> 網(wǎng)友評論
更多>> 猜你喜歡
- Microsoft SQL Server 2000 Personal Edition
- SQL Server 2005 SP2
- Microsoft SQL Server 2000簡體中文企業(yè)版
- PowerDesigner
- 數(shù)據(jù)庫文件轉(zhuǎn)換工具(DBConvert for JSON and SQL)
- DFB數(shù)據(jù)庫修復(fù)工具DataNumen DBF Repair
- mysql for ubuntu
- MongoDB Compass可視圖形化管理工具
- Exportizer(修改編輯數(shù)據(jù)庫軟件)
- SQL Server Compact 4 安裝包
- Navicat premium數(shù)據(jù)庫管理軟件
- Oracle Database 12c數(shù)據(jù)庫軟件