




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、shenxianglKettle運(yùn)用-ETL&KettleETLExtract-Transform-Load的縮寫,即數(shù)據(jù)抽取、轉(zhuǎn)換、裝載的過程,對于金融IT來說,經(jīng)常會遇到大數(shù)據(jù)量的處置,轉(zhuǎn)換,遷移,所以了解并掌握一種etl工具的運(yùn)用,必不可少。Kettle是一款國外開源的etl工具,純java編寫,綠色無需安裝,數(shù)據(jù)抽取高效穩(wěn)定。Kettle中有兩種腳本文件,transformation和job,transformation完成針對數(shù)據(jù)的根底轉(zhuǎn)換,job那么完成整個任務(wù)流的控制。Kettle運(yùn)用-下載&部署Kettle可以在/網(wǎng)站
2、下載下載kettle緊縮包,因kettle為綠色軟件,解緊縮到恣意本地途徑即可Kettle運(yùn)用-運(yùn)轉(zhuǎn)進(jìn)入到Kettle目錄,假設(shè)Kettle部署在windows環(huán)境下,雙擊運(yùn)轉(zhuǎn)spoon.bat文件,出現(xiàn)如下界面Kettle運(yùn)用-運(yùn)轉(zhuǎn)Kettle提供了資源庫方式的方式來整合一切的任務(wù),但是由于資源庫移植不方便,所以選擇沒有資源庫Kettle運(yùn)用-ktr&kjb點(diǎn)擊頁面左上角的 創(chuàng)建一個新的transformation,點(diǎn)擊 保管到本地途徑,例如保管到D:/etltest下,保管文件名為EtltestTrans,kettle默許transformation文件保管后后綴名為ktr點(diǎn)擊頁面
3、左上角的 創(chuàng)建一個新的job,點(diǎn)擊 保管到本地途徑,例如保管到D:/etltest下,保管文件名為EtltestJob,kettle默許job文件保管后后綴名為kjbKettle運(yùn)用-transformation菜單引見Main Tree菜單列出的是一個transformation中根本的屬性,可以經(jīng)過各個節(jié)點(diǎn)來查看。DB銜接:顯示當(dāng)前transformation中的數(shù)據(jù)庫銜接,每一個transformation的數(shù)據(jù)庫銜接都需求單獨(dú)配置。Steps:一個transformation中運(yùn)用到的環(huán)節(jié)列表Hops:一個transformation中運(yùn)用到的節(jié)點(diǎn)銜接列表Kettle運(yùn)用-transf
4、ormation菜單引見Core Objects菜單列出的是transformation中可以調(diào)用的環(huán)節(jié)列表,可以經(jīng)過鼠標(biāo)拖動的方式對環(huán)節(jié)進(jìn)展添加。Input:輸入環(huán)節(jié)Output:輸出環(huán)節(jié)Lookup:查詢環(huán)節(jié)Transform:轉(zhuǎn)化環(huán)節(jié)Joins:銜接環(huán)節(jié)Scripting:腳本環(huán)節(jié)Kettle運(yùn)用-Transformation每一個環(huán)節(jié)可以經(jīng)過鼠標(biāo)拖動來將環(huán)節(jié)添加到主窗口中。并可經(jīng)過shift+鼠標(biāo)拖動,實(shí)現(xiàn)環(huán)節(jié)之間的銜接。Kettle運(yùn)用-Transformation常用環(huán)節(jié)引見類別類別 環(huán)節(jié)稱號環(huán)節(jié)稱號 功能闡明功能闡明 Input 文本文件輸入 從本地文本文件輸入數(shù)據(jù) 表輸入 從數(shù)
5、據(jù)庫表中輸入數(shù)據(jù) 獲取系統(tǒng)信息 讀取系統(tǒng)信息輸入數(shù)據(jù) Output 文本文件輸出 將處置結(jié)果輸出到文本文件 表輸出 將處置結(jié)果輸出到數(shù)據(jù)庫表 插入/更新 根據(jù)處置結(jié)果對數(shù)據(jù)庫表機(jī)型插入更新,假設(shè)數(shù)據(jù)庫中不存在相關(guān)記錄那么插入,否那么為更新。會根據(jù)查詢條件中字段進(jìn)展判別 更新 根據(jù)處置結(jié)果對數(shù)據(jù)庫進(jìn)展更新,假設(shè)需求更新的數(shù)據(jù)在數(shù)據(jù)庫表中無記錄,那么會報錯停頓 刪除 根據(jù)處置結(jié)果對數(shù)據(jù)庫記錄進(jìn)展刪除,假設(shè)需求刪除的數(shù)據(jù)在數(shù)據(jù)庫表中無記錄,那么會報錯停頓Lookup 數(shù)據(jù)庫查詢 根據(jù)設(shè)定的查詢條件,對目的表進(jìn)展查詢,前往需求的結(jié)果字段 流查詢 將目的表讀取到內(nèi)存,經(jīng)過查詢條件對內(nèi)存中數(shù)據(jù)集進(jìn)展查詢
6、調(diào)用DB存儲過程 調(diào)用數(shù)據(jù)庫存儲過程 Transform 字段選擇 選擇需求的字段,過濾掉不要的字段,也可做數(shù)據(jù)庫字段對應(yīng)過濾記錄 根據(jù)條件對記錄進(jìn)展分類排序記錄 將數(shù)據(jù)根據(jù)某以條件,進(jìn)展排序空操作 無操作添加常量 添加需求的常量字段Scripting Modified Java Script Value 擴(kuò)展功能,編寫JavaScript腳本,對數(shù)據(jù)進(jìn)展相應(yīng)處置Mapping 映射子轉(zhuǎn)換 數(shù)據(jù)映射Job Sat Variables設(shè)置環(huán)境變量Get Variables獲取環(huán)境變量Kettle運(yùn)用-Job菜單引見Main Tree菜單列出的是一個Job中根本的屬性,可以經(jīng)過各個節(jié)點(diǎn)來查看。DB
7、銜接:顯示當(dāng)前Job中的數(shù)據(jù)庫銜接,每一個Job的數(shù)據(jù)庫銜接都需求單獨(dú)配置。Job entries:一個Job中援用的環(huán)節(jié)列表Kettle運(yùn)用-Job菜單引見Job entries菜單列出的是Job中可以調(diào)用的環(huán)節(jié)列表,可以經(jīng)過鼠標(biāo)拖動的方式對環(huán)節(jié)進(jìn)展添加。每一個環(huán)節(jié)可以經(jīng)過鼠標(biāo)拖動來將環(huán)節(jié)添加到主窗口中。并可經(jīng)過shift+鼠標(biāo)拖動,實(shí)現(xiàn)環(huán)節(jié)之間的銜接。Kettle運(yùn)用-Job常用環(huán)節(jié)引見類別類別環(huán)節(jié)稱號環(huán)節(jié)稱號功能闡明功能闡明Job entriesSTART開場DUMMY終了Transformation援用Transformation流程Job援用Job流程Shell調(diào)用Shell腳本SQ
8、L執(zhí)行sql語句FTP經(jīng)過FTP下載Table exists檢查目的表能否存在,前往布爾值File exists檢查文件能否存在,前往布爾值Javascript執(zhí)行JavaScript腳本Create file創(chuàng)建文件Delete file刪除文件Wait for file等待文件,文件出現(xiàn)后繼續(xù)下一個環(huán)節(jié)File Compare文件比較,前往布爾值Wait for等待時間,設(shè)定一段時間,kettle流程處于等待形狀Zip file緊縮文件為ZIP包Kettle運(yùn)用-作業(yè)作業(yè):作業(yè):根據(jù)客戶,帳戶,買賣表中的數(shù)據(jù),生根據(jù)客戶,帳戶,買賣表中的數(shù)據(jù),生成對應(yīng)的數(shù)據(jù)文件,將數(shù)據(jù)文件可以導(dǎo)成對應(yīng)的數(shù)
9、據(jù)文件,將數(shù)據(jù)文件可以導(dǎo)入到對應(yīng)表中,并且可以用入到對應(yīng)表中,并且可以用jobjob來調(diào)用整來調(diào)用整個流程。個流程。成果:成果:1 1,提交對應(yīng)的,提交對應(yīng)的KettleKettle文件文件2 2,KettleKettle流程可以正確執(zhí)行,不報錯流程可以正確執(zhí)行,不報錯3 3,對應(yīng)的數(shù)據(jù)文件生成并格式無誤,對,對應(yīng)的數(shù)據(jù)文件生成并格式無誤,對應(yīng)表中有數(shù)據(jù)并格式無誤應(yīng)表中有數(shù)據(jù)并格式無誤Kettle運(yùn)用-作業(yè)闡明:數(shù)據(jù)庫中存在四張表:表名表名字段名字段名闡明闡明關(guān)系關(guān)系CUSTCustno客戶號Custname客戶姓名Custid客戶證件號Custtype客戶類型1是對公,2是對私ACCOUNTAcctno帳號Custno帳戶對應(yīng)的客戶號和CUST.CUSTNO對應(yīng)Amt帳戶余額TRADETradeid買賣流水號Acctno買賣發(fā)生的帳號和ACCOUNT.ACCTNO對應(yīng)Amt買賣金額Kettle運(yùn)用-作業(yè)表名表名字段名字段名闡明闡明關(guān)系關(guān)系TRADE_ALLTradeid買賣流水號Acctno帳號Amt買賣金額Custno客戶號Custname客戶姓名Custid客戶證件號Custtype_cn客戶類別對公/對私Value_買賣闡明假設(shè)是對公客戶發(fā)生的買賣,填寫“這是一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廠房電費(fèi)收租合同范本
- 制作物業(yè)合同范本
- 分期施工合同范本
- 林木定金合同范本
- 代購果樹合同范本
- 勞務(wù)合同范本 兼職
- 兒童竹刀購買合同范本
- 到國外工作合同范本
- 判決協(xié)商合同范例
- 產(chǎn)品供貨合作合同范本
- 碳酸鈣市場分析及競爭策略分析報告
- 糖尿病性眼肌麻痹的護(hù)理查房
- 泡泡瑪特展廳活動策劃
- 健康生活方式與健康促進(jìn)的科學(xué)研究
- 文旅部門消防培訓(xùn)課件
- 中職語文課件:1.1《送瘟神》課件14張2023-2024學(xué)年中職語文職業(yè)模塊
- 胃瘍(消化性潰瘍)中醫(yī)護(hù)理方案
- 《哲學(xué)概論(第2版)》-課件全套 第0-6章 緒論、哲學(xué)的形態(tài)-馬克思主義哲學(xué)
- 踝關(guān)節(jié)骨性關(guān)節(jié)炎課件整理
- 高處作業(yè)安全經(jīng)驗分享
- 工余安健環(huán)管理制度
評論
0/150
提交評論