TDM系統(tǒng)中數(shù)據(jù)導(dǎo)入功能的設(shè)計(jì)和實(shí)現(xiàn)_第1頁
TDM系統(tǒng)中數(shù)據(jù)導(dǎo)入功能的設(shè)計(jì)和實(shí)現(xiàn)_第2頁
TDM系統(tǒng)中數(shù)據(jù)導(dǎo)入功能的設(shè)計(jì)和實(shí)現(xiàn)_第3頁
TDM系統(tǒng)中數(shù)據(jù)導(dǎo)入功能的設(shè)計(jì)和實(shí)現(xiàn)_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、TDM體系中數(shù)據(jù)導(dǎo)入成效的方案和實(shí)現(xiàn)摘要:td體系的數(shù)據(jù)導(dǎo)入成效必要接納三層布局以順應(yīng)保密需求;數(shù)據(jù)導(dǎo)入性能是關(guān)鍵指標(biāo),而rale數(shù)據(jù)庫體系的外部表特性可以大大進(jìn)步數(shù)據(jù)導(dǎo)入性能。關(guān)鍵詞:試驗(yàn)數(shù)據(jù)辦理;td;數(shù)據(jù)導(dǎo)入;etl1配景進(jìn)入到21世紀(jì)以來,我國的td(試驗(yàn)數(shù)據(jù)辦理)技能范疇顯現(xiàn)出興隆的生氣,越來越多的行業(yè)和單元開始存眷該技能和相干的辦理方案,如航空、航天、武器、船舶、汽車等。td體系正在成為企業(yè)進(jìn)步試驗(yàn)辦理程度、收縮科研周期、低落科研經(jīng)費(fèi)的緊張本領(lǐng)。作為一個(gè)綜合數(shù)字化辦理平臺,td體系涉及很多龐大的成效和技能,而數(shù)據(jù)導(dǎo)入成效就是此中之一。試驗(yàn)數(shù)據(jù)導(dǎo)入成效就是從種種格式的海量試驗(yàn)數(shù)據(jù)文件

2、中快速提取目的數(shù)據(jù)、再轉(zhuǎn)換洗濯后裝載到數(shù)據(jù)庫中。如今試驗(yàn)數(shù)據(jù)辦理的需求狀態(tài)決定了數(shù)據(jù)導(dǎo)入成效的緊張性。(1)試驗(yàn)數(shù)據(jù)格式多變?nèi)缃駠H和海內(nèi)的試驗(yàn)數(shù)據(jù)網(wǎng)羅裝備多種多樣,而且還沒有形成同一的尺度,而且很多客戶單元也大量接納非標(biāo)裝備,于是網(wǎng)羅的試驗(yàn)數(shù)據(jù)格式也就多種多樣。這對td體系的導(dǎo)入成效帶來了很多的挑釁。(2)試驗(yàn)數(shù)據(jù)量很大試驗(yàn)作為產(chǎn)物研產(chǎn)生命周期的緊張事情,其職位日漸加強(qiáng),試驗(yàn)產(chǎn)生的數(shù)據(jù)量也呈多少數(shù)目級增長。td體系的導(dǎo)入性能也就成為一個(gè)關(guān)鍵指標(biāo)。2數(shù)據(jù)導(dǎo)入成效特點(diǎn)同很多etl東西一樣,td體系的導(dǎo)入成效包羅extrat(抽取)、transfer(轉(zhuǎn)換)、lean(洗濯)和lad(裝載)等幾個(gè)

3、步調(diào)。但是,試驗(yàn)數(shù)據(jù)辦理的特別需求決定了它又具有自身的特點(diǎn)。除了前面提到的數(shù)據(jù)格式多樣、數(shù)據(jù)量大之外,單元保密要求對付產(chǎn)物架構(gòu)方案產(chǎn)生了很大的影響。很多單元,尤其是國防單元,都有嚴(yán)酷的保密制度。在信息化體系的擺設(shè)方面,平凡用戶盤算機(jī)一樣平常是不容許直接拜候數(shù)據(jù)庫的,只有指定的辦事器才有權(quán)限直接拜候數(shù)據(jù)庫。這就決定了傳統(tǒng)的/s兩層布局不克不及順應(yīng)客戶需求,b/s三層布局那么成為必需的選擇。3三層布局辦理方案我們把體系分為三層布局:用戶層、應(yīng)用層和數(shù)據(jù)層,如圖1所示。此中用戶層為數(shù)據(jù)導(dǎo)入客戶端東西;應(yīng)用層為基于j2ee平臺的應(yīng)用辦事器和ftp辦事器,j2ee辦事器提供ebservie,包羅ebse

4、rvie和javabeans等j2ee組件;ftp辦事器提供對上傳文件的辦理成效,并提供多線程的文件上載到數(shù)據(jù)層的成效。數(shù)據(jù)層包羅數(shù)據(jù)庫辦事器,此中數(shù)據(jù)庫辦事器中包羅體系的元數(shù)據(jù)庫、業(yè)務(wù)數(shù)據(jù)庫和相干的背景歷程。在用戶層中,數(shù)據(jù)導(dǎo)入東西通過ebservie接口與體系應(yīng)用層提供的ebservie舉行交互,創(chuàng)立相應(yīng)的映射規(guī)矩,同時(shí)數(shù)據(jù)導(dǎo)入東西對用戶導(dǎo)入的非布局化數(shù)據(jù)文件舉行抽取和轉(zhuǎn)換,剖析成格式化、布局化的文本文件,并把導(dǎo)入的數(shù)據(jù)規(guī)矩及映射干系等信息保存下來,然后通過ftp把轉(zhuǎn)化后的文件上傳到應(yīng)用層,同時(shí)通過ebservie接口把數(shù)據(jù)校驗(yàn)及關(guān)聯(lián)映射信息傳到應(yīng)用層。在體系應(yīng)用層中,ebservie按照

5、用戶層的哀求信息在內(nèi)部調(diào)用相應(yīng)的javabean組件,javabean組件通過拜候數(shù)據(jù)庫辦事器,對數(shù)據(jù)庫辦事器中的元數(shù)據(jù)庫、背景歷程和業(yè)務(wù)數(shù)據(jù)庫舉行操縱。在三層布局的數(shù)據(jù)導(dǎo)入東西中接納應(yīng)用層重要是為了包管體系的機(jī)動性和數(shù)據(jù)的寧靜性,用戶層不克不及直接拜候數(shù)據(jù)庫,用戶層對數(shù)據(jù)的操縱都要通過應(yīng)用層才氣拜候到數(shù)據(jù)層。應(yīng)用層提供ftp辦事器的成效重要是為了進(jìn)步數(shù)據(jù)文件上傳的速率,也可以接納sket編程的方法實(shí)現(xiàn)文件的上傳,同時(shí)ftp辦事器提供文件下載成效,當(dāng)客戶端的數(shù)據(jù)文件上傳完成后可以體系主動把相應(yīng)的文件下載到數(shù)據(jù)層的數(shù)據(jù)庫辦事器上。在數(shù)據(jù)層中,元數(shù)據(jù)庫、業(yè)務(wù)數(shù)據(jù)庫和背景歷程通過應(yīng)用層javabea

6、n組件被拜候,當(dāng)應(yīng)用層的數(shù)據(jù)文件吸收樂成后,通過rale數(shù)據(jù)庫的特性,接納創(chuàng)立外部表的方法對數(shù)據(jù)文件舉行“導(dǎo)入,然后對導(dǎo)入外部表的數(shù)據(jù)舉行校驗(yàn)和處置懲罰,并返回?cái)?shù)據(jù)導(dǎo)入的提示信息通過應(yīng)用層到數(shù)據(jù)導(dǎo)入東西,然后再把外部表中的數(shù)據(jù)導(dǎo)入到現(xiàn)實(shí)表中。4數(shù)據(jù)庫技能提拔導(dǎo)入性能為了進(jìn)步數(shù)據(jù)導(dǎo)入的性能,我們思量數(shù)據(jù)導(dǎo)入方案接納先導(dǎo)入暫時(shí)表然后舉行校驗(yàn)、末了再導(dǎo)入到真實(shí)表的方法.由于暫時(shí)表中無索引、數(shù)據(jù)量少,因此能明顯進(jìn)步數(shù)據(jù)導(dǎo)入速率和性能。數(shù)據(jù)導(dǎo)入暫時(shí)表后,通過數(shù)據(jù)庫的成效實(shí)現(xiàn)對暫時(shí)表中的數(shù)據(jù)舉行校驗(yàn)和掃除,同時(shí)產(chǎn)生數(shù)據(jù)導(dǎo)入日記信息,先導(dǎo)入后校驗(yàn)的方法可以進(jìn)一步進(jìn)步數(shù)據(jù)導(dǎo)入的速率。數(shù)據(jù)導(dǎo)入的末了一步才是把暫

7、時(shí)表中的數(shù)據(jù)導(dǎo)入到真實(shí)表中,為了進(jìn)步性能,可以在晚間數(shù)據(jù)庫拜候少的時(shí)間體系主動實(shí)現(xiàn)數(shù)據(jù)從暫時(shí)表導(dǎo)入到真實(shí)表,同時(shí)清空暫時(shí)表中數(shù)據(jù)。結(jié)合rale數(shù)據(jù)庫體系提供的特性,可以利用創(chuàng)立外部表的要領(lǐng)來實(shí)現(xiàn)暫時(shí)表的成效,rale數(shù)據(jù)庫可以把一個(gè)平凡的文本格式文件看作是rale數(shù)據(jù)庫的外部表,外部表可以像平凡表一樣舉行selet操縱,可以建視圖,可以與其他舉行毗連等,但不克不及對其舉行dl操縱,即該表是只讀的。外部表為rale用戶提供了宏大的利益。通過利用外部表,arehusebuilder開拓職員不再必要創(chuàng)立平面文件暫時(shí)表。如許,外部表就淘汰了加載平面文件數(shù)據(jù)的處置懲罰時(shí)間,而且必要的分外存儲空間也比平面文件暫時(shí)表少。外部表可以與干系表和其他外部表毗連,從而在平面文件和干系表之間實(shí)現(xiàn)了異類毗連。別的由于消除了分外的步調(diào),因此pl/sql轉(zhuǎn)換與sql加載步伐轉(zhuǎn)換比擬越發(fā)機(jī)動,從而在大多數(shù)環(huán)境下將得到宏大的性能提拔。5竣事語td體系的導(dǎo)入成效是其焦點(diǎn)成效之一,一些通用etl技能都實(shí)用于該成效。本文僅從試驗(yàn)數(shù)據(jù)辦理需求的角度提出了數(shù)據(jù)導(dǎo)入技能的實(shí)現(xiàn)要領(lǐng),并提到了數(shù)據(jù)導(dǎo)入性能提拔本領(lǐng)。td技能尚未成熟,此中的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論