下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 基于國(guó)產(chǎn)軟硬件的行業(yè)大數(shù)據(jù)體系架構(gòu)研究 大數(shù)據(jù)技術(shù)最近幾年在迅速發(fā)展,國(guó)內(nèi)外的廠商和組織已經(jīng)推出了多種大數(shù)據(jù)解決方案。在金融領(lǐng)域,已經(jīng)利用大數(shù)據(jù)技術(shù)解決詐騙檢驗(yàn)、IT風(fēng)險(xiǎn)管理和自助服務(wù)等問(wèn)題,未來(lái)大數(shù)據(jù)技術(shù)將會(huì)起到越來(lái)越重要的作用。由于國(guó)內(nèi)外針對(duì)商業(yè)機(jī)構(gòu)系統(tǒng)頻頻發(fā)生的安全事件,國(guó)內(nèi)各行業(yè)的信息化目前正在向基于國(guó)產(chǎn)軟硬件和自主可控方向發(fā)展,大數(shù)據(jù)也是目前國(guó)內(nèi)各行業(yè)重點(diǎn)關(guān)注的技術(shù)。很多廠商和企業(yè)紛紛進(jìn)行技術(shù)研究、方案準(zhǔn)備和內(nèi)部測(cè)試,并逐步開(kāi)始在歷史數(shù)據(jù)查詢、分析,非結(jié)構(gòu)化數(shù)據(jù)檢索等方向上開(kāi)始使用。從最近幾年的趨勢(shì)來(lái)看,安全、自主可控的大數(shù)據(jù)解決方案在大數(shù)據(jù)行業(yè)領(lǐng)域有非常大的市場(chǎng)需求。國(guó)內(nèi)很多關(guān)鍵
2、行業(yè)應(yīng)用,如金融信息系統(tǒng)的許多關(guān)鍵設(shè)備都沒(méi)有采用國(guó)產(chǎn)產(chǎn)品,導(dǎo)致無(wú)法準(zhǔn)確判斷其安全隱患,這使得我國(guó)信息化建設(shè)的安全底數(shù)不清。迫切需要國(guó)內(nèi)IT企業(yè)和行業(yè)共同研發(fā)自主可控、自主知識(shí)產(chǎn)權(quán)的信息系統(tǒng)、信息環(huán)境和信息安全產(chǎn)品。針對(duì)這種狀況國(guó)家銀監(jiān)會(huì)提出了“自主可控,持續(xù)發(fā)展,科技創(chuàng)新”的三大戰(zhàn)略,國(guó)產(chǎn)的信息化產(chǎn)品,在金融領(lǐng)域的應(yīng)用已經(jīng)開(kāi)始了破冰之旅,事實(shí)證明,自主可控的軟硬件產(chǎn)品,在關(guān)鍵行業(yè)領(lǐng)域的應(yīng)用是可行的,但是缺乏完整的經(jīng)過(guò)驗(yàn)證的整體解決方案和實(shí)際案例,無(wú)法復(fù)制和推廣。行業(yè)大數(shù)據(jù)應(yīng)用的需求分析(1)面向多源異構(gòu)業(yè)務(wù)數(shù)據(jù)的采集和管理需求以在客戶信息為例,行業(yè)內(nèi)的集團(tuán)企業(yè)經(jīng)常會(huì)面臨急需解決的數(shù)據(jù)集成問(wèn)題,
3、企業(yè)存在大量分散的客戶信息資源,并由各系統(tǒng)自主采集和維護(hù),沒(méi)有良好的共享體系,客戶信息、訂單信息等異構(gòu)的存在不同數(shù)據(jù)源中,沒(méi)有橫跨多個(gè)業(yè)務(wù)領(lǐng)域的客戶信息的統(tǒng)一管理和分發(fā)體系。因此,要求統(tǒng)一建設(shè)行業(yè)信息大數(shù)據(jù)管理系統(tǒng),是一套為所有在線業(yè)務(wù)服務(wù)的、整合的行業(yè)信息大數(shù)據(jù)管理與分析系統(tǒng),并具有行業(yè)先進(jìn)水平的大數(shù)據(jù)管理和分析能力,以滿足企業(yè)形成市場(chǎng)競(jìng)爭(zhēng)優(yōu)勢(shì)的要求。(2)針對(duì)海量異構(gòu)大數(shù)據(jù)的高性能存儲(chǔ)需求通過(guò)調(diào)研發(fā)現(xiàn)很多大型企業(yè)的信息系統(tǒng)已經(jīng)積累了大量的業(yè)務(wù)數(shù)據(jù),而且隨著業(yè)務(wù)拓展的需求,大數(shù)據(jù)分析的數(shù)據(jù)源已經(jīng)不僅局限于企業(yè)內(nèi)部,如對(duì)客戶流失分析或者產(chǎn)品銷售趨勢(shì)預(yù)測(cè),就還需要互聯(lián)網(wǎng)社交網(wǎng)絡(luò)或者電商消費(fèi)信息等
4、。這些多源、異構(gòu)、海量的數(shù)據(jù)對(duì)于大數(shù)據(jù)平臺(tái)的存儲(chǔ)提出了極高的要求。以某大型企業(yè)集團(tuán)的客戶和生產(chǎn)經(jīng)營(yíng)信息為例,數(shù)據(jù)規(guī)模已經(jīng)達(dá)到上百TB容量,且相關(guān)數(shù)據(jù)量,特別是生產(chǎn)線的傳感器數(shù)據(jù)和用戶行為等數(shù)據(jù)還在持續(xù)大幅增長(zhǎng)。(3)多樣性大數(shù)據(jù)分析和處理需求大數(shù)據(jù)分析系統(tǒng)不但集成了多個(gè)系統(tǒng)的數(shù)據(jù)源,未來(lái)大數(shù)據(jù)分析應(yīng)用系統(tǒng)也會(huì)被多個(gè)部門(mén),多個(gè)業(yè)務(wù)中使用,而且不同的部門(mén)和不同業(yè)務(wù)對(duì)大數(shù)據(jù)分析處理 的響應(yīng)時(shí)間、數(shù)據(jù)量、結(jié)果準(zhǔn)確程度以及具體的分析算法都會(huì)有很大差異。因此需要完整的對(duì)這些分析和處理需求進(jìn)行分析,以便于設(shè)計(jì)滿足當(dāng)前和潛在需求的大數(shù)據(jù)分析處理架構(gòu)。(4)行業(yè)大數(shù)據(jù)的安全監(jiān)控和隱私保護(hù)需求面向行業(yè)和企業(yè)的大數(shù)
5、據(jù)平臺(tái)都將集成來(lái)自于不同數(shù)據(jù)源的數(shù)據(jù),其中有很多數(shù)據(jù)會(huì)涉及商業(yè)秘密和個(gè)人隱私等安全問(wèn)題,所以這些數(shù)據(jù)在大數(shù)據(jù)平臺(tái)中應(yīng)該被合理的授權(quán)使用,并有完善的安全監(jiān)控和隱私保護(hù)措施,以避免引起數(shù)據(jù)泄密或者隱私糾紛。(5)行業(yè)大數(shù)據(jù)平臺(tái)的業(yè)務(wù)應(yīng)用和可視化展現(xiàn)的需求大數(shù)據(jù)分析的結(jié)果是更好的支持業(yè)務(wù)推廣和運(yùn)營(yíng)決策,所以企業(yè)大數(shù)據(jù)分析還是要和現(xiàn)有的業(yè)務(wù)應(yīng)用緊密結(jié)合,并且以簡(jiǎn)單友好的操作,以及可視化的方式直觀的展現(xiàn)分析結(jié)果,這樣才能被各部門(mén)和各級(jí)別的人員使用好大數(shù)據(jù)系統(tǒng)。基于自主可控服務(wù)器的大數(shù)據(jù)基礎(chǔ)架構(gòu)研究通過(guò)行業(yè)大數(shù)據(jù)需求和數(shù)據(jù)現(xiàn)狀的調(diào)研和測(cè)算,大數(shù)據(jù)基礎(chǔ)平臺(tái)如采用傳統(tǒng)的集中數(shù)據(jù)庫(kù)Oracle+小型機(jī)+集中式存
6、儲(chǔ)環(huán)境,將無(wú)法滿足大數(shù)據(jù)在存儲(chǔ)和分析處理方面的需求,而且采用國(guó)外進(jìn)口設(shè)備為主的方式也無(wú)法保證系統(tǒng)數(shù)據(jù)的安全和自主可控,國(guó)外小型機(jī)和存儲(chǔ)的硬件成本過(guò)高,投入產(chǎn)出比低。因此本文研究對(duì)比了主流的大數(shù)據(jù)硬件方案,提出基于國(guó)產(chǎn)主機(jī)的行業(yè)大數(shù)據(jù)基礎(chǔ)平臺(tái),包括分布式Hadoop大數(shù)據(jù)存儲(chǔ)和處理集群、分布式海量數(shù)據(jù)采集集群和應(yīng)用與可視化展現(xiàn)服務(wù)器集群架構(gòu)研究,形成滿足行業(yè)大數(shù)據(jù)應(yīng)用的基礎(chǔ)硬件平臺(tái)技術(shù)方案。系統(tǒng)的網(wǎng)絡(luò)部署架構(gòu)如下圖所示:自主可控的大數(shù)據(jù)分析基礎(chǔ)軟件平臺(tái)研究通過(guò)項(xiàng)目前期技術(shù)研究和分析,我們發(fā)現(xiàn)傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)模式進(jìn)行行大數(shù)據(jù)分析在軟件平臺(tái)方面是不能滿足性能、容量和成本方面的需求的。為此,我們對(duì)大數(shù)據(jù)軟
7、件平臺(tái)進(jìn)行充分對(duì)比研究,重點(diǎn)研究了國(guó)內(nèi)面向行業(yè)的大數(shù)據(jù)平臺(tái)的軟件基礎(chǔ)架構(gòu),包括操作系統(tǒng)、分布式文件系統(tǒng)、列式數(shù)據(jù)庫(kù)、批處理框架、內(nèi)存計(jì)算引擎、資源調(diào)度、安全管控等方面的研究。形成了滿足行業(yè)大數(shù)據(jù)應(yīng)用的基礎(chǔ)軟件平臺(tái)技術(shù)方案。我們研究和評(píng)估了基于國(guó)產(chǎn)操作系統(tǒng)和基于開(kāi)源自主可控的大數(shù)據(jù)平臺(tái)基礎(chǔ)軟件架構(gòu),操作系統(tǒng)層面可以支持國(guó)產(chǎn)Linux和Unix操作系統(tǒng)。大數(shù)據(jù)基礎(chǔ)軟件架構(gòu)采用了大量的組件實(shí)現(xiàn)大數(shù)據(jù)的存儲(chǔ)、計(jì)算、分析和管理功能,如上圖所示。在大數(shù)據(jù)軟件架構(gòu)中設(shè)計(jì)通過(guò)分布式ETL工具各業(yè)務(wù)系統(tǒng)完成數(shù)據(jù)采集,支持結(jié)構(gòu)化數(shù)據(jù)以及非/半結(jié)構(gòu)化數(shù)據(jù),即數(shù)據(jù)庫(kù)數(shù)據(jù)、文件、日志等類型,采集數(shù)據(jù)包括全量歷史數(shù)據(jù)遷移
8、以及增量數(shù)據(jù)同步。未來(lái)保證數(shù)據(jù)質(zhì)量和數(shù)據(jù)溯源,采集過(guò)程中需要對(duì)數(shù)據(jù)質(zhì)量分析、治理。架構(gòu)中設(shè)計(jì)了數(shù)據(jù)分層存儲(chǔ)的解決方案,對(duì)于需要進(jìn)行持久化存儲(chǔ)的數(shù)據(jù)(離線保存3年以上)和非結(jié)構(gòu)化數(shù)據(jù),可直接在HDFS中存放,以數(shù)據(jù)倉(cāng)庫(kù)ORC表形式存儲(chǔ);需要挖掘或檢索管理的數(shù)據(jù)放入HBase列式數(shù)據(jù)庫(kù)中,并支持與傳統(tǒng)數(shù)據(jù)庫(kù)互導(dǎo),系統(tǒng)會(huì)自動(dòng)完成多個(gè)數(shù)據(jù)副本的拷貝,從而實(shí)現(xiàn)冗余備份;對(duì)于需要快速實(shí)時(shí)交互式分析 的數(shù)據(jù)以Cube的形式存儲(chǔ)在SSD或內(nèi)存中,可以提供快速交互式分析能力。架構(gòu)中還包括了數(shù)據(jù)分析功能和組件,對(duì)需要進(jìn)行數(shù)據(jù)關(guān)聯(lián)分析和數(shù)據(jù)挖掘等涉及大數(shù)據(jù)量的統(tǒng)計(jì)和查詢需求的應(yīng)用,可選用Mahout,R等數(shù)據(jù)分析和數(shù)據(jù)挖掘工具。架構(gòu)中的數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度高速公路LED顯示屏購(gòu)銷合同
- 2024年度智能機(jī)場(chǎng)行李處理系統(tǒng)供應(yīng)合同
- 2024年度軟件許可合同:CRM系統(tǒng)銷售管理專用
- DB4117T 221-2019 夏季番茄嫁接育苗技術(shù)規(guī)程
- DB4115T 046-2018 信陽(yáng)傳統(tǒng)風(fēng)味小吃烹飪技藝 金絲貢馓
- DB4114T 161-2021 甘薯機(jī)械化生產(chǎn)技術(shù)規(guī)程
- 押題08城鎮(zhèn)變化與區(qū)域發(fā)展-備戰(zhàn)2023年高考地理之考前押大題(解析版)
- 2024年房產(chǎn)交易協(xié)議模板
- 2024年商業(yè)門(mén)面租賃合同格式
- 2024年擔(dān)保公司債務(wù)契約匯編:個(gè)人與企業(yè)間借款協(xié)議指南
- 2024江蘇省沿海開(kāi)發(fā)集團(tuán)限公司招聘23人高頻難、易錯(cuò)點(diǎn)500題模擬試題附帶答案詳解
- 2024年計(jì)算機(jī)二級(jí)WPS考試題庫(kù)380題(含答案)
- 22G101三維彩色立體圖集
- 大學(xué)生安全文化智慧樹(shù)知到期末考試答案章節(jié)答案2024年中南大學(xué)
- 建筑施工安全生產(chǎn)治本攻堅(jiān)三年行動(dòng)方案(2024-2026年)
- 人教版小學(xué)英語(yǔ)單詞表(完整版)
- DL-T 1476-2023 電力安全工器具預(yù)防性試驗(yàn)規(guī)程
- 國(guó)家開(kāi)放大學(xué)《心理健康教育》形考任務(wù)1-9參考答案
- MOOC 法理學(xué)-西南政法大學(xué) 中國(guó)大學(xué)慕課答案
- 《短視頻拍攝與制作》課件-3短視頻拍攝的三大技巧
- 【川教版】《生命 生態(tài) 安全》四上第11課《預(yù)防流感》課件
評(píng)論
0/150
提交評(píng)論