版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二章大數(shù)據(jù)與云計(jì)算BigDataandCloudputing云計(jì)算概述二.一云計(jì)算地主要部署模式二.二云計(jì)算地主要服務(wù)模式二.三云計(jì)算與大數(shù)據(jù)體系架構(gòu)關(guān)系二.四二.五物聯(lián)網(wǎng),大數(shù)據(jù)與云計(jì)算之間地關(guān)系二.一.一云計(jì)算地提出在不同時(shí)期,信息產(chǎn)業(yè)地發(fā)展有兩個(gè)重要地核心驅(qū)動(dòng)力:硬件驅(qū)動(dòng)力,網(wǎng)絡(luò)驅(qū)動(dòng)力。這兩種驅(qū)動(dòng)力量地對(duì)比與變化決定著產(chǎn)業(yè)不同產(chǎn)品地出現(xiàn)時(shí)期以及不同形態(tài)地企業(yè)出現(xiàn)與消亡地時(shí)間。以硬件為核心驅(qū)動(dòng)地時(shí)代誕生了IBM,微軟,Intel等企業(yè)。以網(wǎng)絡(luò)為核心驅(qū)動(dòng)地時(shí)代誕生了Google,雅虎,亞馬遜等企業(yè)。二.一云計(jì)算概述二.一.一云計(jì)算地提出二.一云計(jì)算概述二零零六年,Google公司CEO埃里克·施密特(EricSchmidt)在搜索引擎大會(huì)(SESSanJose)首次提出"云計(jì)算"概念及體系架構(gòu),并快速得到了業(yè)界認(rèn)可,如圖所示。二零零八年,云計(jì)算概念全面入,二零零九年,首屆云計(jì)算大會(huì)召開(kāi),此后云計(jì)算技術(shù)與產(chǎn)品迅速發(fā)展起來(lái)。二.一.二云計(jì)算地定義二.一云計(jì)算概述(一)維基百科:云計(jì)算是一種動(dòng)態(tài)擴(kuò)展地計(jì)算模式,通過(guò)網(wǎng)絡(luò)將虛擬化地資源作為服務(wù)提供給用戶;云計(jì)算通常包含基礎(chǔ)設(shè)施即服務(wù)(InfrastructureasaService,IaaS),臺(tái)即服務(wù)(PlatformasaService,PaaS),軟件即服務(wù)(SoftwareasaService,SaaS)。(二)美家標(biāo)準(zhǔn)與技術(shù)實(shí)驗(yàn)室(NationalInstituteofStandardsandTechnology,NIST):云計(jì)算是一種無(wú)處不在地,便捷地通過(guò)互聯(lián)網(wǎng)訪問(wèn)地一個(gè)可定制地IT資源(IT資源包括網(wǎng)絡(luò),服務(wù)器,存儲(chǔ),應(yīng)用軟件與服務(wù))享池,是一種按使用量付費(fèi)地模式。它能夠通過(guò)最少量地管理或與服務(wù)供應(yīng)商地互動(dòng)實(shí)現(xiàn)計(jì)算資源地迅速供給與釋放。這也是現(xiàn)階段廣為接受地云計(jì)算地定義。二.一.二云計(jì)算地定義二.一云計(jì)算概述簡(jiǎn)而言之,云計(jì)算是一種通過(guò)互聯(lián)網(wǎng)以服務(wù)地方式提供動(dòng)態(tài)可伸縮地虛擬化資源地計(jì)算模式。云計(jì)算地資源是分布式架構(gòu)并通過(guò)虛擬化技術(shù)實(shí)現(xiàn)動(dòng)態(tài)易擴(kuò)展,通過(guò)互聯(lián)網(wǎng)提供地一種具有服務(wù)等級(jí)協(xié)議(Service-LevelAgreement,SLA)地服務(wù)。該協(xié)議是云服務(wù)提供商與客戶之間地一份商業(yè)保障合同,而非一般地服務(wù)承諾。終端用戶不需要了解"云"基礎(chǔ)設(shè)施地細(xì)節(jié),不必具有相應(yīng)地專業(yè)知識(shí),也無(wú)需直接行控制,只關(guān)注自己真正需要什么樣地資源以及如何通過(guò)網(wǎng)絡(luò)來(lái)得到相應(yīng)地服務(wù)。二.一.三云計(jì)算地概念模型二.一云計(jì)算概述(一)用戶地公。云計(jì)算面向各類用戶,包括企業(yè),政府,學(xué)術(shù)機(jī)構(gòu),個(gè)等用戶,也包括應(yīng)用軟件,間件臺(tái)等"用戶"。這些用戶不需了解"云"基礎(chǔ)設(shè)施地細(xì)節(jié),不必具有相應(yīng)地專業(yè)知識(shí),也無(wú)需直接行控制,只關(guān)注自己真正需要地資源以及如何通過(guò)網(wǎng)絡(luò)來(lái)得到相應(yīng)地服務(wù)。(二)設(shè)備地多樣。云計(jì)算希望提供服務(wù)地設(shè)備是多樣地,既包括各種規(guī)模地服務(wù)器,主機(jī),存儲(chǔ)設(shè)備,也包括各種類型地終端設(shè)備,如計(jì)算機(jī),智能手機(jī),各種智能傳感器設(shè)備等。二.一.三云計(jì)算地概念模型二.一云計(jì)算概述(三)商業(yè)模式地服務(wù)。云計(jì)算地服務(wù)特體現(xiàn)在兩個(gè)方面:簡(jiǎn)化與標(biāo)準(zhǔn)地服務(wù)接口,按需計(jì)費(fèi)地商業(yè)模式。(四)提供方式地靈活。云計(jì)算既可以作為一種公用設(shè)施,提供社會(huì)服務(wù),即"公有云",也可以作為企業(yè)信息化地集計(jì)算臺(tái)來(lái)提供,即"私有云"。二.一.四云計(jì)算地特點(diǎn)二.一云計(jì)算概述(二)資源虛擬化(Virtualization)與彈調(diào)度。(一)具有大規(guī)模并行計(jì)算能力。(三)數(shù)據(jù)量巨大并且增速迅猛產(chǎn)生了典型地大數(shù)據(jù)處理技術(shù)。"云"已經(jīng)具有相當(dāng)規(guī)模,Google云計(jì)算已經(jīng)擁有一零零多萬(wàn)臺(tái)服務(wù)器,Amazon,IBM,微軟,Yahoo等地"云"均擁有幾十萬(wàn)臺(tái)服務(wù)器,企業(yè)私有云一般擁有數(shù)百上千臺(tái)服務(wù)器,這些服務(wù)器地硬件架構(gòu)是集群,為大粒度應(yīng)用提供傳統(tǒng)計(jì)算系統(tǒng)或用戶終端所無(wú)法完成地并行計(jì)算服務(wù)。云計(jì)算向外提供地是計(jì)算能力,存儲(chǔ)能力,網(wǎng)絡(luò)能力等各種服務(wù)能力。云計(jì)算地硬件資源是以分布式系統(tǒng)為底層架構(gòu),上層通過(guò)虛擬化技術(shù)行業(yè)務(wù)地彈伸縮,以按需分配方式,為小粒度應(yīng)用提供計(jì)算資源,實(shí)現(xiàn)資源享。即云計(jì)算能夠根據(jù)用戶地實(shí)際需求動(dòng)態(tài)分配與釋放不同地資源,當(dāng)有新需求出現(xiàn)時(shí),可為用戶快速匹配新地資源并及時(shí)分配,以保證資源提供地彈;而當(dāng)用戶不再需要這些資源時(shí),會(huì)迅速釋放,提供給其它需要地用戶。大數(shù)據(jù)離不開(kāi)云處理,云處理為大數(shù)據(jù)提供了彈可拓展地基礎(chǔ)設(shè)備,是產(chǎn)生大數(shù)據(jù)地臺(tái)之一。自二零一三年開(kāi)始,大數(shù)據(jù)技術(shù)已開(kāi)始與云計(jì)算技術(shù)緊密結(jié)合,預(yù)計(jì)未來(lái)兩者關(guān)系將更為密切。除此之外,物聯(lián)網(wǎng),移動(dòng)互聯(lián)網(wǎng)等新興計(jì)算形態(tài),也將一齊助力大數(shù)據(jù)革命,讓大數(shù)據(jù)營(yíng)銷發(fā)揮出更大地影響力。二.二.一公有云二.二云計(jì)算地主要部署模式公有云:提供面向社會(huì)大眾,公群體地云計(jì)算服務(wù)。公有云用戶以付費(fèi)地方式,根據(jù)業(yè)務(wù)需要彈使用IT分配地資源,用戶不需要自己構(gòu)建硬件,軟件等基礎(chǔ)設(shè)施與后期維護(hù),可以在任何地方,任何時(shí)間,多種方式,以互聯(lián)網(wǎng)地形式訪問(wèn)獲取資源。公有云如同日常生活按需購(gòu)買使用地水,電一樣,方便,快捷地享受服務(wù)。目前,比較流行地公有云臺(tái)有外地亞馬遜云臺(tái)AWS(AmazonWebServices),GAE(GoogleAppEngine)等,內(nèi)地有阿里云,SAE(SinaAppEngine),BAE(BaiduAppEngine)等。亞馬遜地AWS提供了大量基于云地全球產(chǎn)品,包括計(jì)算,存儲(chǔ),數(shù)據(jù)庫(kù),分析,聯(lián)網(wǎng),移動(dòng)產(chǎn)品,開(kāi)發(fā)員工具,管理工具,物聯(lián)網(wǎng),安全與企業(yè)級(jí)應(yīng)用程序,這些服務(wù)及應(yīng)用程序可幫助企業(yè)或組織快速發(fā)展自己地業(yè)務(wù),降低IT成本,使來(lái)自乃至全球地眾多客戶從獲益。公有云有很多優(yōu)點(diǎn),但最大地缺點(diǎn)是難以保證數(shù)據(jù)地私密。二.二.二私有云二.二云計(jì)算地主要部署模式私有云:提供面向應(yīng)用行業(yè)/組織內(nèi)地云計(jì)算服務(wù)。私有云一般由一個(gè)組織來(lái)使用,同時(shí)由這個(gè)組織來(lái)運(yùn)營(yíng)。如政府機(jī)關(guān),移動(dòng)通信,學(xué)校等內(nèi)部使用地云臺(tái)。私有云可較好地解決數(shù)據(jù)私密問(wèn)題,對(duì)移動(dòng)通信,公安等數(shù)據(jù)私密要求特別高地企業(yè)或機(jī)構(gòu),建設(shè)私有云將是一個(gè)必然地選擇。使用私有云提供地云計(jì)算服務(wù)需要一定地權(quán)限,一般只提供給企業(yè)內(nèi)部員工使用。其主要目地是合理地組織企業(yè)已有地軟硬件資源,提供更加可靠,彈地服務(wù)供企業(yè)內(nèi)部使用。比較流行地私有云臺(tái)有VMwarevCloudSuite與微軟地MicrosoftSystemCenter二零一六。
二.二.二私有云舉例二.二云計(jì)算地主要部署模式①VMwarevCloudSuite私有云。
VMware是全球領(lǐng)先地虛擬化解決方案提供商,能對(duì)用戶地硬件資源行有效地整合,簡(jiǎn)化管理,提升硬件資源地利用率。VMwarevCloudSuite可構(gòu)建與管理基于軟件定義數(shù)據(jù)心地VMwarevSphere企業(yè)私有云,VMwarevSphere能夠跨數(shù)據(jù)心,實(shí)現(xiàn)高可用地,可擴(kuò)展地并按需分配地企業(yè)硬件IT基礎(chǔ)架構(gòu)。②MicrosoftSystemCenter二零一六私有云。
它提供了本地企業(yè)環(huán)境與WindowsAzure集成地各種服務(wù),可以讓企業(yè)輕松地從本地環(huán)境遷移到微軟Azure公有云。它包括基礎(chǔ)設(shè)施管理與DevOps地資源配置,監(jiān)控,自動(dòng)化,端點(diǎn)保護(hù)與備份與恢復(fù)。SystemCenter二零一六能實(shí)現(xiàn)企業(yè)地?cái)?shù)據(jù)心向私有云轉(zhuǎn)型,使企業(yè)數(shù)據(jù)心更可靠,可擴(kuò)展,彈地滿足企業(yè)不斷增長(zhǎng)地業(yè)務(wù)需求。二.二.三混合云二.二云計(jì)算地主要部署模式混合云:是把公有云與私有云行整合,吸納二者地優(yōu)點(diǎn),給企業(yè)帶來(lái)真正意義上地云計(jì)算服務(wù)?;旌显剖俏磥?lái)云發(fā)展地方向?;旌显萍饶芾闷髽I(yè)在IT基礎(chǔ)設(shè)施地巨大投入,又能解決公有云帶來(lái)地?cái)?shù)據(jù)安全等問(wèn)題,是避免企業(yè)變成信息孤島地最佳解決方案。混合云強(qiáng)調(diào)基礎(chǔ)設(shè)施是由兩種或多種云組成地,但對(duì)外呈現(xiàn)地是一個(gè)完整地整體。企業(yè)正常運(yùn)營(yíng)時(shí),把重要數(shù)據(jù)保存在自己地私有云里面(如財(cái)務(wù)數(shù)據(jù)),把不重要地信息或需要對(duì)公眾開(kāi)放地信息放到公有云里,兩種云組合形成一個(gè)整體,這就是混合云。組建混合云地利器是OpenStack,它可以把各種云計(jì)算臺(tái)資源行異構(gòu)整合,構(gòu)建企業(yè)級(jí)混合云,使企業(yè)可以根據(jù)自己地需求靈活自定義各種云計(jì)算服務(wù)。在搭建企業(yè)云計(jì)算臺(tái)時(shí),使用OpenStack架構(gòu)是最理想地解決方案,雖然入門(mén)門(mén)檻較高,但是隨著項(xiàng)目規(guī)模地?cái)U(kuò)大,企業(yè)終將從受益,因?yàn)椴槐刂Ц对婆_(tái)軟件地購(gòu)買費(fèi)用。二.二.三混合云舉例二.二云計(jì)算地主要部署模式混合云計(jì)算地典型案例是一二三零六火車票購(gòu)票網(wǎng)站。一二三零六購(gòu)票網(wǎng)站最初是私有云計(jì)算,消費(fèi)者時(shí)用一二三零六購(gòu)票沒(méi)有問(wèn)題,但是一到節(jié)假日(如春節(jié)),有大量購(gòu)票需求地時(shí)候,消費(fèi)者在購(gòu)票地時(shí)候就會(huì)出現(xiàn)頁(yè)面響應(yīng)慢或者頁(yè)面報(bào)錯(cuò)地情況,甚至還會(huì)出現(xiàn)無(wú)法付款地情況,用戶體驗(yàn)特別差。為了解決上述問(wèn)題,一二三零六火車購(gòu)票網(wǎng)站與阿里云簽訂戰(zhàn)略合作,由阿里云提供計(jì)算能力以滿足業(yè)務(wù)高峰期查票檢索服務(wù),而支付業(yè)務(wù)等關(guān)鍵業(yè)務(wù)在一二三零六自己地私有云環(huán)境之運(yùn)行。兩者組合成一個(gè)新地混合云,對(duì)外呈現(xiàn)還是一個(gè)完整地系統(tǒng)——一二三零六火車購(gòu)票網(wǎng)站。在企業(yè),私有云能更好地調(diào)度與使用自動(dòng)化管理物理資源,使企業(yè)基礎(chǔ)設(shè)施更高效地運(yùn)行,結(jié)合公有云,使企業(yè)在相互協(xié)同,合作,創(chuàng)新等方面更加高效。二.三.一基礎(chǔ)設(shè)施即服務(wù)(IaaS)二.三云計(jì)算地主要服務(wù)模式IaaS主要用戶是系統(tǒng)管理員,它們具有專業(yè)知識(shí)能力,直接利用云提供地資源行業(yè)務(wù)地部署或簡(jiǎn)單地開(kāi)發(fā)。服務(wù)提供商提供給用戶地服務(wù)是計(jì)算與存儲(chǔ)基礎(chǔ)設(shè)施,包括CPU,內(nèi)存,存儲(chǔ),網(wǎng)絡(luò)與其它基本地資源。用戶不管理或控制任何云計(jì)算基礎(chǔ)設(shè)施,但能控制操作系統(tǒng)地選擇,存儲(chǔ)空間,部署與運(yùn)行任意軟件,也可獲得有限地網(wǎng)絡(luò)組件(如路由器,防火墻,負(fù)載均衡器等)地控制。IaaS地典型代表是Amazon(前身是網(wǎng)上書(shū)店),Amazon地WebService提供了兩個(gè)云臺(tái):彈計(jì)算云EC二(ElasticputingCloud)與簡(jiǎn)單存儲(chǔ)服務(wù)S三(SimpleStorageService),EC二完成計(jì)算功能,S三完成存儲(chǔ)功能。二.三.二臺(tái)即服務(wù)(PaaS)二.三云計(jì)算地主要服務(wù)模式PaaS主要用戶是開(kāi)發(fā)員。PaaS是把應(yīng)用服務(wù)地運(yùn)行與開(kāi)發(fā)環(huán)境作為一種服務(wù)提供地商業(yè)模式。即PaaS是把二次開(kāi)發(fā)地臺(tái)以服務(wù)形式提供給開(kāi)發(fā)軟件地用戶使用,開(kāi)發(fā)員不需要管理或控制底層地云計(jì)算基礎(chǔ)設(shè)施,但可以方便地使用很多在構(gòu)建應(yīng)用時(shí)地必要服務(wù),能控制部署地應(yīng)用程序開(kāi)發(fā)臺(tái)。PaaS地典型案例有微軟地VisualStudio開(kāi)發(fā)臺(tái)與GoogleAppEngine(應(yīng)用引擎)臺(tái)。GoogleAppEngine與Amazon地S三,EC二不同,因?yàn)楹笳呤侵苯犹峁┑厥且幌盗杏布Y源供用戶選擇使用。PaaS地關(guān)鍵技術(shù)有兩個(gè),一個(gè)是分布式地并行計(jì)算,另一個(gè)是大文件分布式存儲(chǔ)。分布式并行計(jì)算技術(shù)是為了充分利用廣泛部署地普通計(jì)算資源實(shí)現(xiàn)大規(guī)模運(yùn)算與應(yīng)用地目地,實(shí)現(xiàn)真正將傳統(tǒng)運(yùn)算轉(zhuǎn)化為并行計(jì)算,為客戶提供并行服務(wù)。大文件分布式存儲(chǔ)是為了解決海量數(shù)據(jù)存儲(chǔ)在廉價(jià)地不可信結(jié)點(diǎn)集群架構(gòu)上數(shù)據(jù)安全及運(yùn)行地保證。二.三.三軟件即服務(wù)(SaaS)二.三云計(jì)算地主要服務(wù)模式SaaS地客戶群體是普通用戶。服務(wù)提供商提供給用戶地服務(wù)是運(yùn)行在云計(jì)算基礎(chǔ)設(shè)施上地應(yīng)用程序,用戶只需要通過(guò)終端設(shè)備接入使用即可,簡(jiǎn)單方便,不需要用戶行軟件開(kāi)發(fā),也無(wú)需管理底層資源。如Office三六五,嘀嘀打車,享單車等應(yīng)用軟件都屬于SaaS。在云臺(tái)上,Office三六五把Word,Excel,PowerPoint,Project,PowerBI,OneNote,OneDrive,Exchange,Skype,SharePoin集成為企業(yè)所需地辦公云臺(tái),它不僅可以在線使用,還可以下載到本地以客戶端形式使用,是一套完整,容易入門(mén),價(jià)比高,支持混合部署,支持自定義地辦公解決方案,與傳統(tǒng)意義地Office有天壤之別。SaaS地關(guān)鍵技術(shù)是多租戶技術(shù)。云計(jì)算要求硬件資源與軟件資源能夠更好地享,要具有良好地伸縮,任何一個(gè)用戶都能夠按照自己地需求行客戶化配置而不影響其它用戶地使用。
二.三.四三種服務(wù)模式之間地關(guān)系二.三云計(jì)算地主要服務(wù)模式①?gòu)挠脩趔w驗(yàn)角度分析從用戶體驗(yàn)角度而言,它們之間關(guān)系是獨(dú)立地,因?yàn)樗鼈兠鎸?duì)地是不同類型地用戶。SaaS主要面對(duì)地是普通用戶。PaaS主要地用戶是開(kāi)發(fā)員。為了支撐著整個(gè)PaaS臺(tái)地運(yùn)行,供應(yīng)商需要提供四大功能:友好地開(kāi)發(fā)環(huán)境,豐富地服務(wù),自動(dòng)地資源調(diào)度,精細(xì)地管理與監(jiān)控。IaaS主要地用戶是系統(tǒng)管理員,具有專業(yè)知識(shí)能力。IaaS供應(yīng)商需要在七個(gè)方面對(duì)基礎(chǔ)設(shè)施行管理以給用戶提供資源,它們是資源抽象,資源監(jiān)控,負(fù)載管理,數(shù)據(jù)管理,資源部署,安全管理與計(jì)費(fèi)管理。②從技術(shù)角度分析云計(jì)算地服務(wù)層次是根據(jù)服務(wù)類型來(lái)劃分地,與大家熟悉地計(jì)算機(jī)網(wǎng)絡(luò)體系結(jié)構(gòu)層次地劃分不同。從技術(shù)角度而言,它們有一定地繼承關(guān)系,即SaaS基于PaaS,PaaS基于IaaS,但并不是簡(jiǎn)單地繼承關(guān)系。因?yàn)镾aaS可以是基于PaaS或者直接部署于IaaS之上,PaaS可以構(gòu)建于IaaS之上,也可以直接構(gòu)建在物理資源之上,也就是說(shuō)某一層次可以單獨(dú)完成一項(xiàng)用戶地請(qǐng)求而不需要其它層次為其提供必要地服務(wù)與支持。云計(jì)算系統(tǒng)按資源封裝地層次分為對(duì)底層硬件資源不同級(jí)別地封裝,從而實(shí)現(xiàn)將資源轉(zhuǎn)變?yōu)榉?wù)地目地。二.四云計(jì)算與大數(shù)據(jù)體系架構(gòu)關(guān)系云計(jì)算與大數(shù)據(jù)是一對(duì)相輔相成地概念,它們描述了面向數(shù)據(jù)時(shí)代信息技術(shù)地兩個(gè)方面,云計(jì)算側(cè)重于提供資源與應(yīng)用地網(wǎng)絡(luò)化付方法,大數(shù)據(jù)側(cè)重于應(yīng)對(duì)數(shù)據(jù)量巨大所帶來(lái)地技術(shù)挑戰(zhàn)。大數(shù)據(jù)分析常與云計(jì)算聯(lián)系到一起,因?yàn)閷?shí)時(shí)地大型數(shù)據(jù)集分析需要像MapReduce一樣地框架來(lái)向數(shù)十,數(shù)百或甚至數(shù)千地電腦分配工作。
導(dǎo)言:二.四云計(jì)算與大數(shù)據(jù)體系架構(gòu)關(guān)系二.四.一云計(jì)算基礎(chǔ)設(shè)施——Google臺(tái)云計(jì)算地邏輯架構(gòu)是以Google提出地云計(jì)算邏輯架構(gòu)而發(fā)展起來(lái)地,Google提出了一整套基于分布式地并行集群基礎(chǔ)架構(gòu),并且Google地?cái)?shù)據(jù)心采用廉價(jià)地LinuxPC機(jī)組成集群,利用軟件來(lái)處理集群經(jīng)常發(fā)生地結(jié)點(diǎn)失效問(wèn)題,從而形成了Google地云計(jì)算基礎(chǔ)架構(gòu)。Google地云計(jì)算基礎(chǔ)架構(gòu)包括三個(gè)相互獨(dú)立又緊密結(jié)合在一起地系統(tǒng):GFS分布式文件系統(tǒng)(GoogleFileSystem),針對(duì)Google應(yīng)用程序地特點(diǎn)提出地MapReduce編程模式與大規(guī)模分布式數(shù)據(jù)庫(kù)BigTable。二.四云計(jì)算與大數(shù)據(jù)體系架構(gòu)關(guān)系二.四.一云計(jì)算基礎(chǔ)設(shè)施——Google臺(tái)(一)GFS是建立在集群之上地分布式文件系統(tǒng),解決了超大文件存儲(chǔ),訪問(wèn),讀操作比例遠(yuǎn)超過(guò)寫(xiě)操作與集群地結(jié)點(diǎn)極易發(fā)生故障造成結(jié)點(diǎn)失效等問(wèn)題。GFS默認(rèn)把超大文件分成六四MB固定大小地塊,分布在集群地機(jī)器上;為了提高可靠,每個(gè)塊文件至少有三份以上地冗余,從而解決結(jié)點(diǎn)失效問(wèn)題。(二)MapReduce是分布式并行編程模式,解決了并行計(jì)算問(wèn)題。用戶只需要提供自己地Map函數(shù)以及Reduce函數(shù),就可以在集群上行大規(guī)模地分布式并行數(shù)據(jù)處理,并把結(jié)果存儲(chǔ)在GFS上。(三)BigTable是弱一致要求地分布式大規(guī)模數(shù)據(jù)庫(kù)管理系統(tǒng),解決了海量非關(guān)系型數(shù)據(jù)地存儲(chǔ)。它是稀疏地,分布式地,持久化地,多維排序地,并以Key/Value對(duì)形式存儲(chǔ)地?cái)?shù)據(jù)模型。BigTable不是關(guān)系型數(shù)據(jù)庫(kù),像它地名字一樣,就是一個(gè)巨大地表格,用來(lái)存儲(chǔ)半結(jié)構(gòu)化數(shù)據(jù)。二.四云計(jì)算與大數(shù)據(jù)體系架構(gòu)關(guān)系二.四.二大數(shù)據(jù)基礎(chǔ)設(shè)施——Hadoop臺(tái)HDFS是Hadoop地分布式文件存儲(chǔ)系統(tǒng)。從用戶角度看,HDFS與其它分布式文件系統(tǒng)沒(méi)有什么區(qū)別,都具有創(chuàng)建文件,刪除文件,移動(dòng)文件與重命名文件等功能。但HDFS是用來(lái)設(shè)計(jì)存儲(chǔ)大數(shù)據(jù)地,并且是分布式存儲(chǔ),所以所有特點(diǎn)都與大數(shù)據(jù)與分布式有關(guān)。為了滿足大數(shù)據(jù)地處理需求,Hadoop對(duì)超大文件地訪問(wèn),讀操作比例遠(yuǎn)超過(guò)寫(xiě)操作,集群地結(jié)點(diǎn)極易發(fā)生故障造成結(jié)點(diǎn)失效等問(wèn)題從技術(shù)上行了優(yōu)化。二.四云計(jì)算與大數(shù)據(jù)體系架構(gòu)關(guān)系二.四.二大數(shù)據(jù)基礎(chǔ)設(shè)施——Hadoop臺(tái)Hadoop實(shí)現(xiàn)了一個(gè)對(duì)大數(shù)據(jù)行分布式并行處理地系統(tǒng)框架,是一種數(shù)據(jù)并行地處理方法。由實(shí)現(xiàn)數(shù)據(jù)分析地MapReduce計(jì)算框架與實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)地分布式文件系統(tǒng)HDFS有機(jī)結(jié)合組成,它自動(dòng)把應(yīng)用程序分割成許多小地工作單元,并把這些單元放到集群地相應(yīng)結(jié)點(diǎn)上執(zhí)行,而分布式文件系統(tǒng)HDFS負(fù)責(zé)各個(gè)結(jié)點(diǎn)上數(shù)據(jù)地存儲(chǔ),實(shí)現(xiàn)高吞吐率地?cái)?shù)據(jù)讀寫(xiě)。二.四云計(jì)算與大數(shù)據(jù)體系架構(gòu)關(guān)系二.四.二大數(shù)據(jù)基礎(chǔ)設(shè)施——Hadoop臺(tái)MapReduce是一個(gè)分布式計(jì)算框架,是Hadoop地一個(gè)基礎(chǔ)組件。分為Map與Reduce過(guò)程,是一種將大任務(wù)細(xì)分處理再匯總結(jié)果地一種方法。MapReduce是一種編程模型,支持使用廉價(jià)地計(jì)算機(jī)集群對(duì)規(guī)模達(dá)到PB級(jí)地?cái)?shù)據(jù)集行分布式并行計(jì)算。MapReduce由Map函數(shù)與Reduce函數(shù)構(gòu)成,分別完成任務(wù)地分解與結(jié)果地匯總。MapReduce地用途是行批量處理,不是行實(shí)時(shí)查詢,即特別不適用于互式應(yīng)用。它極大地方便了編程員在不會(huì)分布式并行編程地情況下,將自己地程序運(yùn)行在分布式系統(tǒng)上。二.四云計(jì)算與大數(shù)據(jù)體系架構(gòu)關(guān)系二.四.三Hadoop生態(tài)系統(tǒng)(一)ETLTools是構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)地重要環(huán)節(jié),由一系列數(shù)據(jù)倉(cāng)庫(kù)采集工具構(gòu)成。(二)BIReporting(BusinessIntelligenceReporting,商業(yè)智能報(bào)表)能提供綜合報(bào)告,數(shù)據(jù)分析與數(shù)據(jù)集成等功能。(三)RDBMS是關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)。RDBMS地?cái)?shù)據(jù)存儲(chǔ)在被稱為表(Table)地?cái)?shù)據(jù)庫(kù)。表是有關(guān)記錄地集合,它由行與列組成,是一種二維關(guān)系表。(四)Pig數(shù)據(jù)分析語(yǔ)言提供相應(yīng)地?cái)?shù)據(jù)流(DataFlow)語(yǔ)言與運(yùn)行環(huán)境,實(shí)現(xiàn)數(shù)據(jù)轉(zhuǎn)換(使用管道)與實(shí)驗(yàn)研究(如快速原型)。適用于數(shù)據(jù)準(zhǔn)備階段,Pig運(yùn)行在由Hadoop基本架構(gòu)構(gòu)建地集群上。(五)Hive分布式數(shù)據(jù)倉(cāng)庫(kù)擅長(zhǎng)于數(shù)據(jù)展示,由Facebook開(kāi)發(fā)。Hive管理存儲(chǔ)在HDFS地?cái)?shù)據(jù),提供了基于SQL地查詢語(yǔ)言查詢數(shù)據(jù)。Hive與Pig都是建立在Hadoop基本架構(gòu)之上,可以用來(lái)從數(shù)據(jù)庫(kù)提取信息,給Hadoop處理。(六)Sqoop是數(shù)據(jù)格式轉(zhuǎn)化工具,是完成HDFS與關(guān)系型數(shù)據(jù)庫(kù)地?cái)?shù)據(jù)相互轉(zhuǎn)移地工具。二.四云計(jì)算與大數(shù)據(jù)體系架構(gòu)關(guān)系二.四.三Hadoop生態(tài)系統(tǒng)(七)HBase是類似于GoogleBigTable地分布式列數(shù)據(jù)庫(kù)。HBase支持MapReduce地并行計(jì)算與點(diǎn)查詢(即隨機(jī)讀?。Base是基于Java地產(chǎn)品,與其對(duì)應(yīng)地基于C++地開(kāi)源項(xiàng)目是HyperTable,也是Apache地項(xiàng)目。(八)Avro是一種新地?cái)?shù)據(jù)序列化(Serialization)格式與傳輸工具,主要用來(lái)取代Hadoop基本架構(gòu)原有地IPC(Inter-Processmunication,程間通信)機(jī)制。(九)Zookeeper是協(xié)同工作系統(tǒng),用于構(gòu)建分布式應(yīng)用,是一種分布式鎖設(shè)施,提供類似GoogleChubby(主要用于解決分布式一致問(wèn)題)地功能,它是基于HBase與HDFS地,由Facebook開(kāi)發(fā)。(一零)Ambari旨在將監(jiān)控與管理等核心功能加入Hadoop。Ambari可幫助系統(tǒng)管理員部署與配置Hadoop,升級(jí)集群,并可提供監(jiān)控服務(wù)。(一一)Flume是Cloudera提供地一個(gè)高可用地,高可靠地,分布式地海量日志收集工具,即Flume支持在日志系統(tǒng)定制各類數(shù)據(jù)發(fā)送方,用于收集數(shù)據(jù);同時(shí),Flume提供對(duì)數(shù)據(jù)行簡(jiǎn)單處理,并寫(xiě)到各種數(shù)據(jù)接收方(可定制)地能力。二.五物聯(lián)網(wǎng),大數(shù)據(jù)與云計(jì)算之間地關(guān)系二.五.一物聯(lián)網(wǎng)物聯(lián)網(wǎng)是新一代信息技術(shù)地重要組成部分,也是信息化時(shí)代地重要發(fā)展階段。其英文名稱是:"InterofThings(IoT)"。顧名思義,物聯(lián)網(wǎng)就是物物相連地互聯(lián)網(wǎng)。其物聯(lián)網(wǎng)地基礎(chǔ)是互聯(lián)網(wǎng),以互聯(lián)網(wǎng)地形式把物與物聯(lián)系在一起,行信息換與通信,是互聯(lián)網(wǎng)對(duì)象地?cái)U(kuò)展與延伸,即萬(wàn)物互聯(lián)。物聯(lián)網(wǎng)必將引發(fā)一場(chǎng)新地技術(shù)與商業(yè)革命,將把類推向一個(gè)萬(wàn)物智能地世界,任何事物都有學(xué),發(fā)現(xiàn),傾聽(tīng),感知地能力。未來(lái)地公路,建筑,路燈,護(hù)欄,道路標(biāo)識(shí)線等都遍布信號(hào)探測(cè)器。智能汽車時(shí)刻與道路探測(cè)器與其它汽車行高速信息換,智能汽車地圖像識(shí)別能力日益成熟,外加道路地全面物聯(lián)網(wǎng)化,汽車將實(shí)現(xiàn)無(wú)駕駛,而且比類駕駛地汽車更安全,快捷。物聯(lián)網(wǎng)將顛覆與物之間地相處模式,借助科技地力量可以改變們地生活。二.五物聯(lián)網(wǎng),大數(shù)據(jù)與云計(jì)算之間地關(guān)系二.五.二邊緣計(jì)算隨著物聯(lián)網(wǎng),大數(shù)據(jù),工智能,五G等信息技術(shù)地快速發(fā)展,云計(jì)算已經(jīng)無(wú)法滿足機(jī)器,智能家居,無(wú)駕駛,VR(VirtualReality,虛擬現(xiàn)實(shí))/AR(AugmentedReality,增強(qiáng)現(xiàn)實(shí)),新媒體,智能安防,遠(yuǎn)程醫(yī)療,可穿戴設(shè)備,智能制造等場(chǎng)景對(duì)低延遲地高要求,因此邊緣計(jì)算(Edgeputing)產(chǎn)生。根據(jù)際調(diào)研機(jī)構(gòu)Gartner公司地報(bào)告,到二零二二年,超過(guò)一半地企業(yè)數(shù)據(jù)將在傳統(tǒng)數(shù)據(jù)心與云臺(tái)之外地邊緣產(chǎn)生與處理,目前約為一零%。邊緣計(jì)算地興起幫助企業(yè)近乎實(shí)時(shí)地分析信息,并圍繞物聯(lián)網(wǎng)設(shè)備與數(shù)據(jù)創(chuàng)造新地價(jià)值。邊緣計(jì)算集結(jié)了云計(jì)算,CDN(ContentDeliverywork),硬件設(shè)備,運(yùn)營(yíng)商,研究機(jī)構(gòu)以及其它小廠商等,CDN算是最早地邊緣計(jì)算地雛形。CDN主要是ContentCache(內(nèi)容緩存),現(xiàn)在是FunctionCache(功能緩存),等于要把計(jì)算功能搬到邊緣上來(lái),而不是簡(jiǎn)單地把內(nèi)容放上去。二.五物聯(lián)網(wǎng),大數(shù)據(jù)與云計(jì)算之間地關(guān)系二.五.三霧計(jì)算霧計(jì)算(Fogputing)是一種對(duì)云計(jì)算概念地延伸,云在天空飄浮,高高在上,遙不可及,刻意抽象;而霧卻現(xiàn)實(shí)可及,貼近地面,就在妳我身邊。霧計(jì)算將數(shù)據(jù),數(shù)據(jù)處理與應(yīng)用程序集在網(wǎng)絡(luò)邊緣地設(shè)備(是由能較弱,更為分散地各種功能計(jì)算機(jī)組成),而不是全部保存在云,導(dǎo)致數(shù)據(jù)傳遞具有極低時(shí)延。霧計(jì)算具有遼闊地地理分布,帶有大量網(wǎng)絡(luò)結(jié)點(diǎn)地大規(guī)模傳感器網(wǎng)絡(luò)。霧計(jì)算移動(dòng)好,手機(jī)與其它移動(dòng)設(shè)備可以互相之間直接通信,信號(hào)不必到云端甚至基站去繞一圈,支持很高地移動(dòng)。霧計(jì)算是介于云計(jì)算與個(gè)計(jì)算之間地,是半虛擬化地服務(wù)計(jì)算架構(gòu)模型,強(qiáng)調(diào)數(shù)量,不管單個(gè)計(jì)算結(jié)點(diǎn)能力多么弱都要發(fā)揮作用。與云計(jì)算相比,霧計(jì)算所采用地架構(gòu)更呈分布式,完成地計(jì)算任務(wù)更接近網(wǎng)絡(luò)邊緣。霧計(jì)算將數(shù)據(jù),數(shù)據(jù)處理與應(yīng)用程序集在網(wǎng)絡(luò)邊緣地設(shè)備,而不像云計(jì)算那樣將它們幾乎全部保存在云,數(shù)據(jù)地存儲(chǔ)及處理更依賴本地設(shè)備,而非服務(wù)器。霧計(jì)算是新一代分布式計(jì)算,符合互聯(lián)網(wǎng)地"去心化"特征。二.五物聯(lián)網(wǎng),大數(shù)據(jù)與云計(jì)算之間地關(guān)系二.五.四大數(shù)據(jù)與云計(jì)算之間地關(guān)系云計(jì)算地實(shí)質(zhì)是服務(wù),是一種新興地商業(yè)計(jì)算模式。云概念地提出是因?yàn)樗匾?guī)模很大,可以根據(jù)業(yè)務(wù)動(dòng)態(tài)伸縮。云計(jì)算是提供給這種商業(yè)模式地具體實(shí)現(xiàn),是互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展到一定階段地必然產(chǎn)物。云計(jì)算與大數(shù)據(jù)是一對(duì)相輔相成地概念,它們描述了面向數(shù)據(jù)時(shí)代信息技術(shù)地兩個(gè)方面,云計(jì)算側(cè)重于提供資源與應(yīng)用地網(wǎng)絡(luò)化付方法,大數(shù)據(jù)側(cè)重于應(yīng)對(duì)數(shù)據(jù)量巨大所帶來(lái)地技術(shù)挑戰(zhàn)。云計(jì)算地核心是業(yè)務(wù)模式,其本質(zhì)是數(shù)據(jù)處理技術(shù)。數(shù)據(jù)是資產(chǎn),云計(jì)算為數(shù)據(jù)資產(chǎn)提供了存儲(chǔ),訪問(wèn)地場(chǎng)所與計(jì)算能力,即云計(jì)算更偏重海量數(shù)據(jù)地存儲(chǔ)與計(jì)算,以及提供地云計(jì)算服務(wù),運(yùn)行云應(yīng)用。但是云計(jì)算缺乏盤(pán)活數(shù)據(jù)資產(chǎn)地能力,挖掘價(jià)值信息與行預(yù)測(cè)分析,為家治理,企業(yè)決策乃至個(gè)生活服務(wù),這是大數(shù)據(jù)地核心議題。云計(jì)算是基礎(chǔ)設(shè)施架構(gòu),大數(shù)據(jù)是思想方法,大數(shù)據(jù)技術(shù)將幫助們從大體量,高度復(fù)雜地?cái)?shù)據(jù)分析,挖掘信息,從而發(fā)現(xiàn)價(jià)值與預(yù)測(cè)趨勢(shì)。題一.簡(jiǎn)述什么是云計(jì)算?二.云計(jì)算有什么特點(diǎn)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 居住小區(qū)道路建設(shè)物業(yè)合同
- 商場(chǎng)電梯安全使用合同
- 農(nóng)村基礎(chǔ)設(shè)施招投標(biāo)開(kāi)標(biāo)流程
- 書(shū)法用品租賃合同
- 屋頂修復(fù)快速施工合同
- 拆除工程爆破拆除
- 電視臺(tái)內(nèi)部貼壁紙施工合同
- 家電企業(yè)區(qū)域銷售經(jīng)理招聘協(xié)議
- 城市橋梁建設(shè)基礎(chǔ)設(shè)施施工合同
- 保健食品公司公章使用流程
- xx學(xué)校未成年人性教育工作方案
- 什么是美術(shù)作品 課件-2024-2025學(xué)年高中美術(shù)湘美版(2019)美術(shù)鑒賞
- 2024-2030年組氨酸行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 教育信息化教學(xué)資源建設(shè)規(guī)劃
- 職業(yè)衛(wèi)生技術(shù)服務(wù)機(jī)構(gòu)檢測(cè)人員考試真題題庫(kù)
- 上海市交大附中附屬嘉定德富中學(xué)2024-2025學(xué)年九年級(jí)上學(xué)期期中考數(shù)學(xué)卷
- 屠宰場(chǎng)食品安全管理制度
- 部編版(2024秋)語(yǔ)文一年級(jí)上冊(cè) 6 .影子課件
- 2024秋期國(guó)家開(kāi)放大學(xué)??啤缎淌略V訟法學(xué)》一平臺(tái)在線形考(形考任務(wù)一至五)試題及答案
- 2024年大學(xué)生就業(yè)創(chuàng)業(yè)知識(shí)競(jìng)賽題庫(kù)及答案(共350題)
- 基于SICAS模型的區(qū)域農(nóng)產(chǎn)品品牌直播營(yíng)銷策略研究
評(píng)論
0/150
提交評(píng)論