大數(shù)據(jù)云計算區(qū)別.docx_第1頁
大數(shù)據(jù)云計算區(qū)別.docx_第2頁
大數(shù)據(jù)云計算區(qū)別.docx_第3頁
大數(shù)據(jù)云計算區(qū)別.docx_第4頁
免費預覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

(一)關(guān)于大數(shù)據(jù)和云計算的關(guān)系分別做一句話直白解釋就是:云計算就是硬件資源的虛擬化;大數(shù)據(jù)就是海量數(shù)據(jù)的高效處理。雖然上面的一句話解釋不是非常的貼切,但是可以幫助你簡單的理解二者的區(qū)別。另外,如果做一個更形象的解釋,云計算相當于我們的計算機和操作系統(tǒng),將大量的硬件資源虛擬化之后再進行分配使用。大數(shù)據(jù)相當于海量數(shù)據(jù)的“數(shù)據(jù)庫”,而且通觀大數(shù)據(jù)領(lǐng)域的發(fā)展也能看出,當前的大數(shù)據(jù)處理一直在向著近似于傳統(tǒng)數(shù)據(jù)庫體驗的方向發(fā)展,整體來看,未來的趨勢是,云計算作為計算資源的底層,支撐著上層的大數(shù)據(jù)處理,而大數(shù)據(jù)的發(fā)展趨勢是,實時交互式的查詢效率和分析能力,借用Google一篇技術(shù)論文中的話,“動一下鼠標就可以在秒級操作PB級別的數(shù)據(jù)”難道不讓人興奮嗎?在談大數(shù)據(jù)的時候,首先談到的就是大數(shù)據(jù)的4V特性,即類型復雜,海量,快速和價值。IBM原來談大數(shù)據(jù)的時候談3V,沒有價值這個V。而實際我們來看4V更加恰當,價值才是大數(shù)據(jù)問題解決的最終目標,其它3V都是為價值目標服務。在有了4V的概念后,就很容易簡化的來理解大數(shù)據(jù)的核心,即大數(shù)據(jù)的總體架構(gòu)包括三層,數(shù)據(jù)存儲,數(shù)據(jù)處理和數(shù)據(jù)分析。類型復雜和海量由數(shù)據(jù)存儲層解決,快速和時效性要求由數(shù)據(jù)處理層解決,價值由數(shù)據(jù)分析層解決。數(shù)據(jù)先要通過存儲層存儲下來,然后根據(jù)數(shù)據(jù)需求和目標來建立相應的數(shù)據(jù)模型和數(shù)據(jù)分析指標體系對數(shù)據(jù)進行分析產(chǎn)生價值。而中間的時效性又通過中間數(shù)據(jù)處理層提供的強大的并行計算和分布式計算能力來完成。三層相互配合,讓大數(shù)據(jù)最終產(chǎn)生價值。數(shù)據(jù)存儲層數(shù)據(jù)有很多分法,有結(jié)構(gòu)化,半結(jié)構(gòu)化,非結(jié)構(gòu)化;也有元數(shù)據(jù),主數(shù)據(jù),業(yè)務數(shù)據(jù);還可以分為GIS,視頻,文件,語音,業(yè)務交易類各種數(shù)據(jù)。傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)庫已經(jīng)無法滿足數(shù)據(jù)多樣性的存儲要求,因此在RDBMS基礎(chǔ)上增加了兩種類型,一種是hdfs可以直接應用于非結(jié)構(gòu)化文件存儲,一種是nosql類數(shù)據(jù)庫,可以應用于結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)存儲。數(shù)據(jù)處理層數(shù)據(jù)處理層核心解決問題在于數(shù)據(jù)存儲出現(xiàn)分布式后帶來的數(shù)據(jù)處理上的復雜度,海量存儲后帶來了數(shù)據(jù)處理上的時效性要求,這些都是數(shù)據(jù)處理層要解決的問題。數(shù)據(jù)分析層最后回到分析層,分析層重點是真正挖掘大數(shù)據(jù)的價值所在,而價值的挖掘核心又在于數(shù)據(jù)分析和挖掘。那么數(shù)據(jù)分析層核心仍然在于傳統(tǒng)的BI分析的內(nèi)容。包括數(shù)據(jù)的維度分析,數(shù)據(jù)的切片,數(shù)據(jù)的上鉆和下鉆,cube等。(二)云計算和大數(shù)據(jù)之間的關(guān)系可以用下面的一張圖來說明,兩者之間結(jié)合后會產(chǎn)生如下效應:可以提供更多基于海量業(yè)務數(shù)據(jù)的創(chuàng)新型服務;通過云計算技術(shù)的不斷發(fā)展降低大數(shù)據(jù)業(yè)務的創(chuàng)新成本。大數(shù)據(jù)的本質(zhì)就是利用計算機集群來處理大批量的數(shù)據(jù),大數(shù)據(jù)的技術(shù)關(guān)注點在于如何將數(shù)據(jù)分發(fā)給不同的計算機進行存儲和處理。云計算的本質(zhì)就是將計算能力作為一種較小顆粒度的服務提供給用戶,按需使用和付費,體現(xiàn)了:1.經(jīng)濟性,不需要購買整個服務器2.快捷性,即刻使用,不需要長時間的購買和安裝部署3.彈性,隨著業(yè)務增長可以購買更多的計算資源,可以需要時購買幾十臺服務器的1個小時時間,運算完成就釋放4.自動化,不需要通過人來完成資源的分配和部署,通過API可以自動創(chuàng)建云主機等服務。云計算的技術(shù)關(guān)注點在于如何在一套軟硬件環(huán)境中,為不同的用戶提供服務,使得不同的用戶彼此不可見,并進行資源隔離,保障每個用戶的服務質(zhì)量。在大數(shù)據(jù)和云計算的關(guān)系上,我們可以這樣理解:1.兩者都關(guān)注對資源的調(diào)度。2.大數(shù)據(jù)處理可以基于云計算平臺(如IaaS,容器)。3.大數(shù)據(jù)處理也可以作為一種云計算的服務,如AWS的EMR(Amazon Elastic MapReduce )阿里云的ODPS(Open Data ProcessingService)。如果將云計算與大數(shù)據(jù)進行一些比較,最明顯的區(qū)分在兩個方面:第一,在概念上兩者有所不同,云計算改變了IT,而大數(shù)據(jù)則改變了業(yè)務。然而大數(shù)據(jù)必須有云作為基礎(chǔ)架構(gòu),才能得

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論