




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
大數(shù)據(jù)了解知識什么是大數(shù)據(jù)BigData什么是大數(shù)據(jù)HadoopIBM英特爾HP數(shù)據(jù)商業(yè)智能數(shù)據(jù)庫效勞器SAPHANANoSQLSQLHDFS預(yù)測數(shù)據(jù)流運算節(jié)點機器學(xué)習(xí)并行計算磁盤陣列甲骨文AMD內(nèi)存計算GoogleMapreduce
可視化GbPbTbZbBigData什么是大數(shù)據(jù)由多個軟件、硬件部分組成的一個數(shù)據(jù)系統(tǒng)一個執(zhí)行體系有別于傳統(tǒng)企業(yè)數(shù)據(jù)中心,用來應(yīng)對現(xiàn)代海量數(shù)據(jù)化的生活,商業(yè)環(huán)境。不是一個行業(yè),而是一種新的數(shù)據(jù)處理方法是關(guān)于數(shù)據(jù)的運輸和處理,以及最后有效使用的體系與云計算一樣都是一種新的生產(chǎn)組織形式Web2.0時代的解決方案大數(shù)據(jù)(bigdata),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內(nèi)到達擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊BigData什么是大數(shù)據(jù)大數(shù)據(jù)的目的原始數(shù)據(jù)的處理和分類存儲將存儲的數(shù)據(jù)調(diào)取并分析最終提供決策依據(jù)歸類數(shù)據(jù)類型有效分析組合大數(shù)據(jù)的特點4V海量高速多樣準(zhǔn)確BigData什么是大數(shù)據(jù)1KB=1024字節(jié)存儲單位1MB=1024KB1GB=1024MB1TB=1024GB1PB=1024TB=1,048,576GB1EB=1024PB=1,073,741,824GB1ZB=1024EB=1,099,511,627,776GB100萬G10億G1萬億G22億臺215萬臺2100臺500G硬盤電腦15寸電腦排成行可以往返一次月球BigData什么是大數(shù)據(jù)Volume海量1PB=1024TB=1,048,576GB1EB=1024PB=1,073,741,824GB1ZB=1024EB=1,099,511,627,776GBIntel:人類文明開場到2003年地球共產(chǎn)生了5EB數(shù)據(jù).2021年全年,全球產(chǎn)生數(shù)據(jù)2.7ZB是2003年以前的500倍2021年,全球估計產(chǎn)生數(shù)據(jù)8ZB,等于1800萬個美國國會圖書館44%35ZB2000年數(shù)字信息占全球數(shù)據(jù)量的25%75%都在報紙膠片磁帶等媒介2021年數(shù)字信息98%非數(shù)字信息2%BigData什么是大數(shù)據(jù)商業(yè)數(shù)據(jù)現(xiàn)狀Twitter2007年5000條微博更新/天2021年30萬條微博更新/天2021年250萬條微博更新/天2021年3500萬條微博更新/天2021年2億條微博更新/天2021年4億條微博更新/天2021年上傳時長12年的視頻/天2021年用戶分享25億條信息/天我國一個一線城市的安康檔案數(shù)據(jù)5PB/年我國一個智慧城市的數(shù)據(jù)800PB/年一個單數(shù)據(jù)表幾億-幾百億條記錄下線商品14億件,在線商品8億件淘寶數(shù)據(jù)庫存了20PB數(shù)據(jù)平均每月增加智能移動終端設(shè)備的巨量增長BigData什么是大數(shù)據(jù)Velocity高速6000萬用戶登錄/天20億次頁面訪問/天每天億次網(wǎng)站訪問響應(yīng)時間小于100毫秒大數(shù)據(jù)的驚人不止是在數(shù)量上,同時數(shù)據(jù)還是巨量具有動態(tài)分析價值的數(shù)據(jù)。訪問響應(yīng)時間的加快,數(shù)據(jù)庫讀寫速度的加快,對電商企業(yè)來說就等于多成交。對于很多情況下,動態(tài)的數(shù)據(jù)價值遠大于靜態(tài)數(shù)據(jù),比方氣象預(yù)測,災(zāi)難預(yù)測,快消行業(yè)等。由于輸入速度加快,所以要求輸出速度也要加快BigData什么是大數(shù)據(jù)Variety多樣數(shù)據(jù):結(jié)構(gòu)化數(shù)據(jù)半結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)指關(guān)系型數(shù)據(jù)表指關(guān)系構(gòu)造與內(nèi)容混合在一起的數(shù)據(jù)類型文檔、視頻、音頻、圖片20%構(gòu)造化80非構(gòu)造化企業(yè)數(shù)據(jù)2021年互聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)25%構(gòu)造化75非構(gòu)造化50%-70%源于人與人的互動BigData什么是大數(shù)據(jù)Veracity準(zhǔn)確大數(shù)據(jù)的核心思想之一準(zhǔn)確源自于對全部數(shù)據(jù)的處理分析根底數(shù)據(jù)的真實準(zhǔn)確性,才能保證結(jié)果的有效性。BigData什么是大數(shù)據(jù)大數(shù)據(jù)VS云計算兩者都是生產(chǎn)方式改變?yōu)橹?,生產(chǎn)資料改變?yōu)檩o,提高生產(chǎn)效率。云計算是將計算和存儲,由本地轉(zhuǎn)移到了云端。大數(shù)據(jù)那么是提供了一套新的計算和存儲工作原理。二者有本質(zhì)的不同,但卻是一個完整的體系。大數(shù)據(jù)可以是云計算的心臟,云計算是大數(shù)據(jù)效勞的通路。BigData什么是大數(shù)據(jù)大數(shù)據(jù)VS物聯(lián)網(wǎng)物聯(lián)網(wǎng)是大數(shù)據(jù)的流程中的第一層采集層物聯(lián)網(wǎng)網(wǎng)關(guān)以上就進入了大數(shù)據(jù)工作范疇。局部域內(nèi)的物聯(lián)網(wǎng)應(yīng)用解決方案等同于這個域內(nèi)的大數(shù)據(jù)系統(tǒng)大數(shù)據(jù)原理和構(gòu)成大數(shù)據(jù)的核心工作思路大數(shù)據(jù)系統(tǒng)顛覆了傳統(tǒng)數(shù)據(jù)中心的工作邏輯傳統(tǒng)數(shù)據(jù)系統(tǒng)工作邏輯:運算系統(tǒng)調(diào)動數(shù)據(jù)庫的數(shù)據(jù),數(shù)據(jù)的移動。大數(shù)據(jù)系統(tǒng)工作邏輯:運算系統(tǒng)直接部署至數(shù)據(jù)處,數(shù)據(jù)僅架構(gòu)內(nèi)移動。BigData大數(shù)據(jù)原理和構(gòu)成BigData大數(shù)據(jù)原理和構(gòu)成傳統(tǒng)數(shù)據(jù)系統(tǒng)工作原理客戶客戶客戶客戶客戶客戶互聯(lián)網(wǎng)路由器訪問請求負(fù)載均衡效勞器集群DBDBDBDB數(shù)據(jù)庫集群數(shù)據(jù)調(diào)用請求數(shù)據(jù)移動結(jié)果反響B(tài)igData大數(shù)據(jù)原理和構(gòu)成Hadoop軟件框架大數(shù)據(jù)系統(tǒng)核心組件MapreduceHBaseHDFSHadoop核心子工程BigData大數(shù)據(jù)原理和構(gòu)成Hadoop系統(tǒng)工作原理BigData大數(shù)據(jù)原理和構(gòu)成Hadoop系統(tǒng)構(gòu)架BigData大數(shù)據(jù)原理和構(gòu)成存儲與數(shù)據(jù)庫的比較傳統(tǒng)數(shù)據(jù)中心HadoopJOBDRAID存儲系統(tǒng)HDFS容錯性擴展性某已分配任務(wù)出錯,該計算必須重新執(zhí)行節(jié)點靈活調(diào)整節(jié)點相對固定,擴展時會造成無法訪問在任務(wù)執(zhí)行中任何時候可任意添加節(jié)點SQLNoSQL數(shù)據(jù)類型平行計算系統(tǒng)MapReduceRAID出現(xiàn)壞盤后,重建陣列需要十多個小時,這在大數(shù)據(jù)時代是無法承受的BigData大數(shù)據(jù)原理和構(gòu)成SAPHANAHadoop的升級內(nèi)存計算技術(shù)真正的海量數(shù)據(jù)瞬間分析內(nèi)存數(shù)據(jù)庫
實現(xiàn)任何地點、任何時候、可以查看實時的動態(tài)數(shù)據(jù),任何時候都可以知道正在發(fā)生著什么。并且做出應(yīng)對。利用高性能的大數(shù)據(jù)一體機效勞器,將數(shù)據(jù)庫直接植入大容量內(nèi)存中進展實時處理。HadoopMapreduceHDFSHBaseBigData大數(shù)據(jù)原理和構(gòu)成大數(shù)據(jù)的硬件32顆處理器、每顆處理器12核=384核X96個線程32TB的內(nèi)存很多中型企業(yè)的數(shù)據(jù)庫也只不過幾TB.可以完美運行內(nèi)存計算數(shù)據(jù)庫大數(shù)據(jù)一體機效勞器+存儲+網(wǎng)絡(luò)=融合根底架構(gòu)SeaMicroSM1500064顆處理器、每顆處理器8核=512核心4TB的內(nèi)存5PB本地存儲10U的空間萬兆以太網(wǎng)Systemx3650M4機架式2U2顆處理器8核心內(nèi)存最大768GB本地存儲9TB萬換算成10U的空間80核心大數(shù)據(jù)的軟件數(shù)據(jù)存儲管理數(shù)據(jù)處理數(shù)據(jù)分析Hadoop數(shù)據(jù)庫軟件BigData大數(shù)據(jù)原理和構(gòu)成提取轉(zhuǎn)換歸類可視化BI商業(yè)智能大數(shù)據(jù)的核心價值高附加值階段大數(shù)據(jù)應(yīng)用BigData大數(shù)據(jù)應(yīng)用大數(shù)據(jù)應(yīng)用的意義巨量數(shù)據(jù)的產(chǎn)生對所有復(fù)雜數(shù)據(jù)格式的歸類管理分析20%構(gòu)造化數(shù)據(jù)的分析利用80%非構(gòu)造化的沒有發(fā)揮作用,商業(yè)洞察力的資源浪費。找出最優(yōu)解決方案應(yīng)用的核心大數(shù)據(jù)分析BigData大數(shù)據(jù)應(yīng)用數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理可視化分析語義引擎數(shù)據(jù)挖掘算法預(yù)測性分析能力大數(shù)據(jù)應(yīng)用的分析方法高質(zhì)量的數(shù)據(jù)處理和管理是輸出高質(zhì)量結(jié)果的前提深入數(shù)據(jù)內(nèi)部,用機器去做人工做不到的數(shù)據(jù)價值發(fā)現(xiàn)從非構(gòu)造化數(shù)據(jù)中提取信息的方式展示數(shù)據(jù)分析結(jié)果,供使用者決策根據(jù)可視化和數(shù)據(jù)挖掘的結(jié)果做出預(yù)測BigData大數(shù)據(jù)應(yīng)用大數(shù)據(jù)應(yīng)用的分析邏輯DescriptivePredictivePrescriptive發(fā)生了什么?為什么?還會發(fā)生什么?還會發(fā)生什么?,如果發(fā)生了,如何應(yīng)對?BigData大數(shù)據(jù)應(yīng)用大數(shù)據(jù)應(yīng)用的假想一給某總辦公室、汽車、家里裝上煙感。發(fā)現(xiàn)某總在辦公室的抽煙數(shù)量最大,在車?yán)锖驮诩腋静怀?。那么就可以知道,某總在工作期間香煙以及與香煙有關(guān)的產(chǎn)品消費多。那在家期間的消費習(xí)慣又是什么,根據(jù)人的行為習(xí)慣,不抽煙但需要其他事情分散注意力。吃東西?看電視?看書?。。。。。。。。。。。這樣就可以深入了解一個人的消費行為習(xí)慣,從而提前做出應(yīng)對或者積極的主動應(yīng)對。BigData大數(shù)據(jù)應(yīng)用大數(shù)據(jù)應(yīng)用的假想二通過對某人淘寶購物的跟蹤分析,挖掘出他的消費趨勢。某男,在電子商務(wù)網(wǎng)站上長期買衣服,內(nèi)衣等商品。通過消費記錄可以預(yù)知其單身。用百度聯(lián)盟,把世紀(jì)佳緣,花田等交友網(wǎng)站的廣告推送給他。某男開場買女士消費品了比方衣服,鞋帽等。那么說明該男找到女朋友了。通過信用卡記錄可以分析出其關(guān)系進展情況。發(fā)現(xiàn)其買房,裝修了。那么該男快結(jié)婚了。之后就是孕嬰用品的推薦。BigData大數(shù)據(jù)應(yīng)用大數(shù)據(jù)的大應(yīng)用城市智能交通智能電力照明能源管理系統(tǒng)智能安康醫(yī)療體系政府財政管理綜合信息系統(tǒng)工商
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中西醫(yī)結(jié)合內(nèi)科學(xué)進展知到課后答案智慧樹章節(jié)測試答案2025年春浙江中醫(yī)藥大學(xué)
- 三級人力資源管理師-《企業(yè)人力資源管理師(理論知識)》權(quán)威預(yù)測卷1
- 2018-2019學(xué)年高中一輪復(fù)習(xí)化學(xué)跟蹤檢測(三十八)常用儀器與基本操作
- 2025年絕緣材料:絕緣套管項目發(fā)展計劃
- 機械服務(wù)框架施工方案
- 2025年節(jié)能型空氣分離設(shè)備項目建議書
- 新經(jīng)濟背景下人力資源經(jīng)濟管理創(chuàng)新研究
- 新發(fā)鴨生長遲緩病毒ELISA抗體檢測方法的建立及傳代致弱研究
- 小鼠2型糖尿病發(fā)病進程中腸道微生態(tài)變化的初步研究
- 西北地區(qū)冬小麥普通根腐病和莖基腐病病原鑒定及種質(zhì)資源抗性篩選
- (二模)2025年寶雞市高考模擬檢測試題(二)物理試卷(含答案)
- 基地種植合作合同范本
- 露天煤礦安全生產(chǎn)技術(shù)露天煤礦安全管理培訓(xùn)
- 【2025年衛(wèi)生健康宣傳日】世界防治結(jié)核病日
- 新版《醫(yī)療器械經(jīng)營質(zhì)量管理規(guī)范》(2024)培訓(xùn)試題及答案
- 2025年人教版數(shù)學(xué)五年級下冊教學(xué)計劃(含進度表)
- 2025年初級社會工作者綜合能力全國考試題庫(含答案)
- 《神奇糖果店》教學(xué)課件
- 部編人教版二年級道德與法治下冊同步練習(xí)(全冊)
- h型鋼力學(xué)性能計算表
- 音樂室使用記錄表
評論
0/150
提交評論