版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
大數(shù)據(jù)了解知識什么是大數(shù)據(jù)BigData什么是大數(shù)據(jù)HadoopIBM英特爾HP數(shù)據(jù)商業(yè)智能數(shù)據(jù)庫效勞器SAPHANANoSQLSQLHDFS預(yù)測數(shù)據(jù)流運(yùn)算節(jié)點(diǎn)機(jī)器學(xué)習(xí)并行計(jì)算磁盤陣列甲骨文AMD內(nèi)存計(jì)算GoogleMapreduce
可視化GbPbTbZbBigData什么是大數(shù)據(jù)由多個(gè)軟件、硬件部分組成的一個(gè)數(shù)據(jù)系統(tǒng)一個(gè)執(zhí)行體系有別于傳統(tǒng)企業(yè)數(shù)據(jù)中心,用來應(yīng)對現(xiàn)代海量數(shù)據(jù)化的生活,商業(yè)環(huán)境。不是一個(gè)行業(yè),而是一種新的數(shù)據(jù)處理方法是關(guān)于數(shù)據(jù)的運(yùn)輸和處理,以及最后有效使用的體系與云計(jì)算一樣都是一種新的生產(chǎn)組織形式Web2.0時(shí)代的解決方案大數(shù)據(jù)(bigdata),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時(shí)間內(nèi)到達(dá)擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊BigData什么是大數(shù)據(jù)大數(shù)據(jù)的目的原始數(shù)據(jù)的處理和分類存儲將存儲的數(shù)據(jù)調(diào)取并分析最終提供決策依據(jù)歸類數(shù)據(jù)類型有效分析組合大數(shù)據(jù)的特點(diǎn)4V海量高速多樣準(zhǔn)確BigData什么是大數(shù)據(jù)1KB=1024字節(jié)存儲單位1MB=1024KB1GB=1024MB1TB=1024GB1PB=1024TB=1,048,576GB1EB=1024PB=1,073,741,824GB1ZB=1024EB=1,099,511,627,776GB100萬G10億G1萬億G22億臺215萬臺2100臺500G硬盤電腦15寸電腦排成行可以往返一次月球BigData什么是大數(shù)據(jù)Volume海量1PB=1024TB=1,048,576GB1EB=1024PB=1,073,741,824GB1ZB=1024EB=1,099,511,627,776GBIntel:人類文明開場到2003年地球共產(chǎn)生了5EB數(shù)據(jù).2021年全年,全球產(chǎn)生數(shù)據(jù)2.7ZB是2003年以前的500倍2021年,全球估計(jì)產(chǎn)生數(shù)據(jù)8ZB,等于1800萬個(gè)美國國會圖書館44%35ZB2000年數(shù)字信息占全球數(shù)據(jù)量的25%75%都在報(bào)紙膠片磁帶等媒介2021年數(shù)字信息98%非數(shù)字信息2%BigData什么是大數(shù)據(jù)商業(yè)數(shù)據(jù)現(xiàn)狀Twitter2007年5000條微博更新/天2021年30萬條微博更新/天2021年250萬條微博更新/天2021年3500萬條微博更新/天2021年2億條微博更新/天2021年4億條微博更新/天2021年上傳時(shí)長12年的視頻/天2021年用戶分享25億條信息/天我國一個(gè)一線城市的安康檔案數(shù)據(jù)5PB/年我國一個(gè)智慧城市的數(shù)據(jù)800PB/年一個(gè)單數(shù)據(jù)表幾億-幾百億條記錄下線商品14億件,在線商品8億件淘寶數(shù)據(jù)庫存了20PB數(shù)據(jù)平均每月增加智能移動(dòng)終端設(shè)備的巨量增長BigData什么是大數(shù)據(jù)Velocity高速6000萬用戶登錄/天20億次頁面訪問/天每天億次網(wǎng)站訪問響應(yīng)時(shí)間小于100毫秒大數(shù)據(jù)的驚人不止是在數(shù)量上,同時(shí)數(shù)據(jù)還是巨量具有動(dòng)態(tài)分析價(jià)值的數(shù)據(jù)。訪問響應(yīng)時(shí)間的加快,數(shù)據(jù)庫讀寫速度的加快,對電商企業(yè)來說就等于多成交。對于很多情況下,動(dòng)態(tài)的數(shù)據(jù)價(jià)值遠(yuǎn)大于靜態(tài)數(shù)據(jù),比方氣象預(yù)測,災(zāi)難預(yù)測,快消行業(yè)等。由于輸入速度加快,所以要求輸出速度也要加快BigData什么是大數(shù)據(jù)Variety多樣數(shù)據(jù):結(jié)構(gòu)化數(shù)據(jù)半結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)指關(guān)系型數(shù)據(jù)表指關(guān)系構(gòu)造與內(nèi)容混合在一起的數(shù)據(jù)類型文檔、視頻、音頻、圖片20%構(gòu)造化80非構(gòu)造化企業(yè)數(shù)據(jù)2021年互聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)25%構(gòu)造化75非構(gòu)造化50%-70%源于人與人的互動(dòng)BigData什么是大數(shù)據(jù)Veracity準(zhǔn)確大數(shù)據(jù)的核心思想之一準(zhǔn)確源自于對全部數(shù)據(jù)的處理分析根底數(shù)據(jù)的真實(shí)準(zhǔn)確性,才能保證結(jié)果的有效性。BigData什么是大數(shù)據(jù)大數(shù)據(jù)VS云計(jì)算兩者都是生產(chǎn)方式改變?yōu)橹鳎a(chǎn)資料改變?yōu)檩o,提高生產(chǎn)效率。云計(jì)算是將計(jì)算和存儲,由本地轉(zhuǎn)移到了云端。大數(shù)據(jù)那么是提供了一套新的計(jì)算和存儲工作原理。二者有本質(zhì)的不同,但卻是一個(gè)完整的體系。大數(shù)據(jù)可以是云計(jì)算的心臟,云計(jì)算是大數(shù)據(jù)效勞的通路。BigData什么是大數(shù)據(jù)大數(shù)據(jù)VS物聯(lián)網(wǎng)物聯(lián)網(wǎng)是大數(shù)據(jù)的流程中的第一層采集層物聯(lián)網(wǎng)網(wǎng)關(guān)以上就進(jìn)入了大數(shù)據(jù)工作范疇。局部域內(nèi)的物聯(lián)網(wǎng)應(yīng)用解決方案等同于這個(gè)域內(nèi)的大數(shù)據(jù)系統(tǒng)大數(shù)據(jù)原理和構(gòu)成大數(shù)據(jù)的核心工作思路大數(shù)據(jù)系統(tǒng)顛覆了傳統(tǒng)數(shù)據(jù)中心的工作邏輯傳統(tǒng)數(shù)據(jù)系統(tǒng)工作邏輯:運(yùn)算系統(tǒng)調(diào)動(dòng)數(shù)據(jù)庫的數(shù)據(jù),數(shù)據(jù)的移動(dòng)。大數(shù)據(jù)系統(tǒng)工作邏輯:運(yùn)算系統(tǒng)直接部署至數(shù)據(jù)處,數(shù)據(jù)僅架構(gòu)內(nèi)移動(dòng)。BigData大數(shù)據(jù)原理和構(gòu)成BigData大數(shù)據(jù)原理和構(gòu)成傳統(tǒng)數(shù)據(jù)系統(tǒng)工作原理客戶客戶客戶客戶客戶客戶互聯(lián)網(wǎng)路由器訪問請求負(fù)載均衡效勞器集群DBDBDBDB數(shù)據(jù)庫集群數(shù)據(jù)調(diào)用請求數(shù)據(jù)移動(dòng)結(jié)果反響B(tài)igData大數(shù)據(jù)原理和構(gòu)成Hadoop軟件框架大數(shù)據(jù)系統(tǒng)核心組件MapreduceHBaseHDFSHadoop核心子工程BigData大數(shù)據(jù)原理和構(gòu)成Hadoop系統(tǒng)工作原理BigData大數(shù)據(jù)原理和構(gòu)成Hadoop系統(tǒng)構(gòu)架BigData大數(shù)據(jù)原理和構(gòu)成存儲與數(shù)據(jù)庫的比較傳統(tǒng)數(shù)據(jù)中心HadoopJOBDRAID存儲系統(tǒng)HDFS容錯(cuò)性擴(kuò)展性某已分配任務(wù)出錯(cuò),該計(jì)算必須重新執(zhí)行節(jié)點(diǎn)靈活調(diào)整節(jié)點(diǎn)相對固定,擴(kuò)展時(shí)會造成無法訪問在任務(wù)執(zhí)行中任何時(shí)候可任意添加節(jié)點(diǎn)SQLNoSQL數(shù)據(jù)類型平行計(jì)算系統(tǒng)MapReduceRAID出現(xiàn)壞盤后,重建陣列需要十多個(gè)小時(shí),這在大數(shù)據(jù)時(shí)代是無法承受的BigData大數(shù)據(jù)原理和構(gòu)成SAPHANAHadoop的升級內(nèi)存計(jì)算技術(shù)真正的海量數(shù)據(jù)瞬間分析內(nèi)存數(shù)據(jù)庫
實(shí)現(xiàn)任何地點(diǎn)、任何時(shí)候、可以查看實(shí)時(shí)的動(dòng)態(tài)數(shù)據(jù),任何時(shí)候都可以知道正在發(fā)生著什么。并且做出應(yīng)對。利用高性能的大數(shù)據(jù)一體機(jī)效勞器,將數(shù)據(jù)庫直接植入大容量內(nèi)存中進(jìn)展實(shí)時(shí)處理。HadoopMapreduceHDFSHBaseBigData大數(shù)據(jù)原理和構(gòu)成大數(shù)據(jù)的硬件32顆處理器、每顆處理器12核=384核X96個(gè)線程32TB的內(nèi)存很多中型企業(yè)的數(shù)據(jù)庫也只不過幾TB.可以完美運(yùn)行內(nèi)存計(jì)算數(shù)據(jù)庫大數(shù)據(jù)一體機(jī)效勞器+存儲+網(wǎng)絡(luò)=融合根底架構(gòu)SeaMicroSM1500064顆處理器、每顆處理器8核=512核心4TB的內(nèi)存5PB本地存儲10U的空間萬兆以太網(wǎng)Systemx3650M4機(jī)架式2U2顆處理器8核心內(nèi)存最大768GB本地存儲9TB萬換算成10U的空間80核心大數(shù)據(jù)的軟件數(shù)據(jù)存儲管理數(shù)據(jù)處理數(shù)據(jù)分析Hadoop數(shù)據(jù)庫軟件BigData大數(shù)據(jù)原理和構(gòu)成提取轉(zhuǎn)換歸類可視化BI商業(yè)智能大數(shù)據(jù)的核心價(jià)值高附加值階段大數(shù)據(jù)應(yīng)用BigData大數(shù)據(jù)應(yīng)用大數(shù)據(jù)應(yīng)用的意義巨量數(shù)據(jù)的產(chǎn)生對所有復(fù)雜數(shù)據(jù)格式的歸類管理分析20%構(gòu)造化數(shù)據(jù)的分析利用80%非構(gòu)造化的沒有發(fā)揮作用,商業(yè)洞察力的資源浪費(fèi)。找出最優(yōu)解決方案應(yīng)用的核心大數(shù)據(jù)分析BigData大數(shù)據(jù)應(yīng)用數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理可視化分析語義引擎數(shù)據(jù)挖掘算法預(yù)測性分析能力大數(shù)據(jù)應(yīng)用的分析方法高質(zhì)量的數(shù)據(jù)處理和管理是輸出高質(zhì)量結(jié)果的前提深入數(shù)據(jù)內(nèi)部,用機(jī)器去做人工做不到的數(shù)據(jù)價(jià)值發(fā)現(xiàn)從非構(gòu)造化數(shù)據(jù)中提取信息的方式展示數(shù)據(jù)分析結(jié)果,供使用者決策根據(jù)可視化和數(shù)據(jù)挖掘的結(jié)果做出預(yù)測BigData大數(shù)據(jù)應(yīng)用大數(shù)據(jù)應(yīng)用的分析邏輯DescriptivePredictivePrescriptive發(fā)生了什么?為什么?還會發(fā)生什么?還會發(fā)生什么?,如果發(fā)生了,如何應(yīng)對?BigData大數(shù)據(jù)應(yīng)用大數(shù)據(jù)應(yīng)用的假想一給某總辦公室、汽車、家里裝上煙感。發(fā)現(xiàn)某總在辦公室的抽煙數(shù)量最大,在車?yán)锖驮诩腋静怀?。那么就可以知道,某總在工作期間香煙以及與香煙有關(guān)的產(chǎn)品消費(fèi)多。那在家期間的消費(fèi)習(xí)慣又是什么,根據(jù)人的行為習(xí)慣,不抽煙但需要其他事情分散注意力。吃東西?看電視?看書?。。。。。。。。。。。這樣就可以深入了解一個(gè)人的消費(fèi)行為習(xí)慣,從而提前做出應(yīng)對或者積極的主動(dòng)應(yīng)對。BigData大數(shù)據(jù)應(yīng)用大數(shù)據(jù)應(yīng)用的假想二通過對某人淘寶購物的跟蹤分析,挖掘出他的消費(fèi)趨勢。某男,在電子商務(wù)網(wǎng)站上長期買衣服,內(nèi)衣等商品。通過消費(fèi)記錄可以預(yù)知其單身。用百度聯(lián)盟,把世紀(jì)佳緣,花田等交友網(wǎng)站的廣告推送給他。某男開場買女士消費(fèi)品了比方衣服,鞋帽等。那么說明該男找到女朋友了。通過信用卡記錄可以分析出其關(guān)系進(jìn)展情況。發(fā)現(xiàn)其買房,裝修了。那么該男快結(jié)婚了。之后就是孕嬰用品的推薦。BigData大數(shù)據(jù)應(yīng)用大數(shù)據(jù)的大應(yīng)用城市智能交通智能電力照明能源管理系統(tǒng)智能安康醫(yī)療體系政府財(cái)政管理綜合信息系統(tǒng)工商
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 專題03:論述類文本閱讀(考題練習(xí))(原卷版)
- 二建建筑工程實(shí)務(wù)-二建《建筑工程管理與實(shí)務(wù)》押題密卷4265
- 2016新編計(jì)算機(jī)基礎(chǔ)知識練習(xí)題及答案解析
- 2025年銷售經(jīng)理工作計(jì)劃模板
- 2025年財(cái)務(wù)部工作計(jì)劃 財(cái)務(wù)科2025年工作計(jì)劃
- 2025年醫(yī)院年度工作計(jì)劃 醫(yī)院年度工作計(jì)劃
- Unit 3 第3課時(shí) Section B (1a-2b)2024-2025學(xué)年新教材七年級英語上冊同步說課稿(人教版2024)河北專版
- 行政總監(jiān)的工作職責(zé)范文15篇
- 2025年市醫(yī)療器械日常監(jiān)督檢查工作計(jì)劃
- 2025年小學(xué)四年級上冊數(shù)學(xué)教學(xué)計(jì)劃
- (八省聯(lián)考)河南省2025年高考綜合改革適應(yīng)性演練 思想政治試卷(含答案)
- 綜合測試 散文閱讀(多文本)(解析版)-2025年高考語文一輪復(fù)習(xí)(新高考)
- 鈑金設(shè)備操作培訓(xùn)
- 2024駕校經(jīng)營權(quán)承包合同
- 福建省能化集團(tuán)筆試題目
- 快遞公司與驛站合作協(xié)議模板 3篇
- 水利工程招標(biāo)文件樣本
- 品質(zhì)管控培訓(xùn)質(zhì)量管理與質(zhì)量控制課件
- 小數(shù)加減乘除計(jì)算題大全(300題大全)-
- 2023-2024學(xué)年小學(xué)語文四年級素養(yǎng)檢測復(fù)習(xí)試題附答案
- 手糊補(bǔ)強(qiáng)工A卷考試 (1)附有答案
評論
0/150
提交評論