版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、大數(shù)據(jù)導論大數(shù)據(jù)的發(fā)展第1頁,共19頁。一、導入如果僅僅是從數(shù)據(jù)量的角度來看的話,大數(shù)據(jù)在過去就已經(jīng)存在了。(1)波音的噴氣發(fā)動機(2)生物技術(shù)領域中的基因組分析第2頁,共19頁?,F(xiàn)在和過去的區(qū)別之一,就是大數(shù)據(jù)已經(jīng)不僅產(chǎn)生于特定領域中,而且還產(chǎn)生于我們每天的日常生活中,臉書、推特、領英(LinkedIn)、微信、QQ等社交媒體上的文本數(shù)據(jù)就是最好的例子。而且,盡管我們無法得到全部數(shù)據(jù),但大部分數(shù)據(jù)可以通過公開的API(應用程序編程接口)相對容易地進行采集。在B2C(商家對顧客)企業(yè)中,使用文本挖掘(text mining)和情感分析等技術(shù),就可以分析消費者對于自家產(chǎn)品的評價。二、大數(shù)據(jù)的發(fā)展
2、第3頁,共19頁。1. 硬件性價比提高與軟件技術(shù)進步二、大數(shù)據(jù)的發(fā)展1. 硬件性價比提高與軟件技術(shù)進步第4頁,共19頁。(1)計算機性價比的提高二、大數(shù)據(jù)的發(fā)展1. 硬件性價比提高與軟件技術(shù)進步第5頁,共19頁。(2)磁盤價格的下降。二、大數(shù)據(jù)的發(fā)展1. 硬件性價比提高與軟件技術(shù)進步第6頁,共19頁。(3)大規(guī)模數(shù)據(jù)分布式處理技術(shù)Hadoop。最大特征,就是能夠?qū)Υ罅糠墙Y(jié)構(gòu)化數(shù)據(jù)進行高速處理。二、大數(shù)據(jù)的發(fā)展1. 硬件性價比提高與軟件技術(shù)進步第7頁,共19頁。2. 云計算的普及二、大數(shù)據(jù)的發(fā)展2. 云計算的普及第8頁,共19頁。(1)網(wǎng)絡廣告公司Razorfish(2)提供預測航班起飛晚點等“
3、航班預報”服務的FlightCaster(3)對消費電子產(chǎn)品價格走勢進行預測的D等。二、大數(shù)據(jù)的發(fā)展2. 云計算的普及第9頁,共19頁。3. 大數(shù)據(jù)作為BI的進化形式二、大數(shù)據(jù)的發(fā)展3. 大數(shù)據(jù)作為BI的進化形式第10頁,共19頁。BI的概念是1989年由時任美國高德納(Gartner)咨詢公司的分析師Howard Dresner所提出的。Dresner當時提出的觀點是,應該將過去100依賴信息系統(tǒng)部門來完成的銷售分析、客戶分析等業(yè)務,通過讓作為數(shù)據(jù)使用者的管理人員以及一般商務人員等最終用戶來親自參與,從而實現(xiàn)決策的迅速化以及生產(chǎn)效率的提高。二、大數(shù)據(jù)的發(fā)展3. 大數(shù)據(jù)作為BI的進化形式第11
4、頁,共19頁。二、大數(shù)據(jù)的發(fā)展3. 大數(shù)據(jù)作為BI的進化形式商務智能用于改善商業(yè)應用,將數(shù)據(jù)倉庫中的數(shù)據(jù)以及儀表板的分析查詢結(jié)合起來第12頁,共19頁。(1)數(shù)據(jù)挖掘(Data Mining)(2)機器學習(3)Hadoop+云計算(4)對大數(shù)據(jù)應用機器學習二、大數(shù)據(jù)的發(fā)展3. 大數(shù)據(jù)作為BI的進化形式第13頁,共19頁。4. 從交易數(shù)據(jù)分析到交互數(shù)據(jù)分析(1)例如,像亞馬遜這樣運營電商網(wǎng)站的企業(yè),可以通過網(wǎng)站的點擊流數(shù)據(jù),追蹤用戶在網(wǎng)站內(nèi)的行為,從而對用戶從訪問網(wǎng)站到最終購買商品的行為路線進行分析。這種點擊流數(shù)據(jù),正是表現(xiàn)客戶與公司網(wǎng)站之間相互作用的一種交互數(shù)據(jù)。二、大數(shù)據(jù)的發(fā)展4. 從交易
5、數(shù)據(jù)分析到交互數(shù)據(jù)分析第14頁,共19頁。(2)在超市中, IC標簽收集到的顧客行動路線數(shù)據(jù)和POS等銷售數(shù)據(jù)相結(jié)合,從而分析出顧客買或不買某種商品的理由,這樣的應用現(xiàn)在已經(jīng)開始出現(xiàn)了。二、大數(shù)據(jù)的發(fā)展4. 從交易數(shù)據(jù)分析到交互數(shù)據(jù)分析第15頁,共19頁。(3)O2O(Online to Offline,線上與線下的結(jié)合),今后更為重要的是對連接網(wǎng)絡世界和真實世界的交互數(shù)據(jù)進行分析。二、大數(shù)據(jù)的發(fā)展4. 從交易數(shù)據(jù)分析到交互數(shù)據(jù)分析第16頁,共19頁。 三、重新認識數(shù)據(jù)最初,大數(shù)據(jù)這個概念是指需要處理的信息量過大,已經(jīng)超出了一般電腦在處理數(shù)據(jù)時所能使用的內(nèi)存量,因此工程師們必須改進處理數(shù)據(jù)的工具。這導致了新的處理技術(shù)的誕生,例如谷歌的MapReduce和開源Hadoop平臺。這些技術(shù)使得人們可以處理的數(shù)據(jù)量大大增加。更重要的是,這些數(shù)據(jù)不再需要用傳統(tǒng)的數(shù)據(jù)庫表格來整齊地排列,這些都是傳統(tǒng)數(shù)據(jù)庫結(jié)構(gòu)化查詢語言(SQL)的要求。而非結(jié)構(gòu)化數(shù)據(jù)庫(NoSQL)不再有這些要求。同時,因為互聯(lián)網(wǎng)公司可以收集大量有價值的數(shù)據(jù),而且有利用這些數(shù)據(jù)的強烈的利益
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度無線電頻率占用費支付合同3篇
- 2024年員工與企業(yè)共同創(chuàng)業(yè)股權(quán)入股協(xié)議3篇
- 2024年度五金建材行業(yè)銷售代理合作協(xié)議3篇
- 2024年幼兒園園長任期教育質(zhì)量提升聘用合同范本3篇
- 2024年度金融服務代理居間合作協(xié)議3篇
- 2024年無保險勞務派遣服務外包與合作協(xié)議3篇
- 2024年度環(huán)保產(chǎn)業(yè)知識產(chǎn)權(quán)保護及合作協(xié)議范本3篇
- 2024年度風景名勝區(qū)栽樹保護承包合同3篇
- 2024學校圖書館數(shù)字資源與紙質(zhì)圖書采購一體化合同3篇
- 2024年度個人與個人之間互助借款合同3篇
- 北京市朝陽區(qū)2022-2023學年三年級上學期英語期末試卷
- GB/T 9755-2024合成樹脂乳液墻面涂料
- 嗶哩嗶哩MATES人群資產(chǎn)經(jīng)營白皮書【嗶哩嗶哩】
- 認識實習報告(10篇)
- 銷售部門年度工作規(guī)劃
- 【MOOC】內(nèi)科護理學-中山大學 中國大學慕課MOOC答案
- 2024年度網(wǎng)絡安全評估及維護合同2篇
- 2024年商業(yè)地產(chǎn)買賣合同樣本
- 倉庫主管年度工作總結(jié)
- 內(nèi)蒙古興安盟(2024年-2025年小學五年級語文)人教版隨堂測試((上下)學期)試卷及答案
- S16榮濰高速公路萊陽至濰坊段改擴建工程可行性研究報告
評論
0/150
提交評論