大數(shù)據(jù)與管理 課件_第1頁(yè)
大數(shù)據(jù)與管理 課件_第2頁(yè)
大數(shù)據(jù)與管理 課件_第3頁(yè)
大數(shù)據(jù)與管理 課件_第4頁(yè)
大數(shù)據(jù)與管理 課件_第5頁(yè)
已閱讀5頁(yè),還剩69頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大數(shù)據(jù)與管理報(bào)告人:和力大數(shù)據(jù)與管理報(bào)告人:和力1數(shù)據(jù):數(shù)據(jù)是記錄下來(lái)可以被鑒別的符號(hào),包括文字、圖片、視頻和聲音等。巖畫MB文字GB

紙、印刷術(shù)TB互聯(lián)網(wǎng)PB大數(shù)據(jù)ZB太字節(jié),記作TB,1TB=1024GB;拍字節(jié),記作PB,1PB=1024TB;艾字節(jié),記作EB,1EB=1024PB;澤字節(jié),記作ZB,1ZB=1024EB。數(shù)據(jù):數(shù)據(jù)是記錄下來(lái)可以被鑒別的符號(hào),包括文字、圖片、視頻和2目錄大數(shù)據(jù)的發(fā)展1大數(shù)據(jù)的定義和特征2案例分享3大數(shù)據(jù)時(shí)代的機(jī)遇和挑戰(zhàn)4目錄大數(shù)據(jù)的發(fā)展1大數(shù)據(jù)的定義和特征2案例分享3大數(shù)據(jù)時(shí)代的3大航海時(shí)代,早期由于對(duì)潮汐、風(fēng)和洋流等知識(shí)的缺乏,遠(yuǎn)洋航海不僅效率低下,而且充滿危險(xiǎn)。大數(shù)據(jù)的前世今生馬修·方丹·莫里曾是一名優(yōu)秀的美國(guó)海軍軍官,在一次偶然的事故后被迫退役。隨后,他與20個(gè)志同道合的數(shù)據(jù)處理者一起,整理了所有舊航海圖上的信息,并繪制了一張擁有120萬(wàn)數(shù)據(jù)點(diǎn)的航海圖。通過(guò)分析這些數(shù)據(jù),莫里知道了一些良好的天然航線,這些航線上的風(fēng)向和洋流都非常利于航行。他所繪制的圖表使航海路程減少,也變得更安全。莫里航海圖,最早的大數(shù)據(jù)實(shí)踐大航海時(shí)代,早期由于對(duì)潮汐、風(fēng)和洋流等知識(shí)的缺乏,4UPS的司機(jī)一般每天要送120至175次貨。在任何兩個(gè)目的地之間,都可以選擇多條路線。顯然,司機(jī)和UPS想要找到其中最有效率的那條。大數(shù)據(jù)的前世今生UPS行車路線選擇因此UPS利用大數(shù)據(jù)分析打造了一個(gè)名為Orion的道路優(yōu)化與導(dǎo)航集成系統(tǒng),可以在約3秒內(nèi)找出最佳路線。

2011年,UPS的駕駛員少跑了5000萬(wàn)公里的路,節(jié)省了300萬(wàn)加侖燃料,少排放了3萬(wàn)立方公噸的二氧化碳。UPS的司機(jī)一般每天要送120至175次貨。在任何兩5大數(shù)據(jù)的發(fā)展背景2001年Gartner研究指出,現(xiàn)代信息社會(huì)的信息爆炸已經(jīng)演變成了數(shù)據(jù)爆炸。2008年2011年《Nature》雜志出版??癇igData”,分析了大量快速涌現(xiàn)數(shù)據(jù)給數(shù)據(jù)分析處理帶來(lái)的巨大挑戰(zhàn)。《Science》推出關(guān)于數(shù)據(jù)處理的??癉ealingwithdata”,討論了數(shù)據(jù)洪流(DataDeluge)所帶來(lái)的挑戰(zhàn)。5月麥肯錫全球研究院發(fā)布了《大數(shù)據(jù):創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的下一個(gè)領(lǐng)域》研究報(bào)告。2012年3月奧巴馬總統(tǒng)宣布美國(guó)政府投資逾2億美元啟動(dòng)“大數(shù)據(jù)研究和發(fā)展計(jì)劃(BDRDI)”。5月,聯(lián)合國(guó)發(fā)表名為《大數(shù)據(jù)促發(fā)展:挑戰(zhàn)與機(jī)遇》的政務(wù)白皮書。大數(shù)據(jù)的發(fā)展背景2001年Gartner研究指出,現(xiàn)代信息社6大數(shù)據(jù)的發(fā)展背景

隨著一系列標(biāo)志性事件的發(fā)生和建立,人們?cè)桨l(fā)感覺到大數(shù)據(jù)時(shí)代的力量。因此2013年被許多國(guó)外媒體和專家稱為“大數(shù)據(jù)元年”。Information二十世紀(jì)中后期Industry十八世紀(jì)中葉Data2013年Agricultural一萬(wàn)年前大數(shù)據(jù)的發(fā)展背景隨著一系列標(biāo)志性事件的發(fā)生和7大數(shù)據(jù)的發(fā)展背景1、智能終端的普及2、網(wǎng)絡(luò)帶寬的提升3、電子商務(wù)的狂熱4、社交網(wǎng)絡(luò)流行5、位置信息6、云計(jì)算的興起7、物聯(lián)網(wǎng)時(shí)代的到來(lái)大數(shù)據(jù)的發(fā)展背景1、智能終端的普及2、網(wǎng)絡(luò)帶寬的提升3、電子8大數(shù)據(jù)的發(fā)展背景大數(shù)據(jù)的發(fā)展背景9大數(shù)據(jù)的發(fā)展背景大數(shù)據(jù)的發(fā)展背景10大數(shù)據(jù)的定義麥肯錫全球研究院(2011)對(duì)大數(shù)據(jù)的定義是從數(shù)據(jù)集的大體量入手的:大數(shù)據(jù)是指那些規(guī)模大到傳統(tǒng)的數(shù)據(jù)庫(kù)軟件工具已經(jīng)無(wú)法采集、存儲(chǔ)、管理和分析的數(shù)據(jù)集。百度百科對(duì)大數(shù)據(jù)的定義是:大數(shù)據(jù)(BigData),或稱巨量資料,指由于容量太大和過(guò)于復(fù)雜,無(wú)法在一定時(shí)間內(nèi)用常規(guī)軟件對(duì)其內(nèi)容進(jìn)行抓取、管理、存儲(chǔ)、檢索、共享、傳輸和分析的數(shù)據(jù)集。維克托?邁爾-舍恩伯格(2012)在《大數(shù)據(jù)時(shí)代》一書中主要從價(jià)值大的角度來(lái)定義大數(shù)據(jù),他認(rèn)為大數(shù)據(jù)是當(dāng)今社會(huì)所獨(dú)有的一種新型的能力:以一種前所未有的方式,通過(guò)對(duì)海量數(shù)據(jù)進(jìn)行分析,獲得有巨大價(jià)值的產(chǎn)品和服務(wù),或深刻的洞見。大數(shù)據(jù)的定義麥肯錫全球研究院(2011)對(duì)大數(shù)據(jù)的定義是從數(shù)11大數(shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity、Variety、Value數(shù)據(jù)體量巨大。從TB級(jí)別躍升到PB級(jí)別。Volume大量存儲(chǔ)量據(jù)估計(jì),2007年全球存儲(chǔ)了大約300EB的數(shù)據(jù),而到2013年,已達(dá)1.8ZB,據(jù)估計(jì)到2020年,世界上存儲(chǔ)的數(shù)據(jù)預(yù)計(jì)能達(dá)到35ZB之多,相當(dāng)于數(shù)千億個(gè)大型圖書館存儲(chǔ)的數(shù)據(jù)。太字節(jié),記作TB,1TB=1024GB;拍字節(jié),記作PB,1PB=1024TB;艾字節(jié),記作EB,1EB=1024PB;澤字節(jié),記作ZB,1ZB=1024EB。。。。大數(shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity12大數(shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity、Variety、Value數(shù)據(jù)體量巨大。從TB級(jí)別躍升到PB級(jí)別。Volume大量存儲(chǔ)量+計(jì)算量廣州超算中心16000個(gè)運(yùn)算節(jié)點(diǎn)312萬(wàn)個(gè)計(jì)算核心整體總計(jì)內(nèi)存1.408PB12.4PB的硬盤陣列大數(shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity13大數(shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity、Variety、Value數(shù)據(jù)體量巨大。從TB級(jí)別躍升到PB級(jí)別。Volume大量Velocity高速處理速度快。1秒定律。這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。數(shù)據(jù)更新、增長(zhǎng)速度快Facebook上每秒有4.1萬(wàn)張照片上傳,淘寶每秒有數(shù)萬(wàn)筆交易。+數(shù)據(jù)存儲(chǔ)、傳輸?shù)忍幚硭俣瓤齑髷?shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity14大數(shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity、Variety、Value數(shù)據(jù)體量巨大。從TB級(jí)別躍升到PB級(jí)別。Volume大量Velocity高速處理速度快。1秒定律。這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。Variety多樣數(shù)據(jù)類型繁多。不僅包括傳統(tǒng)的關(guān)系數(shù)據(jù)類型,也包括以網(wǎng)頁(yè)、音視頻、文檔等形式存在的未加工的、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)。大數(shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity15大數(shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity、Variety、Value數(shù)據(jù)體量巨大。從TB級(jí)別躍升到PB級(jí)別。Volume大量Velocity高速處理速度快。1秒定律。這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。Variety多樣數(shù)據(jù)類型繁多。不僅包括傳統(tǒng)的關(guān)系數(shù)據(jù)類型,也包括以網(wǎng)頁(yè)、音視頻、文檔等形式存在的未加工的、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)。Value價(jià)值

價(jià)值密度低。但龐大的數(shù)據(jù)中蘊(yùn)含著新知識(shí),以及極其重要的預(yù)測(cè)價(jià)值。大數(shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity16大數(shù)據(jù)平臺(tái)框架大數(shù)據(jù)平臺(tái)框架17管理模式的變遷決策、預(yù)策業(yè)務(wù)數(shù)據(jù)市場(chǎng)、金融、政策等等業(yè)務(wù)數(shù)據(jù)市場(chǎng)、金融、政策等等報(bào)表等決策、預(yù)策業(yè)務(wù)數(shù)據(jù)信息、預(yù)策大數(shù)據(jù)系統(tǒng)決策市場(chǎng)、金融、政策等等管理模式的變遷決策、預(yù)策業(yè)務(wù)數(shù)據(jù)市場(chǎng)、金融、政策等等業(yè)務(wù)數(shù)據(jù)18LOGO案例-谷歌流感趨勢(shì)項(xiàng)目傳統(tǒng)的流感預(yù)報(bào)會(huì)滯后大約兩周的時(shí)間,這種滯后往往會(huì)導(dǎo)致嚴(yán)重的后果。谷歌發(fā)現(xiàn),某些搜索字詞可以很好地標(biāo)示流感疫情的現(xiàn)狀。Google流感趨勢(shì)使用了經(jīng)過(guò)匯總的Google搜索數(shù)據(jù)庫(kù)來(lái)測(cè)流感疫情。LOGO案例-谷歌流感趨勢(shì)項(xiàng)目傳統(tǒng)的流感預(yù)報(bào)會(huì)滯19案例-谷歌流感趨勢(shì)項(xiàng)目

2009年,H1N1病毒肆虐全球,谷歌的“全球流感地圖”成功派上用場(chǎng),準(zhǔn)確預(yù)測(cè)出患病高發(fā)地區(qū),有效地指導(dǎo)人們進(jìn)行預(yù)防。案例-谷歌流感趨勢(shì)項(xiàng)目2009年,H1N1病毒肆虐全20案例-大數(shù)據(jù)在政務(wù)領(lǐng)域的應(yīng)用大數(shù)據(jù)的發(fā)展,將極大地改變政府的管理模式,有利于節(jié)約政府投資、加強(qiáng)市場(chǎng)監(jiān)管能力、提高政府決策能力、提升公共服務(wù)能力,實(shí)現(xiàn)區(qū)域化管理。

2013年10月,濟(jì)南電子政務(wù)數(shù)據(jù)交換平臺(tái)正式啟用。該平臺(tái)基于云計(jì)算理念,成功將工商、國(guó)稅、質(zhì)檢、公安、社保等20多個(gè)部門數(shù)據(jù)共享。國(guó)稅局與地稅局通過(guò)數(shù)據(jù)比對(duì),發(fā)現(xiàn)了25000條數(shù)據(jù)差異,落實(shí)納稅企業(yè)5000多戶,補(bǔ)繳稅款2700多萬(wàn)元。推廣:如將我國(guó)城鎮(zhèn)居民醫(yī)療數(shù)據(jù)與保險(xiǎn)數(shù)據(jù)對(duì)比分析可以優(yōu)化保險(xiǎn)企業(yè)報(bào)銷比例,發(fā)現(xiàn)虛假報(bào)銷行為;與制藥廠數(shù)據(jù)比對(duì)分析可以調(diào)節(jié)藥品的生產(chǎn)量與銷售渠道。但醫(yī)療政策信息并不能發(fā)揮這樣的作用。案例-大數(shù)據(jù)在政務(wù)領(lǐng)域的應(yīng)用大數(shù)據(jù)的發(fā)展,將極大地改21案例-政治選舉在2012年奧巴馬的競(jìng)選團(tuán)隊(duì)對(duì)數(shù)以千萬(wàn)計(jì)的選民郵件進(jìn)行數(shù)據(jù)挖掘,精確預(yù)測(cè)出更擁護(hù)奧巴馬的選民類型,并進(jìn)行了有針對(duì)性的宣傳,從而幫助奧巴馬成為了美國(guó)歷史上唯一一位在競(jìng)選經(jīng)費(fèi)處于劣勢(shì)下實(shí)現(xiàn)連任的總統(tǒng)。案例-政治選舉在2012年奧巴馬的競(jìng)選團(tuán)隊(duì)對(duì)數(shù)以千萬(wàn)計(jì)的22案例-《爸爸去哪兒》大數(shù)據(jù)解讀新華社新媒體中心聯(lián)合數(shù)托邦創(chuàng)意分析工作室抓取了新浪微博上提及“爸爸去哪兒”45.5萬(wàn)條原創(chuàng)微博,并對(duì)36.7萬(wàn)獨(dú)立原發(fā)作者用戶(去除疑似水軍賬戶)、1300余萬(wàn)條用戶微博及近1億的關(guān)系進(jìn)行數(shù)據(jù)分析。結(jié)果發(fā)現(xiàn):《爸爸去哪兒》不僅成為名副其實(shí)的“口碑王”,還使娛樂節(jié)目發(fā)生了很多微妙變化。

案例-《爸爸去哪兒》大數(shù)據(jù)解讀新華社新媒體中心聯(lián)合數(shù)23案例-《爸爸去哪兒》大數(shù)據(jù)解讀粉絲性別比例:“爸爸粉”女性占到八成。難道是因?yàn)樾前痔珟???dāng)然,這與微博中女性用戶占比較高和她們更愛分享轉(zhuǎn)評(píng)的習(xí)慣也有關(guān)。用戶年齡分布:覆蓋適齡婚育群體,觀眾氣質(zhì)更顯成熟。不少適齡青年發(fā)微博稱,“看到某某,我也好想結(jié)婚,想有個(gè)這樣的兒子/女兒。”地區(qū)偏好排行:《爸爸去哪兒》的觀眾明顯向GDP高地聚集。對(duì)湘派娛樂節(jié)目免疫力極強(qiáng)的京、滬、蘇、蜀等地罕見上榜?!栋职秩ツ膬骸菲枚惹笆》葜?,有5個(gè)GDP十強(qiáng)省份,涵蓋3個(gè)直轄市。這是否能說(shuō)明,一部分“先富起來(lái)”的人,對(duì)親子關(guān)系有更深的焦慮和更多的期待?案例-《爸爸去哪兒》大數(shù)據(jù)解讀粉絲性別比例:“爸爸粉”女性占24案例-《爸爸去哪兒》大數(shù)據(jù)解讀贊助商潛在贊助商明星同類節(jié)目競(jìng)爭(zhēng)者節(jié)目組觀眾大數(shù)據(jù)解讀可能的受益者滿足了自己“八卦”的需求。對(duì)這個(gè)節(jié)目有了深入的了解。從《爸爸去哪兒》的成功中可以學(xué)到什么?本次贊助是否成功?成功在哪里?為以后廣告的投放提供了經(jīng)驗(yàn)。了解了自己及孩子在觀眾心中的“熱度”,為下一步轉(zhuǎn)型及孩子未來(lái)的規(guī)劃提供參考。根據(jù)之前的數(shù)據(jù)分析,大膽推出了低成本同名電影并大獲成功!第二季的拍攝緊鑼密鼓地進(jìn)行著……為決策提供支持。若自己的目標(biāo)客戶與該節(jié)目的觀眾一致,可以考慮下一季的贊助。案例-《爸爸去哪兒》大數(shù)據(jù)解讀贊助商潛在贊助商明星同類節(jié)目競(jìng)25案例-紙牌屋的創(chuàng)作在《紙牌屋》是從3000萬(wàn)付費(fèi)用戶的數(shù)據(jù)中總結(jié)收視習(xí)慣、選擇,仔細(xì)分析400萬(wàn)條評(píng)論、300萬(wàn)次主題搜索,并對(duì)用戶喜好精準(zhǔn)分析的基礎(chǔ)上進(jìn)行創(chuàng)作的。最終,拍什么、誰(shuí)來(lái)拍、誰(shuí)來(lái)演、怎么播,都由數(shù)千萬(wàn)觀眾的客觀喜好統(tǒng)計(jì)決定,是用大數(shù)據(jù)“算”出來(lái)的電視劇。案例-紙牌屋的創(chuàng)作在《紙牌屋》是從3000萬(wàn)付費(fèi)用戶的數(shù)據(jù)26案例-大數(shù)據(jù)在金融領(lǐng)域的應(yīng)用大數(shù)據(jù)助力推進(jìn)高頻金融交易和小額信貸高頻交易:目前美國(guó)股市每天的成交量高達(dá)70億股,通過(guò)對(duì)歷史和實(shí)時(shí)數(shù)據(jù)的挖掘創(chuàng)新,以創(chuàng)造和改進(jìn)量化交易模型,并將之應(yīng)用于基于計(jì)算機(jī)模型的實(shí)時(shí)證券交易過(guò)程中。據(jù)統(tǒng)計(jì)其中高達(dá)三分之二的交易都是由建立在數(shù)學(xué)模型和算法之上的計(jì)算機(jī)程序自動(dòng)完成的。小額信貸:截止2013年底阿里巴巴數(shù)據(jù)平臺(tái)服務(wù)器上,已積攢超過(guò)100PB已處理的數(shù)據(jù),包括交易、金融、SNS、地圖、生活服務(wù)等多種數(shù)據(jù)類型,依托阿里電商平臺(tái)強(qiáng)大的數(shù)據(jù)體系和平臺(tái)支撐,阿里金融開創(chuàng)了一種“純信用、無(wú)抵押、免擔(dān)?!钡男☆~貸款模式,從而給數(shù)十萬(wàn)小微企業(yè),放貸數(shù)百億元,壞賬率僅為0.3%左右,低于商業(yè)銀行水平。案例-大數(shù)據(jù)在金融領(lǐng)域的應(yīng)用大數(shù)據(jù)助力推進(jìn)高頻金融交易和小額27案例-紐約沙井蓋爆炸預(yù)測(cè)在每年紐約有很多沙井蓋因內(nèi)部失火發(fā)生爆炸,后來(lái)相關(guān)部門對(duì)足夠圍繞地球三周半的地下電纜和數(shù)萬(wàn)個(gè)沙井蓋的歷史數(shù)據(jù)進(jìn)行了處理,從數(shù)據(jù)中發(fā)現(xiàn)了大型沙井蓋爆炸的106種預(yù)警情況,并成功預(yù)測(cè)出了高危沙井蓋。這樣,包含這些預(yù)警指標(biāo)的預(yù)測(cè)模型就建立起來(lái)了,可用于對(duì)以后的沙井蓋爆炸做出預(yù)測(cè),幫助公司事前做出針對(duì)性的維修決策。案例-紐約沙井蓋爆炸預(yù)測(cè)在每年紐約有很多沙井蓋因內(nèi)部失火發(fā)28案例-CPI預(yù)測(cè)美國(guó)勞工統(tǒng)計(jì)局每個(gè)月都要公布CPI,這些數(shù)據(jù)對(duì)投資者和商家都非常重要。政府為了得到這些數(shù)據(jù),每年大概需要花費(fèi)兩億五千萬(wàn)美元。這些數(shù)據(jù)是精確的也是有序的,但是這個(gè)采集結(jié)果的公布會(huì)有幾周的滯后。MIT的兩位經(jīng)濟(jì)學(xué)家通過(guò)一個(gè)軟件在互聯(lián)網(wǎng)上收集信息,他們每天可以收集到50萬(wàn)種商品的價(jià)格。通過(guò)把大數(shù)據(jù)和好的分析法相結(jié)合,這個(gè)項(xiàng)目在2008年9月雷曼兄弟破產(chǎn)之后馬上就發(fā)現(xiàn)了通貨緊縮趨勢(shì),然而那些依賴官方數(shù)據(jù)的人直到11月份才知道這個(gè)情況。案例-CPI預(yù)測(cè)美國(guó)勞工統(tǒng)計(jì)局每個(gè)月都要公布C29案例-百度遷徙圖國(guó)內(nèi)有2億手機(jī)用戶使用百度地圖,用戶每次位置變化,百度都能得到數(shù)據(jù)。把手機(jī)網(wǎng)民的定位信息匯總成大數(shù)據(jù)進(jìn)行分析,就能勾勒出人們的遷徙軌跡。房產(chǎn)道路廣告……案例-百度遷徙圖國(guó)內(nèi)有2億手機(jī)用戶使用百度地圖30案例-智能電表智能電表部署后,每隔5分鐘就從用戶處讀取一次數(shù)據(jù),從而產(chǎn)生海量用電信息。錯(cuò)峰用電……平衡用電住房空置率違建用電分析案例-智能電表智能電表部署后,每隔5分鐘就從用戶31大數(shù)據(jù)時(shí)代的機(jī)遇當(dāng)前,我國(guó)工業(yè)化、信息化、城鎮(zhèn)化、農(nóng)業(yè)現(xiàn)代化任務(wù)很重,建設(shè)下一代信息基礎(chǔ)設(shè)施,發(fā)展現(xiàn)代信息技術(shù)產(chǎn)業(yè)體系,健全信息安全保障體系,推進(jìn)信息網(wǎng)絡(luò)技術(shù)廣泛運(yùn)用,是實(shí)現(xiàn)四化同步發(fā)展的保證。大數(shù)據(jù)分析對(duì)我們深刻領(lǐng)會(huì)世情和國(guó)情,把握規(guī)律,實(shí)現(xiàn)科學(xué)發(fā)展,做出科學(xué)決策具有重要意義,我們必須重新認(rèn)識(shí)數(shù)據(jù)的重要價(jià)值。這也是李克強(qiáng)總理提出的“互聯(lián)網(wǎng)+”行動(dòng)計(jì)劃的重要組成部分。機(jī)遇——大數(shù)據(jù)技術(shù)促進(jìn)國(guó)家和社會(huì)發(fā)展大數(shù)據(jù)時(shí)代的機(jī)遇當(dāng)前,我國(guó)工業(yè)化、信息化、城鎮(zhèn)化、農(nóng)業(yè)32大數(shù)據(jù)時(shí)代的機(jī)遇大數(shù)據(jù)正在對(duì)每個(gè)領(lǐng)域都造成影響,包括商業(yè)、經(jīng)濟(jì)等領(lǐng)域。大數(shù)據(jù)正在促生新的藍(lán)海,催生新的經(jīng)濟(jì)增長(zhǎng)點(diǎn)。主動(dòng)地?fù)肀н@種變化,從戰(zhàn)略到戰(zhàn)術(shù)層而開始自我的蛻變和進(jìn)化將會(huì)讓企業(yè)更加適應(yīng)這個(gè)新的時(shí)代,大數(shù)據(jù)藍(lán)海成為未來(lái)競(jìng)爭(zhēng)的制高點(diǎn)。機(jī)遇——大數(shù)據(jù)藍(lán)海成為企業(yè)競(jìng)爭(zhēng)的新焦點(diǎn)

4月16日,中石化宣布牽手阿里,對(duì)部分傳統(tǒng)石油化工業(yè)務(wù)進(jìn)行升級(jí)。中石化與阿里巴巴合作意在將所有網(wǎng)點(diǎn)收集到的車輛加油及運(yùn)行數(shù)據(jù)收集起來(lái),進(jìn)行動(dòng)態(tài)實(shí)時(shí)的油量需求分析,在油品供應(yīng)、油站建設(shè)、油庫(kù)建設(shè)、輸送網(wǎng)絡(luò)上進(jìn)行更加滿足市場(chǎng)需求的決策,這樣可以大幅降低中石化的運(yùn)營(yíng)成本。大數(shù)據(jù)時(shí)代的機(jī)遇大數(shù)據(jù)正在對(duì)每個(gè)領(lǐng)域都造成影響,包括33大數(shù)據(jù)時(shí)代的機(jī)遇大數(shù)據(jù)時(shí)代催生了一個(gè)創(chuàng)新型的職位——數(shù)據(jù)分析師,麥肯錫公司預(yù)測(cè)美國(guó)到2018年需要深度數(shù)據(jù)分析人才44萬(wàn)—49萬(wàn),缺口14萬(wàn)—19萬(wàn)人;需要既熟悉本單位需求又了解大數(shù)據(jù)技術(shù)與應(yīng)用的管理者150萬(wàn),這方面的人才缺口更大。

中國(guó)是大國(guó),但能理解與應(yīng)用大數(shù)據(jù)的創(chuàng)新人才更是稀缺資源。機(jī)遇——大數(shù)據(jù)時(shí)代呼喚創(chuàng)新型人才大數(shù)據(jù)時(shí)代的機(jī)遇大數(shù)據(jù)時(shí)代催生了一個(gè)創(chuàng)新型的職位——34大數(shù)據(jù)帶來(lái)的挑戰(zhàn)采集、存儲(chǔ)、分析、呈現(xiàn)的技術(shù)隱私泄露預(yù)測(cè)與處罰黑客攻擊數(shù)據(jù)獨(dú)裁大數(shù)據(jù)帶來(lái)的挑戰(zhàn)大數(shù)據(jù)帶來(lái)的挑戰(zhàn)采集、存儲(chǔ)、分析、呈現(xiàn)的技術(shù)隱私泄露預(yù)測(cè)與處35大數(shù)據(jù)帶來(lái)的挑戰(zhàn)當(dāng)前,大數(shù)據(jù)的應(yīng)用只是冰山一角,絕大部分隱藏在表面之下。未來(lái),大數(shù)據(jù)所帶來(lái)的精彩值得期待!

BigData,therevolutionthathaschangedhowwelive,workandthink.大數(shù)據(jù)帶來(lái)的挑戰(zhàn)當(dāng)前,大數(shù)據(jù)的應(yīng)用只是冰山一角,絕大部分36ThankYou!ThankYou!37大數(shù)據(jù)與管理報(bào)告人:和力大數(shù)據(jù)與管理報(bào)告人:和力38數(shù)據(jù):數(shù)據(jù)是記錄下來(lái)可以被鑒別的符號(hào),包括文字、圖片、視頻和聲音等。巖畫MB文字GB

紙、印刷術(shù)TB互聯(lián)網(wǎng)PB大數(shù)據(jù)ZB太字節(jié),記作TB,1TB=1024GB;拍字節(jié),記作PB,1PB=1024TB;艾字節(jié),記作EB,1EB=1024PB;澤字節(jié),記作ZB,1ZB=1024EB。數(shù)據(jù):數(shù)據(jù)是記錄下來(lái)可以被鑒別的符號(hào),包括文字、圖片、視頻和39目錄大數(shù)據(jù)的發(fā)展1大數(shù)據(jù)的定義和特征2案例分享3大數(shù)據(jù)時(shí)代的機(jī)遇和挑戰(zhàn)4目錄大數(shù)據(jù)的發(fā)展1大數(shù)據(jù)的定義和特征2案例分享3大數(shù)據(jù)時(shí)代的40大航海時(shí)代,早期由于對(duì)潮汐、風(fēng)和洋流等知識(shí)的缺乏,遠(yuǎn)洋航海不僅效率低下,而且充滿危險(xiǎn)。大數(shù)據(jù)的前世今生馬修·方丹·莫里曾是一名優(yōu)秀的美國(guó)海軍軍官,在一次偶然的事故后被迫退役。隨后,他與20個(gè)志同道合的數(shù)據(jù)處理者一起,整理了所有舊航海圖上的信息,并繪制了一張擁有120萬(wàn)數(shù)據(jù)點(diǎn)的航海圖。通過(guò)分析這些數(shù)據(jù),莫里知道了一些良好的天然航線,這些航線上的風(fēng)向和洋流都非常利于航行。他所繪制的圖表使航海路程減少,也變得更安全。莫里航海圖,最早的大數(shù)據(jù)實(shí)踐大航海時(shí)代,早期由于對(duì)潮汐、風(fēng)和洋流等知識(shí)的缺乏,41UPS的司機(jī)一般每天要送120至175次貨。在任何兩個(gè)目的地之間,都可以選擇多條路線。顯然,司機(jī)和UPS想要找到其中最有效率的那條。大數(shù)據(jù)的前世今生UPS行車路線選擇因此UPS利用大數(shù)據(jù)分析打造了一個(gè)名為Orion的道路優(yōu)化與導(dǎo)航集成系統(tǒng),可以在約3秒內(nèi)找出最佳路線。

2011年,UPS的駕駛員少跑了5000萬(wàn)公里的路,節(jié)省了300萬(wàn)加侖燃料,少排放了3萬(wàn)立方公噸的二氧化碳。UPS的司機(jī)一般每天要送120至175次貨。在任何兩42大數(shù)據(jù)的發(fā)展背景2001年Gartner研究指出,現(xiàn)代信息社會(huì)的信息爆炸已經(jīng)演變成了數(shù)據(jù)爆炸。2008年2011年《Nature》雜志出版??癇igData”,分析了大量快速涌現(xiàn)數(shù)據(jù)給數(shù)據(jù)分析處理帶來(lái)的巨大挑戰(zhàn)。《Science》推出關(guān)于數(shù)據(jù)處理的??癉ealingwithdata”,討論了數(shù)據(jù)洪流(DataDeluge)所帶來(lái)的挑戰(zhàn)。5月麥肯錫全球研究院發(fā)布了《大數(shù)據(jù):創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的下一個(gè)領(lǐng)域》研究報(bào)告。2012年3月奧巴馬總統(tǒng)宣布美國(guó)政府投資逾2億美元啟動(dòng)“大數(shù)據(jù)研究和發(fā)展計(jì)劃(BDRDI)”。5月,聯(lián)合國(guó)發(fā)表名為《大數(shù)據(jù)促發(fā)展:挑戰(zhàn)與機(jī)遇》的政務(wù)白皮書。大數(shù)據(jù)的發(fā)展背景2001年Gartner研究指出,現(xiàn)代信息社43大數(shù)據(jù)的發(fā)展背景

隨著一系列標(biāo)志性事件的發(fā)生和建立,人們?cè)桨l(fā)感覺到大數(shù)據(jù)時(shí)代的力量。因此2013年被許多國(guó)外媒體和專家稱為“大數(shù)據(jù)元年”。Information二十世紀(jì)中后期Industry十八世紀(jì)中葉Data2013年Agricultural一萬(wàn)年前大數(shù)據(jù)的發(fā)展背景隨著一系列標(biāo)志性事件的發(fā)生和44大數(shù)據(jù)的發(fā)展背景1、智能終端的普及2、網(wǎng)絡(luò)帶寬的提升3、電子商務(wù)的狂熱4、社交網(wǎng)絡(luò)流行5、位置信息6、云計(jì)算的興起7、物聯(lián)網(wǎng)時(shí)代的到來(lái)大數(shù)據(jù)的發(fā)展背景1、智能終端的普及2、網(wǎng)絡(luò)帶寬的提升3、電子45大數(shù)據(jù)的發(fā)展背景大數(shù)據(jù)的發(fā)展背景46大數(shù)據(jù)的發(fā)展背景大數(shù)據(jù)的發(fā)展背景47大數(shù)據(jù)的定義麥肯錫全球研究院(2011)對(duì)大數(shù)據(jù)的定義是從數(shù)據(jù)集的大體量入手的:大數(shù)據(jù)是指那些規(guī)模大到傳統(tǒng)的數(shù)據(jù)庫(kù)軟件工具已經(jīng)無(wú)法采集、存儲(chǔ)、管理和分析的數(shù)據(jù)集。百度百科對(duì)大數(shù)據(jù)的定義是:大數(shù)據(jù)(BigData),或稱巨量資料,指由于容量太大和過(guò)于復(fù)雜,無(wú)法在一定時(shí)間內(nèi)用常規(guī)軟件對(duì)其內(nèi)容進(jìn)行抓取、管理、存儲(chǔ)、檢索、共享、傳輸和分析的數(shù)據(jù)集。維克托?邁爾-舍恩伯格(2012)在《大數(shù)據(jù)時(shí)代》一書中主要從價(jià)值大的角度來(lái)定義大數(shù)據(jù),他認(rèn)為大數(shù)據(jù)是當(dāng)今社會(huì)所獨(dú)有的一種新型的能力:以一種前所未有的方式,通過(guò)對(duì)海量數(shù)據(jù)進(jìn)行分析,獲得有巨大價(jià)值的產(chǎn)品和服務(wù),或深刻的洞見。大數(shù)據(jù)的定義麥肯錫全球研究院(2011)對(duì)大數(shù)據(jù)的定義是從數(shù)48大數(shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity、Variety、Value數(shù)據(jù)體量巨大。從TB級(jí)別躍升到PB級(jí)別。Volume大量存儲(chǔ)量據(jù)估計(jì),2007年全球存儲(chǔ)了大約300EB的數(shù)據(jù),而到2013年,已達(dá)1.8ZB,據(jù)估計(jì)到2020年,世界上存儲(chǔ)的數(shù)據(jù)預(yù)計(jì)能達(dá)到35ZB之多,相當(dāng)于數(shù)千億個(gè)大型圖書館存儲(chǔ)的數(shù)據(jù)。太字節(jié),記作TB,1TB=1024GB;拍字節(jié),記作PB,1PB=1024TB;艾字節(jié),記作EB,1EB=1024PB;澤字節(jié),記作ZB,1ZB=1024EB。。。。大數(shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity49大數(shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity、Variety、Value數(shù)據(jù)體量巨大。從TB級(jí)別躍升到PB級(jí)別。Volume大量存儲(chǔ)量+計(jì)算量廣州超算中心16000個(gè)運(yùn)算節(jié)點(diǎn)312萬(wàn)個(gè)計(jì)算核心整體總計(jì)內(nèi)存1.408PB12.4PB的硬盤陣列大數(shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity50大數(shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity、Variety、Value數(shù)據(jù)體量巨大。從TB級(jí)別躍升到PB級(jí)別。Volume大量Velocity高速處理速度快。1秒定律。這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。數(shù)據(jù)更新、增長(zhǎng)速度快Facebook上每秒有4.1萬(wàn)張照片上傳,淘寶每秒有數(shù)萬(wàn)筆交易。+數(shù)據(jù)存儲(chǔ)、傳輸?shù)忍幚硭俣瓤齑髷?shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity51大數(shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity、Variety、Value數(shù)據(jù)體量巨大。從TB級(jí)別躍升到PB級(jí)別。Volume大量Velocity高速處理速度快。1秒定律。這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。Variety多樣數(shù)據(jù)類型繁多。不僅包括傳統(tǒng)的關(guān)系數(shù)據(jù)類型,也包括以網(wǎng)頁(yè)、音視頻、文檔等形式存在的未加工的、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)。大數(shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity52大數(shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity、Variety、Value數(shù)據(jù)體量巨大。從TB級(jí)別躍升到PB級(jí)別。Volume大量Velocity高速處理速度快。1秒定律。這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。Variety多樣數(shù)據(jù)類型繁多。不僅包括傳統(tǒng)的關(guān)系數(shù)據(jù)類型,也包括以網(wǎng)頁(yè)、音視頻、文檔等形式存在的未加工的、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)。Value價(jià)值

價(jià)值密度低。但龐大的數(shù)據(jù)中蘊(yùn)含著新知識(shí),以及極其重要的預(yù)測(cè)價(jià)值。大數(shù)據(jù)的特征大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity53大數(shù)據(jù)平臺(tái)框架大數(shù)據(jù)平臺(tái)框架54管理模式的變遷決策、預(yù)策業(yè)務(wù)數(shù)據(jù)市場(chǎng)、金融、政策等等業(yè)務(wù)數(shù)據(jù)市場(chǎng)、金融、政策等等報(bào)表等決策、預(yù)策業(yè)務(wù)數(shù)據(jù)信息、預(yù)策大數(shù)據(jù)系統(tǒng)決策市場(chǎng)、金融、政策等等管理模式的變遷決策、預(yù)策業(yè)務(wù)數(shù)據(jù)市場(chǎng)、金融、政策等等業(yè)務(wù)數(shù)據(jù)55LOGO案例-谷歌流感趨勢(shì)項(xiàng)目傳統(tǒng)的流感預(yù)報(bào)會(huì)滯后大約兩周的時(shí)間,這種滯后往往會(huì)導(dǎo)致嚴(yán)重的后果。谷歌發(fā)現(xiàn),某些搜索字詞可以很好地標(biāo)示流感疫情的現(xiàn)狀。Google流感趨勢(shì)使用了經(jīng)過(guò)匯總的Google搜索數(shù)據(jù)庫(kù)來(lái)測(cè)流感疫情。LOGO案例-谷歌流感趨勢(shì)項(xiàng)目傳統(tǒng)的流感預(yù)報(bào)會(huì)滯56案例-谷歌流感趨勢(shì)項(xiàng)目

2009年,H1N1病毒肆虐全球,谷歌的“全球流感地圖”成功派上用場(chǎng),準(zhǔn)確預(yù)測(cè)出患病高發(fā)地區(qū),有效地指導(dǎo)人們進(jìn)行預(yù)防。案例-谷歌流感趨勢(shì)項(xiàng)目2009年,H1N1病毒肆虐全57案例-大數(shù)據(jù)在政務(wù)領(lǐng)域的應(yīng)用大數(shù)據(jù)的發(fā)展,將極大地改變政府的管理模式,有利于節(jié)約政府投資、加強(qiáng)市場(chǎng)監(jiān)管能力、提高政府決策能力、提升公共服務(wù)能力,實(shí)現(xiàn)區(qū)域化管理。

2013年10月,濟(jì)南電子政務(wù)數(shù)據(jù)交換平臺(tái)正式啟用。該平臺(tái)基于云計(jì)算理念,成功將工商、國(guó)稅、質(zhì)檢、公安、社保等20多個(gè)部門數(shù)據(jù)共享。國(guó)稅局與地稅局通過(guò)數(shù)據(jù)比對(duì),發(fā)現(xiàn)了25000條數(shù)據(jù)差異,落實(shí)納稅企業(yè)5000多戶,補(bǔ)繳稅款2700多萬(wàn)元。推廣:如將我國(guó)城鎮(zhèn)居民醫(yī)療數(shù)據(jù)與保險(xiǎn)數(shù)據(jù)對(duì)比分析可以優(yōu)化保險(xiǎn)企業(yè)報(bào)銷比例,發(fā)現(xiàn)虛假報(bào)銷行為;與制藥廠數(shù)據(jù)比對(duì)分析可以調(diào)節(jié)藥品的生產(chǎn)量與銷售渠道。但醫(yī)療政策信息并不能發(fā)揮這樣的作用。案例-大數(shù)據(jù)在政務(wù)領(lǐng)域的應(yīng)用大數(shù)據(jù)的發(fā)展,將極大地改58案例-政治選舉在2012年奧巴馬的競(jìng)選團(tuán)隊(duì)對(duì)數(shù)以千萬(wàn)計(jì)的選民郵件進(jìn)行數(shù)據(jù)挖掘,精確預(yù)測(cè)出更擁護(hù)奧巴馬的選民類型,并進(jìn)行了有針對(duì)性的宣傳,從而幫助奧巴馬成為了美國(guó)歷史上唯一一位在競(jìng)選經(jīng)費(fèi)處于劣勢(shì)下實(shí)現(xiàn)連任的總統(tǒng)。案例-政治選舉在2012年奧巴馬的競(jìng)選團(tuán)隊(duì)對(duì)數(shù)以千萬(wàn)計(jì)的59案例-《爸爸去哪兒》大數(shù)據(jù)解讀新華社新媒體中心聯(lián)合數(shù)托邦創(chuàng)意分析工作室抓取了新浪微博上提及“爸爸去哪兒”45.5萬(wàn)條原創(chuàng)微博,并對(duì)36.7萬(wàn)獨(dú)立原發(fā)作者用戶(去除疑似水軍賬戶)、1300余萬(wàn)條用戶微博及近1億的關(guān)系進(jìn)行數(shù)據(jù)分析。結(jié)果發(fā)現(xiàn):《爸爸去哪兒》不僅成為名副其實(shí)的“口碑王”,還使娛樂節(jié)目發(fā)生了很多微妙變化。

案例-《爸爸去哪兒》大數(shù)據(jù)解讀新華社新媒體中心聯(lián)合數(shù)60案例-《爸爸去哪兒》大數(shù)據(jù)解讀粉絲性別比例:“爸爸粉”女性占到八成。難道是因?yàn)樾前痔珟洠慨?dāng)然,這與微博中女性用戶占比較高和她們更愛分享轉(zhuǎn)評(píng)的習(xí)慣也有關(guān)。用戶年齡分布:覆蓋適齡婚育群體,觀眾氣質(zhì)更顯成熟。不少適齡青年發(fā)微博稱,“看到某某,我也好想結(jié)婚,想有個(gè)這樣的兒子/女兒。”地區(qū)偏好排行:《爸爸去哪兒》的觀眾明顯向GDP高地聚集。對(duì)湘派娛樂節(jié)目免疫力極強(qiáng)的京、滬、蘇、蜀等地罕見上榜?!栋职秩ツ膬骸菲枚惹笆》葜?,有5個(gè)GDP十強(qiáng)省份,涵蓋3個(gè)直轄市。這是否能說(shuō)明,一部分“先富起來(lái)”的人,對(duì)親子關(guān)系有更深的焦慮和更多的期待?案例-《爸爸去哪兒》大數(shù)據(jù)解讀粉絲性別比例:“爸爸粉”女性占61案例-《爸爸去哪兒》大數(shù)據(jù)解讀贊助商潛在贊助商明星同類節(jié)目競(jìng)爭(zhēng)者節(jié)目組觀眾大數(shù)據(jù)解讀可能的受益者滿足了自己“八卦”的需求。對(duì)這個(gè)節(jié)目有了深入的了解。從《爸爸去哪兒》的成功中可以學(xué)到什么?本次贊助是否成功?成功在哪里?為以后廣告的投放提供了經(jīng)驗(yàn)。了解了自己及孩子在觀眾心中的“熱度”,為下一步轉(zhuǎn)型及孩子未來(lái)的規(guī)劃提供參考。根據(jù)之前的數(shù)據(jù)分析,大膽推出了低成本同名電影并大獲成功!第二季的拍攝緊鑼密鼓地進(jìn)行著……為決策提供支持。若自己的目標(biāo)客戶與該節(jié)目的觀眾一致,可以考慮下一季的贊助。案例-《爸爸去哪兒》大數(shù)據(jù)解讀贊助商潛在贊助商明星同類節(jié)目競(jìng)62案例-紙牌屋的創(chuàng)作在《紙牌屋》是從3000萬(wàn)付費(fèi)用戶的數(shù)據(jù)中總結(jié)收視習(xí)慣、選擇,仔細(xì)分析400萬(wàn)條評(píng)論、300萬(wàn)次主題搜索,并對(duì)用戶喜好精準(zhǔn)分析的基礎(chǔ)上進(jìn)行創(chuàng)作的。最終,拍什么、誰(shuí)來(lái)拍、誰(shuí)來(lái)演、怎么播,都由數(shù)千萬(wàn)觀眾的客觀喜好統(tǒng)計(jì)決定,是用大數(shù)據(jù)“算”出來(lái)的電視劇。案例-紙牌屋的創(chuàng)作在《紙牌屋》是從3000萬(wàn)付費(fèi)用戶的數(shù)據(jù)63案例-大數(shù)據(jù)在金融領(lǐng)域的應(yīng)用大數(shù)據(jù)助力推進(jìn)高頻金融交易和小額信貸高頻交易:目前美國(guó)股市每天的成交量高達(dá)70億股,通過(guò)對(duì)歷史和實(shí)時(shí)數(shù)據(jù)的挖掘創(chuàng)新,以創(chuàng)造和改進(jìn)量化交易模型,并將之應(yīng)用于基于計(jì)算機(jī)模型的實(shí)時(shí)證券交易過(guò)程中。據(jù)統(tǒng)計(jì)其中高達(dá)三分之二的交易都是由建立在數(shù)學(xué)模型和算法之上的計(jì)算機(jī)程序自動(dòng)完成的。小額信貸:截止2013年底阿里巴巴數(shù)據(jù)平臺(tái)服務(wù)器上,已積攢超過(guò)100PB已處理的數(shù)據(jù),包括交易、金融、SNS、地圖、生活服務(wù)等多種數(shù)據(jù)類型,依托阿里電商平臺(tái)強(qiáng)大的數(shù)據(jù)體系和平臺(tái)支撐,阿里金融開創(chuàng)了一種“純信用、無(wú)抵押、免擔(dān)?!钡男☆~貸款模式,從而給數(shù)十萬(wàn)小微企業(yè),放貸數(shù)百億元,壞賬率僅為0.3%左右,低于商業(yè)銀行水平。案例-大數(shù)據(jù)在金融領(lǐng)域的應(yīng)用大數(shù)據(jù)助力推進(jìn)高頻金融交易和小額64案例-紐約沙井蓋爆炸預(yù)測(cè)在每年紐約有很多沙井蓋因內(nèi)部失火發(fā)生爆炸,后來(lái)相關(guān)部門對(duì)足夠圍繞地球三周半的地下電纜和數(shù)萬(wàn)個(gè)沙井蓋的歷史數(shù)據(jù)進(jìn)行了處理,從數(shù)據(jù)中發(fā)現(xiàn)了大型沙井蓋爆炸的106種預(yù)警情況,并成功預(yù)測(cè)出了高危沙井蓋。這樣,包含這些預(yù)警指標(biāo)的預(yù)測(cè)模型就建立起來(lái)了,可用于對(duì)以后的沙井蓋爆炸做出預(yù)測(cè),幫助公司事前做出針對(duì)性的維修決策。案例-紐約沙井蓋爆炸預(yù)測(cè)在每年紐約有很多沙井蓋因內(nèi)部失火發(fā)65案例-CPI預(yù)測(cè)美國(guó)勞工統(tǒng)計(jì)局每個(gè)月都要公布CPI,這些數(shù)據(jù)對(duì)投資者和商家都非常重要。政府為了得到這些數(shù)據(jù),每年大概需要花費(fèi)兩億五千萬(wàn)美元。這些數(shù)據(jù)是精確的也是有序的,但是這個(gè)采集結(jié)果的公布會(huì)有幾周的滯后。MIT的兩位經(jīng)濟(jì)學(xué)家通過(guò)一個(gè)軟件在互聯(lián)網(wǎng)上收集信息,他們每天可以收集到50萬(wàn)種商品的價(jià)格。通過(guò)把大數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論