




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、教師大數(shù)據(jù)時代讀后感大數(shù)據(jù)時代這本書主要描述的是大數(shù)據(jù)時代到臨人 們生活、工作與思維各方面所遇到的重大變革。文中清晰的闡述了大數(shù)據(jù)的基本概念和特點(diǎn),并列出明 確的觀點(diǎn)。不管對于產(chǎn)業(yè)實(shí)踐者,還是對于政府和公眾機(jī)構(gòu), 都非常具有價值。作者將本書分為3個部分。第一部分提出了大數(shù)據(jù)時代處理數(shù)據(jù)理念上的三大轉(zhuǎn)變:抽樣等于全體; 要效率不要絕對精確;要相關(guān)不要因果;第二部分作者從萬 事萬物數(shù)據(jù)化和數(shù)據(jù)交叉復(fù)用的巨大價值兩個方面,講述驅(qū) 動大數(shù)據(jù)戰(zhàn)車在材質(zhì)和智力方面向前滾動的最根本動力;最 后一部分,作者描繪了大數(shù)據(jù)帝國前夜的脆弱和不安,包括 產(chǎn)業(yè)生態(tài)環(huán)境、數(shù)據(jù)安全隱私、信息公正公開等問題。本書觀點(diǎn)擲地有聲
2、,作者觀念高屋建瓴,從很多實(shí)例和 經(jīng)驗(yàn)中萃取普適性觀念。例子詳實(shí)豐富,囊括了進(jìn)百個學(xué)術(shù) 和商業(yè)實(shí)例。引言提出了大數(shù)據(jù)將給生活、工作于思維帶來重大的變 革。一個例子是20XX年H1N1流行病毒背景下谷歌通過檢測 檢索詞條,處理了億個不同的數(shù)據(jù)模型,通過預(yù)測并與20XX年、20XX年美國疾控中心記錄的實(shí)際流感病例進(jìn)行對比后, 確定了 45條檢索詞條組合,并將其用于一個特定的數(shù)學(xué)模 型后,預(yù)測的結(jié)果與官方數(shù)據(jù)的相關(guān)系數(shù)高達(dá)97%按照傳 統(tǒng)的信息返回流程,通告新流感病毒病例將有一到兩周的延 遲。對于飛速傳播的疾病,信息滯后兩周是致命的。而谷歌 運(yùn)用大數(shù)據(jù)技術(shù),以前所未有的方式,通過海量數(shù)據(jù)分析得 出流
3、感所傳播的范圍,為世界預(yù)測流感提供了一種更快捷的 預(yù)測工具。此外,我聯(lián)想到原淘寶董事長馬云通過大量數(shù)據(jù) 分析得出20XX年經(jīng)濟(jì)疲弱,為其商家提前做好迎接經(jīng)濟(jì)危 機(jī)提供了時間緩沖。(補(bǔ)充并清晰描述詳細(xì))關(guān)于大數(shù)據(jù)在 商業(yè)領(lǐng)域的應(yīng)用,F(xiàn)arecast 公司是一個成功的典型范例。 該公司由奧倫埃齊奧尼創(chuàng)辦,利用機(jī)票的銷售數(shù)據(jù)來預(yù)測 未來的機(jī)票價格,旨在幫助用戶在購買機(jī)票方面做出預(yù)測, 并對機(jī)票價格走勢預(yù)測的可信度標(biāo)示出來供消費(fèi)者查考。 Farecast系統(tǒng)利用近十萬億條價格記錄預(yù)測的準(zhǔn)確度達(dá) 75%使得使用Farecast票價預(yù)測工具購買機(jī)票的旅客,平 均每張機(jī)票節(jié)約 50美元。而處理如此多的數(shù)據(jù)離
4、開了大數(shù) 據(jù)技術(shù)將無法進(jìn)行。也正是由于我們進(jìn)入了一個前所未有的信息化時代,人 們擁有了如此多的數(shù)據(jù),才提供給我們利用大數(shù)據(jù)的分析處 理手段,創(chuàng)造新的價值。也許有人以為我們大數(shù)據(jù)時代的還 未來臨。其實(shí)大數(shù)據(jù)技術(shù)早已滲透到我們中間,它被應(yīng)用在 垃圾郵件的過濾,新浪微博技術(shù)平臺,谷歌翻譯以及輸入文 字的自動糾錯等。文中提出的一個觀點(diǎn)是,預(yù)測是大數(shù)據(jù)的核心。其實(shí)從 過去的時代人們就利用掌握的數(shù)據(jù)進(jìn)行各種分析,從而對經(jīng) 濟(jì)等各方面進(jìn)行預(yù)測、矯正。只是進(jìn)入了大數(shù)據(jù)時代人們掌 握的數(shù)據(jù)爆炸性的速度在增長,從而數(shù)據(jù)的存儲和分析數(shù)據(jù) 分方法成了釋放大數(shù)據(jù)能量的關(guān)鍵。關(guān)于不是隨機(jī)樣本而是整體數(shù)據(jù)中。作者指出了隨機(jī)
5、取 樣是小數(shù)據(jù)時代用最少的數(shù)據(jù)獲取最大價值的做法。作者用 大數(shù)據(jù)與喬布斯的癌癥治療例子說明了使用全部數(shù)據(jù)而非 樣本的意義。喬布斯成為世界上第一個對自身所有DNA和腫瘤DNA進(jìn)行排序的人。喬布斯曾開玩笑說“我要么是第一個 通過這種方式戰(zhàn)勝癌癥的人,要么就是最后一個因?yàn)檫@種方 式死于癌癥的人”。雖然最后難免死于癌癥但這種獲得所有 數(shù)據(jù)而不是僅樣本的方法將他的生命延長了幾年。同樣,從 事跨境匯款業(yè)務(wù)的 Xoom公司偵破一起犯罪集團(tuán)的詐騙也是 由于使用了整體數(shù)據(jù)。初此之外,他還列舉了日本“相撲” 等來證明使用全體數(shù)據(jù)的重要性。作者同時也指出隨著數(shù)據(jù)使用的越來越多,其得出的結(jié) 果并一定能越來越精確,畢竟
6、數(shù)據(jù)不能保證百分之百的正 確,特別是大數(shù)據(jù)時代各種結(jié)構(gòu)化與非結(jié)構(gòu)化類型的數(shù)據(jù)聚 集在一起難免導(dǎo)致結(jié)果的不太精確。大數(shù)據(jù)時代要求我們重 新審視精確性的優(yōu)劣。作者特別舉了谷歌翻譯成功的例子。 谷歌翻譯之所以優(yōu)于IBM的Candide系統(tǒng)并不是因?yàn)樗鼡碛?更好的算法機(jī)制。和微軟的班科和布里爾一樣,谷歌翻譯增 加了各種各樣的數(shù)據(jù),并且接受了有錯誤的數(shù)據(jù)。(其語庫 來自于未經(jīng)過濾的網(wǎng)頁內(nèi)容,會包含一些不完整的句子、拼 寫錯誤、語法錯誤以及其他各種錯誤)在不是因果關(guān)系,而是相關(guān)關(guān)系的篇章中。作者指出在大數(shù)據(jù)時代往往知道是什么要比知道為什么來的更實(shí)在。作 者列舉了林登的亞馬遜推薦系統(tǒng)的成功,證實(shí)了大數(shù)據(jù)在分
7、 析相關(guān)性方面的優(yōu)勢以及在銷售中獲得的成功。沃爾瑪也是 充分利用并挖掘各類數(shù)據(jù)信息的先鋒和代表,從以前廣為人 事的啤酒和尿布的案例,以及作者舉的有關(guān)蛋撻和颶風(fēng)天氣 的案例,都說明了掌握了相關(guān)關(guān)系對于其策略的幫助。建立 在相關(guān)關(guān)系分析法基礎(chǔ)上的預(yù)測是大數(shù)據(jù)的核心。Aviva保險公司利用幾百種生活方式的數(shù)據(jù),如愛好、長瀏覽網(wǎng)頁等 間接的預(yù)測出哪些人更可能患高血壓、糖尿病和抑郁癥。UPS國家快遞公司通過使用預(yù)測性分析檢測其全美6萬輛車隊(duì)。進(jìn)行防御性的修理,節(jié)約巨大得的成本。這些都充分顯示了 大數(shù)據(jù)在預(yù)測方面的優(yōu)勢。本書第二部分講的是大數(shù)據(jù)時代的商業(yè)變革。作者用莫里繪制導(dǎo)航圖的例子告訴我們,遠(yuǎn)在信息數(shù)
8、字化之前,對數(shù)據(jù)的運(yùn)用就已經(jīng)開始了。莫里利用大量的人力 去分析多年保存的航海記錄,他從這些大量的數(shù)據(jù)中獲取到 新的利用價值。繪制的圖表幫助商人節(jié)約一大筆錢,使年輕 的海員們間接獲取了成千上萬名經(jīng)驗(yàn)豐富的航海家的指導(dǎo)。日本先進(jìn)工業(yè)技術(shù)研究所越水重臣教授通過安裝壓力傳感 器將人屁股特征數(shù)據(jù)化,進(jìn)而形成對乘客身份的特征識別。 這項(xiàng)技術(shù)為汽車防盜系統(tǒng)提供了方案。公司,致力于為顧客 預(yù)測商品的價格,通過處理海量的價格信息,預(yù)測準(zhǔn)確率高 達(dá)77%幫助顧客在購買一個產(chǎn)品時節(jié)約了大約100美元。部門通過分析來自210個國家的15億信用卡用戶的650億 條交易記錄,分析得出商業(yè)發(fā)展和客戶消費(fèi)趨勢,如通過分 析發(fā)
9、現(xiàn)如果一個人下午四點(diǎn)左右給汽車加油的話,他很可能 在接下來的一個小時內(nèi)去購物或者去餐館吃飯,且在這一小 時里大約花費(fèi)35到40美元。商家正可以利用這個分析結(jié)果, 在加油的小票背面附加上附近商店的優(yōu)惠券。這些例子都證明了大數(shù)據(jù)蘊(yùn)藏著巨大的商業(yè)價值。根據(jù) 提供價值的不同,大數(shù)據(jù)價值鏈包括三大構(gòu)成部分。包括第 一種是基于數(shù)據(jù)本身的公司。這些公司擁有大量數(shù)據(jù)或者至 少可以到大量數(shù)據(jù),卻不一定有從數(shù)據(jù)中提取價值或者用數(shù) 據(jù)催生創(chuàng)新思想的技能。第二種是基于技能的公司。它們通 常是咨詢公司、技術(shù)供應(yīng)商或者分析公司。它們掌握了專業(yè) 技能但并不一定擁有數(shù)據(jù)或者提出數(shù)據(jù)創(chuàng)性用途的才能。比 如說,沃爾瑪和Pop-T
10、arts這兩個零售商就是借助天睿公司 的分析來獲得營銷點(diǎn)子,天睿就是一家大數(shù)據(jù)分析公司。第 三種是基于思維的公司。皮特.華登,Jetpac的聯(lián)合創(chuàng)始人,就是通過想法獲得價值的一個例子,他通過用戶分享到網(wǎng)上 的旅行照片來為人們推薦下一次旅行目的地。對于某些公司 來說,數(shù)據(jù)和技能并不是成功的關(guān)鍵。挖掘數(shù)據(jù)的新價值的 創(chuàng)新思維才是這些公司脫穎而出的優(yōu)勢所在。大數(shù)據(jù)成為許多公司競爭力的,未來可能整個行業(yè)的結(jié) 構(gòu)會發(fā)生改變,大公司和小公司最有可能成為贏家。如今的 核心競爭力在于快速而廉價地進(jìn)行大量的數(shù)據(jù)存儲和處理。 當(dāng)然公司要根據(jù)自己的情況進(jìn)行調(diào)整。大數(shù)據(jù)向小數(shù)據(jù)時代 的贏家以及那些線下大公司(如沃爾瑪
11、、聯(lián)邦快遞、寶潔公 司、雀巢公司、波音公司)提出了挑戰(zhàn)。同時,大數(shù)據(jù)也為 小公司帶來了機(jī)遇。大數(shù)據(jù)也將會影響國家競爭力。當(dāng)制造 業(yè)已經(jīng)大幅轉(zhuǎn)向發(fā)展中國家,而大家都爭相發(fā)展創(chuàng)新行業(yè)的 時候,工業(yè)化國家因?yàn)檎莆樟藬?shù)據(jù)以及大數(shù)據(jù)技術(shù),所以仍 然在全球競爭中占據(jù)優(yōu)勢,但這個優(yōu)勢很難持續(xù)。隨著技術(shù) 的發(fā)展,西方世界在大數(shù)據(jù)技術(shù)的優(yōu)勢將會慢慢消失。對于 大公司而言,好消息是大數(shù)據(jù)技術(shù)可以加劇優(yōu)勝劣汰。一旦 公司掌握了大數(shù)據(jù),它不但可能超過對手還可能遙遙領(lǐng)先。文章第三部分講了大數(shù)據(jù)帶來無數(shù)好處的同時帶來的 不良影響以及如何面對這些影響。包括如數(shù)據(jù)的收益的處理 問題以及數(shù)據(jù)中用戶資料的隱私和決策過程帶來的影響
12、。作 者在保護(hù)個人隱私方面提出了幾種想法。一種是使用數(shù)據(jù)時 征詢數(shù)據(jù)所有個人的知曉和授權(quán)。第二個技術(shù)途徑就是匿名 化。作者同時也指出了這兩種方式的難度。一方面到的數(shù)據(jù) 可能會被后續(xù)的多次利用。另一方面,匿名化會在數(shù)據(jù)越來 越多和數(shù)據(jù)的相互結(jié)合關(guān)聯(lián)使用時變得無效。作者列列舉電 影少數(shù)派報告的情節(jié)說明越來越依賴數(shù)據(jù)時,大數(shù)據(jù)可 能將我們禁錮在可能性之中。當(dāng)然通過分析犯罪的常發(fā)地與 常發(fā)時間,合理安排警力會對治安防范提供不小的幫助。作 者還指出不能盡信數(shù)據(jù)的分析結(jié)果,因?yàn)椴荒鼙WC獲取分析 結(jié)果的數(shù)據(jù)準(zhǔn)確性。大數(shù)據(jù)在給我們生活提供便利的同時, 也讓隱私保護(hù)的法律手段失去了作用。我們必須杜絕對數(shù)據(jù) 的過
13、分依賴。在高速邁進(jìn)大數(shù)據(jù)時代的同時,人類信息管理準(zhǔn)則需要 重新定位,這將帶動社會核心價值觀的轉(zhuǎn)變。大數(shù)據(jù)時代, 對原有規(guī)范的修修補(bǔ)補(bǔ)已經(jīng)不足以抑制大數(shù)據(jù)帶來的風(fēng)險。 保護(hù)個人隱私就需要對個人數(shù)據(jù)處理器對其政策和行為承 擔(dān)更多責(zé)任。同時必須重新定義公正的概念,以確保人類行 為的自由。作者提出了解決這些問題的方向。如個人隱私保 護(hù)方面,可以讓使用者承擔(dān)更多的社會責(zé)任。將責(zé)任從民眾 轉(zhuǎn)移到數(shù)據(jù)使用者有很多意義,也有充分的理由。因?yàn)樗麄?更清楚將如何使用數(shù)據(jù)且是數(shù)據(jù)應(yīng)用最大的受益者。關(guān)于公 正方面簡單的講就是個人可以并應(yīng)為他們的行為而非傾向 負(fù)責(zé)。就像公司有內(nèi)部會計(jì)和外部審計(jì)人員一樣,大數(shù)據(jù)時 代,公司將設(shè)置專門的人員-內(nèi)部和外部算法師對大數(shù)據(jù)活 動進(jìn)行監(jiān)督。還有可能出現(xiàn)第三方的機(jī)構(gòu)對大數(shù)據(jù)行為進(jìn)行 監(jiān)督和衡量。作者甚至考慮到對大數(shù)據(jù)存在的壟斷情況進(jìn)行 分析并在反壟斷反面給了建議。最后結(jié)語中作者提出大數(shù)據(jù) 提供給人們的只是參考答案,提醒我們在利用這個工具時要 銘記人類的作用是無法完全替代的。大數(shù)據(jù)時代是信息化社會發(fā)展必然趨勢,我們只有緊緊 跟隨時代發(fā)展的潮流,在技術(shù)上、制度上、價值觀念上做出 迅速調(diào)整并牢牢跟進(jìn),才能在接下來新一輪的國際競爭中擺 脫受制于人的弱勢境地,才能把握發(fā)展的方向,沖破與西方 國家的差距。對于一個國家如此,對于一個企業(yè)亦是如此。 在如此快速的到來的大數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 服裝搭配平臺項(xiàng)目商業(yè)計(jì)劃書
- 海洋經(jīng)濟(jì)的未來發(fā)展?jié)摿εc行業(yè)趨勢探討
- 傳感器行業(yè)未來發(fā)展趨勢與市場機(jī)會分析
- 5G技術(shù)助力醫(yī)療健康創(chuàng)新應(yīng)用試點(diǎn)方案
- 隴南市兩當(dāng)縣泰山鄉(xiāng)衛(wèi)生院招聘考試真題2024
- 2024年北京市海淀區(qū)青苗學(xué)校招聘筆試真題
- 項(xiàng)目簽約合同范本
- 生物燃料生產(chǎn)與農(nóng)業(yè)現(xiàn)代化建設(shè)考核試卷
- 術(shù)后正壓負(fù)壓引流護(hù)理
- 新疆小麥購銷合同范本
- 血液學(xué)檢驗(yàn)造血功能障礙性貧血
- 【基于STM32智能門鎖系統(tǒng)的設(shè)計(jì)10000字(論文)】
- 工程倫理案例分析
- 優(yōu)秀初中語文說課課件
- A06442《個人所得稅自行納稅申報表(A表)》 (填寫樣例)
- 2022全科醫(yī)師轉(zhuǎn)崗培訓(xùn)理論考試題庫及答案
- 建筑空間組合論
- 特種工作作業(yè)人員體格檢查表
- 清遠(yuǎn)市城市樹木修剪技術(shù)指引(試行)
- 廣州國際文化中心詳細(xì)勘察報告正文-171229end
- 警察禮儀(PPT53頁)
評論
0/150
提交評論