大數據時代下的數據挖掘簡易PPT學習教案_第1頁
大數據時代下的數據挖掘簡易PPT學習教案_第2頁
大數據時代下的數據挖掘簡易PPT學習教案_第3頁
大數據時代下的數據挖掘簡易PPT學習教案_第4頁
大數據時代下的數據挖掘簡易PPT學習教案_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、會計學1大數據時代下的數據挖掘簡易大數據時代下的數據挖掘簡易一場生活、工作與思維的大變革第1頁/共33頁一場生活、工作與思維的大變革第2頁/共33頁第3頁/共33頁FarecastBing第4頁/共33頁大數據大數據的特性的特性第5頁/共33頁大數據時代的思維變革大數據時代的商業(yè)變革大數據時代的管理變革第6頁/共33頁第7頁/共33頁“更多”不是隨機樣本,而是全體數據 當數據處理技術已經發(fā)生翻天覆地的變化時,在大數據時代進行抽樣分析就像在汽車時代騎馬一樣。一切都改變了,我們需要的是所有的數據,“樣本總體”。讓數據“發(fā)聲”小數據時代的隨機采樣,最少的數據獲得最多的信息全數據模式,樣本總體第8頁/

2、共33頁“更雜”不是精確性,而是混雜性 執(zhí)迷于精確性是信息缺乏時代和模擬時代的產物。只有5%的數據是有框架且能適用于傳統(tǒng)數據庫的。如果不能接受混亂,剩下95%的非框架數據都無法被利用,只有接受不精確性,我們才能打開一扇從未涉足的世界的窗戶。允許不精確大數據的簡單算法比小數據的復雜算法更有效紛繁的數據越多越好混雜性,不是竭力避免,而是標準途徑新的數據庫設計的誕生第9頁/共33頁“更好”不是因果關系,而是相關關系 知道“是什么”就夠了,沒必要知道“為什么”。在大數據時代,我們不必非得知道現象背后的原因,而是要讓數據自己“發(fā)聲”。關聯(lián)物,預測的關鍵“是什么”,而不是“為什么”改變,從操作方式開始大數

3、據,改變人類探索世界的方法第10頁/共33頁第11頁/共33頁“數據化”一切皆可“量化” 大數據發(fā)展的核心動力來源于人類測量、記錄和分析世界的渴望。信息技術變革隨處可見,但是如今信息技術變革的重點在“T”(技術)上,而不是在“I”(信息)上?,F在,我們是時候把聚光燈打向“I”,開始關注信息本身了。數據,從最不可能的地方提取出來數據化,不是數字化量化一切,數據化的核心當文字變成數據當方位變成數據當溝通成為數據一切事物的數據化第12頁/共33頁“價值”“取之不盡,用之不竭”的數據創(chuàng)新 數據就像一個神奇的鉆石礦,當它的首要價值被發(fā)掘后仍能不斷給予。它的真實價值就像漂浮在海洋中的冰山,第一眼只能看到冰

4、山的一角,而絕大部分都隱藏在表面之下。數據創(chuàng)新1:數據的再利用數據創(chuàng)新2:重組數據數據創(chuàng)新3:可擴展數據數據創(chuàng)新4:數據的折舊值數據創(chuàng)新5:數據廢氣數據創(chuàng)新6:開放數據給數據估值第13頁/共33頁“角色定位”數據、技術與思維的三足鼎立 微軟以億美元的價格購買了大數據公司Farecast,而兩年后谷歌則以7億美元的價格購買了給Farecast提供數據的ITA Software公司。如今,我們正處在大數據時代的早期,思維和技術是最有價值的,但是最終大部分價值還是必須從數據本身來挖掘。大數據價值的3大構成大數據掌控公司大數據技術公司大數據思維公司和個人全新的數據中間商專家的消亡與數據科學家的崛起大數

5、據,決定企業(yè)的競爭力第14頁/共33頁第15頁/共33頁“風險”讓數據主宰一切的隱憂 我們時刻都暴露在“第三只眼”之下:亞馬遜監(jiān)視著我們的購物習慣,谷歌監(jiān)視著我們的網頁瀏覽習慣,而微博似乎什么都知道,不僅竊聽到了我們心中的“TA”,還有我們的社交關系網。無處不在的“第三只眼”我們的隱私被二次利用了預測與懲罰,不是因為“所做”,而是因為“將做”數據獨裁掙脫大數據的困境第16頁/共33頁“掌控”責任與自由并舉的信息管理 當世界開始邁向大數據時代時,社會也將經歷類似的地殼運動。在改變人類基本的生活與思考方式的同時,大數據早已在推動人類信息管理準則上重新定位。然而,不同于印刷革命,我們沒有幾個世紀的時

6、間去適應,我們也許只有幾年時間。管理變革1:個人隱私保護,從個人許可到讓數據使用者承擔責任管理變革2:個人動因VS預測分析管理變革3:擊碎黑盒子,大數據程序員的崛起管理變革4:反數據壟斷大亨第17頁/共33頁正在發(fā)生的未來大數據并不是一個充斥著算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。第18頁/共33頁大數據時代下的數據挖掘 第19頁/共33頁數據挖掘簡介數據挖掘簡介1數據挖掘分類數據挖掘分類2成功案例成功案例3總結與展望總結與展望4第20頁/共33頁第21頁/共33頁第22頁/共33頁第23頁/共33頁數據倉庫數據挖掘數據庫原始文件原始文件處理原始文件處理紙張紙張界面、查詢界面、查詢硬盤硬盤聯(lián)機分析處理聯(lián)機分析處理各個數據庫各個數據庫各種媒體各種媒體20世紀60年代前20世紀60年代20世紀80年代現在現在第24頁/共33頁統(tǒng)計學數據庫技術信息科學其他學科機器學習第25頁/共33頁結果解釋和評估數據挖掘算法執(zhí)行數據收集數據收集和與處理和與處理問題定義第26頁/共33頁

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論