分析:做數(shù)據(jù)挖掘工作需要具備哪些思維原理_第1頁
分析:做數(shù)據(jù)挖掘工作需要具備哪些思維原理_第2頁
分析:做數(shù)據(jù)挖掘工作需要具備哪些思維原理_第3頁
免費預覽已結束,剩余1頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

分析:做數(shù)據(jù)挖掘工作需要具備哪些思維原理?

大數(shù)據(jù)時代,計算模式也發(fā)生了轉變,從“流程”核心轉變?yōu)椤皵?shù)據(jù)”核心。Hadoop體系的分布式計算框架已經(jīng)是“數(shù)據(jù)”為核心的范式。非結構化數(shù)據(jù)及分析需求,將改變IT系統(tǒng)的升級方式:從簡單增量到架構變化。大數(shù)據(jù)下的新思維——計算模式的轉變。例如:IBM將使用以數(shù)據(jù)為中心的設計,目的是降低在超級計算機之間進行大量數(shù)據(jù)交換的必要性。大數(shù)據(jù)下,云計算找到了破繭重生的機會,在存儲和計算上都體現(xiàn)了數(shù)據(jù)為核心的理念。大數(shù)據(jù)和云計算的關系:云計算為大數(shù)據(jù)提供了有力的工具和途徑,大數(shù)據(jù)為云計算提供了很有價值的用武之地。而大數(shù)據(jù)比云計算更為落地,可有效利用已大量建設的云計算資源,最后加以利用.說明:用數(shù)據(jù)核心思維方式思考問題,解決問題。以數(shù)據(jù)為核心,反映了當下IT產(chǎn)業(yè)的變革,數(shù)據(jù)成為人工智能的基礎,也成為智能化的基礎,數(shù)據(jù)比流程更重要,數(shù)據(jù)庫、記錄數(shù)據(jù)庫,都可開發(fā)出深層次信息。云計算機可以從數(shù)據(jù)庫、記錄數(shù)據(jù)庫中搜索出你是誰,你需要什么,從而推薦給你需要的信息。2、數(shù)據(jù)價值原理由功能式價值轉變?yōu)閿?shù)據(jù)式價值大數(shù)據(jù)真正有意思的是數(shù)據(jù)變得在線了,這個恰恰是互聯(lián)網(wǎng)的特點。非互聯(lián)網(wǎng)時期的產(chǎn)品,功能一定是它的價值,今天互聯(lián)網(wǎng)的產(chǎn)品,數(shù)據(jù)一定是它的價值。例如:大數(shù)據(jù)的真正價值在于創(chuàng)造,在于填補無數(shù)個還未實現(xiàn)過的空白。有人把數(shù)據(jù)比喻為蘊藏能量的煤礦,煤炭按照性質(zhì)有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數(shù)據(jù)并不在“大”,而在于“有用”,價值含量、挖掘成本比數(shù)量更為重要。不管大數(shù)據(jù)的核心價值是不是預測,但是基于大數(shù)據(jù)形成決策的模式已經(jīng)為不少的企業(yè)帶來了盈利和聲譽。美國有一家創(chuàng)新企業(yè)D,它可以幫助人們做購買決策,告訴消費者什么時候買什么產(chǎn)品,什么時候買最便宜,預測產(chǎn)品的價格趨勢,這家公司背后的驅動力就是大數(shù)據(jù)。他們在全球各大網(wǎng)站上搜集數(shù)以十億計的數(shù)據(jù),然后幫助數(shù)以十萬計的用戶省錢,為他們的采購找到最好的時間,降低交易成本,為終端的消費者帶去更多價值。在這類模式下,盡管一些零售商的利潤會進一步受擠壓,但從商業(yè)本質(zhì)上來講,可以把錢更多地放回到消費者的口袋里,讓購物變得更理性,這是依靠大數(shù)據(jù)催生出的一項全新產(chǎn)業(yè)。這家為數(shù)以十萬計的客戶省錢的公司,在幾個星期前,被eBay以高價收購。SWIFT是全球最大的支付平臺,在該平臺上的每一筆交易都可以進行大數(shù)據(jù)的分析,他們可以預測一個經(jīng)濟體的健康性和增長性。比如,該公司現(xiàn)在為全球性客戶提供經(jīng)濟指數(shù),這又是一個大數(shù)據(jù)服務。,定制化服務的關鍵是數(shù)據(jù)。《大數(shù)據(jù)時代》的作者維克托·邁爾·舍恩伯格認為,大量的數(shù)據(jù)能夠讓傳統(tǒng)行業(yè)更好地了解客戶需求,提供個性化的服務。說明:用數(shù)據(jù)價值思維方式思考問題,解決問題。信息總量的變化導致了信息形態(tài)的變化,量變引發(fā)了質(zhì)變,最先經(jīng)歷信息爆炸的學科,如天文學和基因學,創(chuàng)造出了“大數(shù)據(jù)”這個概念。如今,這個概念幾乎應用到了所有人類致力于發(fā)展的領域中。從功能為價值轉變?yōu)閿?shù)據(jù)為價值,說明數(shù)據(jù)和大數(shù)據(jù)的價值在擴大,數(shù)據(jù)為“王”的時代出現(xiàn)了。數(shù)據(jù)被解釋是信息,信息常識化是知識,所以說數(shù)據(jù)解釋、數(shù)據(jù)分析能產(chǎn)生價值。3、全樣本原理從抽樣轉變?yōu)樾枰繑?shù)據(jù)樣本需要全部數(shù)據(jù)樣本而不是抽樣,你不知道的事情比你知道的事情更重要,但如果現(xiàn)在數(shù)據(jù)足夠多,它會讓人能夠看得見、摸得著規(guī)律。數(shù)據(jù)這么大、這么多,所以人們覺得有足夠的能力把握未來,對不確定狀態(tài)的一種判斷,從而做出自己的決定。這些東西我們聽起來都是非常原始的,但是實際上背后的思維方式,和我們今天所講的大數(shù)據(jù)是非常像的。舉例:在大數(shù)據(jù)時代,無論是商家還是信息的搜集者,會比我們自己更知道你可能會想干什么?,F(xiàn)在的數(shù)據(jù)還沒有被真正挖掘,如果真正挖掘的話,通過信用卡消費的記錄,可以成功預測未來5年內(nèi)的情況。統(tǒng)計學里頭最基本的一個概念就是,全部樣本才能找出規(guī)律。為什么能夠找出行為規(guī)律?一個更深層的概念是人和人是一樣的,如果是一個人特例出來,可能很有個性,但當人口樣本數(shù)量足夠大時,就會發(fā)現(xiàn)其實每個人都是一模一樣的。說明:用全數(shù)據(jù)樣本思維方式思考問題,解決問題。從抽樣中得到的結論總是有水分的,而全部樣本中得到的結論水分就很少,大數(shù)據(jù)越大,真實性也就越大,因為大數(shù)據(jù)包含了全部的信息。4、關注效率原理由關注精確度轉變?yōu)殛P注效率關注效率而不是精確度,大數(shù)據(jù)標志著人類在尋求量化和認識世界的道路上前進了一大步,過去不可計量、存儲、分析和共享的很多東西都被數(shù)據(jù)化了,擁有大量的數(shù)據(jù)和更多不那么精確的數(shù)據(jù)為我們理解世界打開了一扇新的大門。大數(shù)據(jù)能提高生產(chǎn)效率和銷售效率,原因是大數(shù)據(jù)能夠讓我們知道市場的需要,人的消費需要。大數(shù)據(jù)讓企業(yè)的決策更科學,由關注精確度轉變?yōu)殛P注效率的提高,大數(shù)據(jù)分析能提高企業(yè)的效率。例如:在互聯(lián)網(wǎng)大數(shù)據(jù)時代,企業(yè)產(chǎn)品迭代的速度在加快。三星、小米手機制造商半年就推出一代新智能手機。利用互聯(lián)網(wǎng)、大數(shù)據(jù)提高企業(yè)效率的趨勢下,快速就是效率、預測就是效率、預見就是效率、變革就是效率、創(chuàng)新就是效率、應用就是效率。競爭是企業(yè)的動力,而效率是企業(yè)的生命,效率低與效率高是衡量企來成敗的關鍵。一般來講,投入與產(chǎn)出比是效率,追求高效率也就是追求高價值。手工、機器、自動機器、智能機器之間效率是不同的,智能機器效率更高,已能代替人的思維勞動。智能機器核心是大數(shù)據(jù)制動,而大數(shù)據(jù)制動的速度更快。在快速變化的市場,快速預測、快速決策、快速創(chuàng)新、快速定制、快速生產(chǎn)、快速上市成為企業(yè)行動的準則,也就是說,速度就是價值,效率就是價值,而這一切離不開大數(shù)據(jù)思維。說明:用關注效率思維方式思考問題,解決問題。大數(shù)據(jù)思維有點像混沌思維,確定與不確定交織在一起,過去那種一元思維結果,已被二元思維結果取代。過去尋求精確

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論