下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、 大數(shù)據(jù)對對統(tǒng)計學帶來的影響 馬靜汝 年勇摘 要:2010年,全球數(shù)據(jù)跨入了zb時代,全球的數(shù)據(jù)量也越來越多,海量的數(shù)據(jù)對我們的生活、工作,甚至社會發(fā)展、國家經(jīng)濟都產(chǎn)生了實時的影響,大數(shù)據(jù)時代已然悄悄來臨.因為數(shù)據(jù)關(guān)系的內(nèi)在的本質(zhì),它決定了統(tǒng)計學和大數(shù)據(jù)之間有著密不可分的關(guān)系,大數(shù)據(jù)對統(tǒng)計學產(chǎn)生了挑戰(zhàn)又提供了機遇.本論文范文過介紹現(xiàn)代統(tǒng)計學體系,根據(jù)統(tǒng)計方法將統(tǒng)計學分為推斷統(tǒng)計學和描述統(tǒng)計學,本文首先分析了大數(shù)據(jù)對描述統(tǒng)計學帶來的挑戰(zhàn),體現(xiàn)在:給搜集數(shù)據(jù)方法帶來的挑戰(zhàn)、給數(shù)據(jù)存儲方法帶來的挑戰(zhàn).再者總結(jié)了給推斷統(tǒng)計學帶來的挑戰(zhàn).大數(shù)據(jù)給統(tǒng)計學
2、帶來機遇表現(xiàn)在:統(tǒng)計學作用范圍的擴大和統(tǒng)計學家地位的提升.關(guān)鍵詞:大數(shù)據(jù)給統(tǒng)計學帶來的挑戰(zhàn);大數(shù)據(jù)給統(tǒng)計學帶來的機遇;大數(shù)據(jù)時代當我們對“物聯(lián)網(wǎng)”、“云計算”等概念的感覺還依然不知所云的時候,“大數(shù)據(jù)”的發(fā)展就已經(jīng)一發(fā)不可收拾了.大數(shù)據(jù)這個概念的提出可以追溯到上個世紀80年代.我們被包裹在數(shù)據(jù)的海洋里,生活中幾乎任何事物都與數(shù)據(jù)有關(guān),醫(yī)療、金融、體育,我們每一日都在與數(shù)據(jù)打交道,發(fā)微信、到超市購物、打電話、發(fā)微博、上班刷卡、買車票、在論文范文上聊天等等大量的數(shù)據(jù)無時無刻不在對我們的工作、生活乃至社會發(fā)展產(chǎn)生重要的影響.當數(shù)據(jù)變成和人力資源、自然資源同樣重要的戰(zhàn)略資源的時候,便引起了企業(yè)界與科技
3、界的廣泛的關(guān)注.全球數(shù)據(jù)總量在以每兩年翻一番的速度增長.在移動互聯(lián)網(wǎng)、社交網(wǎng)絡、寬帶化、云計算、物聯(lián)網(wǎng)的催生下,大數(shù)據(jù)時代已然來到。一、統(tǒng)計學的分科社會科學和自然科學的眾多領域都會應用到統(tǒng)計方法,統(tǒng)計學也逐漸發(fā)展成為有了各項分支的統(tǒng)計學體系.構(gòu)成統(tǒng)計方法的兩個分支,主要可以分為推斷統(tǒng)計學和描述統(tǒng)計學.描述統(tǒng)計學(descriptivestatistics)指的是研究怎樣獲取那些反映客觀現(xiàn)象的數(shù)據(jù),并且用圖表的形式進行處理加工和展示所收集的數(shù)據(jù),最后通過分析和綜合概括得出顯示客觀現(xiàn)象的規(guī)律性數(shù)量特征.它的內(nèi)容包括統(tǒng)計數(shù)據(jù)的收集方法、加工處理方法、顯示方法、分布特征的分析和概括方法等.推斷統(tǒng)計學(
4、inferentialstatistics)指的是研究怎樣依據(jù)樣本數(shù)據(jù)對總體數(shù)量特征進行推斷的方法,它是在描述樣本數(shù)據(jù)的前提下,以概率形式表述統(tǒng)計對總體的未知數(shù)量特征進行的推斷.推斷統(tǒng)計學和描述統(tǒng)計學二者相輔相成,密不可分,描述統(tǒng)計學是推斷統(tǒng)計學的前提和基礎,推斷統(tǒng)計學也是描述統(tǒng)計的進步和升華.下文將從描述統(tǒng)計學和推斷統(tǒng)計學這兩個分支出發(fā),討論大數(shù)據(jù)對統(tǒng)計方法帶來的挑戰(zhàn)和機遇.二、大數(shù)據(jù)對描述統(tǒng)計學帶來的挑戰(zhàn)1.對數(shù)據(jù)搜集方法的挑戰(zhàn)搜集數(shù)據(jù)可通過統(tǒng)計報表、普查、抽樣調(diào)查、重點調(diào)查、典型調(diào)查等眾多途徑來獲得資料.搜集數(shù)據(jù)時要著重注意已獲得資料的可靠性和真實性.在完善數(shù)據(jù)的各個階段都會有誤差存在,
5、統(tǒng)計數(shù)據(jù)的誤差主要分為代表性誤差和登記性誤差.登記性誤差指的是調(diào)查過程中因為調(diào)查或被調(diào)查者的各種人為因素所導致的誤差.而在大數(shù)據(jù)時代下,數(shù)據(jù)的存儲就跟擺在貨架上的貨物相似,人們能夠直接篩選出自己所需的數(shù)據(jù),搜集這些數(shù)據(jù)單單靠測量方法就能完成,并不需要調(diào)查對象的配合.當技術(shù)完善,在海量的數(shù)據(jù)傳輸中,人為想要篡改數(shù)據(jù)是非常困難的,所以登記性誤差會大大降低.代表性誤差主要是指用樣本數(shù)據(jù)進行統(tǒng)計推斷的過程中出現(xiàn)的隨機誤差.這類誤差在傳統(tǒng)的搜集方法中一般是不能消除的.但在大數(shù)據(jù)背景下,一方面,數(shù)據(jù)搜集下的統(tǒng)計調(diào)查通常可以認定為普查,而普查的情況下,代表性誤差是可以消除的.另一方面,統(tǒng)計數(shù)據(jù)反映的是大方向
6、的情況,無法細致到每個個體的情況,很難取得更有用的信息.但因為數(shù)據(jù)時代的發(fā)展和進步,統(tǒng)計數(shù)據(jù)不光可以反映總體方向的情況,更能細致到每個個體的情況.是技術(shù)進步所帶來數(shù)據(jù)價值的變化.2.對數(shù)據(jù)存儲方法的沖擊從以前的數(shù)據(jù)存儲方法來看,數(shù)據(jù)庫是對高度結(jié)構(gòu)化數(shù)據(jù)來進行存儲的,一般使用電子表格的形式,這樣方便對相對簡單的問題進行處理和分析,比較適用于數(shù)據(jù)處理量小的用戶.但是在這個數(shù)據(jù)飛速增長的時代,數(shù)據(jù)量的大量增加,從機器處理生成的數(shù)據(jù)到電子表格,涉及網(wǎng)頁博客,pdf,視頻,圖片等等.這些所有的數(shù)據(jù)都是特定領域的數(shù)據(jù)類型,結(jié)構(gòu)相對比較復雜.三、大數(shù)據(jù)對推斷統(tǒng)計學帶來的挑戰(zhàn)統(tǒng)計學的依據(jù)是樣本統(tǒng)計(普查除外)
7、,樣本從總體中抽取一定的數(shù)量作為總體代表的集合.在一定規(guī)模的樣本數(shù)量下,越小的樣本數(shù)量,其估計的誤差就會越大,這是樣本統(tǒng)計無法避免的弊端.如果要解決這個弊端就得把樣本量擴大,但擴大樣本量的話,時間、資金等成本就會增加,所以單純擴大樣本量在現(xiàn)實中是行不通的.大數(shù)據(jù)時代產(chǎn)生了海量的即時的電子化數(shù)據(jù),數(shù)據(jù)呈現(xiàn)“總體即樣本”的特點,這一特點剛好能夠解決上面由于樣本數(shù)量小誤差大的弊端.大數(shù)據(jù)的全樣本統(tǒng)計雖然能夠包含全部的總體,但必須對數(shù)據(jù)的可靠性、真實性有所保證.四、大數(shù)據(jù)給統(tǒng)計學帶來的機遇1.擴大了統(tǒng)計應用范圍隨著處理數(shù)據(jù)軟件和網(wǎng)絡的飛速發(fā)展,很多以前無法量化的現(xiàn)象和事物在如今這個時代可以轉(zhuǎn)化成能夠讓
8、人分析的數(shù)據(jù)了,這種現(xiàn)象意味著這些以前不能用統(tǒng)計學來處理的事情現(xiàn)在可以運用統(tǒng)計學的方法來分析了.在大數(shù)據(jù)時代,大量數(shù)據(jù)從一些特殊的領域提取出來,例如可以從企業(yè)經(jīng)理的說說心情看出企業(yè)運營狀況的信息,可以從百度搜索排行榜推測出最近熱搜的商品和時事等.只要能夠獲取數(shù)據(jù),就可以運用統(tǒng)計學方法來進行研究和分析,所以隨著大數(shù)據(jù)的發(fā)展,統(tǒng)計學在各個領域的作用越來越強。例如近幾年來我國各個地區(qū)頻發(fā)霧霾天氣,掀起了社會波瀾和造成了巨大的經(jīng)濟損失.但是如果能制作開發(fā)出一個比較準確的空氣預測系統(tǒng),在霧霾天氣發(fā)生時候能及時對此發(fā)生原因進行解釋并做好預防措施,避免民眾恐慌.雖然目前這只是一個想法,但或許在不遠的將來我們
9、就實現(xiàn)這種方法.2.增加了統(tǒng)計學畢業(yè)生的就業(yè)機會據(jù)一家國際咨詢公司,蓋特納咨詢公司預測大數(shù)據(jù)將為全球帶來440萬個it新崗位和上千萬個非it崗位.麥肯錫公司預測美國到2018年需要深度數(shù)據(jù)分析人才44萬49萬,缺口14萬19萬人;需要既熟悉本單位需求又了解大數(shù)據(jù)技術(shù)與應用的管理者150萬,這方面的人才缺口更大.這些數(shù)據(jù)足以說明,大數(shù)據(jù)時代下,對統(tǒng)計學的人才供不應求,隨著大數(shù)據(jù)的發(fā)展,各行各業(yè)各個領域?qū)y(tǒng)計學畢業(yè)生的人才需求將會不斷增加,更多的增加了統(tǒng)計學畢業(yè)生的就業(yè)機會.3.可以提升統(tǒng)計學家地位在大數(shù)據(jù)時代,數(shù)據(jù)分析家和統(tǒng)計學家通過合理利用數(shù)據(jù)可以在一定程度上起到行業(yè)專家的作用,他們在各個領域都會起到至關(guān)重要的作用,為各個領域提供有利的信息和建議.因為數(shù)據(jù)分析家和統(tǒng)計學家們能夠從大數(shù)據(jù)中提取大量的信息并將其轉(zhuǎn)化為實際價值,所以數(shù)據(jù)分析師和統(tǒng)計學家的作用將會逐漸受到社會廣泛的重視,他們的地位自然
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年綠色辦公裝修標準合同3篇
- 2024年貨車駕駛員辭職和解約合同
- 2024年物業(yè)公司維修工派遣協(xié)議
- 2024年茶具展會參展合同(展位面積與費用)
- 2024年版連鎖加盟合同(餐飲業(yè))
- 2024年版權(quán)許可使用合同(獨家授權(quán))
- 2024張家港化工園區(qū)危險品運輸合同
- 2024年規(guī)范化采購協(xié)議模板指導稿
- 2024年玉米購銷合同
- 2024招投標與合同管理實訓項目創(chuàng)新點挖掘與總結(jié)3篇
- 全國計算機一級考試題庫(附答案)
- 【飛科電器公司基于杜邦分析法的財務分析案例(7700字論文)】
- 兒童呼吸道合胞病毒感染臨床診治試題
- 2021-2022學年廣東省廣州市花都區(qū)六年級(上)期末英語試卷
- A股上市與借殼上市詳細流程圖
- 2024年美國家用WiFi路由器市場現(xiàn)狀及上下游分析報告
- 《橡皮障的應用方法》幻燈片課件
- 錫冶煉工業(yè)副產(chǎn)品利用與價值提升
- 2019教科版《三年級科學上冊》分組實驗報告單
- 人教版5年級上冊音樂測試(含答案)
- 中國電信-空地一體5G增強低空網(wǎng)絡白皮書2024
評論
0/150
提交評論