數(shù)理統(tǒng)計學(xué)課程設(shè)計_第1頁
數(shù)理統(tǒng)計學(xué)課程設(shè)計_第2頁
數(shù)理統(tǒng)計學(xué)課程設(shè)計_第3頁
數(shù)理統(tǒng)計學(xué)課程設(shè)計_第4頁
數(shù)理統(tǒng)計學(xué)課程設(shè)計_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

關(guān)于中小型銀行大數(shù)據(jù)的統(tǒng)計分析學(xué)院專業(yè)*****班級***學(xué)號*****姓名指導(dǎo)教師沈陽航空航天大學(xué)年月目錄TOC\o"1-3"\h\u前言 1一、采集樣本及數(shù)據(jù)整理 21、數(shù)據(jù)的搜集方法及說明 22、數(shù)據(jù)整理:給出頻數(shù)、頻率分布表及說明 53、畫出直方圖和折線圖并給出說明 54、畫出經(jīng)驗分布函數(shù) 7二、假定總體服從正態(tài)分布,給出,的估計 81、矩估計法 82、極大似然估計 8三、參數(shù)區(qū)間估計 101、方差未知,求數(shù)學(xué)期望的置信區(qū)間 102、數(shù)學(xué)期望,均未知,求方差的置信區(qū)間 10四、參數(shù)的假設(shè)檢驗 11 11檢驗 11五、非參數(shù)假設(shè)檢驗 13六、結(jié)論 15參考文獻(xiàn) 16前言數(shù)理統(tǒng)計是一門對隨機(jī)現(xiàn)象進(jìn)行有限次的觀測或試驗的結(jié)果進(jìn)行數(shù)量研究,并依之對總體的數(shù)理規(guī)律性作出具有一定可靠性推斷的應(yīng)用數(shù)學(xué)學(xué)科。也就是說,數(shù)理統(tǒng)計學(xué)是統(tǒng)計學(xué)的數(shù)學(xué)根底,它是研究怎樣有效地收集、整理和分析帶有隨機(jī)性的數(shù)據(jù),以對所考察的問題作出推斷和預(yù)測,直至為采取一定的決策和行動提供依據(jù)和建議的數(shù)學(xué)分支。近幾十年來,數(shù)理統(tǒng)計的廣泛應(yīng)用是非常引人注目的。在社會科學(xué)中,選舉人對政府意見的調(diào)查、民意測驗、經(jīng)濟(jì)價值的評估、產(chǎn)品銷路的預(yù)測、犯罪案件的偵破等,都有數(shù)理統(tǒng)計的功績[1]。在經(jīng)濟(jì)領(lǐng)域,從某種商品未來的銷售情況預(yù)測,甚至整個國家國民經(jīng)濟(jì)狀況預(yù)測及開展方案的制定都要用到數(shù)理統(tǒng)計知識[2]。在自然科學(xué)、軍事科學(xué)、工農(nóng)業(yè)生產(chǎn)、醫(yī)療衛(wèi)生等領(lǐng)域,哪一個門類都離不開數(shù)理統(tǒng)計。它的用處之大不勝枚舉?;\統(tǒng)地說,數(shù)理統(tǒng)計學(xué)的理論和方法,與人類活動的各個領(lǐng)域在不同程度上都有關(guān)聯(lián)。因為各個領(lǐng)域內(nèi)的活動,都得在不同的程度上與數(shù)據(jù)打交道,都有如何收集和分析數(shù)據(jù)的問題,因此也就有數(shù)理統(tǒng)計學(xué)用武之地??梢赃@么說,現(xiàn)代人的生活、科學(xué)的開展都離不開數(shù)理統(tǒng)計。從某種意義上講,數(shù)理統(tǒng)計在一個國家中的應(yīng)用標(biāo)志著這個國家的科學(xué)水平[3]。數(shù)理統(tǒng)計可以看做是概率論的推廣應(yīng)用,其眾多內(nèi)容都是建立在概率論根底之上的[4]。但是,數(shù)理統(tǒng)計作為純數(shù)學(xué)的一個方向,如果僅僅研究數(shù)理統(tǒng)計的數(shù)學(xué)性質(zhì),就脫離了數(shù)學(xué)在科學(xué)研究中應(yīng)有的價值。正如數(shù)學(xué)以其邏輯性和嚴(yán)密性被其他學(xué)科作為有力工具運用于分析應(yīng)用中一樣,數(shù)理統(tǒng)計也因為其邏輯性和嚴(yán)密性被引用到銀行的領(lǐng)域中。本文就是對這方面的應(yīng)用,通過用計算機(jī)領(lǐng)域中的信息平安技術(shù),對全國中小型銀行的大數(shù)據(jù)處理個數(shù)的統(tǒng)計。其間分別進(jìn)行了數(shù)據(jù)模型的選擇和建立,數(shù)據(jù)的采集,數(shù)據(jù)的整理,對數(shù)據(jù)進(jìn)行的統(tǒng)計推斷,給出矩法估計、極大似然估計、給出參數(shù)估計區(qū)間、給出的t檢驗和檢驗,進(jìn)行非參數(shù)擬合優(yōu)度檢驗,從而得出相應(yīng)的結(jié)論。一、采集樣本及數(shù)據(jù)整理1、數(shù)據(jù)的搜集方法及說明眾所周知,數(shù)據(jù)的搜集方法有直接搜集方法和間接搜集方法,直接搜集是直接向調(diào)查對象搜集反映調(diào)查單位的原始資料數(shù)據(jù)。而我采用的是間接搜集方法,也就是通過網(wǎng)絡(luò)搜集到已經(jīng)加工整理過的、能夠說明總表達(dá)象的數(shù)據(jù)。本文采集的是2012年5月1日中國局部中小型銀行利用信息平安技術(shù)對大數(shù)據(jù)處理個數(shù)。如表1-1所示:表1-1中國局部中小型銀行數(shù)據(jù)統(tǒng)計地區(qū)銀行名稱截止時間大數(shù)據(jù)〔億〕湖北孝感市商業(yè)銀行2011-10-1遼寧丹東市商業(yè)銀行2011-10-1湖南岳陽市商業(yè)銀行2011-10-1浙江象山縣綠葉城市信用社2011-10-1457四川宜賓市商業(yè)銀行2011-10-1黑龍江牡丹江市商業(yè)銀行2011-10-1云南曲靖市商業(yè)銀行2011-10-15山西晉中市商業(yè)銀行2011-10-1山西陽泉市商業(yè)銀行2011-10-1四川遂寧市商業(yè)銀行2011-10-1湖北黃石市商業(yè)銀行2011-10-1山東棗莊市商業(yè)銀行2011-10-11388重慶重慶三峽銀行2011-10-11501陜西寶雞市商業(yè)銀行2011-10-1河南信陽市商業(yè)銀行2011-10-11722遼寧鞍山市商業(yè)銀行2011-10-1河北邢臺市商業(yè)銀行2011-10-11800湖北荊州市商業(yè)銀行2011-10-11800河南安陽市商業(yè)銀行2011-10-11800河南焦作市商業(yè)銀行2011-10-1內(nèi)蒙古烏海市商業(yè)銀行2011-10-1山東濟(jì)寧市商業(yè)銀行2011-10-11810河南許昌市商業(yè)銀行2011-10-1遼寧撫順市商業(yè)銀行2011-10-1內(nèi)蒙古呼和浩特市商業(yè)銀行2011-10-11江西九江銀行2011-10-1河北秦皇島市商業(yè)銀行2011-10-11816河南平頂山市商業(yè)銀行2011-10-1青海青海銀行2011-10-1湖南湘潭市商業(yè)銀行2011-10-1湖南株洲市商業(yè)銀行2011-10-12000湖南衡陽市商業(yè)銀行2011-10-12000福建泉州市商業(yè)銀行2011-10-1江西贛州銀行2011-10-12055.47河南南陽市商業(yè)銀行2011-10-12106遼寧阜新市商業(yè)銀行2011-10-12107湖北宜昌市商業(yè)銀行2011-10-1廣西桂林市商業(yè)銀行2011-10-1黑龍江齊齊哈爾市商業(yè)銀行2011-10-12178浙江湖州市商業(yè)銀行2011-10-1河北滄州市商業(yè)銀行2011-10-1河南新鄉(xiāng)市商業(yè)銀行2011-10-12217廣東湛江商業(yè)銀行2011-10-12225浙江浙江泰隆商業(yè)銀行2011-10-1河北張家口市商業(yè)銀行2011-10-1廣西柳州市商業(yè)銀行2011-10-1河北冀中銀行2011-10-12244浙江嘉興市商業(yè)銀行2011-10-12247廣西廣西北部灣銀行2011-10-1河北廊坊銀行2011-10-1遼寧營口銀行2011-10-12249遼寧葫蘆島市商業(yè)銀行2011-10-16山東東營市商業(yè)銀行2011-10-12503浙江浙江民泰商業(yè)銀行2011-10-12507山東德州市商業(yè)銀行2011-10-12534遼寧朝陽市商業(yè)銀行2011-10-12548黑龍江大慶市商業(yè)銀行2011-10-1浙江浙江稠州市商業(yè)銀行2011-10-1山西大同市商業(yè)銀行2011-10-1山東萊蕪市商業(yè)銀行2011-10-1浙江金華市商業(yè)銀行2011-10-12605山東臨商銀行2011-10-12609河南洛陽市商業(yè)銀行2011-10-12627福建廈門市商業(yè)銀行2011-10-1山東日照市商業(yè)銀行2011-10-1山西太原市商業(yè)銀行2011-10-12652山東濰坊市商業(yè)銀行2011-10-1浙江臺州市商業(yè)銀行2011-10-1山東威海市商業(yè)銀行2011-10-1寧夏寧夏銀行2011-10-1浙江紹興市商業(yè)銀行2011-10-12680新疆烏魯木齊市商業(yè)銀行2011-10-1山東齊商銀行2011-10-12682江西南昌銀行2011-10-1山東煙臺市商業(yè)銀行2011-10-12689甘肅蘭州市商業(yè)銀行2011-10-12699浙江溫州銀行2011-10-12871貴州貴陽市商業(yè)銀行2011-10-1河南鄭州市商業(yè)銀行2011-10-12900山東青島市商業(yè)銀行2011-10-12901遼寧錦州市商業(yè)銀行2011-10-1福建海峽銀行2011-10-1云南富滇銀行2011-10-1湖北漢口銀行2011-10-1山東齊魯銀行2011-10-1河北石家莊市商業(yè)銀行2011-10-13005重慶重慶銀行2011-10-1吉林吉林銀行2011-10-1黑龍江哈爾濱銀行2011-10-1304內(nèi)蒙古包商銀行2011-10-1湖南長沙銀行2011-10-1四川成都銀行2011-10-1廣東東莞銀行2011-10-13118浙江杭州市商業(yè)銀行2011-10-1遼寧大連銀行2011-10-13520遼寧盛京銀行2011-10-1廣東廣州銀行2011-10-1天津天津銀行2011-10-1安徽徽商銀行2011-10-1江蘇南京銀行2011-10-1浙江寧波銀行2011-10-1廣東深圳平安銀行2011-10-1江蘇江蘇銀行2011-10-1上海上海銀行2011-10-1北京北京銀行2011-10-1從表1-1中,可以非常明顯得看到各中小型銀行的大數(shù)據(jù)處理個數(shù),下面我們對各銀行做下討論與研究。2、數(shù)據(jù)整理:給出頻數(shù)、頻率分布表及說明從上面的表中看到,銀行大數(shù)據(jù)〔單元:億〕的樣本觀察值的最小值是湖北省孝感市商業(yè)銀行的個數(shù),最大值是位于北京市的北京銀行,取a=78,b=4418,全距L=4418-78=4340,把數(shù)據(jù)分布的區(qū)間(78,4418]等分為10個子區(qū)間,等組距為,i=1,2,…10。通過計數(shù)求出落在各子區(qū)間的大數(shù)據(jù)個數(shù),那么得頻數(shù)和頻率分布,列入表1-2。表1-2大數(shù)據(jù)頻數(shù)和頻率分布表序號大數(shù)據(jù)子區(qū)間組中值頻數(shù)頻率12345678910(78,512](512,946](946,1380](1380,1814](1814,2248](2248,2682](2682,3116](3116,3550](3550,3984](3984,4418]2957291163515972031246528993333376742014251425222083213、畫出直方圖和折線圖并給出說明由于等組距,故在橫軸上截取子區(qū)間,且各子區(qū)間的寬度等于組距434,第i個小矩形的高為組頻數(shù),由此從直方圖的分布上可以大致看出大數(shù)據(jù)的分布。直方圖1-1和折線圖1-2所示。圖1-1頻數(shù)-大數(shù)據(jù)子區(qū)間直方圖圖1-2頻數(shù)-大數(shù)據(jù)子區(qū)間折線圖由圖1-1和圖1-2可見,直方圖大致呈對稱形狀,可以認(rèn)為大數(shù)據(jù)近似服從正態(tài)分布,其數(shù)學(xué)期望大致在2300附近。畫出經(jīng)驗分布函數(shù)由于依賴順序統(tǒng)計量的觀察值,所以是一個隨機(jī)變量,它的可能取值為:,,…,,1,故表示n次獨立試驗中,事件發(fā)生的頻率。樣本X1,X2,…Xn中n個隨機(jī)變量相互獨立,導(dǎo)致事件發(fā)生的概率等價于進(jìn)行n次伯努力試驗,事件發(fā)生k次的概率,即其中是總體X的分布函數(shù)。二、假定總體服從正態(tài)分布,給出,的估計1、矩估計法從總體中隨機(jī)抽取25個樣本:162.33,,1233.85,1501,1795.1,1800,1928.38,2000,2107,2217,2240.77,2247.81,2507,2577.56,2627,2668.4,2681.5,2699,2926.7,2998.13,3015.24,3108.56,3533.6,3716,4417.65將樣本值代入,得出和的矩估計值:的矩估計值為=的矩估計值為2、極大似然估計對正態(tài)總體,是二維參數(shù),設(shè)有樣本,,…,那么似然函數(shù)及其對數(shù)分別為將分別關(guān)于兩個分量求偏導(dǎo)并令其為0,即得到似然方程組解此方程組,可得的極大似然估計為將之代入第二方程,得出的極大似然估計所以的極大似然估計量為的極大似然估計量為將樣本值代入,得出,的極大似然估計值=三、參數(shù)區(qū)間估計1、方差未知,求數(shù)學(xué)期望的置信區(qū)間當(dāng)時,選取樣本的函數(shù)服從標(biāo)準(zhǔn)正態(tài)分布,即給定置信水平0.95,使分位數(shù)為,上式等價于那么2、數(shù)學(xué)期望,均未知,求方差的置信區(qū)間選取樣本的函數(shù)為給定置信水平0.95,使從分布表查出分位數(shù)為,,于是樣本方差為四、參數(shù)的假設(shè)檢驗假設(shè)所有銀行所處理的大數(shù)據(jù)個數(shù)都為2400億個。(1)原假設(shè)和備擇假設(shè),(2)選取檢驗統(tǒng)計量當(dāng)原假設(shè)為真時,檢驗統(tǒng)計量為(3)確定拒絕域給定顯著水平,使查t分布表得臨界值為,那么拒絕域為或。(4)樣本標(biāo)準(zhǔn)差為,計算檢驗統(tǒng)計量的觀察值,(5)作判斷由于,因此接受原假設(shè)。認(rèn)為所有銀行所處理的大數(shù)據(jù)均為2400億個。檢驗(1)原假設(shè)和備擇假設(shè),(2)選取檢驗統(tǒng)計量當(dāng)原假設(shè)為真時,檢驗統(tǒng)計量為(3)確定拒絕域樣本方差為844117.9,給定顯著性水平,使那么拒絕域為(0,10.856]或[42.980,)。計算檢驗統(tǒng)計量的觀察值(5)作判斷因為,所以接受原假設(shè)。非參數(shù)假設(shè)檢驗擬合優(yōu)度檢驗頻率分布如表1-2所示,通過畫直方圖,粗略知大數(shù)據(jù)個數(shù)服從正態(tài)分布,數(shù)學(xué)期望大致在2300左右。檢驗在顯著性水平下,各銀行的大數(shù)據(jù)個數(shù)X是否服從正態(tài)分布。原假設(shè)和備擇假設(shè)為,不真其中,均為未知參數(shù)。,的極大似然估計值分別為=2376.5,以表1-2為根底,原假設(shè)為真時,計算隨機(jī)變量X落在各小區(qū)間的概率?!葍r檢驗假設(shè),,…,計算結(jié)果列于表5-1。表5-1各區(qū)間概率序號大數(shù)據(jù)子區(qū)間頻數(shù)12345678910(78,512](512,946](946,1380](1380,1814](1814,2248](2248,2682](2682,3116](3116,3550](3550,3984](3984,4418]142522208105合并后的區(qū)間個數(shù)為k=7,隨機(jī)變量分布中含有兩個未知參數(shù),因此當(dāng)原假設(shè)為真時,檢驗統(tǒng)計量為給定顯著性水平,使臨界值為,那么拒絕域為[9.448,)。檢驗統(tǒng)計量的觀察值為因此,因此接受原假設(shè),可以認(rèn)為大數(shù)據(jù)個數(shù)服從正態(tài)分布N2)。六、結(jié)論本文第一局部對全國中小型銀行的大數(shù)據(jù)處理情況分別進(jìn)行采集、數(shù)據(jù)整理,給

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論