概率論與數(shù)理統(tǒng)計(jì)大作業(yè)_第1頁(yè)
概率論與數(shù)理統(tǒng)計(jì)大作業(yè)_第2頁(yè)
概率論與數(shù)理統(tǒng)計(jì)大作業(yè)_第3頁(yè)
概率論與數(shù)理統(tǒng)計(jì)大作業(yè)_第4頁(yè)
概率論與數(shù)理統(tǒng)計(jì)大作業(yè)_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、概率論與數(shù)理統(tǒng)計(jì)大作業(yè)題 目:對(duì)圖書館晚間人員離館時(shí)間的調(diào)查研究學(xué) 院:理學(xué)院姓 名:顧倍康 柳鑠 劉振鵬學(xué) 號(hào):160401010216040102101604010614專業(yè)班級(jí):理科實(shí)驗(yàn)班1603任課教師:王清河 2016年5月12日關(guān)鍵詞人員流量、相關(guān)關(guān)系、回歸分析、與時(shí)間對(duì)應(yīng)關(guān)系、計(jì)算機(jī)輔助分析。摘要圖書館是大學(xué)內(nèi)重要的功能性場(chǎng)所,很多人都選擇在這里做工作,每天進(jìn)、出館人員流量巨大。這對(duì)圖書館的管理工作構(gòu)成了挑戰(zhàn),能否合理安排工作,使得工作時(shí)間內(nèi)所有人都能方便的進(jìn)出館成為一個(gè)隨之產(chǎn)生的問題,而解決離館人員流量和時(shí)間的相關(guān)關(guān)系則是解決該問題的關(guān)鍵。一、問題背景中國(guó)石油大學(xué)圖書館始建于1

2、953年,當(dāng)時(shí)是北京石油學(xué)院圖書館,在清華大學(xué)石油工程系圖書資料室的基礎(chǔ)上建立。遷校山東后,先后于1980年和1997年兩次在東營(yíng)建館,2004年在青島建成本館,館舍總面積5萬平方米,其中本館2.9萬平方米。館藏紙質(zhì)圖書文獻(xiàn)244萬余冊(cè),中外文紙質(zhì)期刊2000種,電子文獻(xiàn)資源總量35TB(截至2011年),年進(jìn)紙質(zhì)圖書9萬冊(cè)。作為一個(gè)重要的功能性公共場(chǎng)所,很多人都有且有不盡相同的入館需求,因此就會(huì)產(chǎn)生非常大的,且隨機(jī)性很強(qiáng)的進(jìn)出館人數(shù)。在一天中的其他時(shí)間,館內(nèi)人員都可以自行決定是否需要離館,而館內(nèi)人員的時(shí)間安排不盡相同,因此人員流量都不是很大,一般來說不會(huì)出現(xiàn)大量人流。而閉館則要求館內(nèi)人員必須

3、在閉館時(shí)間之前盡快離館,這樣很多人就都會(huì)具有離館需求,離館走向可能出現(xiàn)大量人流。因此我們研究的重點(diǎn)就基于此。二、問題調(diào)查考慮到每個(gè)人都必須離館,且離館時(shí)間均是自己決定的,基本上不會(huì)互相影響,因此我們推測(cè)晚間同學(xué)們離館的時(shí)間分布與泊松分布類似。因此我們將從晚間九點(diǎn)到十點(diǎn)三十分成若干個(gè)小區(qū)間,而且我們安排了三位同學(xué)同時(shí)進(jìn)行統(tǒng)計(jì),將每次結(jié)果取平均值,并且連續(xù)統(tǒng)計(jì)十五天(含周末)。但我們?cè)谙惹暗膬商彀l(fā)現(xiàn)了這樣的情況:可以看出在21:4022:05間出現(xiàn)了趨勢(shì)的變化,出現(xiàn)了峰值,且遠(yuǎn)遠(yuǎn)超過之前所取得的極值。繪制餅圖結(jié)果更加明顯:因此我們決定將研究的重點(diǎn)放在人員流量發(fā)生激增的21:5022:00這一時(shí)段。

4、并劃定每分鐘為一個(gè)計(jì)數(shù)點(diǎn),經(jīng)過剩余幾天的調(diào)查得到了以下的數(shù)據(jù):如果取得平均數(shù),我們發(fā)現(xiàn)趨勢(shì)會(huì)更加明顯,可以得圖:從圖像上可以看出這個(gè)分布確實(shí)和泊松分布很相像;但僅僅根據(jù)視覺上的相像是絕不能就此下結(jié)論說這就是泊松分布,這是非常不嚴(yán)謹(jǐn)?shù)淖龇ā5覀儾环晾眠@個(gè)模型進(jìn)行一次擬合:(將上面圖例的50、51簡(jiǎn)化為0、1)很明顯,這個(gè)模型是失敗的:除了24部分比較接近,其他部分的殘差是非常大的,甚至在5以后的部分殘差居然變號(hào)了,顯然需要進(jìn)行調(diào)整。我們可以發(fā)現(xiàn),24部分?jǐn)M合的效果還是很不錯(cuò)的,表明這個(gè)模型可能具有范圍內(nèi)的適用性。之前我們知道對(duì)于光子軌道的能級(jí)問題,也不是一個(gè)模型就能做到普適性極強(qiáng)。那么我們不

5、妨利用分段函數(shù)對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步研究,對(duì)于不同的區(qū)段利用不同的模型去擬合。這并不是說數(shù)據(jù)本身存在問題,因?yàn)檫@些數(shù)據(jù)畢竟是實(shí)地考察的結(jié)果,應(yīng)該具有一定的參考意義?;谶@種情況,我們決定利用盡可能少的幾個(gè)模型來得出一個(gè)盡可能普適的結(jié)果:分析元數(shù)據(jù)圖像可知,前半部分圖線對(duì)應(yīng)的函數(shù)的二次導(dǎo)數(shù)是單調(diào)遞減的,而后半部分則相反,那么我們可以利用兩個(gè)不同的泊松分布模型來完成,利用殘差平方和最小的原則來控制是否采用的問題:經(jīng)計(jì)算,當(dāng)=4.90時(shí),e2 =62.19328663取得最小值(在0處的孤立點(diǎn)暫不考慮),作為04部分的模型;如圖:同理,當(dāng)=4.46時(shí),e2 = 6.540435取得最小值,作為610部分的

6、模型;如圖:發(fā)現(xiàn)5處一直都?xì)埐钶^大,故以510為研究區(qū)間獨(dú)立建模。進(jìn)行簡(jiǎn)單擬合后出現(xiàn)以下情況:很明顯,這個(gè)模型顯然沒有先前的好。但這個(gè)模型在5附近是很接近原數(shù)據(jù)的,因此不妨只采用它在46的擬合情況。當(dāng)=1.75時(shí),e2 = 3.874265714取得最小值,作為46部分的模型;如圖:綜合以上的模型,可以得到以下的綜合效果圖:(實(shí)心部分是原數(shù)據(jù))濾去不采用的部分可以看出:這個(gè)分段擬合的模型還是比較成功的。因此初步得到一個(gè)回歸函數(shù):F(X)= 428.8667*4.9x /(x!*e4.9 ) 0x4; 290*1.75x /(x!*e1.75 ) 4x6; 428.8667*4.46x /(x!

7、*e4.46 ) 6x10;從均值進(jìn)行一次驗(yàn)證?;旧峡梢哉f,樣本方差是的無偏估計(jì),所以可以用樣本函數(shù)求的區(qū)間估計(jì)。我們知道樣本函數(shù)Tt(n-1)分布(為方便計(jì)算,此處n為100)。對(duì)于給定的=0.05,那么置信區(qū)間為(,)。查表得=1.984,可以算出各個(gè)區(qū)段的置信區(qū)間:0x4(43.32,43.74),4x6(69.09144,71.23144),6x10(31.60565,31.92565)。所以我們有95%的把握說這個(gè)組合模型基本上是成功的。為了驗(yàn)證這一模型的真正可靠性,決定進(jìn)行一次調(diào)查驗(yàn)證。選取非常正常的一個(gè)工作日進(jìn)行預(yù)報(bào)值檢驗(yàn),可得知結(jié)果如下:如果剔除某些離群值(1),求得殘差平方

8、和為31.38852466,考慮到隨機(jī)性事件發(fā)生的情況,這個(gè)模型運(yùn)行還是比較成功的。另外,這里補(bǔ)充說明一下的算法:(以04區(qū)段為例)在計(jì)算機(jī)上編寫程序,利用二分法,計(jì)算取中點(diǎn)時(shí)模型的殘差平方和和取兩個(gè)端點(diǎn)時(shí)的該值進(jìn)行比較,取較小的兩個(gè)取值點(diǎn)作為新的端點(diǎn),在新區(qū)間中再重復(fù)以上的過程,為避免陷入死循環(huán),設(shè)定當(dāng)區(qū)間長(zhǎng)小于0.01時(shí)停止取中點(diǎn),取兩端點(diǎn)中該值較小的點(diǎn)的對(duì)應(yīng)作為結(jié)果使用。核心部分的代碼如下:(輸出的p即為所求)#include#includeint f1(int x)int i=0,j=1;for(i=0;i=x;i+)j*=i;return j;/*階乘算法*/double f2(do

9、uble x,int i)double j=1.0;int k;for(k=0;k0.01)for(i=0;i5;i+)lp+= f2(428.8667*f2(l,i)/(f1(i)*exp(l)-ai,2);for(i=0;ilp)/*二分法比較*/r=m; m=(l+r)/2;p=l;elsel=m; m=(l+r)/2;p=r;lp=0.0, rp=0.0;for(i=0;i5;i+)lp+= f2(428.8667*f2(l,i)/(f1(i)*exp(l)-ai,2);for(i=0;ilp)p=l;elsep=r;printf(“%lf”,p);三、問題總結(jié)各個(gè)圖表的峰值時(shí)間之晚足

10、以體現(xiàn)出石大學(xué)子學(xué)習(xí)的忙碌、刻苦。然而,猛增的人流量存在安全隱患。建議同學(xué)們合理安排學(xué)習(xí)時(shí)間,盡量不要集中在臨近閉館時(shí)離開;建議圖書館將各書庫(kù)閉館時(shí)間分離,從十點(diǎn)到十點(diǎn)半自下而上逐步關(guān)閉各層書庫(kù);此外,建議學(xué)校修繕南教、南堂等教室的桌椅,安裝空調(diào),吸引一部分自習(xí)的同學(xué),加快小圖書館修建進(jìn)程,以減輕圖書館的壓力;對(duì)于在臨近閉館前不可避免的流量上升,館方應(yīng)做好預(yù)案,如有擁堵及時(shí)疏導(dǎo),防止發(fā)生人員滯留甚至更加嚴(yán)重的安全問題。在本次數(shù)據(jù)調(diào)查與分析的過程中,我組采取邊收集數(shù)據(jù)邊統(tǒng)計(jì)分析的方式,深刻體會(huì)到樣本長(zhǎng)度的增加會(huì)使模型逐漸趨近契合于總體的現(xiàn)象;及時(shí)針對(duì)現(xiàn)實(shí)情況作出了相應(yīng)調(diào)整,避免了產(chǎn)生大量無研究?jī)r(jià)值數(shù)據(jù)的問題。試想如果未對(duì)調(diào)查方向及時(shí)調(diào)整,模型建立將難以進(jìn)行,后續(xù)的工作將無法開展,直至研究失??;求得的回歸函數(shù)亦表明,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論