第五講數(shù)據(jù)統(tǒng)計(jì)分析以及概率模型_第1頁(yè)
第五講數(shù)據(jù)統(tǒng)計(jì)分析以及概率模型_第2頁(yè)
第五講數(shù)據(jù)統(tǒng)計(jì)分析以及概率模型_第3頁(yè)
第五講數(shù)據(jù)統(tǒng)計(jì)分析以及概率模型_第4頁(yè)
第五講數(shù)據(jù)統(tǒng)計(jì)分析以及概率模型_第5頁(yè)
已閱讀5頁(yè),還剩39頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五講

數(shù)據(jù)統(tǒng)計(jì)分析以及概率模型1MATLAB中統(tǒng)計(jì)工具箱中的基本統(tǒng)計(jì)命令2概率模型2/3/20231一MATLAB中統(tǒng)計(jì)工具箱中的基本統(tǒng)計(jì)命令1.數(shù)據(jù)的錄入、保存和調(diào)用2.基本統(tǒng)計(jì)量3.常見(jiàn)的概率分布函數(shù)4.頻數(shù)直方圖的描繪5.參數(shù)估計(jì)6.假設(shè)檢驗(yàn)7.綜合實(shí)例返回2/3/20232一、數(shù)據(jù)的錄入、保存和調(diào)用例1

上海市區(qū)社會(huì)商品零售總額和全民所有制職工工資總額的數(shù)據(jù)如下:統(tǒng)計(jì)工具箱中的基本統(tǒng)計(jì)命令2/3/202331.年份數(shù)據(jù)以1為增量,用產(chǎn)生向量的方法輸入.

命令格式:x=a:h:b

t=78:87

2.分別以x和y代表變量職工工資總額和商品零售總額.

x=[23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4]

y=[41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0]3.將變量t、x、y的數(shù)據(jù)保存在文件data中.savedatatxy

4.進(jìn)行統(tǒng)計(jì)分析時(shí),調(diào)用數(shù)據(jù)文件data中的數(shù)據(jù).

loaddataToMATLAB(txy)方法12/3/202341.輸入矩陣:data=[78,79,80,81,82,83,84,85,86,87,88;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0]2.將矩陣data的數(shù)據(jù)保存在文件data1中:savedata1data3.進(jìn)行統(tǒng)計(jì)分析時(shí),先用命令:loaddata1

調(diào)用數(shù)據(jù)文件data1中的數(shù)據(jù),再用以下命令分別將矩陣data的第一、二、三行的數(shù)據(jù)賦給變量t、x、y:

t=data(1,:)x=data(2,:)y=data(3,:)若要調(diào)用矩陣data的第j列的數(shù)據(jù),可用命令:

data(:,j)方法2ToMATLAB(data)返回2/3/20235基本統(tǒng)計(jì)量2/3/202362/3/20237二、基本統(tǒng)計(jì)量對(duì)隨機(jī)變量x,計(jì)算其基本統(tǒng)計(jì)量的命令如下:均值:mean(x)中位數(shù):median(x)標(biāo)準(zhǔn)差:std(x)

方差:var(x)偏度:skewness(x)

峰度:kurtosis(x)例對(duì)例1中的職工工資總額x,可計(jì)算上述基本統(tǒng)計(jì)量.ToMATLAB(tjl)返回2/3/20238三、常見(jiàn)概率分布的函數(shù)MATLAB工具箱對(duì)每一種分布都提供5類函數(shù),其命令字符為:概率密度:pdf

概率分布:cdf逆概率分布:inv

均值與方差:stat隨機(jī)數(shù)生成:rnd(當(dāng)需要一種分布的某一類函數(shù)時(shí),將以上所列的分布命令字符與函數(shù)命令字符接起來(lái),并輸入自變量(可以是標(biāo)量、數(shù)組或矩陣)和參數(shù)即可.)2/3/20239在MATLAB中輸入以下命令:x=-6:0.01:6;y=normpdf(x);z=normpdf(x,0,2);plot(x,y,x,z)1.密度函數(shù):p=normpdf(x,mu,sigma)(當(dāng)mu=0,sigma=1時(shí)可缺省)ToMATLAB(liti2)如對(duì)均值為mu、標(biāo)準(zhǔn)差為sigma的正態(tài)分布,舉例如下:2/3/202310ToMATLAB(liti3)2.概率分布:P=normcdf(x,mu,sigma)4.均值與方差:[m,v]=normstat(mu,sigma)例5求正態(tài)分布N(3,52)的均值與方差.

命令為:[m,v]=normstat(3,5)

結(jié)果為:m=3,v=25ToMATLAB(liti5)2/3/2023111.給出數(shù)組data的頻數(shù)表的命令為:

[N,X]=hist(data,k)

此命令將區(qū)間[min(data),max(data)]分為k個(gè)小區(qū)間(缺省為10),返回?cái)?shù)組data落在每一個(gè)小區(qū)間的頻數(shù)N和每一個(gè)小區(qū)間的中點(diǎn)X.2.描繪數(shù)組data的頻數(shù)直方圖的命令為:

hist(data,k)四、數(shù)直方圖的描繪返回2/3/202312五、參數(shù)估計(jì)1.正態(tài)總體的參數(shù)估計(jì)設(shè)總體服從正態(tài)分布,則其點(diǎn)估計(jì)和區(qū)間估計(jì)可同時(shí)由以下命令獲得:

[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha)此命令在顯著性水平alpha下估計(jì)數(shù)據(jù)X的參數(shù)(alpha缺省時(shí)設(shè)定為0.05),返回值muhat是X的均值的點(diǎn)估計(jì)值,sigmahat是標(biāo)準(zhǔn)差的點(diǎn)估計(jì)值,muci是均值的區(qū)間估計(jì),sigmaci是標(biāo)準(zhǔn)差的區(qū)間估計(jì).2/3/2023132.其它分布的參數(shù)估計(jì)有兩種處理辦法:一、取容量充分大的樣本(n>50),按中心極限定理,它近似地服從正態(tài)分布;二、使用MATLAB工具箱中具有特定分布總體的估計(jì)命令.(1)[muhat,muci]=expfit(X,alpha)──在顯著性水平alpha下,求指數(shù)分布的數(shù)據(jù)X的均值的點(diǎn)估計(jì)及其區(qū)間估計(jì).(2)[lambdahat,lambdaci]=poissfit(X,alpha)──在顯著性水平alpha下,求泊松分布的數(shù)據(jù)X的參數(shù)的點(diǎn)估計(jì)及其區(qū)間估計(jì).(3)[phat,pci]=weibfit(X,alpha)──在顯著性水平alpha下,求Weibull分布的數(shù)據(jù)X的參數(shù)的點(diǎn)估計(jì)及其區(qū)間估計(jì).返回2/3/202314六、假設(shè)檢驗(yàn)在總體服從正態(tài)分布的情況下,可用以下命令進(jìn)行假設(shè)檢驗(yàn).1.總體方差已知時(shí),總體均值的檢驗(yàn)使用z檢驗(yàn)

[h,sig,ci]=ztest(x,m,sigma,alpha,tail)檢驗(yàn)數(shù)據(jù)x的關(guān)于均值的某一假設(shè)是否成立,其中sigma為已知方差,alpha為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于tail的取值:tail=0,檢驗(yàn)假設(shè)“x的均值等于m”tail=1,檢驗(yàn)假設(shè)“x的均值大于m”tail=-1,檢驗(yàn)假設(shè)“x的均值小于m”tail的缺省值為0,alpha的缺省值為0.05.返回值h為一個(gè)布爾值,h=1表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig為假設(shè)成立的概率,ci

為均值的1-alpha置信區(qū)間.2/3/202315

例7MATLAB統(tǒng)計(jì)工具箱中的數(shù)據(jù)文件gas.mat.中提供了美國(guó)1993年1月份和2月份的汽油平均價(jià)格(price1,price2分別是1、2月份的油價(jià),單位為美分),它是容量為20的雙樣本.假設(shè)1月份油價(jià)的標(biāo)準(zhǔn)偏差是每加侖4分幣(=4),試檢驗(yàn)1月份油價(jià)的均值是否等于115.解作假設(shè):m=115.首先取出數(shù)據(jù),用以下命令:

loadgas然后用以下命令檢驗(yàn)

[h,sig,ci]=ztest(price1,115,4)返回:h=0,sig=0.8668,ci=[113.3970116.9030].檢驗(yàn)結(jié)果:1.布爾變量h=0,表示不拒絕零假設(shè).說(shuō)明提出的假設(shè)均值115

是合理的.2.sig值為0.8668,遠(yuǎn)超過(guò)0.5,不能拒絕零假設(shè)

3.95%的置信區(qū)間為[113.4,116.9],它完全包括115,且精度很高..

ToMATLAB(liti7)2/3/2023162.總體方差未知時(shí),總體均值的檢驗(yàn)使用t檢驗(yàn)

[h,sig,ci]=ttest(x,m,alpha,tail)檢驗(yàn)數(shù)據(jù)x的關(guān)于均值的某一假設(shè)是否成立,其中alpha為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于tail的取值:tail=0,檢驗(yàn)假設(shè)“x的均值等于m”tail=1,檢驗(yàn)假設(shè)“x的均值大于m”tail=-1,檢驗(yàn)假設(shè)“x的均值小于m”tail的缺省值為0,alpha的缺省值為0.05.返回值h為一個(gè)布爾值,h=1表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig為假設(shè)成立的概率,ci

為均值的1-alpha置信區(qū)間.2/3/202317返回:h=1,sig=4.9517e-004,ci=[116.8120.2].檢驗(yàn)結(jié)果:1.布爾變量h=1,表示拒絕零假設(shè).說(shuō)明提出的假設(shè)油價(jià)均值115是不合理的.2.95%的置信區(qū)間為[116.8120.2],它不包括

115,故不能接受假設(shè).3.sig值為4.9517e-004,遠(yuǎn)小于0.5,不能接受零假設(shè).

ToMATLAB(liti8)例8試檢驗(yàn)例8中2月份油價(jià)price2的均值是否等于115.解作假設(shè):m=115,price2為2月份的油價(jià),不知其方差,故用以下命令檢驗(yàn)[h,sig,ci]=ttest(price2,115)2/3/2023183.兩總體均值的假設(shè)檢驗(yàn)使用t

檢驗(yàn)

[h,sig,ci]=ttest2(x,y,alpha,tail)檢驗(yàn)數(shù)據(jù)x,y的關(guān)于均值的某一假設(shè)是否成立,其中alpha為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于tail的取值:tail=0,檢驗(yàn)假設(shè)“x的均值等于y的均值”tail=1,檢驗(yàn)假設(shè)“x的均值大于y的均值”tail=-1,檢驗(yàn)假設(shè)“x的均值小于y的均值”tail的缺省值為0,alpha的缺省值為0.05.返回值h為一個(gè)布爾值,h=1表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig為假設(shè)成立的概率,ci

為與x與y均值差的的1-alpha置信區(qū)間.2/3/202319返回:h=1,sig=0.0083,ci=[-5.8,-0.9].檢驗(yàn)結(jié)果:1.布爾變量h=1,表示拒絕零假設(shè).說(shuō)明提出的假設(shè)“油價(jià)均值相同”是不合理的.2.95%的置信區(qū)間為[-5.8,-0.9],說(shuō)明一月份油價(jià)比二月份油價(jià)約低1至6分.3.sig-值為0.0083,遠(yuǎn)小于0.5,不能接受“油價(jià)均相同”假設(shè).ToMATLAB(liti9)例9試檢驗(yàn)例8中1月份油價(jià)price1與2月份的油價(jià)price2均值是否相同.解用以下命令檢驗(yàn)[h,sig,ci]=ttest2(price1,price2)2/3/2023204.非參數(shù)檢驗(yàn):總體分布的檢驗(yàn)MATLAB工具箱提供了兩個(gè)對(duì)總體分布進(jìn)行檢驗(yàn)的命令:(1)h=normplot(x)(2)h=weibplot(x)此命令顯示數(shù)據(jù)矩陣x的正態(tài)概率圖.如果數(shù)據(jù)來(lái)自于正態(tài)分布,則圖形顯示出直線性形態(tài).而其它概率分布函數(shù)顯示出曲線形態(tài).此命令顯示數(shù)據(jù)矩陣x的Weibull概率圖.如果數(shù)據(jù)來(lái)自于Weibull分布,則圖形將顯示出直線性形態(tài).而其它概率分布函數(shù)將顯示出曲線形態(tài).返回2/3/202321分布函數(shù)的近似求法2/3/2023222/3/2023232/3/202324返回F(10,50)分布的密度函數(shù)曲線2/3/202325例10

一道工序用自動(dòng)化車床連續(xù)加工某種零件,由于刀具損壞等會(huì)出現(xiàn)故障.故障是完全隨機(jī)的,并假定生產(chǎn)任一零件時(shí)出現(xiàn)故障機(jī)會(huì)均相同.工作人員是通過(guò)檢查零件來(lái)確定工序是否出現(xiàn)故障的.現(xiàn)積累有100次故障紀(jì)錄,故障出現(xiàn)時(shí)該刀具完成的零件數(shù)如下:

459362624542509584433748815505612452434982640742565706593680926653164487734608428115359384452755251378147438882453886265977585975549697515628954771609402960885610292837473677358638699634555570844166061062484120447654564339280246687539790581621724531512577496468499544645764558378765666763217715310851試觀察該刀具出現(xiàn)故障時(shí)完成的零件數(shù)屬于哪種分布.2/3/202326解1.?dāng)?shù)據(jù)輸入ToMATLAB(liti101)2.作頻數(shù)直方圖

hist(x,10)

3.分布的正態(tài)性檢驗(yàn)

normplot(x)4.參數(shù)估計(jì):

[muhat,sigmahat,muci,sigmaci]=normfit(x)(看起來(lái)刀具壽命服從正態(tài)分布)(刀具壽命近似服從正態(tài)分布)估計(jì)出該刀具的均值為594,方差204,均值的0.95置信區(qū)間為[553.4962,634.5038],方差的0.95置信區(qū)間為[179.2276,237.1329].ToMATLAB(liti104)ToMATLAB(liti102)ToMATLAB(liti103)2/3/2023275.假設(shè)檢驗(yàn)ToMATLAB(liti105)已知刀具的壽命服從正態(tài)分布,現(xiàn)在方差未知的情況下,檢驗(yàn)其均值m是否等于594.結(jié)果:h=0,sig=1,ci=[553.4962,634.5038].檢驗(yàn)結(jié)果:1.布爾變量h=0,表示不拒絕零假設(shè).說(shuō)明提出的假設(shè)壽命均值594是合理的.2.95%的置信區(qū)間為[553.5,634.5],它完全包括594,且精度很高.3.sig值為1,遠(yuǎn)超過(guò)0.5,不能拒絕零假設(shè).

返回2/3/202328第五講

概率模型1軋鋼中的浪費(fèi)2隨機(jī)存儲(chǔ)策略2/3/202329確定性因素和隨機(jī)性因素隨機(jī)因素可以忽略隨機(jī)因素影響可以簡(jiǎn)單地以平均值的作用出現(xiàn)隨機(jī)因素影響必須考慮概率模型統(tǒng)計(jì)回歸模型馬氏鏈模型隨機(jī)模型確定性模型隨機(jī)性模型2/3/2023301軋鋼中的浪費(fèi)軋制鋼材兩道工序

粗軋(熱軋)~形成鋼材的雛形

精軋(冷軋)~得到鋼材規(guī)定的長(zhǎng)度粗軋鋼材長(zhǎng)度正態(tài)分布均值可以調(diào)整方差由設(shè)備精度確定粗軋鋼材長(zhǎng)度大于規(guī)定切掉多余部分粗軋鋼材長(zhǎng)度小于規(guī)定整根報(bào)廢隨機(jī)因素影響精軋問(wèn)題:如何調(diào)整粗軋的均值,使精軋的浪費(fèi)最小背景2/3/202331分析設(shè)已知精軋后鋼材的規(guī)定長(zhǎng)度為l,粗軋后鋼材長(zhǎng)度的均方差為記粗軋時(shí)可以調(diào)整的均值為m,則粗軋得到的鋼材長(zhǎng)度為正態(tài)隨機(jī)變量,記作x~N(m,2)切掉多余部分的概率整根報(bào)廢的概率存在最佳的m使總的浪費(fèi)最小lP0p(概率密度)mxP′mPP′2/3/202332建模選擇合適的目標(biāo)函數(shù)切掉多余部分的浪費(fèi)整根報(bào)廢的浪費(fèi)總浪費(fèi)=+粗軋一根鋼材平均浪費(fèi)長(zhǎng)度粗軋N根成品材

PN根成品材長(zhǎng)度lPN總長(zhǎng)度mN共浪費(fèi)長(zhǎng)度mN-lPN2/3/202333選擇合適的目標(biāo)函數(shù)粗軋一根鋼材平均浪費(fèi)長(zhǎng)度得到一根成品材平均浪費(fèi)長(zhǎng)度更合適的目標(biāo)函數(shù)優(yōu)化模型:求m使J(m)最小(已知l,

)建模粗軋N根得成品材

PN根2/3/202334求解求z使J(z)最?。ㄒ阎?/p>

)2/3/202335求解2/3/202336例設(shè)l=2(米),=20(厘米),求m使浪費(fèi)最小。=l/=10z*=-1.78*=-z*=11.78m*=*=2.36(米)求解1.2530.8760.6560.5160.4200.3550227.0-3.00.556.79-2.51.018.10-2.01.57.206-1.52.02.53.4771.680-1.0-0.5zzF(z)F(z)1.02.00-1.0-2.0105F(z)z2/3/2023372隨機(jī)存貯策略問(wèn)題以周為時(shí)間單位;一周的商品銷售量為隨機(jī);周末根據(jù)庫(kù)存決定是否訂貨,供下周銷售。(s,S)存貯策略制訂下界s,上界S,當(dāng)周末庫(kù)存小于s時(shí)訂貨,使下周初的庫(kù)存達(dá)到S;否則,不訂貨??紤]訂貨費(fèi)、存貯費(fèi)、缺貨費(fèi)、購(gòu)進(jìn)費(fèi),制訂(s,S)存貯策略,使(平均意義下)總費(fèi)用最小2/3/202338模型假設(shè)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論