第五講數(shù)據(jù)統(tǒng)計分析以及概率模型_第1頁
第五講數(shù)據(jù)統(tǒng)計分析以及概率模型_第2頁
第五講數(shù)據(jù)統(tǒng)計分析以及概率模型_第3頁
第五講數(shù)據(jù)統(tǒng)計分析以及概率模型_第4頁
第五講數(shù)據(jù)統(tǒng)計分析以及概率模型_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、2022-5-311第五講第五講 數(shù)據(jù)統(tǒng)計分析以及數(shù)據(jù)統(tǒng)計分析以及 概率模型概率模型1 MATLAB1 MATLAB中中統(tǒng)計工具箱中的基本統(tǒng)計命令統(tǒng)計工具箱中的基本統(tǒng)計命令2 2 概率模型概率模型一一 MATLAB中統(tǒng)計工具箱中的基本統(tǒng)計命令中統(tǒng)計工具箱中的基本統(tǒng)計命令1. 數(shù)據(jù)的錄入、保存和調(diào)用數(shù)據(jù)的錄入、保存和調(diào)用2. 基本統(tǒng)計量基本統(tǒng)計量3. 常見的概率分布函數(shù)常見的概率分布函數(shù)4. 頻頻 數(shù)數(shù) 直直 方方 圖圖 的的 描描 繪繪5. 參數(shù)估計參數(shù)估計6. 假設檢驗假設檢驗7. 綜合實例綜合實例返回返回一、數(shù)據(jù)的錄入、保存和調(diào)用一、數(shù)據(jù)的錄入、保存和調(diào)用 例例1 上海市區(qū)社會商品零售總額

2、和全民所有制職工工資總額的數(shù)據(jù)如下:統(tǒng)計工具箱中的基本統(tǒng)計命令統(tǒng)計工具箱中的基本統(tǒng)計命令1年份數(shù)據(jù)以1為增量,用產(chǎn)生向量的方法輸入. 命令格式: x=a:h:b t=78:872分別以x和y代表變量職工工資總額和商品零售總額.x=23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4 y=41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.03將變量t、x、y的數(shù)據(jù)保存在文件data中. save data t x y 4進行統(tǒng)計分析時,調(diào)用數(shù)據(jù)文件data中的數(shù)據(jù). load dataTo MATL

3、AB(txy)1輸入矩陣:data=78,79,80,81,82,83,84,85,86,87,88; 23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4; 41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.02將矩陣data的數(shù)據(jù)保存在文件data1中:save data1 data3 3進行統(tǒng)計分析時,先用命令:load data1 調(diào)用數(shù)據(jù)文件data1中的數(shù)據(jù),再用以下命令分別將矩陣data的第一、二、三行的數(shù)據(jù)賦給變量t、x、y: t=data(1,:) x=data(2,:) y=d

4、ata(3,:)若要調(diào)用矩陣data的第j列的數(shù)據(jù),可用命令: data(:,j)To MATLAB(data)返回返回2022-5-316基本統(tǒng)計量基本統(tǒng)計量2022-5-317二、基本統(tǒng)計量二、基本統(tǒng)計量對隨機變量x,計算其基本統(tǒng)計量的命令如下:均值:mean(x)中位數(shù):median(x)標準差:std(x) 方差:var(x)偏度:skewness(x) 峰度:kurtosis(x)例例 對例1中的職工工資總額x,可計算上述基本統(tǒng)計量.To MATLAB(tjl)返回返回三三、常見概率分布的函數(shù)常見概率分布的函數(shù)MATLAB工具箱對每一種分布都提供5類函數(shù),其命令字符為:概率密度:pd

5、f 概率分布:cdf逆概率分布:inv 均值與方差:stat隨機數(shù)生成:rnd (當需要一種分布的某一類函數(shù)時,將以上所列的分布命令字符與函數(shù)命令字符接起來,并輸入自變量(可以是標量、數(shù)組或矩陣)和參數(shù)即可.)例例 2 畫出正態(tài)分布) 1 , 0(N和)2 , 0(2N的概率密度函數(shù)圖形.在MATLAB中輸入以下命令:x=-6:0.01:6; y=normpdf(x); z=normpdf(x,0,2);plot(x,y,x,z)1密度函數(shù)密度函數(shù):p=normpdf(x,mu,sigma) (當mu=0,sigma=1時可缺省)To MATLAB(liti2)如對均值為mu、標準差為sigm

6、a的正態(tài)分布,舉例如下:To MATLAB(liti3)2概率分布概率分布:P=normcdf(x,mu,sigma)4均值與方差:均值與方差:m,v=normstat(mu,sigma)例例5 求正態(tài)分布N(3,52)的均值與方差. 命令為:m,v=normstat(3,5) 結(jié)果為:m=3,v=25To MATLAB(liti5)1給出數(shù)組data的頻數(shù)表頻數(shù)表的命令為: N,X=hist(data,k) 此命令將區(qū)間min(data),max(data)分為k個小區(qū)間(缺省為10),返回數(shù)組data落在每一個小區(qū)間的頻數(shù)N和每一個小區(qū)間的中點X.2描繪數(shù)組data的頻數(shù)直方圖頻數(shù)直方圖的

7、命令為: hist(data,k)四、數(shù)四、數(shù) 直直 方方 圖圖 的的 描描 繪繪返回返回五、參數(shù)估計五、參數(shù)估計1正態(tài)總體的參數(shù)估計正態(tài)總體的參數(shù)估計 設總體服從正態(tài)分布,則其點估計和區(qū)間估計可同時由以下命令獲得: muhat,sigmahat,muci,sigmaci=normfit(X,alpha) 此命令在顯著性水平alpha下估計數(shù)據(jù)X的參數(shù)(alpha缺省時設定為0.05),返回值muhat是X的均值的點估計值,sigmahat是標準差的點估計值, muci是均值的區(qū)間估計,sigmaci是標準差的區(qū)間估計.2其它分布的參數(shù)估計其它分布的參數(shù)估計 有兩種處理辦法:一、取容量充分大的

8、樣本(n50),按中心極限定理,它近似地 服從正態(tài)分布;二、使用MATLAB工具箱中具有特定分布總體的估計命令.(1)muhat, muci = expfit(X,alpha) 在顯著性水平alpha下,求指數(shù)分布的數(shù)據(jù)X的均值的點估計及其區(qū)間估計.(2)lambdahat, lambdaci = poissfit(X,alpha) 在顯著性水平alpha下,求泊松分布的數(shù)據(jù)X的參數(shù)的點估計及其區(qū)間估計.(3)phat, pci = weibfit(X,alpha) 在顯著性水平alpha下,求Weibull分布的數(shù)據(jù)X的參數(shù)的點估計及其區(qū)間估計.返回返回六、假設檢驗六、假設檢驗 在總體服從正

9、態(tài)分布的情況下,可用以下命令進行假設檢驗.1總體方差總體方差 已知時,總體均值的檢驗使用已知時,總體均值的檢驗使用 z檢驗檢驗 h,sig,ci = ztest(x,m,sigma,alpha,tail)檢驗數(shù)據(jù) x 的關于均值的某一假設是否成立,其中sigma 為已知方差, alpha 為顯著性水平,究竟檢驗什么假設取決于 tail 的取值:tail = 0,檢驗假設“x 的均值等于 m ”tail = 1,檢驗假設“x 的均值大于 m ”tail =-1,檢驗假設“x 的均值小于 m ”tail的缺省值為 0, alpha的缺省值為 0.05. 返回值 h 為一個布爾值,h=1 表示可以拒

10、絕假設,h=0 表示不可以拒絕假設,sig 為假設成立的概率,ci 為均值的 1-alpha 置信區(qū)間.2 例例7 MATLAB統(tǒng)計工具箱中的數(shù)據(jù)文件gas.mat.中提供了美國1993年1月份和2月份的汽油平均價格(price1,price2分別是1、2月份的油價,單位為美分),它是容量為20的雙樣本.假設1月份油價的標準偏差是每加侖4分幣(=4),試檢驗1月份油價的均值是否等于115.解解 作假設:m = 115.首先取出數(shù)據(jù),用以下命令: load gas然后用以下命令檢驗 h,sig,ci = ztest(price1,115,4)返回:h = 0,sig = 0.8668,ci =

11、113.3970 116.9030.檢驗結(jié)果: 1. 布爾變量h=0, 表示不拒絕零假設. 說明提出的假設均值115 是合理的. 2. sig值為0.8668, 遠超過0.5, 不能拒絕零假設 3. 95%的置信區(qū)間為113.4, 116.9, 它完全包括115, 且精度很 高. To MATLAB(liti7)2總體方差總體方差 未知時,總體均值的檢驗使用未知時,總體均值的檢驗使用t 檢驗檢驗 h,sig,ci = ttest(x,m,alpha,tail)檢驗數(shù)據(jù) x 的關于均值的某一假設是否成立,其中alpha 為顯著性水平,究竟檢驗什么假設取決于 tail 的取值:tail = 0,檢

12、驗假設“x 的均值等于 m ”tail = 1,檢驗假設“x 的均值大于 m ”tail =-1,檢驗假設“x 的均值小于 m ”tail的缺省值為 0, alpha的缺省值為 0.05. 返回值 h 為一個布爾值,h=1 表示可以拒絕假設,h=0 表示不可以拒絕假設,sig 為假設成立的概率,ci 為均值的 1-alpha 置信區(qū)間.2返回:h = 1,sig = 4.9517e-004,ci =116.8 120.2.檢驗結(jié)果: 1. 布爾變量h=1, 表示拒絕零假設. 說明提出的假 設油價均值115是不合理的. 2. 95%的置信區(qū)間為116.8 120.2, 它不包括 115, 故不能

13、接受假設. 3. sig值為4.9517e-004, 遠小于0.5, 不能接受零 假設. To MATLAB(liti8)例例8 試檢驗例8中2月份油價price2的均值是否等于115.解解 作假設:m = 115,price2為2月份的油價,不知其方差,故用以下命令檢驗h,sig,ci = ttest( price2 ,115)3兩總體均值的假設檢驗兩總體均值的假設檢驗使用使用 t 檢驗檢驗 h,sig,ci = ttest2(x,y,alpha,tail)檢驗數(shù)據(jù) x ,y 的關于均值的某一假設是否成立,其中alpha 為顯著性水平,究竟檢驗什么假設取決于 tail 的取值:tail =

14、0,檢驗假設“x 的均值等于 y 的均值 ”tail = 1,檢驗假設“x 的均值大于 y 的均值 ”tail =-1,檢驗假設“x 的均值小于 y 的均值 ”tail的缺省值為 0, alpha的缺省值為 0.05. 返回值 h 為一個布爾值,h=1 表示可以拒絕假設,h=0 表示不可以拒絕假設,sig 為假設成立的概率,ci 為與x與y均值差的的 1-alpha 置信區(qū)間.返回:h = 1,sig = 0.0083,ci =-5.8,-0.9.檢驗結(jié)果:1. 布爾變量h=1, 表示拒絕零假設. 說明提出的 假設“油價均值相同”是不合理的. 2. 95%的置信區(qū)間為-5.8,-0.9,說明一

15、月份油 價比二月份油價約低1至6分. 3. sig-值為0.0083, 遠小于0.5, 不能接受“油價均 相同”假設. To MATLAB(liti9)例例9 試檢驗例8中1月份油價price1與2月份的油價price2均值是否相同.解解 用以下命令檢驗h,sig,ci = ttest2(price1,price2)4非參數(shù)檢驗:總體分布的檢驗非參數(shù)檢驗:總體分布的檢驗MATLAB工具箱提供了兩個對總體分布進行檢驗的命令:(1)h = normplot(x)(2)h = weibplot(x) 此命令顯示數(shù)據(jù)矩陣x的正態(tài)概率圖.如果數(shù)據(jù)來自于正態(tài)分布,則圖形顯示出直線性形態(tài).而其它概率分布函數(shù)

16、顯示出曲線形態(tài). 此命令顯示數(shù)據(jù)矩陣x的Weibull概率圖.如果數(shù)據(jù)來自于Weibull分布,則圖形將顯示出直線性形態(tài).而其它概率分布函數(shù)將顯示出曲線形態(tài).返回返回2022-5-3122分布函數(shù)的近似求法分布函數(shù)的近似求法2022-5-31230510152000.020.040.060.080.10.120.140.162022-5-3124-6-4-2024600.050.10.150.20.250.30.350.42022-5-312500.511.522.5300.10.20.30.40.50.60.70.80.91返回返回F(10,50)分布的密度函數(shù)曲線例例10 一道工序用自動化

17、車床連續(xù)加工某種零件,由于刀具損壞等會出現(xiàn)故障.故障是完全隨機的,并假定生產(chǎn)任一零件時出現(xiàn)故障機會均相同.工作人員是通過檢查零件來確定工序是否出現(xiàn)故障的.現(xiàn)積累有100次故障紀錄,故障出現(xiàn)時該刀具完成的零件數(shù)如下: 459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 49 697 515 628 954

18、771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851試觀察該刀具出現(xiàn)故障時完成的零件數(shù)屬于哪種分布.解解 1數(shù)據(jù)輸入To MATLAB(liti101)2作頻數(shù)直方圖 hist(x,10) 3分布的正態(tài)性檢驗 normplot(x)4參數(shù)

19、估計: muhat,sigmahat,muci,sigmaci=normfit(x)(看起來刀具壽命服從正態(tài)分布)(刀具壽命近似服從正態(tài)分布)估計出該刀具的均值為594,方差204,均值的0.95置信區(qū)間為 553.4962,634.5038,方差的0.95置信區(qū)間為 179.2276,237.1329.To MATLAB(liti104)To MATLAB(liti102)To MATLAB(liti103)5假設檢驗To MATLAB(liti105) 已知刀具的壽命服從正態(tài)分布,現(xiàn)在方差未知的情況下,檢驗其均值 m 是否等于594.結(jié)果:h = 0,sig = 1,ci =553.496

20、2,634.5038.檢驗結(jié)果: 1. 布爾變量h=0, 表示不拒絕零假設. 說 明提出的假設壽命均值594是合理的. 2. 95%的置信區(qū)間為553.5,634.5, 它 完全包括594, 且精度很高. 3. sig值為1, 遠超過0.5, 不能拒絕零假 設. 返回返回2022-5-3129第五講第五講 概率模型概率模型1 軋鋼中的浪費軋鋼中的浪費2 隨機存儲策略隨機存儲策略2022-5-3130確定性因素和隨機性因素確定性因素和隨機性因素隨機因素可以忽略隨機因素可以忽略隨機因素影響可以簡單隨機因素影響可以簡單地以平均值的作用出現(xiàn)地以平均值的作用出現(xiàn)隨機因素影響必須考慮隨機因素影響必須考慮概

21、率模型概率模型統(tǒng)計回歸模型統(tǒng)計回歸模型馬氏鏈模型馬氏鏈模型隨機模型隨機模型確定性模型確定性模型隨機性模型隨機性模型2022-5-31311 軋鋼中的浪費軋鋼中的浪費軋制鋼材軋制鋼材兩道工序兩道工序 粗軋粗軋(熱軋熱軋) 形成鋼材的雛形形成鋼材的雛形 精軋精軋(冷軋冷軋) 得到鋼材規(guī)定的長度得到鋼材規(guī)定的長度粗軋粗軋鋼材長度正態(tài)分布鋼材長度正態(tài)分布均值可以調(diào)整均值可以調(diào)整方差由設備精度確定方差由設備精度確定粗軋鋼材長粗軋鋼材長度大于規(guī)定度大于規(guī)定切掉多余切掉多余 部分部分粗軋鋼材長粗軋鋼材長度小于規(guī)定度小于規(guī)定整根報廢整根報廢隨機因隨機因素影響素影響精軋精軋問題:如何調(diào)整粗軋的均值,使精軋的浪費

22、最小問題:如何調(diào)整粗軋的均值,使精軋的浪費最小背背景景2022-5-3132分析分析設已知精軋后鋼材的規(guī)定長度為設已知精軋后鋼材的規(guī)定長度為 l, 粗軋后鋼材長度的均方差為粗軋后鋼材長度的均方差為 記粗軋時可以調(diào)整的均值為記粗軋時可以調(diào)整的均值為 m,則粗軋得到的,則粗軋得到的鋼材長度為正態(tài)隨機變量,記作鋼材長度為正態(tài)隨機變量,記作 xN(m, 2)切掉多余部切掉多余部分的概率分的概率)(lxPP整根報廢整根報廢的概率的概率)(lxPPPPm,存在最佳的存在最佳的m使總的浪費最小使總的浪費最小lPPPm,0p(概率密度概率密度)mxP mPP 2022-5-3133lldxxxpdxxplxW

23、)()()(ldxxlpdxxxp)()(建模建模選擇合適的目標函數(shù)選擇合適的目標函數(shù)切掉多余部分切掉多余部分的浪費的浪費整根報廢整根報廢的浪費的浪費總浪費總浪費 =+lPm粗軋一根鋼材平均浪費長度粗軋一根鋼材平均浪費長度粗軋粗軋N根根成品材成品材 PN根根成品材長度成品材長度l PN總長度總長度mNNlPNmN lPm共浪費長度共浪費長度 mN-lPN2022-5-3134lPmPNlPNmN)()(mPmmJ記222)(21)(,)()(mxlexpdxxpmP選擇合適的目標函數(shù)選擇合適的目標函數(shù)粗軋一根鋼材平均浪費長度粗軋一根鋼材平均浪費長度lPmNlPNmN得到一根成品材平均浪費長度得

24、到一根成品材平均浪費長度更合適的目標函數(shù)更合適的目標函數(shù)優(yōu)化模型:求優(yōu)化模型:求m 使使J(m) 最小(已知最?。ㄒ阎猯 , )建模建模粗軋粗軋N根根得成品材得成品材 PN根根2022-5-3135,mxylm,)()(J2221)()()(yzeydyyz)()(mPmmJ222)(21)()()(mxlexpdxxpmPz)()()(zzzJ)()(J求解求解求求 z 使使J(z) 最?。ㄒ阎钚。ㄒ阎?) 2022-5-3136求解求解)()()(zzzJ0)()()(zzz)(/ )(zzz)()(zz0dzdJ2221)()()(yzeydyyz)(/ )()()(zzzFzzF20

25、22-5-3137簡表)()()(zzzFz*z例例設設l=2(米米), =20(厘米厘米),求求 m 使浪費最小。使浪費最小。 =l/ =10z*=-1.78 *= -z*=11.78m*= * =2.36(米米)求解求解1.2530.8760.6560.5160.4200.3550227.0-3.00.556.79-2.51.018.10-2.01.57.206-1.52.02.53.4771.680-1.0-0.5zzF(z)F(z)zzF)(1.02.00-1.0-2.0105F(z)z2022-5-31382 隨機存貯策略隨機存貯策略問問題題以周為時間單位;一周的商品銷售量為隨機;以

26、周為時間單位;一周的商品銷售量為隨機;周末根據(jù)庫存決定是否訂貨,供下周銷售。周末根據(jù)庫存決定是否訂貨,供下周銷售。(s, S) 存貯策略存貯策略制訂下界制訂下界s, 上界上界S,當周末庫存小于,當周末庫存小于s 時訂貨,時訂貨,使下周初的庫存達到使下周初的庫存達到S; 否則,不訂貨。否則,不訂貨。考慮訂貨費、存貯費、缺貨費、購進費,制訂考慮訂貨費、存貯費、缺貨費、購進費,制訂(s, S) 存貯策略存貯策略, ,使使( (平均意義下平均意義下) )總費用最小總費用最小2022-5-3139模型假設模型假設 每次訂貨費每次訂貨費c0, 每件商品購進價每件商品購進價c1,每件商品每件商品一周貯存費一

27、周貯存費c2,每件商品缺貨損失費每件商品缺貨損失費c3 (c1c3) 每周銷售量每周銷售量 r 隨機、連續(xù),概率密度隨機、連續(xù),概率密度 p(r) 周末庫存量周末庫存量x, 訂貨量訂貨量 u, 周初庫存量周初庫存量 x+u 每周貯存量按每周貯存量按 x+u-r 計計 2022-5-31400)(0),()(10uxLuuxLuccuJxxdrrpxrcdrrprxcxL032)()()()()(建模與求解建模與求解(s, S) 存貯策略存貯策略0usx確定確定(s, S), 使目標函數(shù)使目標函數(shù)每周總費用的平均值最小每周總費用的平均值最小平均平均費用費用 訂貨費訂貨費c0, 購進價購進價c1, 貯存費貯存費c2, 缺貨費缺貨費c3, 銷售量銷售量 r Suxusx, 0s 訂貨點,訂貨點, S 訂貨值訂貨值2022-5-314112130)()(ccccdrrpdrrpSSuxuxdrrpcdrrpccdudJ0321)()(建模與求解建模與求解1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論