概率與數(shù)理統(tǒng)計(jì)(八)_第1頁(yè)
概率與數(shù)理統(tǒng)計(jì)(八)_第2頁(yè)
概率與數(shù)理統(tǒng)計(jì)(八)_第3頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第八章假設(shè)檢驗(yàn)一、假設(shè)檢驗(yàn)的根本思想和概念1、根本思想我們以教材例8-1來(lái)說(shuō)明假設(shè)檢驗(yàn)的根本思想和概念。例:味精廠用一臺(tái)包裝機(jī)自動(dòng)包裝味精,袋裝味精的重量X N(),0.0152)。機(jī)器正常時(shí),其均值=0.5公斤,某日開(kāi)工后,隨機(jī)抽取9袋味精, 其凈重(公斤)為:0.497, 0.506,0.518, 0.524, 0.498, 0.511,0.520,0.515,0.512問(wèn)這臺(tái)包裝機(jī)是否正常?此例隨機(jī)抽樣取的9袋味精重量都不是正好0.5公斤,這種實(shí)際重量和標(biāo)準(zhǔn) 重量不一致的現(xiàn)象,在實(shí)際中是經(jīng)常出現(xiàn)的。造成這種差異不外乎有兩種原因: 一是偶然因素影響,如電壓波動(dòng),金屬部件熱脹冷縮,稱量?jī)x器誤

2、差等,稱為隨 機(jī)誤差,隨機(jī)誤差是無(wú)法防止的;二是條件因素影響,如機(jī)器缺陷,部件損耗等, 稱為條件誤差,那是我們要設(shè)法解決的。如果我們斷定標(biāo)準(zhǔn)重量已不是0.5公斤,那么原因很可能是第二種原因造成的包裝機(jī)器工作不正常。問(wèn)題就是如何根據(jù)樣本觀測(cè)值推斷“=0.5是否為真?我們不妨先假設(shè)包裝機(jī)是正常的,在統(tǒng)計(jì)中用如下符號(hào)表示:H 0:丄=0.5, H1- 0.5其中Ho為待檢驗(yàn)的假設(shè),稱為原假設(shè);H1是與原假設(shè)相對(duì)立的假設(shè),稱為備擇假設(shè)。我們的任務(wù)就是要依據(jù)樣本觀測(cè)值在這兩對(duì)立的假設(shè)中作出選擇。由于樣本均值x是的一個(gè)很好的估計(jì),故當(dāng)Ho為真時(shí),| x-0.5|應(yīng)很小, 如果| X-0.5|過(guò)分大,我們應(yīng)

3、疑心H。不正確而拒絕H。接受H1?,F(xiàn)在的問(wèn)題究 竟| x-0.5|取值在什么范圍才算“比擬大? “|X-0.5|比擬大這個(gè)事件概率有 多少?如果概率很小可以認(rèn)為是“不可能發(fā)生的。我們的方法是構(gòu)造一個(gè)適當(dāng)?shù)慕y(tǒng)計(jì)量,這里我們構(gòu)造X-0u=w當(dāng)Ho為真時(shí),uN(0, 1),對(duì)于給定的很小的數(shù)0:1,例如取-=0.05|>匕是2P|u|> 七 =P|2個(gè)小概率事件,0-/ / n|> 七=:2小概率事件在一次試驗(yàn)中幾乎是不可能發(fā)生的當(dāng):- =0.05我們查附表得u 一 =uo25=1.96,又n=9,;二=0.015,由樣本計(jì)算得ix =0.511=|u|=|x-二/.n 0.015

4、/3|=2.2>1.96小概率事件居然發(fā)生了,這與“ H0:.L = %=0.5的推斷矛盾,于是拒絕H0 而認(rèn)為這臺(tái)包裝機(jī)不正常。類(lèi)似于反證法2、統(tǒng)計(jì)假設(shè)的概念在許多實(shí)際問(wèn)題中,常需要根據(jù)理論與經(jīng)驗(yàn)對(duì)總體X的分布函數(shù)或其所含的一些參數(shù)作出某種假設(shè)H。,這種假設(shè)H。稱為統(tǒng)計(jì)假設(shè)?!皘u|> u:.這個(gè)事件雖是小概率事件,但小概率事件它仍然可能發(fā)生發(fā)生的概率a ,因此假設(shè)根據(jù)| u|> U就拒絕Ho也有可能犯錯(cuò)誤,就是犯錯(cuò)誤的概率2很小,僅為a,換句話說(shuō)當(dāng)| u|> 時(shí),拒絕Ho這一判斷可信度是1- a2x _這里我們稱u=X/ 0為檢驗(yàn)統(tǒng)計(jì)量,而稱區(qū)域 W=|u|_Uj為

5、拒絕域。W=|u|亠 u ;-=-二,-u JU二,在假設(shè)檢驗(yàn)中,小概率a常取0.05,0.01,或0.1, a稱為顯著性水平。如在 上例中可以說(shuō)包裝機(jī)的包裝規(guī)格與 0.5公斤有顯著差異,而顯著性水平為 0.05。 作為拒絕域的邊界數(shù)值,稱為臨界值,如 W=|u|_u=時(shí),臨界值為-口二與u ; 當(dāng)a =0.05,臨界值為-1.96與1.96。3、兩類(lèi)錯(cuò)誤數(shù)理統(tǒng)計(jì)的任務(wù)是用樣本去推斷總體,即從局部去推斷整體,當(dāng)然有可能犯 錯(cuò)誤。一類(lèi)錯(cuò)誤是:在H。成立的情況下,樣本落入了拒絕域 W,因而H。被拒絕, 稱這種錯(cuò)誤為第一類(lèi)錯(cuò)誤,又稱拒真錯(cuò)誤,一般記犯第一類(lèi)錯(cuò)誤的概率為另一類(lèi)錯(cuò)誤是:在H。不成立的情況

6、下,樣本未落入拒絕域 W,因而H。被接 受,稱這種錯(cuò)誤為第二類(lèi)錯(cuò)誤,又稱取偽錯(cuò)誤,并記犯第二類(lèi)錯(cuò)誤的概率為我們借用條件概率的表示方法簡(jiǎn)單如下:第一類(lèi)錯(cuò)誤拒真P拒絕H ° | H °為真= a第二類(lèi)錯(cuò)誤取偽P接受H。|H。不真= B二、正態(tài)總體均值的假設(shè)檢驗(yàn)1、u檢驗(yàn)重點(diǎn)1方差,單個(gè)正態(tài)總體均值檢驗(yàn)設(shè)Xi,X2Xn,是從總體N.二,二02中抽取的一個(gè)樣本,二0是常數(shù),假設(shè):H。:"%,Hi: 八 °其中為數(shù)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量x - 在假設(shè)H °成立時(shí)uN0,1,拒絕域 W= , -口空J(rèn)u, +o0 ,假設(shè)樣本算出的u值落在W內(nèi),那么作出拒絕H0,否

7、那么認(rèn)為與H0相容。2方差時(shí),兩個(gè)正態(tài)總體均值的檢驗(yàn)了解設(shè)X叮打,丫N卩2戸22 其中 12 , 2為常數(shù),Xi,X2Xm和yi,y2yn分別是取自X和丫的樣本,且互相獨(dú)立。假設(shè):Ho:叫=J,H 2檢驗(yàn)假設(shè) 5=9,等價(jià)于假設(shè)叫-=0,而X-y是I的好的估計(jì)量,且當(dāng)H。為真時(shí),有x y于是對(duì)于給定顯著水平a,查表可得臨界值U舟使P|U|> U =a從而得拒絕域W=:,uj u,+:再由樣本計(jì)算u的觀測(cè)值假設(shè)u W,貝冊(cè)絕H。,否那么就認(rèn)為H。與相容.2、t檢驗(yàn)重點(diǎn)1方差未知時(shí),單個(gè)正態(tài)總體的均值檢驗(yàn)設(shè)Xi,X2Xn,是從總體N,:二2中抽取的一個(gè)樣本,其中二2是未知,假設(shè):H°

8、;: 7,Hi:°其中為數(shù)由于二2是未知,故不能用u=X0二。八n進(jìn)行檢驗(yàn),這時(shí)最自然的想法就是用樣本方差s2替代總體方差C2,因而構(gòu)造檢驗(yàn)統(tǒng)計(jì)量前已經(jīng)知道,當(dāng)H。為真時(shí)tt( n-1),于是對(duì)于給定顯著性水平a,查t分布表n -1使得即得拒絕域 W=(-:,-嘗(n-1)(t二(n-1) , +二) 通過(guò)樣本觀測(cè)值計(jì)算檢驗(yàn)統(tǒng)計(jì)量t,假設(shè)t W,那么拒絕H。,否那么就認(rèn)為H。與相容P172 例 8-2(2)方差未知時(shí),兩個(gè)正態(tài)總體均值的檢驗(yàn)(略)三、正態(tài)總體方差的假設(shè)檢驗(yàn)(了解)1、2檢驗(yàn)設(shè)XX2xn,是從總體N(i,匚2)中抽取的一個(gè)樣本,二2未知,假設(shè):H 0 :CT2 =0 ,

9、 比 Q 2其中匚0為常數(shù)自然想到看二2的無(wú)偏估計(jì)s2,當(dāng)Ho為真時(shí),s2應(yīng)在二:周?chē)▌?dòng),如果s2/;0 很大或很小,那么應(yīng)拒絕H。,因此構(gòu)造檢驗(yàn)統(tǒng)計(jì)量2_(n - 1)s2前,在假設(shè)H0成立時(shí)22 (n-1),于是給定顯著性水平a,查2表2 2 可得 :.(n-1 )與1 :.(n-1),使1 2 222P 2 空 :.(n-1) = P 2>:. (n-1) =a /21 2222從而可得拒絕域 W=(0,1 :. (n-1) ) (:. (n-1 ),+:)1 22假設(shè)由樣本觀測(cè)值計(jì)算出2的值,2W,那么拒絕Ho,否那么認(rèn)為與H1相容。2、F檢驗(yàn)(了解)檢驗(yàn)兩個(gè)獨(dú)立正態(tài)總體的未知

10、方差是否相等,用F檢驗(yàn)設(shè)X(卩1,6 ),丫N(卩2®2 )X1,X2Xm和y1,y2yn分別是取自X和丫的樣本,且互相獨(dú)立。假設(shè):Ho :匚 1=二 2,2由于Si是G的無(wú)偏估計(jì),S2是二2的無(wú)偏估計(jì),當(dāng)Ho為真時(shí),自然想到Si與22SS2應(yīng)該差不多,其比值T2不會(huì)太大或太小,前,在假設(shè)Ho成立時(shí)2s2F(m_1, n _1)S2這樣我們?nèi)為檢驗(yàn)統(tǒng)計(jì)量,對(duì)于給定顯著性水平,查表確定臨界值F/m-1,n -1) F 僅伸-1,n-1)2 2使 pFw 匚_: (m -1,n)= pF> FJm-1, n -1)取得拒絕域 W=(0,(m", n") (FJ

11、m-1, n"),+:2 2假設(shè)由樣本觀測(cè)值計(jì)算得F值,當(dāng)F W時(shí)那么拒絕Ho,即認(rèn)為兩總體的方差有顯著差異,否那么認(rèn)為與H1相容,即認(rèn)為兩總體的方差無(wú)顯著差異。第九章回歸分析在現(xiàn)實(shí)世界中,不少變量之間是存在著一定關(guān)系的, 這種關(guān)系大體分為兩類(lèi), 一類(lèi)是確定性的關(guān)系,即函數(shù)關(guān)系,例如,電學(xué)中的電壓 V,電流I,電阻三者之間 有匸V/R的函數(shù)關(guān)系;另一類(lèi)是非確定性的,這類(lèi)變量之間有一定關(guān)系卻又并不 完全確定,例如人的血壓與年齡有關(guān),農(nóng)作物的產(chǎn)量與施肥量有關(guān),這些變量之 間有一定聯(lián)系,但又不能用普通函數(shù)關(guān)系式表達(dá)。事實(shí)上,這些變量是或至少有 一個(gè)是隨機(jī)變量,這種非確定的函數(shù)關(guān)系稱為相關(guān)關(guān)

12、系?;貧w分析是研究相關(guān)關(guān) 系的一種數(shù)學(xué)工具,是數(shù)理統(tǒng)計(jì)中常用的統(tǒng)計(jì)方法之一,在生產(chǎn)實(shí)踐和科學(xué)研究 中有廣泛的應(yīng)用。一、回歸直線方程的建立我們以教材例9-1為例,說(shuō)明線性回歸分析中最簡(jiǎn)單的一元線性回歸分析某種合金的抗拉強(qiáng)度y(kg,mm2)與其中的含碳量x (%)有關(guān),現(xiàn)測(cè)12對(duì)數(shù)據(jù) 如表所示:X0.100.110.120.130.140.150.160.170.180.200.210.23y42.043.545.045.545.047.549.053.050.055.055.060.0個(gè)隨機(jī)變量,實(shí)際觀測(cè)值 y是丫的疋一個(gè)可能取值,隨著X變化的丫觀測(cè)值線性變化的趨勢(shì)可表示為為了了解其相關(guān)關(guān)系的

13、表達(dá)形式, 在坐標(biāo)上以(Xi, yi)為點(diǎn),i=1,2,12 為點(diǎn)畫(huà)出散點(diǎn)圖,這些點(diǎn)大致散布在某 條直線附近,又不完全在一條直線上, 從而可認(rèn)為y與x的關(guān)系根本上是線性 的,而這些點(diǎn)與直線的偏離是其它一切 隨機(jī)因素影響造成的。一般來(lái)說(shuō),含碳 量x是一個(gè)可測(cè)的或可控制的普通變 量,而對(duì)任意含碳量X,相應(yīng)的抗拉強(qiáng)度丫丫= : o: 1X ;其中IX表示丫隨X變化的線性局部是一切隨機(jī)因素影響的總和一般地,將X取一組不同的值X1, X , Xn,通過(guò)試驗(yàn)得到對(duì)應(yīng)丫的值 yi,y2,,yn,這樣就得到n對(duì)觀測(cè)值(Xi, yi),i=1,2,,n。由丫=5必;,可以認(rèn)為Xi,yi之間有如下關(guān)系:yi很;i

14、 (i=1,2,,n);i N (0,1)此式就是一元線性回歸的數(shù)學(xué)模型回歸分析的根本問(wèn)題是依據(jù)樣本(Xi, yi),i=1,2, ,n解決如下問(wèn)題:(1)求出未知參數(shù)j1的點(diǎn)估計(jì)值-0, -1,稱y=:o+ :1X為y關(guān)于x的一元線性回歸方程,其圖像(直線)稱為回歸直線, m稱為回歸系數(shù),飛稱為回歸常數(shù)。(2)回歸方程顯著性檢驗(yàn).實(shí)際問(wèn)題中丫,X之間是否存在線性關(guān)系yio +x 是要經(jīng)過(guò)檢驗(yàn)的。利用回歸方程進(jìn)行預(yù)測(cè)和控制二、最小二乘法要求出y=L+ + x就是要求出-I的點(diǎn)估計(jì)-0 , -1,而求出此估計(jì)一個(gè) 自然又直觀的想法便是希望對(duì)一切 Xi,觀測(cè)值yi與回歸值£二y必的偏離最厲n.、n小。即選取'-0, '-1使7-yi2=v yi - -o -、x2最小,此法稱為最小二乘法, 它涉及高等數(shù)學(xué)內(nèi)容,這里直接給出由最小二乘法得出的計(jì)算y,.公式。由數(shù)據(jù)xyi,i=1,2,n計(jì)算nn°2 2 2Lxx =二(Xi -X)二二 xi - nxi4i £n nLxy = 6 (Xi xj(yi Xi)=, Xi % nxynAi4那么最小二乘估計(jì)為:本例根據(jù)樣本計(jì)算得Lxx =0.0186LXy =2.4292Lyy=335.2292LxyLxx=130.6022-0 =28.5340所以:y

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論