版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第五章參數(shù)估計(jì)與假設(shè)檢驗(yàn)樣本總體樣本統(tǒng)計(jì)量如:樣本均值、比例、方差總體均值、比例、方差等2/1/20231統(tǒng)計(jì)推斷(Statisticalinference)
統(tǒng)計(jì)推斷就是根據(jù)隨機(jī)樣本的實(shí)際數(shù)據(jù),對(duì)總體的數(shù)量特征作出具有一定可靠程度的估計(jì)和判斷。統(tǒng)計(jì)推斷的基本內(nèi)容有參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩方面。概括地說,研究一個(gè)隨機(jī)變量,推斷它具有什么樣的數(shù)量特征,按什么樣的模式來變動(dòng),這屬于估計(jì)理論的內(nèi)容,而推測(cè)這些隨機(jī)變量的數(shù)量特征和變動(dòng)模式是否符合我們事先所作的假設(shè),這屬于檢驗(yàn)理論的內(nèi)容。參數(shù)估計(jì)和假設(shè)檢驗(yàn)的共同點(diǎn)是它們都對(duì)總體無知或不很了解,都是利用樣本觀察值所提供的信息,對(duì)總體的數(shù)量特征作出估計(jì)和判斷,但兩者所要解決問題的著重點(diǎn)及所用方法有所不同。█2/1/20232主要內(nèi)容5.1
參數(shù)估計(jì)的一般問題
5.2一個(gè)總體參數(shù)的區(qū)間估計(jì)5.3必要抽樣數(shù)目的確定5.4假設(shè)檢驗(yàn)的基本問題5.5一個(gè)總體參數(shù)的假設(shè)檢驗(yàn)2/1/202335.1參數(shù)估計(jì)的一般問題
5.1.1參數(shù)估計(jì)的含義5.1.2估計(jì)量與估計(jì)值5.1.3點(diǎn)估計(jì)與區(qū)間估計(jì)5.1.4評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)2/1/20234所謂參數(shù)估計(jì),就是以樣本統(tǒng)計(jì)量(即樣本數(shù)字特征)來估計(jì)未知的總體參數(shù)(或參數(shù)的函數(shù))。實(shí)際工作中一般首先進(jìn)行概率抽樣得到隨機(jī)樣本,然后通過對(duì)樣本單位的實(shí)際觀察取得樣本數(shù)據(jù),最后計(jì)算樣本統(tǒng)計(jì)量的取值對(duì)未知的總體參數(shù)進(jìn)行估計(jì)。5.1.1參數(shù)估計(jì)的含義1、什么是參數(shù)估計(jì)2/1/202352、參數(shù)估計(jì)的特點(diǎn)和邏輯思想(1)以隨機(jī)樣本為基礎(chǔ);(2)以分布理論為依據(jù);(3)推斷的只是一種可能的結(jié)果;(4)是歸納推理和演繹推理的結(jié)合。
歸納推理
從樣本總體
大前提小前提(分布規(guī)律)(樣本信息)結(jié)果演繹推理5.1.1參數(shù)估計(jì)的含義2/1/202363、參數(shù)估計(jì)的主要問題(1)如何得到總體參數(shù)的估計(jì)值?(解決估計(jì)方法問題)(2)如何在保證樣本對(duì)總體具有充分代表性的前提下,使樣本的調(diào)查成本最低?(解決樣本容量問題)5.1.1參數(shù)估計(jì)的含義2/1/20237
1)估計(jì)量:用于估計(jì)總體參數(shù)的統(tǒng)計(jì)量如樣本均值,樣本比例、樣本方差等例如:樣本均值就是總體均值的一個(gè)估計(jì)量
2)參數(shù)用表示,估計(jì)量用表示
3)估計(jì)值:估計(jì)參數(shù)時(shí)計(jì)算出來的估計(jì)量的具體數(shù)值如果樣本均值x=80,則80就是的估計(jì)值1、什么是估計(jì)量與估計(jì)值
(estimator&estimatedvalue)5.1.2估計(jì)量與估計(jì)值2/1/202382、統(tǒng)計(jì)估計(jì)的基本過程
1)首先對(duì)所要研究的總體進(jìn)行概率抽樣,通過隨機(jī)樣本獲取相關(guān)統(tǒng)計(jì)量,然后利用這些統(tǒng)計(jì)量與總體參數(shù)之間的聯(lián)系(獲得統(tǒng)計(jì)量的分布),利用有關(guān)統(tǒng)計(jì)方法計(jì)算估計(jì)量,估計(jì)總體參數(shù)。
2)由此可以看出,統(tǒng)計(jì)量與總體參數(shù)、估計(jì)量的不同:總體參數(shù)通常是未知的常數(shù),是待估計(jì)的量;統(tǒng)計(jì)量是根據(jù)樣本計(jì)算的函數(shù),通常是隨機(jī)變量(對(duì)于總體而言);估計(jì)量是用來對(duì)總體參數(shù)進(jìn)行估計(jì)的統(tǒng)計(jì)量。5.1.2估計(jì)量與估計(jì)值2/1/202391、參數(shù)估計(jì)的方法矩估計(jì)法最小二乘法最大似然法順序統(tǒng)計(jì)量法估計(jì)方法點(diǎn)估計(jì)區(qū)間估計(jì)5.1.3點(diǎn)估計(jì)量與區(qū)間估計(jì)2/1/2023102、點(diǎn)估計(jì)(pointestimate)用樣本統(tǒng)計(jì)量的某個(gè)取值直接作為總體參數(shù)的估計(jì)值例如:用樣本均值直接作為總體均值的估計(jì)例如:用兩個(gè)樣本均值之差直接作為總體均值之差的估計(jì)2) 沒有給出估計(jì)值接近總體參數(shù)程度的信息點(diǎn)估計(jì)的方法有矩估計(jì)法、順序統(tǒng)計(jì)量法、最大似然法、最小二乘法等5.1.3點(diǎn)估計(jì)量與區(qū)間估計(jì)2/1/2023113、區(qū)間估計(jì)(intervalestimate)
(1)有關(guān)概念點(diǎn)估計(jì)是通過樣本估計(jì)量的某一次估計(jì)值來推斷總體參數(shù)的可能取值;區(qū)間估計(jì)則是根據(jù)樣本估計(jì)量以一定的可靠程度推斷總體參數(shù)所在的區(qū)間范圍。人們?cè)诘玫近c(diǎn)估計(jì)值的同時(shí),自然希望知道與到底相差多少?這就引出了區(qū)間估計(jì)問題。即希望對(duì)的取值估計(jì)出一個(gè)范圍,并希望知道這個(gè)范圍包含的可靠程度。即P{}=1-
其中[]是置信區(qū)間;是置信區(qū)間下、上限;1-
是置信水平、置信度或置信系數(shù);是估計(jì)不準(zhǔn)的概率,通常取=0.05,或0.01。由上式可知,要想求出被估計(jì)參數(shù)的置信區(qū)間,必須找到一個(gè)和被估計(jì)參數(shù)相關(guān)聯(lián)的統(tǒng)計(jì)量,并知其概率分布。5.1.3點(diǎn)估計(jì)量與區(qū)間估計(jì)2/1/202312
(2)置信區(qū)間的構(gòu)造
當(dāng)總體服從正態(tài)分布N(μ,σ2)時(shí)(σ2已知),來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x
的數(shù)學(xué)期望為μ,方差為σ2/n。即x~N(μ,σ2/n)
0臨界值-z值a/2a/2
統(tǒng)計(jì)量1-置信水平5.1.3點(diǎn)估計(jì)量與區(qū)間估計(jì)3、區(qū)間估計(jì)2/1/202313(3)區(qū)間估計(jì)的圖示x95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x5.1.3點(diǎn)估計(jì)量與區(qū)間估計(jì)3、區(qū)間估計(jì)2/1/202314
2)
1-
可以認(rèn)為是用樣本估計(jì)值代替總體真值時(shí)誤差在某一范圍內(nèi)的“可能性”,則可認(rèn)為是用代替時(shí)誤差超過這一范圍的“可能性”。
3)用一個(gè)具體的樣本所構(gòu)造的區(qū)間是一個(gè)特定的區(qū)間,我們無法知道這個(gè)樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值。我們只能希望這個(gè)區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè),但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè)??傮w參數(shù)以一定的概率落在這一區(qū)間的表述是錯(cuò)誤的。
1)置信區(qū)間的直觀意義為:n次抽樣形成的n個(gè)置信區(qū)間中,有n(1-)
個(gè)區(qū)間包含總體參數(shù)真值。5.1.3點(diǎn)估計(jì)量與區(qū)間估計(jì)3、區(qū)間估計(jì)注意:(3)區(qū)間估計(jì)的圖示2/1/202315
5.1.3點(diǎn)估計(jì)量與區(qū)間估計(jì)3、區(qū)間估計(jì)(3)區(qū)間估計(jì)的圖示2/1/202316(4)影響區(qū)間寬度的因素1. 總體數(shù)據(jù)的離散程度,用來測(cè)度樣本容量n置信水平(1-),影響
z/2的大小抽樣方法抽樣的組織方式5.1.3點(diǎn)估計(jì)量與區(qū)間估計(jì)3、區(qū)間估計(jì)2/1/202317置信區(qū)間與置信水平(1-)的關(guān)系70%80%90%95%99%置信區(qū)間寬度5.1.3點(diǎn)估計(jì)量與區(qū)間估計(jì)3、區(qū)間估計(jì)(4)影響區(qū)間寬度的因素Neyman原則:即在保證置信度的前提下,盡可能提高估計(jì)的精確度。2/1/2023181、點(diǎn)估計(jì)以樣本指標(biāo)直接估計(jì)總體參數(shù)。評(píng)價(jià)準(zhǔn)則的數(shù)學(xué)期望等于總體參數(shù),即該估計(jì)量稱為無偏估計(jì)。無偏性有效性當(dāng)為的無偏估計(jì)時(shí),方差越小,無偏估計(jì)越有效。一致性對(duì)于無限總體,如果對(duì)任意,則稱的一致估計(jì)。是充分性估計(jì)量如能包含樣本中關(guān)于未知參數(shù)的全部信息,即為充分量。估計(jì)量5.1.4評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)2/1/2023192、區(qū)間估計(jì)估計(jì)未知參數(shù)所在的可能區(qū)間。評(píng)價(jià)準(zhǔn)則隨機(jī)區(qū)間置信度精確度隨機(jī)區(qū)間包含(即可靠程度)越大越好。的概率的平均長度(誤差范圍)越小越好。5.1.4評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)█2/1/202320
5.2一個(gè)總體參數(shù)的區(qū)間估計(jì)
5.2.1一個(gè)總體均值的區(qū)間估計(jì)5.2.2一個(gè)總體比例的區(qū)間估計(jì)5.2.3一個(gè)總體方差的區(qū)間估計(jì)2/1/2023211、有關(guān)符號(hào)總體參數(shù)樣本統(tǒng)計(jì)量均值比例方差5.2.1一個(gè)總體均值的區(qū)間估計(jì)2/1/202322(1)總體服從正態(tài)分布,且方差(2)
已知;或者總體不是正態(tài)分布但大樣本(n30)時(shí)總體均值的區(qū)間估計(jì)該條件下使用標(biāo)準(zhǔn)正態(tài)分布統(tǒng)計(jì)量z下面通過標(biāo)準(zhǔn)正態(tài)分布構(gòu)造總體均值的置信區(qū)間5.2.1一個(gè)總體均值的區(qū)間估計(jì)2、一個(gè)總體均值的置信區(qū)間2/1/202323給定置信度1-,可由標(biāo)準(zhǔn)正態(tài)分布表查得臨界值Z/2,使得從而可得置信度為1-時(shí)總體均值的置信區(qū)間:
在大樣本(n≥30)條件下,不論總體分布形式如何,均可用上述方法進(jìn)行總體均值的區(qū)間估計(jì)。如果總體方差未知,則直接用樣本方差代替。
▼注意:5.2.1一個(gè)總體均值的區(qū)間估計(jì)2/1/202324
(2)小樣本下總體方差未知時(shí),正態(tài)分布總體均值的區(qū)間估計(jì)
如果是小樣本,但總體為正態(tài)分布,在總體方差未知而需用樣本方差代替時(shí),則下式服從自由度為n-1的t分布。5.2.1一個(gè)總體均值的區(qū)間估計(jì)2、一個(gè)總體均值的置信區(qū)間2/1/202325
▼注意:如果小樣本下總體分布非正態(tài),則無法進(jìn)行區(qū)間估計(jì),唯一的解決方法就是增大樣本。從而可得置信度為1-時(shí)總體均值的置信區(qū)間:
于是,給定置信度為1-,可由t分布表查得臨界值t/2(n-1),使得5.2.1一個(gè)總體均值的區(qū)間估計(jì)2/1/202326指在一定的置信水平下,抽樣誤差不允許超過的最大給定范圍,也稱作允許誤差、誤差范圍等。5.2.1一個(gè)總體均值的區(qū)間估計(jì)3、極限誤差(允許誤差)(1)含義(大樣本條件下)(2)極限誤差的計(jì)算公式樣本平均數(shù)的極限誤差:①邊際誤差樣本成數(shù)的極限誤差:②2/1/202327
Z與相應(yīng)的置信水平存在一一對(duì)應(yīng)關(guān)系,常用的置信水平及相應(yīng)的Z值如下:
z值置信水平
1.000.68271.650.90001.960.95002.000.95452.580.99003.000.99735.2.1一個(gè)總體均值的區(qū)間估計(jì)3、極限誤差2/1/202328計(jì)算樣本統(tǒng)計(jì)量確定樣本統(tǒng)計(jì)量分布由置信水平求臨界值確定置信區(qū)間4、區(qū)間估計(jì)步驟(以大樣本下估計(jì)為例)其中:5.2.1一個(gè)總體均值的區(qū)間估計(jì)2/1/202329【例】某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復(fù)抽樣從中隨機(jī)抽取100人調(diào)查他們的當(dāng)日產(chǎn)量(數(shù)據(jù)見下張幻燈片),要求在95﹪的置信水平下,估計(jì)該廠全部工人的日平均產(chǎn)量和日總產(chǎn)量的置信區(qū)間。5.2.1一個(gè)總體均值的區(qū)間估計(jì)5、例題分析2/1/202330按日產(chǎn)量分組(件)工人數(shù)(人)組中值(件)110~114114~118118~122122~126126~130130~134134~138138~14237182321186411211612012412813213614033681221602852268823768165605887006489284648600784合計(jì)100—126004144100名工人的日產(chǎn)量分組資料5.2.1一個(gè)總體均值的區(qū)間估計(jì)5、例題分析2/1/2023315.2.1一個(gè)總體均值的區(qū)間估計(jì)5、例題分析2/1/202332即在95﹪置信水平下,該企業(yè)工人人均產(chǎn)量在124.80至127.20件之間,其日總產(chǎn)量在124797至127303件之間。則該廠全部工人日平均產(chǎn)量和日總產(chǎn)量的置信區(qū)間分別為5.2.1一個(gè)總體均值的區(qū)間估計(jì)5、例題分析2/1/202333例:由532名《商業(yè)周刊》訂閱者組成的樣本表明,其每周使用因特網(wǎng)的平均時(shí)間為6.7小時(shí)。如果總體標(biāo)準(zhǔn)差為5.8小時(shí),求該周刊訂閱者總體每周平均花費(fèi)在因特網(wǎng)上時(shí)間的95%置信區(qū)間。則該置信區(qū)間為:5.2.1一個(gè)總體均值的區(qū)間估計(jì)5、例題分析2/1/2023345、例題分析8.2.1一個(gè)總體均值的區(qū)間估計(jì)從某證券市場(chǎng)抽取一個(gè)由10只股票組成的樣本,其市盈率分別為:
5791014232015326試求該市場(chǎng)全部股票平均市盈率的置信度為95%的置信區(qū)間(假定股票市盈率近似服從正態(tài)分布)。查表總體均值95%置信區(qū)間為:即:2/1/202335n是否為大樣本是否已知是否正態(tài)總體是否已知用S估計(jì)用S估計(jì)增大樣本容量到30以上是是是是否否否否5.2.1一個(gè)總體均值的區(qū)間估計(jì)6、小結(jié)2/1/2023361)假定條件總體服從二項(xiàng)分布當(dāng)樣本容量很大時(shí),可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計(jì)量z3)總體比例在1-置信水平下的置信區(qū)間為5.2.2一個(gè)總體比例(成數(shù))的區(qū)間估計(jì)1、一個(gè)總體比例(成數(shù))的置信區(qū)間2/1/202337
【例】某城市想要估計(jì)職工中女性所占的比例,隨機(jī)地抽取了100名職工,其中65人為女性職工。試以95%的置信水平估計(jì)該城市職工中女性比例的置信區(qū)間。該城市職工中女性比例的置信區(qū)間為55.65%~74.35%
解:已知n=100,p=65%,1-=95%,z/2=1.965.2.2一個(gè)總體比例的區(qū)間估計(jì)2、例題分析2/1/2023381)估計(jì)一個(gè)總體的方差或標(biāo)準(zhǔn)差2)假設(shè)總體服從正態(tài)分布3)總體方差
2
的點(diǎn)估計(jì)量為S2,且4)總體方差在1-置信水平下的置信區(qū)間為1、一個(gè)總體方差的置信區(qū)間5.2.3一個(gè)總體方差的區(qū)間估計(jì)2/1/202339221-2總體方差1-的置信區(qū)間自由度為n-1的2分布2、一個(gè)總體方差置信區(qū)間圖示5.2.3一個(gè)總體方差的區(qū)間估計(jì)2/1/202340【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,現(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測(cè)得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,以95%的置信水平建立該種食品重量標(biāo)準(zhǔn)差的置信區(qū)間。25袋食品的重量
112.5101.0103.0102.0100.5102.6107.5
95.0108.8115.6100.0123.5102.0101.6102.2116.6
95.4
97.8108.6105.0136.8102.8101.5
98.4
93.33、例題分析5.2.3一個(gè)總體方差的區(qū)間估計(jì)2/1/202341解:已知n=25,1-=95%,根據(jù)樣本數(shù)據(jù)計(jì)算得
s2=93.21
2置信度為95%的置信區(qū)間為
該種食品總體重量標(biāo)準(zhǔn)差的置信區(qū)間為7.54~13.43g3、例題分析5.2.3一個(gè)總體方差的區(qū)間估計(jì)2/1/202342一、從某一總體中隨機(jī)抽取一個(gè)容量為100的樣本,其均值為81,標(biāo)準(zhǔn)差為12。要求:1、構(gòu)造總體均值95%置信水平下的置信區(qū)間;2、構(gòu)造總體均值99%置信水平下的置信區(qū)間。二、一個(gè)容量為400的隨機(jī)樣本取自均值和標(biāo)準(zhǔn)差均未知的總體。已經(jīng)計(jì)算出下列值:
=38532要求:1、構(gòu)造總體均值95.45%置信水平下的置信區(qū)間;2、構(gòu)造總體均值99.73%置信水平下的置信區(qū)間。
4、區(qū)間估計(jì)練習(xí)5.2.3一個(gè)總體方差的區(qū)間估計(jì)█2/1/2023435.3必要抽樣數(shù)目的確定
5.3.1確定樣本容量的意義5.3.2推斷總體均值所需的樣本容量5.3.3推斷總體成數(shù)所需的樣本容量5.3.4必要樣本容量的影響因素2/1/202344樣本容量調(diào)查誤差調(diào)查費(fèi)用小樣本容量節(jié)省費(fèi)用但調(diào)查誤差大大樣本容量調(diào)查精度高但費(fèi)用較大找出在規(guī)定誤差范圍內(nèi)的最小樣本容量找出在限定費(fèi)用范圍內(nèi)的最大樣本容量5.3.1確定樣本容量的意義2/1/202345確定方法⑴重復(fù)抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差。通常未知。一般按以下方法確定其估計(jì)值:①過去的經(jīng)驗(yàn)數(shù)據(jù);②試驗(yàn)調(diào)查樣本的S。計(jì)算結(jié)果通常向上進(jìn)位5.3.2推斷總體均值所需的樣本容量2/1/202346⑵不重復(fù)抽樣條件下:確定方法5.3.2推斷總體均值所需的樣本容量2/1/202347【例】某食品廠要檢驗(yàn)本月生產(chǎn)的10000袋某種產(chǎn)品的重量,根據(jù)上月資料,這種產(chǎn)品每袋重量的標(biāo)準(zhǔn)差為25克。要求在95.45﹪的置信水平下,平均每袋重量的誤差范圍不超過5克,應(yīng)抽查多少袋產(chǎn)品?5.3.2推斷總體均值所需的樣本容量例題分析2/1/2023485.3.2推斷總體均值所需的樣本容量例題分析2/1/202349確定方法⑴重復(fù)抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差。計(jì)算結(jié)果通常向上進(jìn)位通常未知。一般按以下方法確定其估計(jì)值:①過去的經(jīng)驗(yàn)數(shù)據(jù);②試驗(yàn)調(diào)查樣本的;③取方差的最大值0.25。5.3.3推斷總體成數(shù)所需的樣本容量2/1/202350⑵不重復(fù)抽樣條件下:確定方法5.3.3推斷總體成數(shù)所需的樣本容量2/1/202351【例】某企業(yè)對(duì)一批總數(shù)為5000件的產(chǎn)品進(jìn)行質(zhì)量檢查,過去幾次同類調(diào)查所得的產(chǎn)品合格率分別為93﹪、95﹪、96﹪,為了使合格率的允許誤差不超過3﹪,在99.73﹪的置信水平下,應(yīng)抽查多少件產(chǎn)品?【分析】因?yàn)楣灿腥齻€(gè)過去的合格率的資料,為保證推斷的把握程度,應(yīng)選擇其中方差最大者,即P=93﹪。例題分析5.3.3推斷總體成數(shù)所需的樣本容量2/1/202352例題分析5.3.3推斷總體成數(shù)所需的樣本容量2/1/202353總體方差的大??;極限誤差的大?。恢眯潘?;抽樣方法;抽樣的組織方式。重復(fù)抽樣條件下:不重復(fù)抽樣條件下:5.3.4必要樣本容量的影響因素█2/1/202354一、假設(shè)檢驗(yàn)(HypothesisTesting)問題的提出二、假設(shè)檢驗(yàn)的基本思想三、有關(guān)概念四、兩類錯(cuò)誤與顯著性水平五、檢驗(yàn)統(tǒng)計(jì)量與拒絕域六、利用P值進(jìn)行決策
七、假設(shè)檢驗(yàn)的步驟5.4假設(shè)檢驗(yàn)的基本問題2/1/202355有許多實(shí)際問題,需要通過部分信息量,對(duì)某種看法進(jìn)行判定或估計(jì)。
例1、某企業(yè)生產(chǎn)一種零件,以往的資料顯示零件平均長度為4cm,標(biāo)準(zhǔn)差為0.1cm。工藝改革后,抽查100個(gè)零件發(fā)現(xiàn)其平均長度為3.94cm。問:工藝改革后零件長度是否發(fā)生了顯著變化?
例2、某廠有一天共生產(chǎn)了2000件產(chǎn)品,按國家標(biāo)準(zhǔn),次品率不得超過3%才能出廠?,F(xiàn)從該批產(chǎn)品中隨機(jī)抽取100件,發(fā)現(xiàn)其中有2件次品,問這批產(chǎn)品能否出廠。
一、假設(shè)檢驗(yàn)(HypothesisTesting)問題的提出2/1/202356例1要判明工藝改革后零件平均長度是否仍為4cm;
例2要判明該批產(chǎn)品的次品率是否低于3%。進(jìn)行這種判斷的信息來自所抽取的樣本這兩個(gè)例子中都是要對(duì)某種“陳述”做出判斷:所謂假設(shè)檢驗(yàn),就是事先對(duì)總體參數(shù)或總體分布形式作出一個(gè)假設(shè),然后利用樣本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否拒絕原假設(shè)。
假設(shè)檢驗(yàn)分兩類:(1)參數(shù)假設(shè)檢驗(yàn);(2)非參數(shù)檢驗(yàn)或自由分布檢驗(yàn)。一、假設(shè)檢驗(yàn)(HypothesisTesting)問題的提出2/1/202357
通過提出假設(shè),利用“小概率原理”和“概率反證法”,論證假設(shè)真?zhèn)蔚囊环N統(tǒng)計(jì)分析方法。
1、小概率原理:也就是實(shí)際推斷原理,它認(rèn)為在一次實(shí)驗(yàn)中,概率很小的事件,實(shí)際上幾乎是不可能發(fā)生的。
2、概率反證法:如果在其他因素給定的前提下,要證明某一事實(shí)(比如對(duì)總體參數(shù)的假定)是否成立,首先假設(shè)該事實(shí)成立,然后在該事實(shí)成立的前提下,計(jì)算由該事實(shí)和樣本構(gòu)造的統(tǒng)計(jì)量的取值,再根據(jù)該統(tǒng)計(jì)量的分布,判斷已經(jīng)觀測(cè)到的樣本信息出現(xiàn)的概率是否為小概率,以此來證明該事實(shí)是否成立。二、假設(shè)檢驗(yàn)的基本思想2/1/202358因此,置信度大小的不同,有可能做出不同的判斷。
3、假設(shè)檢驗(yàn)是基于樣本資料來推斷總體特征的,而這種推斷是在一定概率置信度下進(jìn)行的,而非嚴(yán)格的邏輯證明。在例1中,要判斷工藝改革后零件平均長度是否仍為4cm,可先假設(shè)仍為4cm,根據(jù)樣本平均數(shù)的抽樣分布理論,則樣本點(diǎn)應(yīng)以較大的可能性(置信度)落在以4為中心的某一范圍內(nèi)。二、假設(shè)檢驗(yàn)的基本思想2/1/202359在給定置信度1-下(比如99%):其中:0為所要檢驗(yàn)的假設(shè)(這里為4cm)
為總體標(biāo)準(zhǔn)差(這里為0.1cm)n為樣本容量(這里為100)Z/2為置信度1-下,標(biāo)準(zhǔn)正態(tài)分布對(duì)應(yīng)的右尾臨界值二、假設(shè)檢驗(yàn)的基本思想2/1/202360
如果取置信度為0.99,則顯著性水平=0.01,對(duì)應(yīng)的臨界值為Z/2=2.58
換言之,如果原假設(shè)為真,則樣本測(cè)算值將以99%的可能性落在[-2.58,2.58]區(qū)間內(nèi)。
通過一組(實(shí)際)樣本計(jì)算得:說明小概率事件(標(biāo)準(zhǔn)化后的樣本均值只有1%的可能性落在[-2.58,2.58]區(qū)間外)發(fā)生了。
這是不合理的,應(yīng)拒絕原假設(shè)。二、假設(shè)檢驗(yàn)的基本思想2/1/202361(一)原假設(shè)(nullhypothesis)研究者想收集證據(jù)予以反對(duì)的假設(shè)又稱“零假設(shè)”總是有符號(hào),或表示為H0H0:
=某一數(shù)值指定為符號(hào)=,或例如,H0:
10cm三、有關(guān)概念2/1/202362研究者想收集證據(jù)予以支持的假設(shè)也稱“研究假設(shè)”總是有符號(hào)
,
或表示為
H1H1:
<某一數(shù)值,或某一數(shù)值例如,H1:
<10cm,或
10cm(二)備擇假設(shè)(alternativehypothesis)三、有關(guān)概念2/1/202363原假設(shè)和備擇假設(shè)是一個(gè)完備事件組,而且相互對(duì)立在一項(xiàng)假設(shè)檢驗(yàn)中,原假設(shè)和備擇假設(shè)必有一個(gè)成立,而且只有一個(gè)成立先確定備擇假設(shè),再確定原假設(shè)
含有等號(hào)“=”的符號(hào)總是放在原假設(shè)上因研究目的不同,對(duì)同一問題可能提出不同的假設(shè)如何提出假設(shè)三、有關(guān)概念2/1/202364【例】某品牌洗滌劑在它的產(chǎn)品說明書中聲稱:平均凈含量不少于500克。從消費(fèi)者的利益出發(fā),有關(guān)研究人員要通過抽檢其中的一批產(chǎn)品來驗(yàn)證該產(chǎn)品制造商的說明是否屬實(shí)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)如何提出假設(shè)(例題分析)解:研究者抽檢的意圖是傾向于證實(shí)這種洗滌劑的平均凈含量并不符合說明書中的陳述。建立的原假設(shè)和備擇假設(shè)為
H0:
500H1:
<500500g三、有關(guān)概念2/1/202365【例】一家研究機(jī)構(gòu)估計(jì),某城市中家庭擁有汽車的比例超過30%。為驗(yàn)證這一估計(jì)是否正確,該研究機(jī)構(gòu)隨機(jī)抽取了一個(gè)樣本進(jìn)行檢驗(yàn)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)解:研究者想收集證據(jù)予以支持的假設(shè)是“該城市中家庭擁有汽車的比例超過30%”。建立的原假設(shè)和備擇假設(shè)為
H0:π30%H1:π30%如何提出假設(shè)(例題分析)三、有關(guān)概念2/1/2023661、備擇假設(shè)沒有特定的方向性,并含有符號(hào)“”的假設(shè)檢驗(yàn),稱為雙側(cè)檢驗(yàn)或雙尾檢驗(yàn)(two-tailedtest)
2、備擇假設(shè)具有特定的方向性,并含有符號(hào)“>”或“<”的假設(shè)檢驗(yàn),稱為單側(cè)檢驗(yàn)或單尾檢驗(yàn)(one-tailedtest)備擇假設(shè)的方向?yàn)椤?lt;”,稱為左側(cè)檢驗(yàn)
備擇假設(shè)的方向?yàn)椤?gt;”,稱為右側(cè)檢驗(yàn)
(三)雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)三、有關(guān)概念2/1/202367注:研究者感興趣的是備擇假設(shè),單側(cè)假設(shè)的方向是按備側(cè)假設(shè)的方向來說的。假設(shè)雙側(cè)檢驗(yàn)單側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)原假設(shè)H0:m
=m0H0:m
m0H0:m
m0備擇假設(shè)H1:m
≠m0H1:m
<m0H1:m
>m0(三)雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)三、有關(guān)概念2/1/202368
由于假設(shè)檢驗(yàn)是根據(jù)有限的隨機(jī)樣本信息來推斷總體特征,而樣本的隨機(jī)性可能致使判斷出錯(cuò)。
1、第I類錯(cuò)誤當(dāng)原假設(shè)為真時(shí),而拒絕原假設(shè)所犯的錯(cuò)誤,稱為第I類錯(cuò)誤或棄真錯(cuò)誤。易知犯第I類錯(cuò)誤的概率就是顯著性水平:
2、第II類錯(cuò)誤當(dāng)原假設(shè)為假時(shí),不拒絕原假設(shè)所犯的錯(cuò)誤,稱為第II類錯(cuò)誤或采偽錯(cuò)誤。犯第II類錯(cuò)誤的概率常用表示:四、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤與顯著性水平2/1/2023691)犯第I類錯(cuò)誤與犯第II類錯(cuò)誤的概率存在此消彼長的關(guān)系;
2)若要同時(shí)減少與,須增大樣本容量n;
3)通常的作法是,取較小顯著性水平,即控制犯第I類錯(cuò)誤的概率在較小的范圍內(nèi);
4)在犯第II類錯(cuò)誤的概率不好控制時(shí),將“接受原假設(shè)”更傾向于說成“不拒絕原假設(shè)”。注意:四、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤與顯著性水平2/1/2023703、假設(shè)檢驗(yàn)中的四種可能情況
H0為真H0不真不拒絕H0GoodBad/TypeIIerror
拒絕H0Bad/TypeIerrorGood4、影響錯(cuò)誤的因素1.顯著性水平當(dāng)減少時(shí)增大2.總體標(biāo)準(zhǔn)差當(dāng)增大時(shí)增大3.樣本容量n當(dāng)n減少時(shí)增大4.總體參數(shù)的真值四、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤與顯著性水平2/1/2023715、檢驗(yàn)?zāi)芰?poweroftest)拒絕一個(gè)錯(cuò)誤的原假設(shè)的能力根據(jù)的定義,是指沒有拒絕一個(gè)錯(cuò)誤的原假設(shè)的概率。這也就是說,1-
則是指拒絕一個(gè)錯(cuò)誤的原假設(shè)的概率,這個(gè)概率被稱為檢驗(yàn)?zāi)芰?也被稱為檢驗(yàn)的勢(shì)或檢驗(yàn)的功效(power)可解釋為正確地拒絕一個(gè)錯(cuò)誤的原假設(shè)的概率四、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤與顯著性水平2/1/2023726、顯著性水平(significantlevel)1)是一個(gè)概率值2)原假設(shè)為真時(shí),拒絕原假設(shè)的概率被稱為抽樣分布的拒絕域3)表示為
(alpha)常用的
值有0.01,0.05,0.104)由研究者事先確定四、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤與顯著性水平2/1/202373significant(顯著的)一詞的意義在這里并不是“重要的”,而是指“非偶然的”在假設(shè)檢驗(yàn)中,如果樣本提供的證據(jù)拒絕原假設(shè),我們說檢驗(yàn)的結(jié)果是顯著的,如果不拒絕原假設(shè),我們則說結(jié)果是不顯著的一項(xiàng)檢驗(yàn)在統(tǒng)計(jì)上是“顯著的”,意思是指:這樣的(樣本)結(jié)果不是偶然得到的,或者說,不是靠機(jī)遇能夠得到的在假設(shè)檢驗(yàn)時(shí),如果拒絕原假設(shè),則稱檢驗(yàn)結(jié)果“在統(tǒng)計(jì)上是顯著的”;如果不拒絕原假設(shè),則稱檢驗(yàn)結(jié)果“在統(tǒng)計(jì)上是不顯著的”。7、統(tǒng)計(jì)顯著性
(significant)四、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤與顯著性水平2/1/202374五、檢驗(yàn)統(tǒng)計(jì)量與拒絕域1、根據(jù)樣本觀測(cè)結(jié)果計(jì)算得到的,并據(jù)以對(duì)原假設(shè)和備擇假設(shè)作出決策的某個(gè)樣本統(tǒng)計(jì)量,稱為檢驗(yàn)統(tǒng)計(jì)量2、樣本估計(jì)量標(biāo)準(zhǔn)化的依據(jù):①原假設(shè)H0為真②點(diǎn)估計(jì)量的抽樣分布
3、對(duì)于一個(gè)總體均值和比例的檢驗(yàn),標(biāo)準(zhǔn)化的檢驗(yàn)統(tǒng)計(jì)量可表示為2/1/2023753、顯著性水平和拒絕域(1)
雙側(cè)檢驗(yàn)
H0:m
=m0H1:m
≠m0抽樣分布0臨界值臨界值a/2a/2
樣本統(tǒng)計(jì)量拒絕H0拒絕H01-置信水平五、檢驗(yàn)統(tǒng)計(jì)量與拒絕域2/1/2023763、顯著性水平和拒絕域(2)
左側(cè)檢驗(yàn)
H0:m
m0H1:m
<m00臨界值a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-置信水平五、檢驗(yàn)統(tǒng)計(jì)量與拒絕域2/1/2023773、顯著性水平和拒絕域(3)
右側(cè)檢驗(yàn)
H0:m
m0H1:m
>m00臨界值a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-置信水平五、檢驗(yàn)統(tǒng)計(jì)量與拒絕域2/1/2023785、總結(jié)決策規(guī)則給定顯著性水平,查表得出相應(yīng)的臨界值z(mì)或z/2,t或t/2將檢驗(yàn)統(tǒng)計(jì)量的值與水平的臨界值進(jìn)行比較作出決策雙側(cè)檢驗(yàn):I統(tǒng)計(jì)量I≥臨界值,拒絕H0左側(cè)檢驗(yàn):統(tǒng)計(jì)量≤臨界值,拒絕H0右側(cè)檢驗(yàn):統(tǒng)計(jì)量≥臨界值,拒絕H0五、檢驗(yàn)統(tǒng)計(jì)量與拒絕域2/1/202379在零假設(shè)為真的條件下,檢驗(yàn)統(tǒng)計(jì)量取其計(jì)算值或更加極端值(沿著備擇假設(shè)的方向)的概率稱為p值(p-value)。反映實(shí)際觀測(cè)到的數(shù)據(jù)與原假設(shè)H0之間不一致的程度也稱為觀察到的(或?qū)崪y(cè)的)顯著性水平?jīng)Q策規(guī)則:若p值≤,拒絕H0六、利用P值進(jìn)行決策1、P值及決策規(guī)則2/1/202380/
2
/
2
Z拒絕H0拒絕H00臨界值計(jì)算出的樣本統(tǒng)計(jì)量計(jì)算出的樣本統(tǒng)計(jì)量臨界值1/2P值1/2P值六、利用P值進(jìn)行決策2、各種檢驗(yàn)的P值(1)雙側(cè)檢驗(yàn)的P值2/1/2023810臨界值a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-置信水平計(jì)算出的樣本統(tǒng)計(jì)量P值六、利用P值進(jìn)行決策2、各種檢驗(yàn)的P值(2)左側(cè)檢驗(yàn)的P值2/1/2023820臨界值a拒絕H0抽樣分布1-置信水平計(jì)算出的樣本統(tǒng)計(jì)量P值六、利用P值進(jìn)行決策2、各種檢驗(yàn)的P值(3)右側(cè)檢驗(yàn)的P值2/1/202383有了P值,我們并不需要用5%或1%這類傳統(tǒng)的顯著性水平。P值提供了更多的信息,它讓我們可以選擇任意水平來評(píng)估結(jié)果是否具有統(tǒng)計(jì)上的顯著性,從而可根據(jù)我們的需要來決定是否要拒絕原假設(shè)只要你認(rèn)為這么大的P值就算是顯著了,你就可以在這樣的P值水平上拒絕原假設(shè)傳統(tǒng)的顯著性水平,如1%、5%、10%等等,已經(jīng)被人們普遍接受為“有足夠證據(jù)拒絕原假設(shè)”的標(biāo)準(zhǔn),我們大概可以說:10%代表有“一些證據(jù)”不利于原假設(shè);5%代表有“適度證據(jù)”不利于原假設(shè);1%代表有“很強(qiáng)證據(jù)”不利于原假設(shè)。六、利用P值進(jìn)行決策3、固定顯著性水平是否有意義2/1/202384用P值進(jìn)行檢驗(yàn)比根據(jù)統(tǒng)計(jì)量檢驗(yàn)提供更多的信息統(tǒng)計(jì)量檢驗(yàn)是我們事先給出的一個(gè)顯著性水平,以此為標(biāo)準(zhǔn)進(jìn)行決策,無法知道實(shí)際的顯著性水平究竟是多少比如,根據(jù)統(tǒng)計(jì)量進(jìn)行檢驗(yàn)時(shí),只要統(tǒng)計(jì)量的值落在拒絕域,我們拒絕原假設(shè)得出的結(jié)論都是一樣的,即結(jié)果顯著。但實(shí)際上,統(tǒng)計(jì)量落在拒絕域不同的地方,實(shí)際的顯著性是不同的。比如,統(tǒng)計(jì)量落在臨界值附近與落在遠(yuǎn)離臨界值的地方,實(shí)際的顯著性就有較大差異。而P值給出的是實(shí)際算出的顯著水平,它告訴我們實(shí)際的顯著性水平是多少。六、利用P值進(jìn)行決策4、
P值決策與統(tǒng)計(jì)量的比較2/1/202385拒絕H0拒絕H0的兩個(gè)統(tǒng)計(jì)量的不同顯著性Z拒絕H00統(tǒng)計(jì)量1
P1
值統(tǒng)計(jì)量2
P2
值拒絕H0臨界值六、利用P值進(jìn)行決策4、
P值決策與統(tǒng)計(jì)量的比較2/1/202386
1、提出原假設(shè)和備擇假設(shè)
原假設(shè)(或稱零假設(shè))為正待檢驗(yàn)的假設(shè):H0
備擇假設(shè)(研究假設(shè))為可供選擇的假設(shè):H1
一般地,假設(shè)有三種形式:
(1)雙側(cè)檢驗(yàn):
H0:0;H1:0
(2)左側(cè)檢驗(yàn):
H0:0;H1:<0
(3)右側(cè)檢驗(yàn):
H0:≤0;H1:>0
七、假設(shè)檢驗(yàn)的步驟2/1/202387
2、選擇適當(dāng)?shù)慕y(tǒng)計(jì)量,并確定其分布形式
統(tǒng)計(jì)量是根據(jù)所涉及的問題而定的,如總體均值、比例可選取正態(tài)分布的Z統(tǒng)計(jì)量等。
3、選擇顯著性水平或置信度,確定臨界值
顯著性水平為原假設(shè)為真時(shí),樣本點(diǎn)落在臨界值外的概率(即抽樣結(jié)果遠(yuǎn)離中心點(diǎn)的概率,它為小概率),也是原假設(shè)為真時(shí),拒絕原假設(shè)所冒的風(fēng)險(xiǎn)。
臨界值將樣本點(diǎn)所落區(qū)域分為拒絕域與非拒絕域,臨界值“外”為拒絕域,“內(nèi)”為非拒絕域。七、假設(shè)檢驗(yàn)的步驟2/1/202388通過樣本計(jì)算統(tǒng)計(jì)量的具體值,與臨界值比較,根據(jù)是否落入拒絕域來拒絕或不拒絕原假設(shè)?!y(tǒng)計(jì)量的值落在拒絕域,拒絕H0,否則不拒絕H0—也可以直接利用P值作出決策
4、作出結(jié)論2a
2a
a
a
拒絕域
拒絕域
拒絕域
(a)雙側(cè)檢驗(yàn)
(b)左側(cè)檢驗(yàn)
(c)右側(cè)檢驗(yàn)七、假設(shè)檢驗(yàn)的步驟█2/1/2023895.5一個(gè)總體參數(shù)的假設(shè)檢驗(yàn)一、一個(gè)總體參數(shù)檢驗(yàn)主要內(nèi)容二、一個(gè)總體均值的假設(shè)檢驗(yàn)三、一個(gè)總體比例的假設(shè)檢驗(yàn)四、一個(gè)總體方差的假設(shè)檢驗(yàn)2/1/202390z檢驗(yàn)(單尾和雙尾)
t檢驗(yàn)(單尾和雙尾)z
檢驗(yàn)(單尾和雙尾)
2檢驗(yàn)(單尾和雙尾)均值一個(gè)總體比例方差一、一個(gè)總體參數(shù)檢驗(yàn)主要內(nèi)容2/1/202391① 假定條件正態(tài)總體或非正態(tài)總體大樣本(n30)②使用z檢驗(yàn)統(tǒng)計(jì)量2
已知:2
未知:二、一個(gè)總體均值的假設(shè)檢驗(yàn)1、大樣本的檢驗(yàn)方法(1)假定條件及檢驗(yàn)統(tǒng)計(jì)量2/1/202392【例】一種罐裝飲料采用自動(dòng)生產(chǎn)線生產(chǎn),每罐的容量是255ml,標(biāo)準(zhǔn)差為5ml。為檢驗(yàn)每罐容量是否符合要求,質(zhì)檢人員在某天生產(chǎn)的飲料中隨機(jī)抽取了40罐進(jìn)行檢驗(yàn),測(cè)得每罐平均容量為255.8ml。取顯著性水平=0.05,檢驗(yàn)該天生產(chǎn)的飲料容量是否符合標(biāo)準(zhǔn)要求?雙側(cè)檢驗(yàn)綠色健康飲品綠色健康飲品255255二、一個(gè)總體均值的假設(shè)檢驗(yàn)1、大樣本的檢驗(yàn)方法(2)例題分析(2
已知)2/1/202393H0
:
=255H1
:
255=0.05,n
=40臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:z01.96-1.960.025拒絕H0拒絕H00.025決策:結(jié)論:
不拒絕H0樣本提供的證據(jù)表明:該天生產(chǎn)的飲料符合標(biāo)準(zhǔn)要求
解:作假設(shè)二、一個(gè)總體均值的假設(shè)檢驗(yàn)1、大樣本的檢驗(yàn)方法(2)例題分析(2
已知)2/1/202394第1步:進(jìn)入Excel表格界面,直接點(diǎn)擊“f(x)”(粘貼函數(shù))第2步:在函數(shù)分類中點(diǎn)擊“統(tǒng)計(jì)”,并在函數(shù)名的菜單下選擇“NORMSDIST”,然后確定第3步:將z的絕對(duì)值1.01錄入,得到的函數(shù)值為
0.843752345
P值=2(1-0.843752345)=0.312495
P值遠(yuǎn)遠(yuǎn)大于,故不拒絕H0二、一個(gè)總體均值的假設(shè)檢驗(yàn)1、大樣本的檢驗(yàn)方法(2)例題分析(用Excel計(jì)算正態(tài)分布P值
)2/1/202395【例】一種機(jī)床加工的零件尺寸絕對(duì)平均誤差允許值為1.35mm。生產(chǎn)廠家現(xiàn)采用一種新的機(jī)床進(jìn)行加工以期進(jìn)一步降低誤差。為檢驗(yàn)新機(jī)床加工的零件平均誤差與舊機(jī)床相比是否有顯著降低,從某天生產(chǎn)的零件中隨機(jī)抽取50個(gè)進(jìn)行檢驗(yàn)。利用這些樣本數(shù)據(jù),檢驗(yàn)新機(jī)床加工的零件尺寸的平均誤差與舊機(jī)床相比是否有顯著降低?(=0.01)左側(cè)檢驗(yàn)50個(gè)零件尺寸的誤差數(shù)據(jù)(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86二、一個(gè)總體均值的假設(shè)檢驗(yàn)1、大樣本的檢驗(yàn)方法(2)例題分析(2
未知)2/1/202396H0
:
1.35H1
:
<1.35=0.01,n
=50臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:
拒絕H0新機(jī)床加工的零件尺寸的平均誤差與舊機(jī)床相比有顯著降低決策:結(jié)論:-2.33z0拒絕H00.01解:作假設(shè)左側(cè)檢驗(yàn)二、一個(gè)總體均值的假設(shè)檢驗(yàn)1、大樣本的檢驗(yàn)方法(2)例題分析(2
未知)2/1/202397第1步:進(jìn)入Excel表格界面,直接點(diǎn)擊“f(x)”(粘貼函數(shù))第2步:在函數(shù)分類中點(diǎn)擊“統(tǒng)計(jì)”,并在函數(shù)名的菜單下選擇“ZTEST”,然后確定第3步:在所出現(xiàn)的對(duì)話框Array框中,輸入原始數(shù)據(jù)所在區(qū)域;在X后輸入?yún)?shù)的某一假定值(這里為1.35);在
Sigma后輸入已知的總體標(biāo)準(zhǔn)差(若總體標(biāo)準(zhǔn)差未知?jiǎng)t可忽略不填,系統(tǒng)將自動(dòng)使用樣本標(biāo)準(zhǔn)差代替)第4步:用1減去得到的函數(shù)值0.995421023
即為P值
P值=1-0.995421023=0.004579
P值<=0.01,拒絕H0二、一個(gè)總體均值的假設(shè)檢驗(yàn)1、大樣本的檢驗(yàn)方法(2)例題分析(用Excel計(jì)算正態(tài)分布P值
)2/1/2023980-2.33a=0.05z拒絕H0抽樣分布1-計(jì)算出的樣本統(tǒng)計(jì)量——-2.6061P值P=0.004579
二、一個(gè)總體均值的假設(shè)檢驗(yàn)1、大樣本的檢驗(yàn)方法(2)例題分析(拒絕域與P值圖示
)2/1/202399【例】某一小麥品種的平均產(chǎn)量為5200kg/hm2
。一家研究機(jī)構(gòu)對(duì)小麥品種進(jìn)行了改良以期提高產(chǎn)量。為檢驗(yàn)改良后的新品種產(chǎn)量是否有顯著提高,隨機(jī)抽取了36個(gè)地塊進(jìn)行試種,得到的樣本平均產(chǎn)量為5275kg/hm2,標(biāo)準(zhǔn)差為120kg/hm2
。試檢驗(yàn)改良后的新品種產(chǎn)量是否有顯著提高?(=0.05)右側(cè)檢驗(yàn)二、一個(gè)總體均值的假設(shè)檢驗(yàn)1、大樣本的檢驗(yàn)方法(2)例題分析(2
未知)2/1/2023100H0
:
5200H1
:
>5200=0.05,n
=36臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:
拒絕H0(P=0.000088<
=0.05)改良后的新品種產(chǎn)量有顯著提高決策:結(jié)論:z0拒絕H00.051.645解:作假設(shè)右側(cè)檢驗(yàn)二、一個(gè)總體均值的假設(shè)檢驗(yàn)1、大樣本的檢驗(yàn)方法(2)例題分析(2
未知)2/1/2023101P=0.000088
01.645a=0.05拒絕H01-計(jì)算出的樣本統(tǒng)計(jì)量=3.75P值右側(cè)檢驗(yàn)二、一個(gè)總體均值的假設(shè)檢驗(yàn)1、大樣本的檢驗(yàn)方法(2)例題分析(拒絕域與P值圖示
)抽樣分布2/1/2023102假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0:m=m0H1:
mm0H0:mm0H1:m<m0H0:
m
m0
H1:
m>m0統(tǒng)計(jì)量已知:未知:拒絕域P值決策拒絕H0二、一個(gè)總體均值的假設(shè)檢驗(yàn)1、大樣本的檢驗(yàn)方法(3)大樣本檢驗(yàn)方法小結(jié)2/1/20231031. 假定條件總體服從正態(tài)分布小樣本(n<
30)檢驗(yàn)統(tǒng)計(jì)量2
已知:2
未知:二、一個(gè)總體均值的假設(shè)檢驗(yàn)2、小樣本的檢驗(yàn)方法(1)假定條件及檢驗(yàn)統(tǒng)計(jì)量2/1/2023104【例】一種汽車配件的平均長度要求為12cm,高于或低于該標(biāo)準(zhǔn)均被認(rèn)為是不合格的。汽車生產(chǎn)企業(yè)在購進(jìn)配件時(shí),通常是經(jīng)過招標(biāo),然后對(duì)中標(biāo)的配件提供商提供的樣品進(jìn)行檢驗(yàn),以決定是否購進(jìn)?,F(xiàn)對(duì)一個(gè)配件提供商提供的10個(gè)零件進(jìn)行了檢驗(yàn)。假定該供貨商生產(chǎn)的配件長度服從正態(tài)分布,在0.05的顯著性水平下,檢驗(yàn)該供貨商提供的配件是否符合要求?10個(gè)零件尺寸的長度(cm)12.210.812.011.811.912.411.312.212.012.3樣本二、一個(gè)總體均值的假設(shè)檢驗(yàn)2、小樣本的檢驗(yàn)方法(2)例題分析2/1/2023105H0
:
=12H1
:
12=0.05df
=10-1=9臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:
不拒絕H0該供貨商提供的零件符合要求
決策:結(jié)論:t02.262-2.2620.025拒絕
H0拒絕H00.025解:二、一個(gè)總體均值的假設(shè)檢驗(yàn)2、小樣本的檢驗(yàn)方法(2)例題分析2/1/2023106第1步:進(jìn)入Excel表格界面,直接點(diǎn)擊“f(x)”(粘貼函數(shù))第2步:在函數(shù)分類中點(diǎn)擊“統(tǒng)計(jì)”,并在函數(shù)名的菜單下選擇“TDIST”,然后確定第3步:在出現(xiàn)對(duì)話框的X欄中輸入計(jì)算出的t的絕對(duì)值
0.7053,在Deg-freedom(自由度)欄中輸入本例的自由度9,在Tails欄中輸入2(表明是雙側(cè)檢驗(yàn),如果是單側(cè)檢驗(yàn)則在該欄輸入1)第4步:P值=0.498469786
P值>=0.05,故不拒絕H0
二、一個(gè)總體均值的假設(shè)檢驗(yàn)2、小樣本的檢驗(yàn)方法(2)例題分析(用Excel計(jì)算t分布P值)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)院業(yè)務(wù)副院長職責(zé)(五篇)
- 網(wǎng)絡(luò)課程設(shè)計(jì)的分類
- 網(wǎng)頁課程設(shè)計(jì)摘要模板
- 網(wǎng)上書店c 課程設(shè)計(jì)
- 微機(jī)原理通訊錄課程設(shè)計(jì)
- 聯(lián)想記憶課程設(shè)計(jì)
- 電話禮儀課程設(shè)計(jì)
- 職工系統(tǒng)Delphi課程設(shè)計(jì)
- 家政保潔公司營業(yè)員服務(wù)總結(jié)
- 美的物流課程設(shè)計(jì)
- 中藥材及飲片性狀鑒別1總結(jié)課件
- 信息系統(tǒng)及信息安全運(yùn)維服務(wù)項(xiàng)目清單
- 最新大壩固結(jié)灌漿生產(chǎn)性試驗(yàn)大綱
- DB32-T 2948-2016水利工程卷揚(yáng)式啟閉機(jī)檢修技術(shù)規(guī)程-(高清現(xiàn)行)
- 公司EHS(安全、環(huán)保、職業(yè)健康)檢查表
- 《模擬電子技術(shù)基礎(chǔ)》課程設(shè)計(jì)-心電圖儀設(shè)計(jì)與制作
- 繪本brown bear教案及反思
- 精品電力工程質(zhì)量目標(biāo)、質(zhì)量保證體系及技術(shù)組織措施
- 川中干法脫硫
- 船舶PSC檢查表(全船)
- 檳榔黃化病的診斷及防控
評(píng)論
0/150
提交評(píng)論