




下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
還有一本書(shū),上周一晚上才第一次見(jiàn)到
《統(tǒng)計(jì)學(xué):從數(shù)據(jù)到結(jié)論---學(xué)習(xí)指導(dǎo)與習(xí)題》
(很多學(xué)校老師的工作)
中國(guó)統(tǒng)計(jì)出版社
ISBN7-5037-4780-3/C.2086
集體買(mǎi)從32元減為?元?王威(),徐占波:63266695或63266600-30407統(tǒng)計(jì)推斷從數(shù)據(jù)得到對(duì)現(xiàn)實(shí)世界的結(jié)論的過(guò)程估計(jì)總體代表我們所關(guān)心的那部分世界。而在利用樣本中的信息來(lái)對(duì)總體進(jìn)行推斷之前人們往往對(duì)代表總體的變量假定了分布族。(描述數(shù)據(jù)時(shí)不用假定)比如假定人們的身高屬于正態(tài)分布族;在抽樣調(diào)查時(shí)假定了二項(xiàng)分布族等等(這些假定可能有風(fēng)險(xiǎn)!)。這些模型基本上是根據(jù)“經(jīng)驗(yàn)”來(lái)假定的,僅僅是對(duì)現(xiàn)實(shí)世界的一個(gè)近似。估計(jì)
在假定了總體分布族之后,進(jìn)一步對(duì)總體的認(rèn)識(shí)就是要在這個(gè)分布族中選擇一個(gè)適合于我們問(wèn)題的成員由于分布族成員是由參數(shù)確定的,如果參數(shù)能夠估計(jì),對(duì)總體的具體分布就知道得差不多了。估計(jì)量是用來(lái)估計(jì)的統(tǒng)計(jì)量
我們知道,統(tǒng)計(jì)量是樣本的不包含未知參數(shù)的函數(shù)。樣本均值、樣本標(biāo)準(zhǔn)差都是統(tǒng)計(jì)量。由于樣本是隨機(jī)的,統(tǒng)計(jì)量也是隨機(jī)變量。用于估計(jì)總體參數(shù)的統(tǒng)計(jì)量稱為估計(jì)量;樣本均值和標(biāo)準(zhǔn)差都是總體均值和標(biāo)準(zhǔn)差的常用估計(jì)量。點(diǎn)估計(jì)和區(qū)間估計(jì)點(diǎn)估計(jì)(pointestimation)就是用估計(jì)量的實(shí)現(xiàn)值來(lái)近似相應(yīng)的總體參數(shù)。區(qū)間估計(jì)(intervalestimation)是包括估計(jì)量在內(nèi)(有時(shí)是以估計(jì)量為中心)的一個(gè)區(qū)間;被認(rèn)為很可能包含總體參數(shù)。點(diǎn)估計(jì)給出一個(gè)數(shù)字,用起來(lái)很方便;而區(qū)間估計(jì)給出一個(gè)區(qū)間,說(shuō)起來(lái)留有余地;不象點(diǎn)估計(jì)那么絕對(duì)。無(wú)偏估計(jì)(大樣本性質(zhì))區(qū)間估計(jì)
注意置信區(qū)間的論述是由區(qū)間和置信度兩部分組成。置信區(qū)間是對(duì)參數(shù)給出的一個(gè)范圍置信度為其可信程度(大樣本意義)有些新聞媒體報(bào)道一些調(diào)查結(jié)果只給出百分比和誤差(即置信區(qū)間),比如“收視率為53%±3%”;
不給出置信度,也不給出被調(diào)查的人數(shù)這是不負(fù)責(zé)的表現(xiàn)。區(qū)間估計(jì)
降低置信度可以使置信區(qū)間變窄(顯得“精確”),有誤導(dǎo)讀者之嫌。如果給出被調(diào)查的人數(shù),則內(nèi)行可以由此推算出置信度,反之亦然。一個(gè)描述性例子
一個(gè)有10000個(gè)人回答的調(diào)查顯示,同意某種觀點(diǎn)的人的比例為70%(有7000人同意),可以算出總體中同意該觀點(diǎn)的比例的95%置信區(qū)間為(0.691,0.709);另一個(gè)調(diào)查聲稱有70%的比例反對(duì)該種觀點(diǎn),還說(shuō)總體中反對(duì)該觀點(diǎn)的置信區(qū)間也是(0.691,0.709)。一個(gè)描述性例子實(shí)際上,第二個(gè)調(diào)查隱瞞了置信度(等價(jià)于隱瞞了樣本量)。如果第二個(gè)調(diào)查僅僅調(diào)查了50個(gè)人,有35個(gè)人反對(duì)該觀點(diǎn)。根據(jù)后面的公式可以算出,第二個(gè)調(diào)查的置信區(qū)間的置信度僅有11%。區(qū)間估計(jì)的意義
置信度的概念為大量重復(fù)抽樣時(shí)的一個(gè)漸近概念。類似于“我們目前得到的置信度為95%的置信區(qū)間(比如上面的75%±3%)以概率0.95覆蓋真正的比例p”的說(shuō)法是錯(cuò)誤的。實(shí)際上應(yīng)該說(shuō)“重復(fù)類似的抽樣所得到的大量區(qū)間中有大約95%的覆蓋真實(shí)比例(其值可能永遠(yuǎn)未知)。區(qū)間估計(jì)的意義
這里的區(qū)間(72%,78%)是固定的,而總體比例p也是固定的值。因此只有兩種可能:或者該區(qū)間包含總體比例,或者不包含;這當(dāng)中沒(méi)有任何概率可言。至于區(qū)間(72%,78%)是否覆蓋真實(shí)比例,除非一個(gè)不漏地調(diào)查所有的人,否則永遠(yuǎn)也無(wú)法知道。均值m的區(qū)間估計(jì)(正態(tài)分布)總體標(biāo)準(zhǔn)差s已知總體標(biāo)準(zhǔn)差s未知區(qū)間估計(jì)的例子(1)例5.1
(數(shù)據(jù):noodle.txt,noodle.sav,noodle.sas7bdat)某廠家生產(chǎn)的掛面包裝上寫(xiě)明“凈含量450克”。在用天平稱量了商場(chǎng)中的48包掛面之后,得到樣本量為48的關(guān)于掛面重量(單位:克)的一個(gè)樣本(我們假定,掛面重量所代表的總體分布服從正態(tài)分布。):449.5461.1457.5444.7456.1454.7441.5446.0454.9446.2457.3446.1456.7451.4452.5452.4442.0452.1452.8442.9449.8452.4458.5442.7447.9450.5448.3451.4449.7446.7441.7455.6442.9451.3452.9457.2448.5444.5443.1442.3439.6446.5447.2445.8449.4441.6444.7441.4w=scan("D:/booktj1/data/noodle.txt");hist(w,10)summary(w)Min.1stQu.MedianMean3rdQu.Max.439.6444.6448.9449.0452.6461.1SPSS不同樣本量和不同置信度的置信區(qū)間的長(zhǎng)短和覆蓋狀況例5.2(數(shù)據(jù):height2.txt,height2.sav,height21.sav,height22.sas7bdat)這是兩個(gè)地區(qū)大學(xué)生的高度數(shù)據(jù);這里,我們假定身高服從正態(tài)分布。在height2.sav數(shù)據(jù)中這兩個(gè)地區(qū)學(xué)生的高度分別用變量x1和x2表示。而在height21.sav數(shù)據(jù)中,它們?yōu)橐粋€(gè)變量height,但用另一個(gè)變量group來(lái)標(biāo)明它們屬于哪個(gè)地區(qū)。區(qū)間估計(jì)的例子(2)
(a)我們想要分別得到這兩個(gè)總體均值和標(biāo)準(zhǔn)差的點(diǎn)估計(jì)(即樣本均值和樣本標(biāo)準(zhǔn)差)和各自總體均值的95%置信區(qū)間。利用height2.sav,SPSS得到:作為兩個(gè)總體均值估計(jì)量的樣本均值分別為170.56和165.60,而樣本標(biāo)準(zhǔn)差分別為6.97857和7.55659;還得到均值的置信區(qū)間分別是(168.5767,172.5433)及(163.4524,167.7476)。(計(jì)算機(jī)輸出很容易明白,這里不顯示。)(b)求兩個(gè)均值差m1-m2的點(diǎn)估計(jì)和95%置信區(qū)間。根據(jù)數(shù)據(jù)height2.sav,利用軟件很容易得到下面結(jié)果區(qū)間估計(jì)的例子(2)
輸出表的頭兩列是檢驗(yàn)(見(jiàn)下面一章的檢驗(yàn))是否方差相等,如果Sig下面的數(shù)目(下一章的p值概念)較大(比如大于0.05)則沒(méi)有證據(jù)認(rèn)為這兩個(gè)數(shù)據(jù)總體的方差不等,則看表的第一行結(jié)果,否則認(rèn)為方差不等,則看表的第二行結(jié)果。這里Sig(p值)等于0.556,因此看第一行結(jié)果。于是,我們得到兩個(gè)樣本均值的差(4.9600),另外還給出了兩總體均值差的95%置信區(qū)間(2.073,7.847)??傮w比例(Bernoulli試驗(yàn)成功概率)p的區(qū)間估計(jì)(大總體、大樣本)例5.3在一個(gè)大都市中對(duì)1341人的隨機(jī)調(diào)查結(jié)果顯示,有934個(gè)人支持限制小轎車的政策。假定該樣本為簡(jiǎn)單隨機(jī)樣本,希望找出總體中支持限制小轎車的人的比例的點(diǎn)估計(jì)及其置信度為95%的置信區(qū)間。n=1341;x=934CI1=function(n,x,alpha){p=x/n;za=qnorm(alpha/2,low=F)a=sqrt(p*(1-p)/n);b=za*a;L1=p-b;L2=p+b;list(1-alpha,L1,L2)}CI1(n,x,.05)得到(0.672,0.721)總體比例(Bernoulli試驗(yàn)成功概率)之差
p1
-p2的區(qū)間估計(jì)(大樣本、大總體)例5.4
在兩個(gè)地區(qū)對(duì)于某商品認(rèn)可與否的調(diào)查結(jié)果顯示,第一個(gè)地區(qū)被調(diào)查的950人中有423人認(rèn)可,而在第二個(gè)地區(qū)的被調(diào)查的1102人中只有215人認(rèn)可。求這兩個(gè)總體比例之差p1
-p2的95%置信區(qū)間。得到(0.211,0.289)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)在假設(shè)檢驗(yàn)中,一般要設(shè)立一個(gè)原假設(shè);而設(shè)立該假設(shè)的動(dòng)機(jī)主要是企圖利用人們掌握的反映現(xiàn)實(shí)世界的數(shù)據(jù)來(lái)找出假設(shè)和現(xiàn)實(shí)的矛盾,從而否定這個(gè)假設(shè)。假設(shè)檢驗(yàn)在多數(shù)統(tǒng)計(jì)教科書(shū)中(除了理論探討之外),假設(shè)檢驗(yàn)都是以否定原假設(shè)為目標(biāo)。如否定不了,那就說(shuō)明證據(jù)不足,無(wú)法否定原假設(shè)。但這不能說(shuō)明原假設(shè)正確。很多教科書(shū)在這個(gè)問(wèn)題上不適當(dāng)?shù)赜谩敖邮茉僭O(shè)”的說(shuō)法,犯了明顯的低級(jí)邏輯錯(cuò)誤。假設(shè)檢驗(yàn)的過(guò)程和邏輯首先要提出一個(gè)原假設(shè),比如某正態(tài)總體的均值等于5(m=5)。這種原假設(shè)也稱為零假設(shè)(nullhypothesis),記為H0與此同時(shí)必須提出對(duì)立假設(shè),比如總體均值大于5(m>5)。對(duì)立假設(shè)又稱為備選假設(shè)或備擇假設(shè)(alternativehypothesis)記為記為H1或Ha假設(shè)檢驗(yàn)的過(guò)程和邏輯根據(jù)零假設(shè)(不是備選假設(shè)?。?,我們可以得到該檢驗(yàn)統(tǒng)計(jì)量的分布;然后再看這個(gè)統(tǒng)計(jì)量的數(shù)據(jù)實(shí)現(xiàn)值(realization)屬不屬于小概率事件。也就是說(shuō)把數(shù)據(jù)代入檢驗(yàn)統(tǒng)計(jì)量,看其值是否落入零假設(shè)下的小概率范疇如果的確是小概率事件,那么我們就有可能拒絕零假設(shè),否則我們說(shuō)沒(méi)有足夠證據(jù)拒絕零假設(shè)。假設(shè)檢驗(yàn)的過(guò)程和邏輯注意:零假設(shè)和備選假設(shè)在我們涉及的假設(shè)檢驗(yàn)中并不對(duì)稱。檢驗(yàn)統(tǒng)計(jì)量的分布是從零假設(shè)導(dǎo)出的,因此,如果有矛盾,當(dāng)然就不利于零假設(shè)了。不發(fā)生矛盾也不說(shuō)明備選假有問(wèn)題。假設(shè)檢驗(yàn)的過(guò)程和邏輯檢驗(yàn)統(tǒng)計(jì)量在零假設(shè)下,等于這個(gè)樣本的數(shù)據(jù)實(shí)現(xiàn)值或更加極端值的概率稱為p-值(p-value)。顯然得到很小p-值意味著小概率事件發(fā)生了。如果小概率事件發(fā)生,是相信零假設(shè),還是相信數(shù)據(jù)呢?當(dāng)然是相信數(shù)據(jù)。于是就拒絕零假設(shè)。但事件概率小并不意味著不會(huì)發(fā)生,僅僅發(fā)生的概率很小罷了。拒絕正確零假設(shè)的錯(cuò)誤常被稱為第一類錯(cuò)誤(typeIerror)。假設(shè)檢驗(yàn)的過(guò)程和邏輯不僅有第一類錯(cuò)誤,還有第二類錯(cuò)誤;那是備選假設(shè)正確時(shí)反而說(shuō)零假設(shè)正確的錯(cuò)誤,稱為第二類錯(cuò)誤(typeIIerror)。如要“接受零假設(shè)”就必須給出第二類錯(cuò)誤的概率.但對(duì)于目前面對(duì)的問(wèn)題,無(wú)法計(jì)算它.假設(shè)檢驗(yàn)的過(guò)程和邏輯零假設(shè)和備選假設(shè)哪一個(gè)正確,這是確定性的,沒(méi)有概率可言。而可能犯錯(cuò)誤的是人。涉及假設(shè)檢驗(yàn)的犯錯(cuò)誤的概率就是犯第一類錯(cuò)誤的概率和犯第二類錯(cuò)誤的概率。負(fù)責(zé)的態(tài)度是無(wú)論做出什么決策,都應(yīng)該給出犯錯(cuò)誤的概率。假設(shè)檢驗(yàn)的過(guò)程和邏輯到底p-值是多小才能夠拒絕零假設(shè)呢?也就是說(shuō),需要有什么是小概率的標(biāo)準(zhǔn)。這要看具體應(yīng)用的需要。但在一般的統(tǒng)計(jì)書(shū)和軟件中,使用最多的標(biāo)準(zhǔn)是在零假設(shè)下(或零假設(shè)正確時(shí))抽樣所得的數(shù)據(jù)拒絕零假設(shè)的概率應(yīng)小于0.05(也可能是0.01,0.005,0.001等等)。假設(shè)檢驗(yàn)的過(guò)程和邏輯這種事先規(guī)定的概率稱為顯著性水平(significantlevel),用字母a來(lái)表示。當(dāng)p-值小于或等于a時(shí),就拒絕零假設(shè)。所以,a是所允許的犯第一類錯(cuò)誤概率的最大值。當(dāng)p-值小于或等于a時(shí),我們說(shuō)這個(gè)檢驗(yàn)是顯著的(significant)。假設(shè)檢驗(yàn)的過(guò)程和邏輯歸納起來(lái),假設(shè)檢驗(yàn)的邏輯步驟為:第一:寫(xiě)出零假設(shè)和備選假設(shè);第二:確定檢驗(yàn)統(tǒng)計(jì)量;第三:確定顯著性水平a;第四:根據(jù)數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的實(shí)現(xiàn)值;第五:根據(jù)這個(gè)實(shí)現(xiàn)值計(jì)算p-值;第六:進(jìn)行判斷:如果p-值小于或等于a,就拒絕零假設(shè),這時(shí)犯錯(cuò)誤的概率最多為a;如果p-值大于a,就不拒絕零假設(shè),因?yàn)樽C據(jù)不足。假設(shè)檢驗(yàn)的過(guò)程和邏輯實(shí)際上,計(jì)算機(jī)軟件僅僅給出p-值,而不給出a。這有很多方便之處。比如a=0.05,而假定我們得到的p-值等于0.001。這時(shí)我們?nèi)绻绻捎胮-值作為新的顯著性水平,即a=0.001,于是可以說(shuō),我們拒絕零假設(shè),顯著性水平為0.001。拒絕零假設(shè)時(shí)犯錯(cuò)誤的概率實(shí)際只是千分之一而不是百分之五。在這個(gè)意義上,p-值又稱為觀測(cè)的顯著性水平(observedsignificantlevel)。在統(tǒng)計(jì)軟件輸出p-值的位置,有的用“p-value”,有的用significant的縮寫(xiě)“Sig”就是這個(gè)道理。假設(shè)檢驗(yàn)的過(guò)程和邏輯關(guān)于“臨界值”的注:作為概率的顯著性水平a實(shí)際上相應(yīng)于一個(gè)檢驗(yàn)統(tǒng)計(jì)量取值范圍的一個(gè)臨界值(criticalvalue),它定義為,統(tǒng)計(jì)量取該值或更極端的值的概率等于a。也就是說(shuō),“統(tǒng)計(jì)量的實(shí)現(xiàn)值比臨界值更極端”等價(jià)于“p-值小于a”。使用臨界值的概念進(jìn)行的檢驗(yàn)不計(jì)算p-值。只比較統(tǒng)計(jì)量的取值和臨界值的大小。假設(shè)檢驗(yàn)的過(guò)程和邏輯使用臨界值而不是p-值來(lái)判斷拒絕與否是前計(jì)算機(jī)時(shí)代的產(chǎn)物。當(dāng)時(shí)計(jì)算p-值不易,只有采用臨界值的概念。但從給定的a求臨界值同樣也不容易,好在習(xí)慣上僅僅在教科書(shū)中列出相應(yīng)于特定分布的幾個(gè)有限的a臨界值(比如a=0.05,a=0.025,a=0.01,a=0.005,a=0.001等等),或者根據(jù)分布表反過(guò)來(lái)查臨界值(很不方便也很粗糙)?,F(xiàn)在計(jì)算機(jī)軟件都不給出a和臨界值,但都給出p-值和統(tǒng)計(jì)量實(shí)現(xiàn)值,讓用戶自己決定顯著性水平是多少。假設(shè)檢驗(yàn)的例子例6.1(數(shù)據(jù):sugar.txt,sugar.sav,sugar.sas7bdat)一個(gè)顧客買(mǎi)了一包標(biāo)有500g重的一包紅糖,覺(jué)得份量不足,于是找到監(jiān)督部門(mén);當(dāng)然他們會(huì)覺(jué)得一包份量不夠可能是隨機(jī)的。于是監(jiān)督部門(mén)就去商店稱了50包紅糖;得到均值(平均重量)是498.35g;這的確比500g少,但這是否能夠說(shuō)明廠家生產(chǎn)的這批紅糖平均起來(lái)不夠份量呢?首先,可以畫(huà)出這些重量的直方圖(圖6.1)。這個(gè)直方圖看上去象是正態(tài)分布的樣本。于是不妨假定這一批袋裝紅糖呈正態(tài)分布。su=scan("D:/booktj1/data/sugar.txt");hist(su)假設(shè)檢驗(yàn)的例子檢驗(yàn)統(tǒng)計(jì)量為(為什么用這個(gè)?)這次我們的假設(shè)檢驗(yàn)問(wèn)題就是>t.test(su,m=500,alt="less")OneSamplet-testdata:sut=-2.6962,df=49,p-value=0.004793alternativehypothesis:truemeanislessthan50095percentconfidenceinterval:-Inf499.3749sampleestimates:meanofx498.3472SPSSp-value=0.004793=0.009586/2假設(shè)檢驗(yàn)的例子(exh.txt,exh.sav
)汽車廠商聲稱其發(fā)動(dòng)機(jī)排放標(biāo)準(zhǔn)的一個(gè)指標(biāo)平均低于20個(gè)單位。在抽查了10臺(tái)發(fā)動(dòng)機(jī)之后,得到下面的排放數(shù)據(jù):17.0、21.7、17.9、22.9、20.7、22.4、17.3、21.8、24.2、25.4。該樣本均值為21.13。究竟能否由此認(rèn)為該指標(biāo)均值超過(guò)20?這次我們的假設(shè)檢驗(yàn)問(wèn)題就是假設(shè)檢驗(yàn)的例子檢驗(yàn)統(tǒng)計(jì)量為我們可以發(fā)現(xiàn)p-值為0.1243,因此,我們沒(méi)有證據(jù)否定零假設(shè)(如果顯著性水平小于它)。例6.3
(數(shù)據(jù):drug.txt,drug.sav,drug.sas7bdat)為檢測(cè)某種藥物對(duì)攻擊性情緒的影響,對(duì)處理組的100名服藥者和對(duì)照組的150名非服藥者進(jìn)行心理測(cè)試,得到相應(yīng)的某指標(biāo)。我們要檢驗(yàn)處理組指標(biāo)的總體均值m1是否等于對(duì)照組的指標(biāo)的總體均值m2例6.4(數(shù)據(jù):diet.txt,diet.xls,diet.sav,diet.sas7bdat)。這里有兩列50對(duì)減肥數(shù)據(jù)。其中一列數(shù)據(jù)(變量是before)是減肥前的重量,另一列(變量是after)是減肥后的重量(單位:公斤)。我們要比較50個(gè)人在減肥前和減肥后的重量。這樣就有了兩個(gè)樣本,每個(gè)都有50個(gè)數(shù)目。這里不能用前面的獨(dú)立樣本均值差的檢驗(yàn);這是因?yàn)閮蓚€(gè)樣本并不獨(dú)立。每一個(gè)人減肥后的重量都和自己減肥前的重量有關(guān)。但不同人之間卻是獨(dú)立的。令所有個(gè)體減肥前后重量差(減肥前重量減去減肥后重量)的均值為mD;例6.5(數(shù)據(jù):two.txt,twop.sav)對(duì)于評(píng)價(jià)電視節(jié)目,收視率是個(gè)重要的指標(biāo)。一個(gè)電話調(diào)查表明,在某一節(jié)目播出的時(shí)候,被訪的正在觀看電視的人中有23%的正在觀看這個(gè)節(jié)目?,F(xiàn)在想知道,這是否和該節(jié)目的制作人所期望的p0=25%有顯著不足。這顯然是一個(gè)參數(shù)為p的二項(xiàng)分布問(wèn)題。這個(gè)數(shù)值用手算也不費(fèi)力氣。請(qǐng)注意,前面第五章提起過(guò),即使被訪者的百分比一樣,但樣本少的信息就少。對(duì)于假設(shè)檢驗(yàn)也是一樣。樣本量對(duì)于假設(shè)檢驗(yàn)的結(jié)果就十分重要。對(duì)于本例,現(xiàn)在還未給出樣本量n呢。下面看看不同的樣本量會(huì)得到什么結(jié)果(假定不變)。假定樣本量為n=1500(和數(shù)據(jù)給的一樣),那么,上面的檢驗(yàn)得到的精確p值為0.0384,而正態(tài)近似的p值為0.0368。因此,可以認(rèn)為(如果選顯著性水平為0.05的話)說(shuō)收視率有25%是過(guò)分了,即拒絕零假設(shè)。用R軟件,輸入pnorm((.23-.25)/sqrt(.25*.75/1500))得到p值為0.03681914。假定樣本量為n=100,那么,上面的檢驗(yàn)得到的精確p值為0.371,而正態(tài)近似的檢驗(yàn)得到的p值為0.3221。因此,沒(méi)有足夠的理由拒絕收視率有25%的零假設(shè)(如果選顯著性水平為0.05的話)。用R軟件,直接輸入pbinom(0.23*100,100,.25)得到p值為0.3710793。用R軟件,輸入pnorm((.23-.25)/sqrt(.25*.75/100))得到p值為0.3220836。為什么不能“接受零假設(shè)”
其實(shí)可以,比如下面兩種情況:1.備選假設(shè)也是單點(diǎn)分布,這時(shí)可以負(fù)責(zé)地算出犯第二類錯(cuò)誤的概率。2.貝葉斯檢驗(yàn)情況(這是一種決策觀點(diǎn))但在經(jīng)典統(tǒng)計(jì)中的絕大多數(shù)情況都不可以。從一個(gè)例子看“接受零假設(shè)”
(數(shù)據(jù)rice.sav)一個(gè)大米加工廠賣(mài)給一個(gè)超市一批標(biāo)明10kg重的大米。而該超市懷疑該廠家缺斤短兩,對(duì)10包大米進(jìn)行了稱重,得到下面結(jié)果(單位:千克)9.939.839.769.9510.079.8910.039.979.899.87這里假定打包的大米重量服從正態(tài)分布。由于發(fā)生分歧,于是各方同意用這個(gè)數(shù)據(jù)進(jìn)行關(guān)于大米重量均值m的檢驗(yàn);以廠家所說(shuō)的平均重量為10kg作為零假設(shè),而以超市懷疑的份量不足10kg作為備選假設(shè):1.超市的檢驗(yàn)
于是,超市、加工廠老板和該老板的律師都進(jìn)行了檢驗(yàn)。結(jié)果是:超市用全部數(shù)據(jù)進(jìn)行t檢驗(yàn),得到拒絕零假設(shè)的結(jié)論。他們根據(jù)計(jì)算得到:樣本均值為9.92kg,而p-值為0.0106。因此超市認(rèn)為,對(duì)于顯著性水平a=0.05,應(yīng)該拒絕零假設(shè)。2.加工廠老板的檢驗(yàn)大米加工廠老板只用2個(gè)數(shù)據(jù),得到“接受零假設(shè)”的結(jié)論。大米加工廠老板也懂些統(tǒng)計(jì),他只取了上面樣本的頭兩個(gè)個(gè)數(shù)目9.93和9.83進(jìn)行同樣的t檢驗(yàn)。通過(guò)對(duì)這兩個(gè)數(shù)進(jìn)行計(jì)算得到:樣本均值為9.88kg,而p-值為0.1257.雖然樣本均值不如超市檢驗(yàn)的大,但p-值大大增加。加工廠老板于是下了結(jié)論:對(duì)于水平a=0.05,“接受零假設(shè)”,即加工廠的大米平均重量的確為10kg。3.加工廠老板律師的檢驗(yàn)大米加工廠老板的律師用了全部數(shù)據(jù),但不同的檢驗(yàn)方法,得到“接受零假設(shè)”的結(jié)論。大米加工廠老板的律師說(shuō)可以用全部數(shù)據(jù)。他利用對(duì)于連續(xù)變量比例的檢驗(yàn),也就是關(guān)于中位數(shù)的符號(hào)檢驗(yàn)(注意對(duì)于正態(tài)分布,對(duì)中位數(shù)的檢驗(yàn)等價(jià)于對(duì)均值的檢驗(yàn))。根據(jù)計(jì)算,得到該檢驗(yàn)的p-值為0.0547。所以這個(gè)律師說(shuō)在顯著性水平a=0.05時(shí),應(yīng)該“接受零假設(shè)”。還說(shuō),“既然三個(gè)檢驗(yàn)中有兩個(gè)都接受零假設(shè),就應(yīng)該接受?!比绾卧u(píng)價(jià)?加工廠老板實(shí)際上減少了作為證據(jù)的數(shù)據(jù),因此只得到“證據(jù)不
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 南召縣2025屆數(shù)學(xué)四年級(jí)第二學(xué)期期末檢測(cè)模擬試題含解析
- 資產(chǎn)配置一線實(shí)戰(zhàn)課程知到課后答案智慧樹(shù)章節(jié)測(cè)試答案2025年春上海財(cái)經(jīng)大學(xué)
- 南通大學(xué)《現(xiàn)代生物儀器分析》2023-2024學(xué)年第二學(xué)期期末試卷
- 山西大同市第一中學(xué)2025年高三下學(xué)期學(xué)業(yè)質(zhì)量監(jiān)測(cè)(二模)英語(yǔ)試題含解析
- 廈門(mén)演藝職業(yè)學(xué)院《綠色建筑與綠色施工》2023-2024學(xué)年第二學(xué)期期末試卷
- 韓山師范學(xué)院《建設(shè)監(jiān)理1》2023-2024學(xué)年第二學(xué)期期末試卷
- 安徽省滁州市部分高中2025年高三第一次聯(lián)考試卷(英語(yǔ)試題文)試題含解析
- 廣州華立科技職業(yè)學(xué)院《日語(yǔ)綜合能力訓(xùn)練(2)》2023-2024學(xué)年第一學(xué)期期末試卷
- 古詩(shī)表達(dá)技巧
- 公共交通乘客服務(wù)評(píng)價(jià)制度
- 江蘇省鎮(zhèn)江市2024-2025學(xué)年高三下學(xué)期開(kāi)學(xué)檢測(cè)語(yǔ)文試題 含解析
- 2025年咸陽(yáng)職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)完整版
- 公路養(yǎng)護(hù)服務(wù)方案(技術(shù)方案)
- 早泄診斷及治療
- 2025年不離婚互不干涉協(xié)議模板
- 2024年江西司法警官職業(yè)學(xué)院高職單招語(yǔ)文歷年參考題庫(kù)含答案解析
- 2025年云南云天化股份有限公司招聘筆試參考題庫(kù)含答案解析
- 招標(biāo)代理機(jī)構(gòu)選取招標(biāo)代理工作計(jì)劃及流程
- 2025年全國(guó)法制宣傳日普法知識(shí)競(jìng)賽題庫(kù)及答案(共200題)
- 2025年山西交控集團(tuán)招聘109人管理單位筆試遴選500模擬題附帶答案詳解
- 法律談判實(shí)務(wù)完整版課件全套教學(xué)ppt教程
評(píng)論
0/150
提交評(píng)論