假設(shè)檢驗若干問題的研究與應(yīng)用_第1頁
假設(shè)檢驗若干問題的研究與應(yīng)用_第2頁
假設(shè)檢驗若干問題的研究與應(yīng)用_第3頁
假設(shè)檢驗若干問題的研究與應(yīng)用_第4頁
假設(shè)檢驗若干問題的研究與應(yīng)用_第5頁
已閱讀5頁,還剩24頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 學(xué)號:200821哈爾濱師范大學(xué)學(xué)士學(xué)位論文題目 假設(shè)檢驗若干問題的研究與應(yīng)用學(xué) 生 指導(dǎo)教師 講師年 級 2008級專 業(yè) 數(shù)學(xué)與應(yīng)用數(shù)學(xué)系 別 數(shù)學(xué)系學(xué) 院 數(shù)學(xué)科學(xué)學(xué)院哈 爾 濱 師 范 大 學(xué)學(xué)士學(xué)位論文開題報告論文題目 假設(shè)檢驗若干問題的研究與應(yīng)用學(xué)生姓名 指導(dǎo)教師 講師年 級 2008級專 業(yè) 數(shù)學(xué)與應(yīng)用數(shù)學(xué)2011年 11 月說 明本表需在指導(dǎo)教師和有關(guān)領(lǐng)導(dǎo)審查批準(zhǔn)的情況下,要求學(xué)生認真填寫說明課題的來源(自擬題目或指導(dǎo)教師承擔(dān)的科研任務(wù))、課題研究的目的和意義、課題在國內(nèi)外研究現(xiàn)狀和發(fā)展趨勢若課題因故變動時,應(yīng)向指導(dǎo)教師提出申請,提交題目變動論證報告課題來源:由指導(dǎo)教師提供課

2、題研究的目的和意義:假設(shè)檢驗是統(tǒng)計推斷的一個重要內(nèi)容,也是在實際工作中經(jīng)常遇到的,假設(shè)檢驗提出問題和結(jié)局問題的方法有其獨特之處.提出的問題要求定性的回答,回答的方法卻是用定量的數(shù)學(xué)工具,而其中又有重要的定性的因素:顯著性水平的選擇問題解決的本質(zhì)是歸納的方法,推理過程中,最主要的依據(jù)是基于小概率事件的不可能原理,這是演繹推理過程.假設(shè)檢驗不僅提供了一種重要的實用的統(tǒng)計推斷方法,其處理問題的思想在實際的應(yīng)用中也是很值得深入研究和借鑒的國內(nèi)外同類課題研究現(xiàn)狀及發(fā)展趨勢:假設(shè)檢驗推理思想是解決問題一種常用的思維方法,無論是在日常生活還是科學(xué)發(fā)明中,它都是一種重要的啟發(fā)式思維策略統(tǒng)計假設(shè)檢驗是統(tǒng)計學(xué)中一

3、個重要概念.隨著科學(xué)技術(shù)的發(fā)展,一些新的統(tǒng)計假設(shè)檢驗理論與方法被發(fā)現(xiàn),推動了統(tǒng)計假設(shè)檢驗理論的發(fā)展.假設(shè)檢驗包括參數(shù)檢驗和非參數(shù)檢驗兩大類,從檢驗正態(tài)總體參數(shù)問題開始,再被應(yīng)用到方差分析、線性回歸等問題中,再包括基本的擬合優(yōu)度檢驗.更進一步的從它的應(yīng)用發(fā)展表明,假設(shè)檢驗與統(tǒng)計中的其他方法理論的結(jié)合,不斷豐富與發(fā)展著它的思想與應(yīng)用.隨著計算機技術(shù)的普及與提高,假設(shè)檢驗的應(yīng)用前景將越來越廣課題研究的主要內(nèi)容和方法,研究過程中的主要問題和解決辦法:研究內(nèi)容:1.假設(shè)檢驗基本問題研究; 2.關(guān)于兩類錯誤的研究;3.關(guān)于原假設(shè)和備擇假設(shè)的研究;4.假設(shè)檢驗應(yīng)用研究;主要問題:1.原假設(shè)和備擇假設(shè)的關(guān)系與

4、提出;2.假設(shè)檢驗應(yīng)用研究;解決辦法: 1查閱參考多版數(shù)理統(tǒng)計教程,深入分析理解假設(shè)檢驗的思想.2舉例闡釋假設(shè)檢驗的應(yīng)用.課題研究起止時間和進度安排:1. 指導(dǎo)教師給學(xué)生下達任務(wù)(2011.09.012011.10.02);2. 完成開題報告,交給指導(dǎo)教師審閱 (2011.10.022011.11.25);3. 完成畢業(yè)論文,交給指導(dǎo)教師審閱 (2012.03.152012.04.15);4. 畢業(yè)論文答辯 (2012.04.162012.04.26).課題研究所需主要設(shè)備、儀器及藥品:外出調(diào)研主要單位,訪問學(xué)者姓名:指導(dǎo)教師審查意見:指導(dǎo)教師 (簽字) 年 月 教研室(研究室)評審意見:_教

5、研室(研究室)主任 (簽字) 年 月院(系)審查意見:_院(系)主任 (簽字) 年 月學(xué) 士 學(xué) 位 論 文題 目 假設(shè)檢驗若干問題的研究與應(yīng)用學(xué) 生 指導(dǎo)教師 講師 年 級 2008級專 業(yè) 數(shù)學(xué)與應(yīng)用數(shù)學(xué)系 別 數(shù)學(xué)系學(xué) 院 數(shù)學(xué)科學(xué)學(xué)院哈爾濱師范大學(xué)2012年4月目 錄摘 要1關(guān)鍵詞11.假設(shè)檢驗基本問題研究11.1 何為假設(shè)檢驗問題11.3 假設(shè)檢驗的基本概念與推理過程21.4 統(tǒng)計檢驗的基本步驟4關(guān)于兩類錯誤的研究5 關(guān)于原假設(shè)和備擇假設(shè)的研究64 假設(shè)檢驗的應(yīng)用8參考文獻:13英文摘要14假設(shè)檢驗若干問題的研究摘 要:本文討論了數(shù)理統(tǒng)計中的假設(shè)檢驗問題的主要思想與應(yīng)用方法,分析了假

6、設(shè)檢驗問題的特點,并把假設(shè)檢驗推理思想應(yīng)用到實際生活中解決問題關(guān)鍵詞:假設(shè)檢驗;小概率事件;兩類錯誤;應(yīng)用假設(shè)檢驗是統(tǒng)計推斷的一個重要內(nèi)容,也是在實際工作中經(jīng)常遇到的,假設(shè)檢驗提出問題和結(jié)局問題的方法有其獨特之處.提出的問題要求定性的回答,回答的方法卻是用定量的數(shù)學(xué)工具,而其中又有重要的定性的因素:顯著性水平的選擇.問題解決的本質(zhì)是歸納的方法,推理過程中,最主要的依據(jù)是基于小概率事件的不可能原理,這是演繹推理過程.假設(shè)檢驗不僅提供了一種重要的實用的統(tǒng)計推斷方法,其處理問題的思想在實際的應(yīng)用中也是很值得深入研究和借鑒的.1.假設(shè)檢驗基本問題研究 1.1 何為假設(shè)檢驗問題假設(shè)檢驗是另一大類統(tǒng)計推斷

7、問題它是先假設(shè)總體具有某種特征,然后通過利用樣本構(gòu)造統(tǒng)計量,用以推斷假設(shè)是否合理從純粹邏輯上考慮,似乎對參數(shù)的估計與對參數(shù)的檢驗不應(yīng)有實質(zhì)性的差別,猶如說:“求某方程的根”與“驗證某數(shù)是否是某方程的根”這兩個問題不會得出矛盾的結(jié)論一樣但從統(tǒng)計的角度看估計和檢驗,這兩種統(tǒng)計推斷是不同的,它們不是簡單的“計算”和“驗算”的關(guān)系假設(shè)檢驗有它獨特的統(tǒng)計思想,是估計方法所不能體現(xiàn)的,因此,假設(shè)檢驗問題的引入在數(shù)學(xué)思想方法上是完全必要的我們來考慮下面的例子,解釋何為假設(shè)檢驗問題 舉例1 某廠家向一百貨商店長期供應(yīng)某種貨物,雙方根據(jù)廠家的傳統(tǒng)生產(chǎn)水平,定出質(zhì)量標(biāo)準(zhǔn),即若次品率超過3%,則百貨商店拒收該批貨物

8、今有一批貨物,隨機抽43件檢驗,發(fā)現(xiàn)有次品2件,問應(yīng)如何處理這批貨物?如果雙方商定用點估計方法作為驗收方法,顯然2/43 > 3%,這批貨物是要被拒收的但是廠家有理由反對用這種方法驗收他們認為,由于抽樣是隨機的,在這次抽樣中,次品的頻率超過3%,不等于說這批產(chǎn)品的次品率超過了3%就如同說擲一枚錢幣,正反兩面出現(xiàn)的概率各為1/2,但若擲兩次錢幣,不見得正、反面正好各出現(xiàn)一次一樣就是說,即使該批貨的次品率為3%,仍有很大的概率使得在抽檢43件貨物時出現(xiàn)2個以上的次品,因此需要用別的方法如果百貨商店也希望在維護自己利益的前提下,不輕易地失去一個有信譽的貨源,也會同意采用別的更合理的方法事實上,

9、對于這類問題,通常就是采用假設(shè)檢驗的方法具體來說就是先假設(shè)次品率,然后從抽樣的結(jié)果來說明這一假設(shè)是否合理粗略地說就是“認為”能否說得過去 還有一類問題實際上很難用參數(shù)估計的方法去解決舉例2 某研究所推出一種感冒特效新藥,為證明其療效,選擇200名患者為志愿者將他們均分為兩組,分別不服藥或服藥,觀察三日后痊愈的情況,得出下列數(shù)據(jù)是否痊愈是否服藥痊愈者未痊愈者合計未服藥者4852100服藥者5644100合計10496200 問新藥是否確有明顯療效? 此例題不存在估計問題從數(shù)據(jù)來看,新藥似乎有一定療效,但效果不明顯,服藥者在這次試驗中的情況比未服藥者好,完全可能是隨機因素造成的對于新藥上市這樣關(guān)系

10、到千萬人健康的事,一定要采取慎重的態(tài)度這就需要用一種統(tǒng)計方法來檢驗藥效,假設(shè)檢驗就是在這種場合下的常用手段 具體來說,我們先不輕易地相信新藥的作用,因此可以提出假設(shè)“新藥無效”,除非抽樣結(jié)果顯著地說明這假設(shè)不合理,否則,將不能認為新藥有明顯的療效這種提出假設(shè)然后做出否定或不否定的判斷通常稱為顯著性檢驗(Significance test)1.2 假設(shè)檢驗的分類假設(shè)檢驗問題分為參數(shù)假設(shè)檢驗與非參數(shù)假設(shè)檢驗兩類若總體的分布函數(shù)或概率函數(shù)的表達式中有些參數(shù)為未知,是針對未知參數(shù)提出并要求檢驗,這樣的問題稱為參數(shù)假設(shè)檢驗問題;若總體的分布函數(shù)或概率函數(shù)為未知,是針對總體的分布、分布的特性或總體的數(shù)字特

11、征而提出并要求檢驗,這類問題的檢驗不依賴于總體分布,稱為非參數(shù)假設(shè)檢驗問題如例題1中,總體是兩點分布,只需對參數(shù)做出假設(shè)檢驗,這是參數(shù)檢驗問題,而例題2則是非參數(shù)檢驗的問題1.3 假設(shè)檢驗的基本概念與推理過程舉例3 據(jù)報載,某商店為搞促銷,對購買一定數(shù)額商品的顧客給予一次摸球中獎的機會,規(guī)定從裝有紅、綠兩色球各10個的暗箱中連續(xù)摸10次(摸后放回),若10次都是摸得綠球,則中大獎某人按規(guī)則去摸10次,皆為綠球,商店認定此人作弊,拒付大獎,此人不服,最后引出官司 我們在此并不關(guān)心此人是否真正作弊,也不關(guān)心官司的最后結(jié)果,但從統(tǒng)計的觀點看,商店的懷疑是有道理的因為,如果此人摸球完全是隨機的,則要正

12、好在10次摸球中均摸到綠球的概率為,這是一個很小的數(shù),一個統(tǒng)計的基本原理是在一次試驗中所發(fā)生的事件不應(yīng)該是小概率事件現(xiàn)在既然這樣小概率的事件發(fā)生了,就應(yīng)當(dāng)推測出此人摸球不是隨機的,換句話說有作弊之嫌所謂“小概率事件”,通常是指定一個正數(shù)(),認為概率不超過的事件是在一次試驗中不會發(fā)生的事件,這個稱為顯著性水平(Level of significance)對于實際問題應(yīng)根據(jù)不同的需要和側(cè)重,指定不同的顯著性水平但為了制表方便,通??蛇x取=0.01,0.05,0.10等 下面我們用假設(shè)檢驗的語言來模擬商店的推斷: 1) 提出假設(shè): :此人未作弊;:此人作弊 這里稱為原假設(shè)(Null hypothe

13、sis),稱為備選假設(shè)(Alternative hypothesis)或?qū)α⒓僭O(shè)(Opposite hypothesis) 2) 構(gòu)造統(tǒng)計量,并由樣本算出其具體值: 統(tǒng)計量取為10次模球中摸中綠球的個數(shù)N由抽樣結(jié)果算出N = 10 3) 求出在下,統(tǒng)計量的分布,構(gòu)造對不利的小概率事件: 在下,即如果此人是完全隨機地摸球的話,統(tǒng)計量服從二項分布其分布列為,那么此人摸到的綠球數(shù)應(yīng)該在平均數(shù)5個附近,所以對不利的小概率事件是:“綠球數(shù)大于某個較大的數(shù),或小于某個較小的數(shù)”在此問題中,若此不成立,即此人作弊的話,不可能故意少摸綠球,因此只需考慮事件“大于某個較大的數(shù)”,這個數(shù)常稱為臨界值,即某個分位數(shù)

14、 4) 給定顯著性水平,確定臨界值: 即取一數(shù)使得=如取=0.01,由分布列算出: . 對于這種離散型概率分布,不一定能取到.取最接近的,使當(dāng)成立時,因此.即該小概率事件是. 5) 得出結(jié)論:已算得,即發(fā)生了,而被視為對不利的小概率事件,它在一次試驗中是不應(yīng)該發(fā)生的,現(xiàn)在居然發(fā)生了,只能認為是不成立的,即:“此人作弊”成立這一推斷過程,也是假設(shè)檢驗的一般步驟在這些步驟中,關(guān)鍵的技術(shù)問題是確定一個適當(dāng)?shù)挠靡詸z驗假設(shè)的統(tǒng)計量,這個統(tǒng)計量至少應(yīng)該滿足在成立的情況下,其抽樣分布易于計算(查到)在統(tǒng)計量選定以后,便可構(gòu)造出由該統(tǒng)計量描述某個顯著性水平下的一小概率事件,我們稱使得這一小概率事件發(fā)生的樣本空

15、間的點的全體為的否定域(Negation region)或拒絕域(Rejection region),通常也簡記為=最后的檢驗即是判斷所給的樣本是否落在內(nèi),或者是是否成立因此,從這個意義上可以說設(shè)計一個檢驗,本質(zhì)上就是找到一個恰當(dāng)?shù)姆穸ㄓ颍沟迷谙?,它的概率另外,稱的余集為的接受域1.4 統(tǒng)計檢驗的基本步驟所有的統(tǒng)計檢驗都包含某些特定的步驟:(1)建立假設(shè)統(tǒng)計檢驗是將抽樣結(jié)果和抽樣分布相對照而作出判斷的工作取得抽樣結(jié)果,依據(jù)描述性統(tǒng)計的方法就足夠了抽樣分布則不然,它無法從資料中得到,非利用概率論不可而不對待概括的總體和使用的抽樣程序做某種必要的假設(shè),這項工作將無法進行(2)求抽樣分布在做了必要

16、的假設(shè)之后,我們就能用數(shù)學(xué)推理過程來求抽樣分布了由于數(shù)學(xué)上已經(jīng)取得的成果,實際上統(tǒng)計工作者要做的這項工作往往并不是真的去求抽樣分布的數(shù)學(xué)形式,而是根據(jù)具體需要,確定特定問題的統(tǒng)計檢驗應(yīng)該采用哪種分布的數(shù)學(xué)用表 (3)選擇顯著性水平和否定域 有了與問題相關(guān)的抽樣分布,我們便可以把所有可能的結(jié)果分成兩類:一類是不大可能的結(jié)果;另一類人們預(yù)料這些結(jié)果很可能發(fā)生既然如此,如果我們在一次實際抽樣中得到的結(jié)果恰好屬于第一類,我們就有理由對概率分布的前提假設(shè)產(chǎn)生懷疑在統(tǒng)計檢驗中,這些不大可能的結(jié)果即為否定域如果這類結(jié)果真的發(fā)生了,我們將否定假設(shè);反之就不否定假設(shè)概率分布的具體形式是由假設(shè)決定的,假設(shè)肯定不止

17、一個在統(tǒng)計檢驗中,通常把被檢驗的那個假設(shè)稱為零假設(shè)(或稱原假設(shè),用符號H0表示),并用它和其他備擇假設(shè)(用符號H1表示)相對比假設(shè)只能被檢驗,從來不能加以證明統(tǒng)計檢驗可以幫助我們否定一個假設(shè),卻不能幫助我們肯定一個假設(shè)為了使檢驗更嚴格、更科學(xué),還需要更多的東西首先,我們必須確定甘冒犯第一類和第二類錯誤的風(fēng)險的程度;其次,要確定否定域是否要包含抽樣分布的兩端(4)計算檢驗統(tǒng)計量 完成了上述工作之后,接下來就是做一次與理想試驗盡量相同的實際抽樣,并從獲取的樣本資料算出檢驗統(tǒng)計量檢驗統(tǒng)計量是關(guān)于樣本的一個綜合指標(biāo),它不用作估測,而只用作檢驗 (5)判定假設(shè)檢驗系指拒絕或保留零假設(shè)的判斷,又稱顯著性檢

18、定在選擇否定域并計算檢驗統(tǒng)計量之后,我們完成最后一道手續(xù),即根據(jù)試驗或樣本結(jié)果決定假設(shè)的取與舍如果結(jié)果落在否定域內(nèi),否定零假設(shè)反之,如果結(jié)果落在否定域外,則不否定零假設(shè)關(guān)于兩類錯誤的研究以“小概率事件在一次試驗中不會發(fā)生”這一原理只是在概率意義下成立,而在實踐研究中,不能說小概率事件在一次試驗中絕對不可能發(fā)生仍以舉例3來說,盡管按統(tǒng)計推斷結(jié)論,認為摸球人作弊,但事實上也完全可能沒有作弊試想如果在不作弊的情況下,10次全部摸中綠球絕對不可能的話,那么開設(shè)摸獎就沒有意義了因此,當(dāng)摸獎人事實上的確是未作弊的話,商店的統(tǒng)計推斷就犯了錯誤假設(shè)檢驗犯錯的原因在于,當(dāng)為真時,檢驗統(tǒng)計量的觀測值落到了落入否定

19、域,從而作出否定的結(jié)論,那就犯了“棄真”錯誤,又稱第一類錯誤當(dāng)為假時,但統(tǒng)計量的實測值未落入否定域,從而沒有作出否定的結(jié)論,即接受了錯誤的,那就犯了“取偽”錯誤,又稱第二類錯誤具體情況見表2-1.表2-1假設(shè)檢驗的兩類錯誤真實情況決定為真為假拒絕第一類錯誤正確接受正確第二類錯誤一個檢驗本質(zhì)上就是要劃定一個否定域,所謂拒絕,就是通過構(gòu)造的統(tǒng)計量計算,得出樣本點落在內(nèi)的結(jié)論所以,第一類錯誤的概率就是在成立的條件下的概率.從前幾節(jié)的具體例子可知,一般地當(dāng)形如時,.當(dāng)形如或時,由此可知,顯著性水平也就是檢驗犯第一類錯誤的概率同樣,接受,即是指樣本點落在接受域中,因此犯第二類錯誤的概率是當(dāng)中包含的參數(shù)不

20、止一個時,一般的具體計算是較困難的不管我們?nèi)绾芜x擇否定域,都不可能完全避免第一類錯誤和第二類錯誤,也不可能同時把犯兩類錯誤的危險壓縮到最小對任何一個給定的檢驗而言,第一類錯誤的危險越小,第二類錯誤的概率就越大;反之亦然一般來講,不可能具體估計出第二類錯誤的概率值第一類錯誤則不然,犯第一類錯誤的概率是否定域內(nèi)各種結(jié)果的概率之和假設(shè)檢驗中,一般是給定,然后將控制到最小原因是:原假設(shè)是什么常常是明確的,而備擇假設(shè)常常是模糊的所以,人們常把最關(guān)心的問題作為原假設(shè)提出,將較嚴重的錯誤放到了,這就能夠在假設(shè)檢驗中對錯誤實施有效控制由于犯第一類錯誤的危險和犯第二類錯誤的危險呈相背趨向,所以統(tǒng)計檢驗時,必須事

21、先在甘冒多大第一類錯誤的風(fēng)險和多大第二類錯誤的風(fēng)險之間作出權(quán)衡被我們事先選定的可以犯第一類錯誤的概率,它決定了否定域的大小如果抽樣分布是連續(xù)的,否定域可以建立在想要建立的任何水平上,否定域的大小可以和顯著性水平的要求一致起來如果抽樣分布是非連續(xù)的,就要用累計概率的方法找出一組構(gòu)成否定域的結(jié)果即在已知概率分布表上,從兩端可能性最小的概率開始向中心累計,直至概率之和略小于選定的顯著性水平為止在許多場合,我們能預(yù)測偏差的方向,或只對一個方向的偏差感興趣每當(dāng)方向能被預(yù)測的時候,在同樣顯著性水平的條件下,單側(cè)檢驗比雙側(cè)檢驗更合適因為否定域被集中到抽樣分布更合適的一側(cè),可以得到一個比較大的尾端這樣做,可以

22、在犯第一類錯誤的危險不變的情況下,減少了犯第二類錯誤的危險 關(guān)于原假設(shè)和備擇假設(shè)的研究在假設(shè)檢驗中,一般提出兩種假設(shè): 原假設(shè)和備擇假設(shè)和是兩種相互對立的假設(shè),拒絕一個就意味著接受另一個那么,如何確定和呢?一般來講,把希望否定的現(xiàn)象作為,把希望肯定的現(xiàn)象作為這樣確定和是基于假設(shè)檢驗的依據(jù)-小概率事件的實際不可能原理根據(jù)這一原理,我們欲判斷備擇假設(shè)成立,卻從原假設(shè)出發(fā),在一定的顯著水平下,從總體中抽取一個子樣對其進行檢驗,在成立的條件下,若發(fā)現(xiàn)這個子樣統(tǒng)計量的值是一個小概率事件(表現(xiàn)為統(tǒng)計量的值落入了拒絕域),這表示小概率事件在一次試驗中發(fā)生了,與小概率事件實際不可能發(fā)生原理矛盾,因此,就拒絕這

23、是所希望的,因為檢驗的目的就是要否定原假設(shè),確認備擇假設(shè). 反之,若發(fā)現(xiàn)這個子樣的統(tǒng)計量的值不是一個小概率事件( 表現(xiàn)為統(tǒng)計量的值落入了接受域),則沒有理由拒絕.原假設(shè)和備擇假設(shè)無論怎么提出都是可以的,它們的檢驗結(jié)論都是相容而不會相互矛盾.正是從這個意義上,原假設(shè)和備擇假設(shè)可以以任意方式提出但是對于給定的樣本數(shù)據(jù),統(tǒng)計假設(shè)的不同設(shè)定方式會得到表述不同的結(jié)論,有的表述更明確而有效,而有的則顯得含糊不清因此,在實踐中,為原假設(shè)和備擇假設(shè)的提出設(shè)定某種規(guī)則是有幫助的通常把被懷疑的或者希望推翻的命題作為原假設(shè)提出來,而把希望得到的命題作為備擇假設(shè)提出根據(jù)與的思想,在假設(shè)檢驗理論中,首先要控制的是第一類

24、錯誤即棄真錯誤的概率不能大于給定的顯著性水平,這表明原假設(shè)是被保護的,也就是說要推翻原假設(shè)需要很充分的證據(jù)正是在這種嚴格的保護下,如果得到拒絕原假設(shè)的結(jié)論,那么這個結(jié)論是很有說服力的;反之,如果得到不拒絕原假設(shè)的結(jié)論,僅僅表明樣本數(shù)據(jù)與原假設(shè)沒有矛盾,但并不意味著原假設(shè)是應(yīng)該被接受的,不拒絕不等于接受,在這種情形下接受原假設(shè)不是很有說服力在假設(shè)檢驗中,原假設(shè)與備選假設(shè)的地位是不對等的一般來說是較小的,因而檢驗推斷是“偏向”原假設(shè),而“歧視”備選假設(shè)的因為,通常若要否定原假設(shè),需要有顯著性的事實,即小概率事件發(fā)生,否則就認為原假設(shè)成立因此在檢驗中接受,并不等于從邏輯上證明了的成立,只是找不到不成

25、立的有力證據(jù)在應(yīng)用中,對同一問題若提出不同的原假設(shè),甚至可以有完全不同的結(jié)論,為了理解這一點,舉例如下:設(shè)總體,樣本均值,樣本容量=1,取,欲檢驗,還是這里有兩種提出假設(shè)的方法,分別如下:() (); 如果按一般邏輯論證的想法,當(dāng)然認為無論怎樣提假設(shè),的最終結(jié)果應(yīng)該是一樣的但事實不然,計算如下:對于()顯然應(yīng)取否定域為,其中,當(dāng)成立時,實際算得接受,即認為對于()應(yīng)取否定域為此時接受,即認為.這種矛盾現(xiàn)象可以解釋為,試驗結(jié)果既不否定,也不否定,究竟應(yīng)認為,還是,就要看你要“保護”誰,即怎樣取原假設(shè)這一結(jié)果的幾何解釋如圖2-1在圖2-1中,既不在密度函數(shù)的陰影部分所對應(yīng)的區(qū)間里,也不在密度函數(shù)的

26、陰影部分所對應(yīng)的區(qū)間內(nèi)所以無論怎樣提出都否定不了圖2-1這一事實告訴了我們,在應(yīng)用中一定要慎重提出原假設(shè),它應(yīng)該有一定的背景依據(jù)它一經(jīng)提出,通常在檢驗中是受到保護的,受保護的程度取決于顯著性水平的大小,越小,以為概率的小概率事件就越難發(fā)生,就越難被否定在實際問題中,這種保護是必要的,如對一個有傳統(tǒng)生產(chǎn)工藝和良好信譽的廠家的商品檢驗,我們就應(yīng)該取原假設(shè)為產(chǎn)品合格來加以保護,并通過檢驗來印證,以免因抽樣的隨機性而輕易否定該廠商品的質(zhì)量從另一個角度看,既然是受保護的,則對于的肯定相對來說是較缺乏說服力的,充其量不過是原假設(shè)與試驗結(jié)果沒有明顯矛盾;反之,對于的否定則是有力的,且越小,小概率事件越難于發(fā)

27、生,一旦發(fā)生了,這種否定就越有力,也就越能說明問題在應(yīng)用中,如果要用假設(shè)檢驗說明某個結(jié)論成立,那么最好設(shè)為該結(jié)論不成立若通過檢驗拒絕了,則說明該結(jié)論的成立是很具有說服力的,如那樣而且取得較小,如果仍拒絕的話,結(jié)論成立的說服力越強4 假設(shè)檢驗的應(yīng)用假設(shè)檢驗方法在生產(chǎn)與實踐中有著廣泛的應(yīng)用例1 美國公共健康雜志(1994年3月)描述涉及20143個個體的一項大規(guī)模研究文章說從脂肪中攝取熱量的平均百分比是38.4%(范圍是6%到71.6%),在某一大學(xué)醫(yī)院進行一項研究以判定在該醫(yī)院中病人的平均攝取量是否不同于38.4%,抽取了15個病人測得平均攝取量為40.5%,樣本標(biāo)準(zhǔn)差為7.5%設(shè)樣本來自正態(tài)總

28、體,均未知試取顯著性水平檢驗假設(shè):解:這是一個方差未知的正態(tài)總體的均值檢驗,屬于雙邊檢驗問題,檢驗統(tǒng)計量為代入本題具體數(shù)據(jù),得到檢驗的臨界值為因為,所以樣本值沒有落入拒絕域中,故接受原假設(shè),即認為平均攝取量顯著地為38.4%例2 自某種銅溶液測得9個銅含量的百分比的觀察值為8.3,標(biāo)準(zhǔn)差為0.025設(shè)樣本來自正態(tài)總體,均未知試依據(jù)這一樣本取顯著性水平檢驗假設(shè):解:這是一個方差未知的正態(tài)總體的均值檢驗,屬于左邊檢驗問題,檢驗統(tǒng)計量為代入本題具體數(shù)據(jù),得到檢驗的臨界值為因為(或者說),所以樣本值落入拒絕域中,故拒絕原假設(shè),即認為銅含量顯著地小于8.42%例3 一工廠的經(jīng)理主張一新來的雇員在參加某項

29、工作之前至少需要培訓(xùn)200小時才能成為獨立工作者,為了檢驗這一主張的合理性,隨機選取10個雇員詢問他們獨立工作之前所經(jīng)歷的培訓(xùn)時間(小時)記錄如下208, 180,232,168,212,208,254,229,230,181設(shè)樣本來自正態(tài)總體,均未知試取檢驗假設(shè):解:這是一個方差未知的正態(tài)總體的均值檢驗,屬于右邊檢驗問題,檢驗統(tǒng)計量為代入本題具體數(shù)據(jù),得到檢驗的臨界值為因為,所以樣本值沒有落入拒絕域中,故接受原假設(shè),即認為培訓(xùn)時間不超過200小時例4 一制造商聲稱他的工廠生產(chǎn)的某種牌號的電池的壽命的方差為5000(小時2),為了檢驗這一主張,隨機地取26只電池測得樣本方差為7200小時2,有

30、理由認為樣本來自正態(tài)總體現(xiàn)需取檢驗假設(shè)解:這是一個正態(tài)總體的方差檢驗問題,屬于雙邊檢驗檢驗統(tǒng)計量為代入本題中的具體數(shù)據(jù)得到檢驗的臨界值為 因為,所以樣本值沒有落入拒絕域,因此接受原假設(shè),即認為電池壽命的方差為5000小時2例5 隨機選擇了10名男生和10名女生讓他們參加一門考試,發(fā)現(xiàn)男生成績的平均數(shù)的平均數(shù)為59.7,標(biāo)準(zhǔn)差為10.7,女生成績的平均數(shù)為51.7,標(biāo)準(zhǔn)差為16.9.試確定男女生的考試成績是否存在差異(,考試成績服從正態(tài)分布)解:該問題為兩個正態(tài)總體的均值差的檢驗,首先要檢驗方差是否相等.(1)建立假設(shè)檢驗:.選擇檢驗統(tǒng)計量,確定其在成立條件下概率分布 : 其中,.計算拒絕域得.

31、計算檢驗統(tǒng)計量的觀測值因為,所以接受,即兩總體的方差在統(tǒng)計學(xué)意義上沒有差異.(2)檢驗?zāi)信煽兊钠骄鶖?shù)是否相同建立假設(shè)檢驗:選擇檢驗統(tǒng)計量,確定其在成立條件下概率分布.因為總體服從正態(tài),且兩總體方差相等所以:計算拒絕域即計算檢驗統(tǒng)計量的觀測值因為 所以接受,即兩總體的平均數(shù)在統(tǒng)計學(xué)意義上沒有差異例6 在自動機床制造零件的過程中,周期地抽取一些樣品進行質(zhì)量檢查.在檢查的250個零件的過程中發(fā)現(xiàn)有12個次品,問是否可以認為加工過程中次品出現(xiàn)的概率不超過?(取顯著性水平)解:設(shè)總體 則 服從分布,概率函數(shù)為 其中參數(shù)為零件加工過程中次品出現(xiàn)的概率.我們有.按題意,要檢驗的假設(shè)是 . 由于原假設(shè)比較復(fù)

32、雜,我們分兩種情形來討論:1)設(shè),當(dāng)樣本容量充分大時,統(tǒng)計量 近似地服從標(biāo)準(zhǔn)正態(tài)分布.對于給定的顯著性水平,有2)設(shè),則因為由列維中心極限定理可知,當(dāng)充分大時,樣本函數(shù)近似地服從標(biāo)準(zhǔn)正態(tài)分布.對于給定的顯著性水平,有注意到:當(dāng)時,;又當(dāng)時,;從而有設(shè)事件表示事件表示 則有.由概率的性質(zhì)知,即.綜上及的討論可知;在原假設(shè)成立的條件下,事件“”是小概率事件.因為抽樣檢查的結(jié)果表明,在250個樣本觀測值中有12個為1,其余為0.所以樣本均值 .由此計算統(tǒng)計量的觀測值得.查表得因為,所以在顯著性水平下,拒絕原假設(shè)而接受備擇假設(shè),即認為零件加工過程中的次品率顯著地大于.參考文獻:1 魏宗舒:概率論與數(shù)理統(tǒng)計教程,高等教育出版社,1998年版2 張凌翔:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論