版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 第四章統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn) # 4.1統(tǒng)計(jì)推斷的含義總體和樣本總體是指我們所關(guān)注現(xiàn)象出現(xiàn)的可能結(jié)果的全體,樣本是總體的一個(gè)子集(例如,杭州的人口;下沙開(kāi)發(fā)區(qū)的人口)。寬泛地說(shuō),統(tǒng)計(jì)推斷研究的是總體與來(lái)自總體的樣本之間的關(guān)系。國(guó)內(nèi)股票交易市場(chǎng)共有1500多支股票。假定某一天從中隨機(jī)選取50支,并計(jì)算這50支股票價(jià)格與收入比的平均值一即P/E比值。(例如,一支股票的價(jià)格為50元,估計(jì)年收益為2.5美元,則P/E為20;也就是說(shuō),股票以20倍的年收益出售。)根據(jù)50支股票的平均P/E值,能否說(shuō)這個(gè)P/E值就是總體的1000多股票的平均P/E值呢?X如果令X表示一支股票的P/E值,表示50支股票
2、的平均P/E值,能否得知總體的均值XE(X)呢?此處統(tǒng)計(jì)推斷的實(shí)質(zhì)就是從樣本值均值()歸納出總體值E(X)的過(guò)程。4.2參數(shù)估計(jì)通常假定某一隨機(jī)變量X服從某種概率密度,但并不道其分布的參數(shù)值。例如,X服從正態(tài)分布,想知道其兩個(gè)參數(shù),均值E(X)=UX,及方差v。Xx為了估計(jì)未知參數(shù),一般的步驟是:假定有來(lái)自某一總體,樣本容量為n的隨機(jī)樣本,根據(jù)樣本估計(jì)總體的未知參數(shù)。因此,可將樣本均值作為總體均值(或期望)的估計(jì)量,樣本方差作為總體方差的估計(jì)量。這個(gè)過(guò)程稱為估計(jì)問(wèn)題,估計(jì)問(wèn)題有兩類:點(diǎn)估計(jì)(pointestimation)和區(qū)間估計(jì)(intervalestimation)。假定隨機(jī)變量X(P/
3、E值)服從某一未知均值和方差的正態(tài)分布。但是,有來(lái)自該正態(tài)總體的隨機(jī)樣本(50個(gè)股票的P/E值),如何根據(jù)這些樣本數(shù)據(jù)計(jì)算總體的均值uX(=E(X)和方差x2?頻數(shù)6272S?9棗10511712513414315斗165181合計(jì):樣本育差-5-275予樣本師進(jìn)差=5.0456中ii數(shù)-眾數(shù)-11?0表4-1點(diǎn)估計(jì)X據(jù)表4-1的數(shù)據(jù)50個(gè)P/E的樣本均值為11.5,顯然我們可以選擇作為UX的估計(jì)值。X我們稱這個(gè)單一數(shù)值為ux的點(diǎn)估計(jì)值。X(注意:點(diǎn)估計(jì)量是一個(gè)隨機(jī)變量,因?yàn)槠渲惦S樣本的不同而不同。)X某一特殊的估計(jì)值(比如11.5)的可信度有多大呢?雖然可能是總體均值的“最好的”估計(jì)值,但是
4、某個(gè)區(qū)間,比如10,更可能包括了總體均值。這正是區(qū)間估計(jì)的基本思想。區(qū)間估計(jì)),則(回區(qū)間估計(jì)的主要思想源于估計(jì)量的概率分布的概念。如果隨機(jī)變量XN(ux憶第三章中心極限定理):XN(uX或,ZN(0,1即樣本均值的抽樣分布也服從正態(tài)分布。2Q-(XX)2如前所述,通常未知,可用其估計(jì)量S2i代替,則:xnt.Xtxs/服從自由度為(n1)的t分布。在P/E一例中,共有50個(gè)樣本觀察值,因此自由度為49。查附錄中的t分布表可得:P(2.0096WtW2.0096)=0.95也即區(qū)間(一2.0096,2.0096)包括t值的概率為95%。2.0096和2.0096稱為臨界t值,表明了在臨界值區(qū)間
5、內(nèi),位于t分布曲線下區(qū)域的比例。X/把t代到p(2.0096WtW2.0096)=0.95中,得到:XsP(2.0096WtXl3,稱為單邊備擇假設(shè)。XHl:uXl3,也稱為單邊備擇假設(shè)。XHl:uxH13,稱為雙邊備擇假設(shè)。X為了檢驗(yàn)零假設(shè)(與備擇假設(shè)),可以根據(jù)樣本數(shù)據(jù)(比如,根據(jù)表4-1得到的樣本平均P/E值11.5)以及統(tǒng)計(jì)理論建立判定規(guī)則來(lái)判斷樣本信息是否支持零假設(shè)。如何建立判定規(guī)則呢?有兩個(gè)互補(bǔ)的方法:置信區(qū)間法顯著性檢驗(yàn)法4.4.1置信區(qū)間法2根據(jù)表4-1提供的數(shù)據(jù)計(jì)算出樣本均值為11.5??芍笜颖揪捣木禐閡X方差為的正態(tài)分布。但是由于真實(shí)的方差是未知的,所以用樣本方差來(lái)代
6、替,在這種情況下,樣本均值服從t分布,tX。根據(jù)t分布,得到ux的一個(gè)95%的置信區(qū)間:WuXW12.36(近似值)X置信區(qū)間提供了在某一置信系數(shù)下(比如95%)真實(shí)的口乂取值范圍。因此,如果這個(gè)X區(qū)間不包括零假設(shè)中的值,比如=13,那么會(huì)拒絕零假設(shè)以95%的置信度拒絕該零假X設(shè)。從上面的討論中,可以看到置信區(qū)間與假設(shè)檢驗(yàn)密切相關(guān)。用假設(shè)檢驗(yàn)的語(yǔ)言,不等式WuXW12.36X描述的置信區(qū)間稱為接受區(qū)域,接受區(qū)域以外的稱為拒絕區(qū)域。接受區(qū)域的上界和下界稱為臨界值(criticalvalues)??梢员硎鰹椋喝绻麉?shù)值在零假設(shè)下位于接受區(qū)域內(nèi),則不拒絕零假設(shè)。但如果落在接受區(qū)域以外(也即落在拒絕區(qū)
7、域內(nèi)),則拒絕零假設(shè)。在這個(gè)例子中,拒絕零假設(shè)H0:uX=13,因?yàn)檫@個(gè)值落在臨界區(qū)域,它比接受區(qū)域X的上界12.36大,也即這是一個(gè)小概率事件不到2.5%。簡(jiǎn)言之,如果參數(shù)值超過(guò)上臨界值或低于下臨界值,那么就拒絕零假設(shè)。4.4.2第一類錯(cuò)誤和第二類錯(cuò)誤在P/E例中,我們拒絕H0:uX=13,這是否意味著表41給出的樣本不是來(lái)自于均值X為13的正態(tài)總體呢?或許事實(shí)的確如此。但是不等式(10.63WuXW12.36)的置信區(qū)間的置X信度僅為95%而并非100%。如果真的如此,那么拒絕H0:uX=13,就可能能犯錯(cuò)誤。此時(shí)X犯了第一類錯(cuò)誤一一即棄真錯(cuò)誤。同樣的原因,假定零假設(shè)H0:uX=12,在這
8、種情況下,根據(jù)不等式(10.63WuXW12.36),XX我們應(yīng)該不拒絕這個(gè)零假設(shè)。但是表4-1這個(gè)樣本很可能不是來(lái)自均值為12的正態(tài)總體。此時(shí),會(huì)犯第二類錯(cuò)誤,也即取偽錯(cuò)誤。用另一個(gè)例子進(jìn)一步闡明假設(shè)檢驗(yàn)的置信區(qū)間法。例4.2某種包裝椒鹽花生的重量服從標(biāo)準(zhǔn)正態(tài)分布,但均值與標(biāo)準(zhǔn)差均是未知的,均值的度量單位為盎司。隨機(jī)選取20包發(fā)現(xiàn)其樣本均值和樣本標(biāo)準(zhǔn)差分別為6.5盎司和2。檢驗(yàn)零假設(shè):真實(shí)均值為7.5盎司;備擇假設(shè):真實(shí)均值不是7.5盎司。給定99%的置信系數(shù)(或1%的置信水平,皆表示犯第一類錯(cuò)誤的概率至多為1%)。令X代表壇子中花生的重量,因此XN(u,),兩個(gè)參數(shù)均未知。由于真實(shí)X方差是
9、未知的,所以它服從自由度為19的t分布:tXt/、/2019從附錄表可知,自由度為19時(shí),P(2.681WtW2.681)=0.99可得:P(X2.681SuX2.681S)0.99x冋X將=6.5,S=2,代入上式,我們得到了UX的一個(gè)99%的置信區(qū)間。X5.22WuXW7.78(近似值)X由于區(qū)間包括了零假設(shè)值7.5,因此,我們不拒絕零假設(shè):真實(shí)的uX=7.5。X“產(chǎn)了產(chǎn)在此區(qū)間567Mb)It4-S對(duì)叨眈的直信呂間可詢珈的置皓國(guó)間(例4$|4_4)例4.3在例4.2中,若置信水平a為5%;即決定冒更大的風(fēng)險(xiǎn)犯第一類錯(cuò)誤。那么情況如何呢?根據(jù)t分布表,當(dāng)a=5%,自由度為19時(shí),t的臨界值
10、為-2.093和+2.093,因?yàn)镻(2.093WuW2.093)=0.95X按照例4.3的步驟,能夠求得:5.56WuXW7.44(近似值)X從中可以看出,這個(gè)區(qū)間不包括7.5,因此,拒絕零假設(shè):ux=7.5。X兩個(gè)例子的不同之處在于后者的置信區(qū)間比前者略窄一些,后者愿意冒較大的風(fēng)險(xiǎn)去犯第一類錯(cuò)誤,即棄真錯(cuò)誤。4.4.3顯著性檢驗(yàn)顯著性檢驗(yàn)方法的基本思想:由于tXx服從自由度為(n1)的t分布。可知X,S,n,惟一未知的是ux。但如x果設(shè)定冬為某一值,則可以求出惟一個(gè)t值,根據(jù)t分布很容易求得獲此t值的概率。如果X與uX的差(絕對(duì)值)不大,則Itl也會(huì)很小。如果X=UX,貝比值為0,在此情況
11、下接X(jué)X受零假設(shè)。因此,隨著t|值偏離0,將逐漸地趨向拒絕零假設(shè),即根據(jù)t分布表,給定自由度,|t|值越大,則獲此|t|值的概率就越小。但在能拒絕零假設(shè)之前,最大的|t|值是多少呢?取決于置信水平.(或者理解為取決于置信區(qū)間大小),即犯第一類錯(cuò)誤的概率,以及自由度。在P/E例中,U=11.5,S=3.0456,n=50。Xt(11.513).4826令H0:uX=13,H1:uXM13,因此有XX3.0456/冋根據(jù)這個(gè)t值能否拒絕零假設(shè)?首先必須設(shè)定置信水平,假定=5%。由于備擇假設(shè)是雙邊假設(shè),可以將犯第一類錯(cuò)誤的風(fēng)險(xiǎn)均分在t分布的兩側(cè)的兩個(gè)拒絕區(qū)域,如果計(jì)算的t值位于任何一個(gè)拒絕區(qū)域,就能
12、夠拒絕零假設(shè)。當(dāng)自由度為49時(shí),在5%的顯著水平下,臨界的t值為-2.0096和2.0096,獲此t值小于或等于一2.0096的概率為2.5%,獲此t值大于或等于2.0096的概率也為2.5%。本例中計(jì)算的t值約為一3.5,位于t分布的左側(cè)拒絕區(qū)域,因此拒絕零假設(shè)。用顯著性檢驗(yàn)的語(yǔ)言,經(jīng)常遇到下面兩個(gè)術(shù)語(yǔ):(1)檢驗(yàn)(統(tǒng)計(jì)量)是統(tǒng)計(jì)顯著的。(2)檢驗(yàn)(統(tǒng)計(jì)量)是統(tǒng)計(jì)不顯著的。當(dāng)檢驗(yàn)是統(tǒng)計(jì)顯著的,一般是指能夠拒絕零假設(shè)。當(dāng)檢驗(yàn)是統(tǒng)計(jì)不顯著的,是指不能拒絕零假設(shè)。4.4.4顯著水平的選擇與p值假設(shè)檢驗(yàn)的古典方法一般常用的值有1%、5%和10%,但是這些值并不是固定不變的。在實(shí)踐中常用p值(即,概率值),也稱為統(tǒng)計(jì)量的精確置信水平,可定義為拒絕零假設(shè)的最低置信水平。(反過(guò)來(lái),即是拒絕零假設(shè)的最高置信系
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年:前配偶贍養(yǎng)費(fèi)終止條件補(bǔ)充協(xié)議3篇
- 放映員知識(shí)培訓(xùn)課件模板
- 校園消防知識(shí)培訓(xùn)課件
- 專業(yè)個(gè)人勞務(wù)協(xié)議格式2024版樣本版B版
- 2024年租賃合同違約責(zé)任追究協(xié)議
- 2024影視公司與特效公司的委托特效制作合同
- 礦泉水行業(yè)知識(shí)培訓(xùn)課件
- 2025年度環(huán)境監(jiān)測(cè)數(shù)據(jù)采集與分析合同3篇
- 2024年民事離婚合同規(guī)范化文檔版B版
- 《男科網(wǎng)絡(luò)推廣方案》課件
- 浙江省金華市婺城區(qū)2024-2025學(xué)年九年級(jí)上學(xué)期期末數(shù)學(xué)試卷(含答案)
- 天津市河西區(qū)2024-2025學(xué)年高二上學(xué)期1月期末英語(yǔ)試題(含答案無(wú)聽(tīng)力音頻及聽(tīng)力原文)
- 2025屆高考語(yǔ)文復(fù)習(xí):信息類文本五大類型的主觀題 課件
- 滬教版小學(xué)數(shù)學(xué)三(下)教案
- 中鐵開(kāi)投、中鐵云投招聘筆試沖刺題2025
- 2024-2025年度村支書(shū)工作述職報(bào)告范文二
- 陜西省西安市高新一中2024-2025學(xué)年九年級(jí)上學(xué)期綜合素養(yǎng)評(píng)價(jià)(三)化學(xué)試卷(含答案)
- 繼電保護(hù)多選試題庫(kù)與參考答案
- 品管圈PDCA改善案例-降低住院患者跌倒發(fā)生率
- 2024版健康醫(yī)療服務(wù)機(jī)構(gòu)合作協(xié)議范本3篇
- 公務(wù)車輛定點(diǎn)加油服務(wù)投標(biāo)文件(技術(shù)方案)
評(píng)論
0/150
提交評(píng)論