




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、統(tǒng)計推斷和假設(shè)檢驗統(tǒng)計推斷從數(shù)據(jù)得到對現(xiàn)實世界的結(jié)論的過程2估計 總體代表我們所關(guān)心的那局部世界。而在利用樣本中的信息來對總體進(jìn)行推斷之前人們往往對代表總體的變量假定了分布族。(描述數(shù)據(jù)時不用假定)比方假定人們的身高屬于正態(tài)分布族;在抽樣調(diào)查時假定了二項分布族等等(這些假定可能有風(fēng)險!)。這些模型根本上是根據(jù)“經(jīng)驗來假定的,僅僅是對現(xiàn)實世界的一個近似。3估計 在假定了總體分布族之后,進(jìn)一步對總體的認(rèn)識就是要在這個分布族中選擇一個適合于我們問題的成員由于分布族成員是由參數(shù)確定的,如果參數(shù)能夠估計,對總體的具體分布就知道得差不多了。 4估計量是用來估計的統(tǒng)計量 我們知道,統(tǒng)計量是樣本的不包含未知參
2、數(shù)的函數(shù)。樣本均值、樣本標(biāo)準(zhǔn)差都是統(tǒng)計量。由于樣本是隨機(jī)的,統(tǒng)計量也是隨機(jī)變量。用于估計總體參數(shù)的統(tǒng)計量稱為估計量;樣本均值和標(biāo)準(zhǔn)差都是總體均值和標(biāo)準(zhǔn)差的常用估計量。5點估計和區(qū)間估計點估計(point estimation)就是用估計量的實現(xiàn)值來近似相應(yīng)的總體參數(shù)。區(qū)間估計(interval estimation) 是包括估計量在內(nèi)有時是以估計量為中心的一個區(qū)間;被認(rèn)為很可能包含總體參數(shù)。點估計給出一個數(shù)字,用起來很方便;而區(qū)間估計給出一個區(qū)間,說起來留有余地;不象點估計那么絕對。無偏估計(大樣本性質(zhì)) 6區(qū)間估計 注意置信區(qū)間的論述是由區(qū)間和置信度兩局部組成。置信區(qū)間是對參數(shù)給出的一個范圍
3、置信度為其可信程度(大樣本意義)有些新聞媒體報道一些調(diào)查結(jié)果只給出百分比和誤差即置信區(qū)間,比方 “收視率為53%3%; 不給出置信度,也不給出被調(diào)查的人數(shù)這是不負(fù)責(zé)的表現(xiàn)。7區(qū)間估計 降低置信度可以使置信區(qū)間變窄顯得“精確,有誤導(dǎo)讀者之嫌。如果給出被調(diào)查的人數(shù),那么內(nèi)行可以由此推算出置信度,反之亦然。8一個描述性例子 一個有10000個人答復(fù)的調(diào)查顯示,同意某種觀點的人的比例為70%有7000人同意,可以算出總體中同意該觀點的比例的95%置信區(qū)間為0.691,0.709;另一個調(diào)查聲稱有70%的比例反對該種觀點,還說總體中反對該觀點的置信區(qū)間也是(0.691,0.709)。9一個描述性例子 實
4、際上,第二個調(diào)查隱瞞了置信度等價于隱瞞了樣本量。如果第二個調(diào)查僅僅調(diào)查了50個人,有35個人反對該觀點。根據(jù)后面的公式可以算出,第二個調(diào)查的置信區(qū)間的置信度僅有11%。10區(qū)間估計的意義 置信度的概念大量重復(fù)抽樣時的一個漸近概念。類似于“我們目前得到的區(qū)間比方上面的75%3%以概率0.95覆蓋真正的比例p的說法是錯誤的。實際上應(yīng)該說“重復(fù)類似的抽樣所得到的大量區(qū)間中有大約95%的覆 蓋真實比例(其值可能永遠(yuǎn)未知)。11區(qū)間估計的意義 這里的區(qū)間72%,78%是固定的,而總體比例p也是固定的值。因此只有兩種可能:或者該區(qū)間包含總體比例,或者不包含;這當(dāng)中沒有任何概率可言。至于區(qū)間72%,78%是
5、否覆蓋真實比例,除非一個不漏地調(diào)查所有的人,否那么永遠(yuǎn)也無法知道。 12假設(shè)檢驗 在假設(shè)檢驗中,一般要設(shè)立一個原假設(shè);而設(shè)立該假設(shè)的動機(jī)主要是企圖利用人們掌握的反映現(xiàn)實世界的數(shù)據(jù)來找出假設(shè)和現(xiàn)實的矛盾,從而否認(rèn)這個假設(shè)。13假設(shè)檢驗 在多數(shù)統(tǒng)計教科書中除了理論探討之外,假設(shè)檢驗都是以否認(rèn)原假設(shè)為目標(biāo)。如否認(rèn)不了,那就說明證據(jù)缺乏,無法否認(rèn)原假設(shè)。但這不能說明原假設(shè)正確。很多教科書在這個問題上不適當(dāng)?shù)赜谩敖邮茉僭O(shè)的說法,犯了明顯的低級邏輯錯誤。 14假設(shè)檢驗的過程和邏輯 首先要提出一個原假設(shè),比方某正態(tài)總體的均值等于5m=5。這種原假設(shè)也稱為零假設(shè)null hypothesis,記為H0與此同
6、時必須提出對立假設(shè),比方總體均值大于5m5。對立假設(shè)又稱為備選假設(shè)或備擇假設(shè)alternative hypothesis記為記為H1或Ha15假設(shè)檢驗的過程和邏輯 根據(jù)零假設(shè)不是備選假設(shè)!,我們可以得到該檢驗統(tǒng)計量的分布;然后再看這個統(tǒng)計量的數(shù)據(jù)實現(xiàn)值realization屬不屬于小概率事件。也就是說把數(shù)據(jù)代入檢驗統(tǒng)計量,看其值是否落入零假設(shè)下的小概率范疇如果確實是小概率事件,那么我們就有可能拒絕零假設(shè),否那么我們說沒有足夠證據(jù)拒絕零假設(shè)。16假設(shè)檢驗的過程和邏輯 注意:零假設(shè)和備選假設(shè)在我們涉及的假設(shè)檢驗中并不對稱。檢驗統(tǒng)計量的分布是從零假設(shè)導(dǎo)出的, 因此, 如果有矛盾, 當(dāng)然就不利于零假設(shè)
7、了。不發(fā)生矛盾也不說明備選假有問題。 17假設(shè)檢驗的過程和邏輯 檢驗統(tǒng)計量在零假設(shè)下,等于這個樣本的數(shù)據(jù)實現(xiàn)值或在備選假設(shè)方向上更加極端值的概率稱為p-值p-value。顯然得到很小p-值意味著小概率事件發(fā)生了。如果小概率事件發(fā)生,是相信零假設(shè),還是相信數(shù)據(jù)呢?當(dāng)然是相信數(shù)據(jù)。于是就拒絕零假設(shè)。但事件概率小并不意味著不會發(fā)生,僅僅發(fā)生的概率很小罷了。拒絕正確零假設(shè)的錯誤常被稱為第一類錯誤type I error。18假設(shè)檢驗的過程和邏輯 不僅有第一類錯誤,還有第二類錯誤;那是備選假設(shè)正確時反而說零假設(shè)正確的錯誤,稱為第二類錯誤type II error。如要“接受零假設(shè)就必須給出第二類錯誤的概
8、率. 但對于目前面對的問題, 無法計算它.19假設(shè)檢驗的過程和邏輯 零假設(shè)和備選假設(shè)哪一個正確,這是確定性的,沒有概率可言。而可能犯錯誤的選項是人。涉及假設(shè)檢驗的犯錯誤的概率就是犯第一類錯誤的概率和犯第二類錯誤的概率。負(fù)責(zé)的態(tài)度是無論做出什么決策,都應(yīng)該給出犯錯誤的概率。20假設(shè)檢驗的過程和邏輯 到底p-值是多小才能夠拒絕零假設(shè)呢?也就是說,需要有什么是小概率的標(biāo)準(zhǔn)。這要看具體應(yīng)用的需要。但在一般的統(tǒng)計書和軟件中,使用最多的標(biāo)準(zhǔn)是在零假設(shè)下或零假設(shè)正確時抽樣所得的數(shù)據(jù)拒絕零假設(shè)的概率應(yīng)小于0.05也可能是0.01,0.005,0.001等等。21假設(shè)檢驗的過程和邏輯 這種事先規(guī)定的概率稱為顯著
9、性水平(significant level),用字母a來表示。當(dāng)p-值小于或等于a時,就拒絕零假設(shè)。所以,a是所允許的犯第一類錯誤概率的最大值。當(dāng)p-值小于或等于a時,我們說這個檢驗是顯著的(significant)。22假設(shè)檢驗的過程和邏輯 歸納起來,假設(shè)檢驗的邏輯步驟為:第一: 寫出零假設(shè)和備選假設(shè);第二: 確定檢驗統(tǒng)計量;第三: 確定顯著性水平a;第四: 根據(jù)數(shù)據(jù)計算檢驗統(tǒng)計量的實現(xiàn)值;第五: 根據(jù)這個實現(xiàn)值計算p-值;第六: 進(jìn)行判斷:如果p-值小于或等于a,就拒絕零假設(shè),這時犯錯誤的概率最多為a;如果p-值大于a,就不拒絕零假設(shè),因為證據(jù)缺乏。 23假設(shè)檢驗的過程和邏輯 實際上,計算
10、機(jī)軟件僅僅給出p-值,而不給出a。這有很多方便之處。比方a=0.05,而假定我們得到的p-值等于0.001。這時我們?nèi)绻绻捎胮-值作為新的顯著性水平,即a=0.001,于是可以說,我們拒絕零假設(shè),顯著性水平為0.001。拒絕零假設(shè)時犯錯誤的概率實際只是千分之一而不是百分之五。在這個意義上,p-值又稱為觀測的顯著性水平observed significant level。在統(tǒng)計軟件輸出p-值的位置,有的用“p-value,有的用significant的縮寫“Sig就是這個道理。24假設(shè)檢驗的例子 汽車廠商聲稱其發(fā)動機(jī)排放標(biāo)準(zhǔn)的一個指標(biāo)平均低于20個單位。在抽查了10臺發(fā)動機(jī)之后,得到下面的排
11、放數(shù)據(jù):17.0、21.7、17.9、22.9、20.7、22.4、17.3、21.8、24.2、25.4。該樣本均值為21.13。究竟能否由此認(rèn)為該指標(biāo)均值超過20?這次我們的假設(shè)檢驗問題就是25假設(shè)檢驗的例子 檢驗統(tǒng)計量為為什么用這個?我們可以發(fā)現(xiàn)p-值為0.1243,因此,我們沒有證據(jù)否認(rèn)零假設(shè)(如果顯著性水平小于它)。2627兩個變量的均值比較 兩個學(xué)校高中學(xué)生的身高均值比較(hight21.sav). H0:m1=m2= H1:m1m228SPSS輸出 P值0.001/2=0.000529為什么不能“接受零假設(shè) 其實可以,比方下面兩種情況:1. 備選假設(shè)也是單點分布,這時可以負(fù)責(zé)地算
12、出犯第二類錯誤的概率。2. 貝葉斯檢驗情況這是一種決策觀點但在經(jīng)典統(tǒng)計中的絕大多數(shù)情況都不可以。30從一個例子看“接受零假設(shè) 數(shù)據(jù) rice.sav一個大米加工廠賣給一個超市一批標(biāo)明10kg重的大米。而該超市疑心該廠家缺斤短兩,對10包大米進(jìn)行了稱重,得到下面結(jié)果單位:千克9.93 9.83 9.76 9.95 10.07 9.89 10.03 9.97 9.89 9.87這里假定打包的大米重量服從正態(tài)分布。由于發(fā)生分歧,于是各方同意用這個數(shù)據(jù)進(jìn)行關(guān)于大米重量均值m的t檢驗;以廠家所說的平均重量為10kg作為零假設(shè),而以超市疑心的份量缺乏10kg作為備選假設(shè):311.超市的檢驗 于是,超市、加
13、工廠老板和該老板的律師都進(jìn)行了檢驗。結(jié)果是:超市用全部數(shù)據(jù)進(jìn)行t檢驗,得到拒絕零假設(shè)的結(jié)論。他們根據(jù)計算得到:樣本均值為9.92kg,而p-值為0.0106。因此超市認(rèn)為,對于顯著性水平a=0.05,應(yīng)該拒絕零假設(shè)。322. 加工廠老板的檢驗大米加工廠老板只用2個數(shù)據(jù),得到“接受零假設(shè)的結(jié)論。大米加工廠老板也懂些統(tǒng)計,他只取了上面樣本的頭兩個個數(shù)目9.93和9.83進(jìn)行同樣的t檢驗。通過對這兩個數(shù)進(jìn)行計算得到:樣本均值為9.88kg, 而p-值為0.1257. 雖然樣本均值不如超市檢驗的大, 但p-值大大增加。加工廠老板于是下了結(jié)論:對于水平a0.05,“接受零假設(shè),即加工廠的大米平均重量確實為10kg。 333.加工廠老板律師的檢驗大米加工廠老板的律師用了全部數(shù)據(jù),但不同的檢驗方法,得到“接受零假設(shè)的結(jié)論。大米加工廠老板的律師說可以用全部數(shù)據(jù)。他利對于連續(xù)變量比例的檢驗,也就是關(guān)于中位數(shù)的符號檢驗注意對于正態(tài)分布,對中位數(shù)的檢驗等價于對均值的檢驗。根據(jù)計算,得到該檢驗的p-值為0.0547。所以這個律師說在顯著性水平a=0.05時,應(yīng)該“接受零假設(shè)。還說,“既然三個檢驗中有兩個都接受零假設(shè),就應(yīng)該接受。34如何評價?加工廠老板實際上減少了作為證據(jù)的數(shù)據(jù),因此只得到“證據(jù)缺乏,無法拒絕零假設(shè)的結(jié)論。但加工廠老板利用一些錯誤的統(tǒng)計教科書的說法,把“證據(jù)缺乏以拒絕零假設(shè)改成“接受零
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工程項目各階段投資管理的主要內(nèi)容
- pe塑料管施工方案
- 2025年奶制品行業(yè)資訊:美國對加拿大奶制品征收關(guān)稅引發(fā)市場波動
- 2024年三季度報湖南地區(qū)A股總資產(chǎn)周轉(zhuǎn)天數(shù)排名前十大上市公司
- 慈溪防滑地坪施工方案
- 河道清理工程施工方案
- 磚砌石墩施工方案
- 油罐防腐保溫施工方案
- 小橋涵施工方案
- 低壓管道施工方案
- 2023年全國醫(yī)學(xué)考博英語試題
- 專業(yè)技術(shù)人員職務(wù)聘任書
- GB/T 25429-2019石油天然氣鉆采設(shè)備鉆具止回閥
- 新版基本公共衛(wèi)生服務(wù)健康教育培訓(xùn)課件
- 六年級上冊音樂課件 《校園小戲迷》人音版
- 2023版北京協(xié)和醫(yī)院重癥醫(yī)學(xué)科診療常規(guī)
- 千里江山圖解析課件
- 《現(xiàn)代漢語常用字表》3500個漢字
- 道路通行能力計算題
- 經(jīng)濟(jì)學(xué)基礎(chǔ)完整版ppt-全體教學(xué)教程課件最新
- JJF(湘) 09-2018 純水-超純水系統(tǒng)監(jiān)測儀表(電導(dǎo)率)計量校準(zhǔn)規(guī)范-(高清現(xiàn)行)
評論
0/150
提交評論