假設(shè)檢驗(yàn)與方差分析_第1頁(yè)
假設(shè)檢驗(yàn)與方差分析_第2頁(yè)
假設(shè)檢驗(yàn)與方差分析_第3頁(yè)
假設(shè)檢驗(yàn)與方差分析_第4頁(yè)
假設(shè)檢驗(yàn)與方差分析_第5頁(yè)
已閱讀5頁(yè),還剩23頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、假設(shè)檢驗(yàn)與方差分析第1頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一本章學(xué)習(xí)目的理解原假設(shè)、備擇假設(shè)、兩類錯(cuò)誤、單側(cè)檢驗(yàn)、雙側(cè)檢驗(yàn)、方差分析等概念。掌握三種不同的實(shí)際情況下陳述正確性、研究性、決策建立假設(shè)檢驗(yàn)的方法。掌握總體方差已知或未知時(shí)正態(tài)總體的均值假設(shè)檢驗(yàn)和總體比例的假設(shè)檢驗(yàn)。本章重難點(diǎn)提示 重點(diǎn)是三種不同情況下的假設(shè)檢驗(yàn)方法,總體方差已知時(shí)正態(tài)總體均值和總體比例的假設(shè)檢驗(yàn)。難點(diǎn)是總體方差未知時(shí)正態(tài)總體均值的假設(shè)檢驗(yàn)和方差分析。第2頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一 第一節(jié) 假設(shè)檢驗(yàn) 一、假設(shè)檢驗(yàn)的概念 假設(shè)(hypothesis),又稱統(tǒng)計(jì)假設(shè),是對(duì)總體

2、參數(shù)的具體數(shù)值所作的陳述。 假設(shè)檢驗(yàn)(hypothesis test) 是先對(duì)總體參數(shù)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的過程。 原假設(shè)與備擇假設(shè) 原假設(shè)(null hypothesis),又稱零假設(shè),用 表示,是指研究者想收集證據(jù)予以反對(duì)的假設(shè)。 備擇假設(shè)(alternative hypothesis),用 或 表示,是指研究者想收集證據(jù)予以支持的假設(shè),它與原假設(shè)陳述的內(nèi)容相反。第3頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一假設(shè)檢驗(yàn)的三種類型 1.對(duì)陳述正確性的檢驗(yàn) 在這種情況下,原假設(shè)通常是基于假定的陳述是正確的。然后建立備擇假設(shè),為拒絕提供統(tǒng)計(jì)證據(jù),從而證明這個(gè)

3、假定的陳述是錯(cuò)誤的。2.對(duì)研究性假設(shè)的檢驗(yàn) 在研究性假設(shè)檢驗(yàn)的調(diào)查研究中,應(yīng)該建立原假設(shè)和備擇假設(shè),并用備擇假設(shè)來表示研究性假設(shè),這樣如果拒絕,將支持樣本所得出的結(jié)論以及應(yīng)該采取某些行動(dòng)。3.對(duì)決策情況下的檢驗(yàn) 在決策情況下的檢驗(yàn)研究中,決策者必須從兩種措施中挑選其中一種,無論是接受還是拒絕,都必須采取一定的措施。 第4頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一假設(shè)檢驗(yàn)的三種形式 設(shè) 表示在原假設(shè)和備擇假設(shè)中考慮的某一特定數(shù)值, 表示總體的實(shí)際值。對(duì)總體 的假設(shè)檢驗(yàn)一定要采取下面的三種形式之一 : 第5頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一 拒絕域與檢驗(yàn)統(tǒng)計(jì)量拒

4、絕域是指能夠作出拒絕原假設(shè)這一結(jié)論的所有可能的樣本取值范圍。檢驗(yàn)統(tǒng)計(jì)量是根據(jù)樣本數(shù)據(jù)計(jì)算出來的,并據(jù)以對(duì)原假設(shè)和備擇假設(shè)作出決策的某種樣本統(tǒng)計(jì)量。 第6頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一 單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)單側(cè)檢驗(yàn)是指檢驗(yàn)統(tǒng)計(jì)量的取值位于其抽樣分布的某一側(cè)范圍內(nèi)時(shí)拒絕原假設(shè),也就是說抽樣分布的某一側(cè)構(gòu)成了拒絕域。雙側(cè)檢驗(yàn)是指檢驗(yàn)統(tǒng)計(jì)量的取值位于其抽樣分布的任何一側(cè)范圍內(nèi)時(shí)拒絕原假設(shè),也就是說抽樣分布的左右兩側(cè)共同構(gòu)成了拒絕域。第7頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一二、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤*第類錯(cuò)誤/棄真錯(cuò)誤 (type error) 當(dāng)原假設(shè)為真時(shí)拒

5、絕原假設(shè)。犯第類錯(cuò)誤的概率通常記為 。第類錯(cuò)誤/取偽錯(cuò)誤(type error) 當(dāng)原假設(shè)為假時(shí)沒有拒絕原假設(shè)。犯第類錯(cuò)誤的概率通常記為 。 在統(tǒng)計(jì)實(shí)踐中,進(jìn)行假設(shè)檢驗(yàn)時(shí)一般先控制第類錯(cuò)誤發(fā)生的概率,并確定犯第類錯(cuò)誤的概率最大值,稱為檢驗(yàn)的顯著性水平。顯著性水平一般選擇為0.05和0.01。 第8頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一假設(shè)檢驗(yàn)的步驟1.確定原假設(shè)和備擇假設(shè);2.選擇檢驗(yàn)統(tǒng)計(jì)量;3.確定檢驗(yàn)的顯著性水平 ;4.用顯著性水平來確定拒絕原假設(shè) 的檢驗(yàn)統(tǒng)計(jì)量的臨界值、拒絕域;5.根據(jù)樣本數(shù)據(jù),計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值;6.將統(tǒng)計(jì)量的值與臨界值進(jìn)行比較,并作出決策:若統(tǒng)計(jì)量的

6、值落在拒絕域內(nèi),拒絕原假設(shè) ,否則不拒絕原假設(shè) 。 或根據(jù)第5步的檢驗(yàn)統(tǒng)計(jì)量的值計(jì)算 值。運(yùn)用 值來確定是否拒絕。第9頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一 總體方差已知時(shí)正態(tài)總體均值的假設(shè)檢驗(yàn) 當(dāng)總體方差 已知,用正態(tài)分布來檢驗(yàn)總體均值的假設(shè)值的情況如下: 當(dāng)樣本數(shù) (大樣本)時(shí)的任意分布總體,(根據(jù)中心極限定理); 當(dāng)樣本數(shù) (小樣本)但是總體是正態(tài)分布的。例8-1 雙環(huán)汽車公司稱其應(yīng)收賬金額的均值為260.0萬元,審計(jì)師希望通過選取一個(gè)的樣本計(jì)算樣本均值來檢驗(yàn)是否如此。只有當(dāng)樣本均值與260.0萬元的假設(shè)值差別較大時(shí),審計(jì)師才會(huì)拒絕這個(gè)假設(shè),已知應(yīng)收賬款金額的標(biāo)準(zhǔn)差為=

7、43.0萬元,計(jì)算0.05顯著性水平下假設(shè)檢驗(yàn)的樣本均值臨界值。第10頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一計(jì)算過程假設(shè):顯著性水平:檢驗(yàn)統(tǒng)計(jì)量: , 的樣本的 因此,為了拒絕原假設(shè),這個(gè)樣本均值的值必須比 245.95小或者比 274.05大。所以,在雙側(cè)檢驗(yàn)(見下圖8-1)中有兩個(gè)拒絕域。第11頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一圖8-1 雙邊檢驗(yàn)的拒絕域與接受域第12頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一 例8-2 在例8-1的假設(shè)檢驗(yàn)中,如果樣本的均值為 ,當(dāng)顯著性水平為0.05時(shí),原假設(shè)是否被拒絕。 當(dāng) 時(shí),對(duì)應(yīng)于的雙側(cè)檢驗(yàn)的臨

8、界值 檢驗(yàn)統(tǒng)計(jì)量的值為 因?yàn)?,落在拒絕域內(nèi),所以否定原假設(shè),也就是說有95的可靠程度否定原假設(shè)。如果將樣本均值與圖8-1中均值的臨界值比較,將得到相同的結(jié)論。第13頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一圖8-2 雙邊檢驗(yàn)的拒絕域與接受域 第14頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一例8-3 新華都商場(chǎng)銷售一種產(chǎn)品,原每周銷售量服從均值為75,方差為14的正態(tài)分布。銷售方案更新后,為了考察銷售量是否提高,抽查了6周銷售量,求得平均銷售量為78,假定方差不變,問在顯著性水平0.05下,銷售方案更新后對(duì)周銷售量是否有顯著提高? 示例第15頁(yè),共28頁(yè),2022年

9、,5月20日,1點(diǎn)44分,星期一假設(shè): 左單邊檢驗(yàn)顯著性水平:檢驗(yàn)統(tǒng)計(jì)量: , 的樣本的 值由于總體服從方差已知的正態(tài)分布,所以在原假設(shè)下,檢驗(yàn)統(tǒng)計(jì)量當(dāng) 時(shí),對(duì)應(yīng)的臨界值為 因?yàn)?,故否定原假設(shè),這說明銷售方案更新后,周銷售量有明顯提高。 計(jì)算過程第16頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一 總體方差未知時(shí)正態(tài)總體均值的假設(shè)檢驗(yàn)如果樣本數(shù) ,根據(jù)中心極限定理,可以假定抽樣分布近似為正態(tài)概率分布;如果樣本數(shù) ,但均值的抽樣分布是正態(tài)分布時(shí)。無論哪一種情況,都應(yīng)當(dāng)使用T分布計(jì)算標(biāo)準(zhǔn)的檢驗(yàn)統(tǒng)計(jì)量,在計(jì)算檢驗(yàn)統(tǒng)計(jì)量時(shí),我們用樣本標(biāo)準(zhǔn)差 來代替總體標(biāo)準(zhǔn)差 。檢驗(yàn)統(tǒng)計(jì)量 第17頁(yè),共28

10、頁(yè),2022年,5月20日,1點(diǎn)44分,星期一例8-4 華碩筆記本電腦的說明書聲稱電池平均充電次數(shù)可達(dá)4200次。為驗(yàn)證其真實(shí)性,現(xiàn)隨機(jī)抽取10個(gè)樣本調(diào)查,結(jié)果顯示平均充電次數(shù)是4000次,樣本標(biāo)準(zhǔn)差為200小時(shí)。若一般電腦的電池充電次數(shù)服從正態(tài)分布,在5%的顯著性水平下,檢驗(yàn)說明書是否屬實(shí)?假設(shè): 右單側(cè)檢驗(yàn)顯著性水平:檢驗(yàn)統(tǒng)計(jì)量: , 的樣本的t 值由于總體服從方差未知的正態(tài)分布,所以在原假設(shè)下,檢驗(yàn)統(tǒng)計(jì)量 第18頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一當(dāng) 時(shí),對(duì)應(yīng)的臨界值為因?yàn)?所以原假設(shè)被拒絕,接受備擇假設(shè):可以認(rèn)為電池的真實(shí)充電次數(shù)少于4 200次,產(chǎn)品說明不屬實(shí)。第

11、19頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一 總體比例的假設(shè)檢驗(yàn)總體比例又稱總體成數(shù),是指總體中具有某種相同特征的單位數(shù)所占的比例。一般用 來表示總體比例, 表示總體比例的某一特定假設(shè)值??傮w中的某種特征可以是數(shù)值型的,如一定的重量、一定的長(zhǎng)度或一定的規(guī)格等;也可以是品質(zhì)型的,如男女性別、學(xué)歷等級(jí)、城市農(nóng)村等。 第20頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一總體比例的假設(shè)檢驗(yàn)步驟: 建立總體比例檢驗(yàn)的原假設(shè)和備擇假設(shè); 用樣本比例 和樣本標(biāo)準(zhǔn)差 的來計(jì)算檢驗(yàn)統(tǒng)計(jì)量 的值, 因?yàn)槭谴髽颖?,中心極限定理保證了統(tǒng)計(jì)量服從正態(tài)分布,那么統(tǒng)計(jì)量z就近似服從正態(tài)分布。 將檢

12、驗(yàn)統(tǒng)計(jì)量的值與臨界值相比較,確定是否應(yīng)該拒絕原假設(shè)。 第21頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一 例8-5 某保齡球館在過去幾個(gè)月中,有20的顧客是女性。為了提高女顧客比例,球館采取了一些措施來吸引女性保齡球手。一周后隨機(jī)抽取400名球手作為樣本,其中100名女球手。該球館經(jīng)理要據(jù)此判斷:在0.05的顯著性水平下,該球館女性保齡球手的比例是否提高?示例第22頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一假設(shè): 因?yàn)?所以為大樣本分布,檢驗(yàn)統(tǒng)計(jì)量 近似服從正態(tài)分布。樣本數(shù)據(jù)顯示 解題過程第23頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一在顯著性水平 情況

13、下,查表可知,因?yàn)?,拒絕原假設(shè) 。所以,該保齡球館的經(jīng)理可以得出結(jié)論:女性保齡球手的比例有所提高。第24頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一第二節(jié) 方差分析一、方差分析的基本問題 概念 方差分析是檢驗(yàn)幾個(gè)總體均值之間是否存在差別時(shí)最常用的統(tǒng)計(jì)方法,其基本原理是英國(guó)統(tǒng)計(jì)學(xué)家羅納德A費(fèi)希爾(Ronald A Fisher)在進(jìn)行實(shí)驗(yàn)設(shè)計(jì)時(shí)為了解釋試驗(yàn)數(shù)據(jù)而首先引入的。方差分析的原假設(shè)是多個(gè)總體均值彼此相等,抽樣方法是獨(dú)立地從每個(gè)分類范疇(即處理水平)中取樣。第25頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一 方差分析的基本假設(shè) 每個(gè)總體都應(yīng)服從正態(tài)分布。也就是說,對(duì)于因素的每一個(gè)水平,其觀察值是來自服從正態(tài)分布總體的簡(jiǎn)單隨機(jī)樣本。 各個(gè)總體的方差必須相同。也就是說,各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的。 觀察值之間是相互獨(dú)立的。第26頁(yè),共28頁(yè),2022年,5月20日,1點(diǎn)44分,星期一二、方差分析在方差分析中,我們將那些影響實(shí)驗(yàn)指標(biāo)的條件稱為因素,而將因素所處的條件稱為水平。如果所研究的問題只涉及一個(gè)影響因素,則稱這樣的方差分析為單因素分析;如果所研究的問題涉及多個(gè)影響因素,則稱為多因素分析。單因素方差分析只檢驗(yàn)一個(gè)變量的影響,是最簡(jiǎn)單的形式

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論