版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、對比實驗聯(lián)想集團 歡迎光臨6sigma世界統(tǒng)計根底知識參數(shù)估計假設(shè)檢驗對比實驗報告編寫和練習(xí)課程進程為什么要學(xué)習(xí)對比實驗許多的問題需求就某些參數(shù)作出接受或回絕的決議,這闡明是一個假設(shè)。它代表把一個實務(wù)的問題演繹成統(tǒng)計學(xué)上的問題。而這個決策過程便稱為:Hypothesis Testing我們把實現(xiàn)假設(shè)檢驗的過程成為對比實驗。統(tǒng)計學(xué)上的測試能為我們就問題作出客觀講解,相比較以前,我們只能作出客觀的講解。這是后續(xù)學(xué)習(xí)內(nèi)容的根底。統(tǒng)計根底知識第一單元總體(Population):在統(tǒng)計問題中,我們把研討對象的全體成為總體個體:構(gòu)成總體的每個成員稱為個體樣本(Sample):從總體中抽取部分個體所組成的
2、集合稱為樣本樣品:樣本中的個體稱為樣品樣本容量:樣品的個數(shù)稱為樣本容量,常用n表示1.1總體和樣本樣本隨機樣本(Random sample):可以被推行運用于更大的總體的樣本。總體的每個個體有一個知的有時是相等的時機被包含在該樣本中。簡單隨機樣本(Simple random sample):1、同一性:樣本與總體有同樣的分布2、獨立性: 假設(shè)給定第一個事件,無論它的結(jié)果是什么,第二個事件的時機都一樣。1.2統(tǒng)計量和抽樣分布統(tǒng)計量:不含未知參數(shù)的樣本函數(shù)稱為統(tǒng)計量。抽樣分布:統(tǒng)計量的分布稱為抽樣分布。有序樣本: 是從總體X中隨機抽取的容量為n的樣本,將它們的觀測值從小到大排序,這便是有序樣本。統(tǒng)
3、計推斷過程統(tǒng)計學(xué)的主要義務(wù):1、研討總體是什么分布?2、這個總體即分布的均值、方差是多少?樣本總體樣本統(tǒng)計量例如:樣本均值、方差總體均值、方差抽樣1.2常用統(tǒng)計量描畫中心位置的統(tǒng)計量:1、眾數(shù)mode:一個變量的眾數(shù)是指出現(xiàn)次數(shù)最多的值,不過它不一定獨一。2、中位數(shù):3、均值mean:1.2常用統(tǒng)計量描畫數(shù)據(jù)分散程度的統(tǒng)計量:1、極差range:2、方差variance3、規(guī)范差standard deviation:4、規(guī)范誤差standard error :是很多不同樣本的均值的規(guī)范差。5、變異系數(shù):1.3正態(tài)分布正態(tài)分布:1.3正態(tài)分布規(guī)范正態(tài)分布:它是特殊的正態(tài)分布,服從規(guī)范的正態(tài)分布的
4、隨機變量記為z,概率密度函數(shù)記為z1.3正態(tài)分布規(guī)范正態(tài)分布的變換:1.3正態(tài)分布規(guī)范正態(tài)分布的分位數(shù):0.975是隨機變量z不超越1.96的概率1.96是規(guī)范正態(tài)分布N0,1)的0.975的分位數(shù),記為z0.9750.9750.0251.4常用的抽樣分布正態(tài)樣本均值的分布: =10Xn = 4Xn =16總體分布抽樣分布1.4常用的抽樣分布t分布: Xt 分布與正態(tài)分布的比較正態(tài)分布t 分布t不同自在度的t分布規(guī)范正態(tài)分布t (df = 13)t (df = 5)1.4常用的抽樣分布F分布:設(shè)X1,X2,Xn是來自正態(tài)總體N(1,12 )的一個樣本, Y1,Y2,Yn是來自正態(tài)總體N(2,2
5、2 )的一個樣本,且相互獨立,那么:將F(n-1 , m-1 )稱為第一自在度為(n-1),第二自在度為(m-1)的F分布1.4常用的抽樣分布F分布:F1,10)(5,10)(10,10)參數(shù)估計第二單元2.1點估計點估計的概念point estimation: 用樣本均值估計總體均值用樣本方差估計總體方差用樣本規(guī)范差估計總體規(guī)范差2.2區(qū)間估計區(qū)間估計的概念interval estimate:置信區(qū)間confidence interval: ,那么稱這種置信區(qū)間為等尾置信區(qū)間。2.2區(qū)間估計 置信區(qū)間下限值1 - aa/2a/2x 置信區(qū)間上限值點估計與區(qū)間估計的區(qū)別:我是意見是這個值是10
6、,但誤差在1之間。2.2區(qū)間估計2.2區(qū)間估計置信程度的概念: 是的置信程度為1-的置信區(qū)間。它的含義是能蓋住未知參數(shù)的概率為1-。置信區(qū)間量化了數(shù)據(jù)的不定性。2.2區(qū)間估計總體均值置信區(qū)間的計算: 知: 未知:2.2區(qū)間估計2分布:方差置信區(qū)間的計算:2.2區(qū)間估計置信區(qū)間的長度:1、大的樣本產(chǎn)生較短的區(qū)間,小的樣本產(chǎn)生較長的區(qū)間。2、低的置信程度產(chǎn)生較短的區(qū)間,高的置信程度產(chǎn)生較長的區(qū)間。N=100N=200N=300N=400N=500ExercisesX=sXnDistribution of Sampling AveragesXX研討草莓醬的分量是多少?答案:=95的置信區(qū)間假設(shè)檢驗第
7、三單元3.1假設(shè)檢驗問題例:草莓醬的凈重服從正態(tài)分布N,2, 6月份從產(chǎn)品中隨機抽取50瓶稱重的平均分量為180.5克, 5月份從產(chǎn)品中隨機抽取50瓶稱重的平均分量為179.6克, ,問從總體上能否分量比原來少了?1、這不是一個參數(shù)估計問題2、要求對6-5=0作出回答:是與否3、這類問題被稱為統(tǒng)計假設(shè)檢驗問題估計的主要義務(wù)是找參數(shù)值等于幾;假設(shè)檢驗的興趣主要是看參數(shù)的值能否等于某個特別感興趣的值3.2定義假設(shè)H0和HaH0要判別0.9克這個值能否超出了樣本變換所能呵斥的差別的范圍,我們先要問一問在總體均值相等的情況下,樣本均值會發(fā)生什么情況,即能否兩個均值的差等于0,在統(tǒng)計學(xué)上被稱為零假設(shè)(n
8、ull hypothesis)之所以用零來修飾假設(shè),其緣由是假設(shè)的內(nèi)容總是沒有差別或沒有改動3.2定義假設(shè)H0和HaHA零假設(shè)其邏輯上的反面假設(shè)是“兩個參數(shù)有區(qū)別。這種反面假設(shè)稱為備擇假設(shè)alternative hypothesis。當零假設(shè)所提問的問題被否認時,備擇假設(shè)的答案就是正確的。假設(shè)樣本數(shù)據(jù)能證明對于零假設(shè)提出的問題應(yīng)該否認,那么我們就回絕reject零假設(shè)而傾向于備擇假設(shè)。3.3怎樣回答零假設(shè)所提出的問題概率:p-值p-值是當零假設(shè)正確時,得到所觀測的數(shù)據(jù)或更極端的數(shù)據(jù)的概率,這個概率稱為p-值p-value。當p-值小到以致于幾乎不能夠在零假設(shè)正確時出現(xiàn)目前的觀測數(shù)據(jù)時,我們就回
9、絕零假設(shè)。 p-值越小,回絕零假設(shè)的理由就越充分。留意: 有時錯誤以為p-值與零假設(shè)對錯的概率有關(guān),但這是不能夠的. p-值指的是關(guān)于數(shù)據(jù)的概率。 p-值通知我們在某總體的許多樣本中,某一類數(shù)據(jù)出現(xiàn)的經(jīng)常程度。3.3怎樣回答零假設(shè)所提出的問題假設(shè)檢驗機制:為了求p-值,統(tǒng)計實際指出要把觀測到的0.9這個樣本均值之差變換成規(guī)范得分。規(guī)范得分:0.0H00.00.510.9觀測到的差樣本均值的差規(guī)范得分2.142 p-值0.03473.3怎樣回答零假設(shè)所提出的問題假設(shè)檢驗機制:t值等于2.142的概率是0.0347,因此兩個樣本均值之差等于0.9的概率也是0.0347 ,換句話說就是假設(shè)兩總體均值
10、相等的話,從均值相等的總體中抽取200個樣本兩兩相減所得之差只需3.47個樣本的樣本均值相差在0.9,是小概率0.05事件,我們回絕零假設(shè)。H00.00.510.9觀測到的差樣本均值的差規(guī)范得分2.142 p-值0.03473.4顯著程度顯著程度:我們不是在數(shù)據(jù)搜集終了之后計算p-值,而是在搜集數(shù)據(jù)以前就曾經(jīng)確定好的小概率來構(gòu)造一個區(qū)間。當樣本數(shù)據(jù)落入這個區(qū)間時就回絕零假設(shè)。這個小概率 稱為檢驗的顯著程度significant level,通常選0.05.一個檢驗的顯著程度是抽樣所得的數(shù)據(jù)回絕了本來是正確的零假設(shè)的概率?;亟^域:當樣本數(shù)據(jù)落入這個區(qū)間時就回絕零假設(shè),那么這個區(qū)間就稱為回絕域。臨
11、界值critical values:回絕域的邊境所對應(yīng)的規(guī)范得分的值。對于雙邊檢驗,樣本統(tǒng)計量的臨界值是兩個值。3.4顯著程度Ho值臨界值臨界值a/2 a/2 樣本統(tǒng)計量回絕域回絕域接受域抽樣分布1 - 置信程度3.5風險和sX=sXnDistribution of Sampling AveragesXX3.5和的關(guān)系sX=sXnDistribution of Sampling AveragesXX他不能同時減少兩類錯誤!3.6假設(shè)檢驗的步驟1、建立假設(shè)2、數(shù)據(jù)獨立性檢查3、數(shù)據(jù)正態(tài)性檢查4、如為One to One問題進展方差的F檢驗5、計算檢驗統(tǒng)計量6、給出顯著性程度 ,通常 =0.057
12、、定出臨界值,寫出回絕域8、判別案例1例:草莓醬的凈重服從正態(tài)分布N180,22, 5月份隨機抽取50罐稱重的平均分量為179.6克,問能否符合規(guī)范?平均凈重:179.6g3.7One to Standard的問題是假設(shè)檢驗的特例: 其中一個 知3.7One to Standard的問題計算規(guī)范得分: 知時,運用z統(tǒng)計量計算 未知時,運用t統(tǒng)計量計算雙側(cè)問題Ho值臨界值臨界值a/2 a/2 樣本統(tǒng)計量回絕域回絕域接受域抽樣分布1 - 置信程度3.7One to Standard的問題單側(cè)左檢驗 表格值(臨界值)回絕范圍無法回絕HOHa: (大于)3.7One to Standard的問題單側(cè)右
13、檢驗回絕范圍無法回絕HO 表格值(臨界值)Ha: (小于)3.7One to Standard的問題JMP中的操作3.7One to Standard的問題JMP中的操作3.7One to Standard的問題JMP中的操作案例2例:草莓醬的凈重服從正態(tài)分布N,2, 6月份從產(chǎn)品中隨機抽取50瓶稱重的平均分量為180.5克, 5月份從產(chǎn)品中隨機抽取50瓶稱重的平均分量為179.6克, ,問從總體上能否分量比原來少了?假設(shè)檢驗的步驟1、建立假設(shè)2、數(shù)據(jù)獨立性檢查3、數(shù)據(jù)正態(tài)性檢查4、如為One to One問題進展方差的F檢驗5、計算檢驗統(tǒng)計量6、給出顯著性程度 ,通常 =0.057、定出臨界
14、值,寫出回絕域8、判別3.8One to One的問題建立假設(shè):假設(shè)檢驗的步驟1、建立假設(shè)2、數(shù)據(jù)獨立性檢查3、數(shù)據(jù)正態(tài)性檢查4、如為One to One問題進展方差的F檢驗5、計算檢驗統(tǒng)計量6、給出顯著性程度 ,通常 =0.057、定出臨界值,寫出回絕域8、判別假設(shè)檢驗的步驟1、建立假設(shè)2、數(shù)據(jù)獨立性檢查3、數(shù)據(jù)正態(tài)性檢查4、如為One to One問題進展方差的F檢驗5、計算檢驗統(tǒng)計量6、給出顯著性程度 ,通常 =0.057、定出臨界值,寫出回絕域8、判別3.8One to One的問題FcritaF檢驗:假設(shè)檢驗的步驟1、建立假設(shè)2、數(shù)據(jù)獨立性檢查3、數(shù)據(jù)正態(tài)性檢查4、如為One to
15、One問題進展方差的F檢驗5、計算檢驗統(tǒng)計量6、給出顯著性程度 ,通常 =0.057、定出臨界值,寫出回絕域8、判別3.8One to One的問題 相等時t的計算:Sp為s1 ,s2的加權(quán)平均,稱為兩個樣本的結(jié)合方差。3.8One to One的問題 不等時t的計算:3.8One to One的問題假設(shè)檢驗的步驟1、建立假設(shè)2、數(shù)據(jù)獨立性檢查3、數(shù)據(jù)正態(tài)性檢查4、如為One to One問題進展方差的F檢驗5、計算檢驗統(tǒng)計量6、給出顯著性程度 ,通常 =0.057、定出臨界值,寫出回絕域8、判別3.8One to One的問題Ho值臨界值臨界值a/2 a/2 樣本統(tǒng)計量回絕域回絕域接受域抽樣
16、分布1 - 置信程度假設(shè)檢驗的步驟1、建立假設(shè)2、數(shù)據(jù)獨立性檢查3、數(shù)據(jù)正態(tài)性檢查4、如為One to One問題進展方差的F檢驗5、計算檢驗統(tǒng)計量6、給出顯著性程度 ,通常 =0.057、定出臨界值,寫出回絕域8、判別3.8One to One的問題由于Prob0.03470.05,所以我們回絕零假設(shè),接受備擇假設(shè)!3.8One to One的問題不等實驗和報告編寫第四單元練習(xí)30分鐘例:兩家供應(yīng)商的硬盤性能目的數(shù)據(jù),問能否這兩個供應(yīng)商有顯著差別?謝謝大家!課程開發(fā)人員:孟繁一、高武附錄假設(shè)檢驗術(shù)語零假設(shè) (Ho) -不存在變化或差別的命題。假設(shè)沒有充分的證據(jù)回絕它,就假設(shè)這一命題是真的。備擇假設(shè)(Ha) - 存在變化或差別的命題。假設(shè)回絕Ho,那么以為這一命題是真的。一類錯誤 - 當Ho 實踐上為真時而被回絕所產(chǎn)生的錯誤,或是接受存在差別、但現(xiàn)實上卻沒有差別時所犯的錯誤。二類錯誤 - 當Ho 實踐上為偽而沒有被回絕所產(chǎn)生的錯誤,或是接受沒有差別、但現(xiàn)實上存在差別時所犯的錯誤。假設(shè)檢驗術(shù)語
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年全球及中國緊湊型真空干燥箱行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025-2030全球高純渦輪分子泵行業(yè)調(diào)研及趨勢分析報告
- 自治物業(yè)管理合同
- 工廠員工勞動合同范本
- 展柜采購合同
- 農(nóng)場承包合同協(xié)議書
- 建筑工程合同的簡述
- 杭州市二手房買賣合同
- 砌體施工勞務(wù)合同
- 2025抵押擔保借款合同
- 醫(yī)院課件:《食源性疾病知識培訓(xùn)》
- 浙教版七年級數(shù)學(xué)下冊單元測試題及參考答案
- 華為人才發(fā)展與運營管理
- 卓有成效的管理者讀后感3000字
- 七年級下冊-備戰(zhàn)2024年中考歷史總復(fù)習(xí)核心考點與重難點練習(xí)(統(tǒng)部編版)
- 巖土工程勘察服務(wù)投標方案(技術(shù)方案)
- 實驗室儀器設(shè)備驗收單
- 新修訂藥品GMP中藥飲片附錄解讀課件
- 蒙特利爾認知評估量表北京版
- 領(lǐng)導(dǎo)干部個人有關(guān)事項報告表(模板)
- GB/T 7631.18-2017潤滑劑、工業(yè)用油和有關(guān)產(chǎn)品(L類)的分類第18部分:Y組(其他應(yīng)用)
評論
0/150
提交評論