


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、歐陽(yáng)家百創(chuàng)編格拉布斯法(Gmbbs)檢驗(yàn)法歐陽(yáng)家百(2021.03. 07)概述:一組測(cè)量數(shù)據(jù)中,如果個(gè)別數(shù)據(jù)偏離平均值很遠(yuǎn),那么 這個(gè)(這些)數(shù)據(jù)稱作“可疑值”。如果用統(tǒng)計(jì)方法一例如格拉布斯 (Grubbs)法判斷,能將“可疑值”從此組測(cè)量數(shù)據(jù)中剔除而不參 與平均值的計(jì)算,那么該“可疑值”就稱作“異常值(粗大誤 差)” O本文就是介紹如何用格拉布斯法(Gmbbs)判斷“可疑值”是否為“異常值” O測(cè)量數(shù)據(jù):例如測(cè)量10次5 = 10),獲得以下數(shù)據(jù):8.2. 5.4.14.0. 73、4.7. 9.0. 6.5. 10.1, 7.7, 60。排列數(shù)據(jù):將上述測(cè)量數(shù)據(jù)按從小到大的順序排列,得到
2、4人5.4. 6.0. 6.5. 7.3. 7人 8.2. 9.0, 10.1, 14.0。可以肯定,可疑 值不是最小值就是最大值。計(jì)算平均值廠和標(biāo)準(zhǔn)差$: x- = 7.89 ;標(biāo)準(zhǔn)差$ = 2.704。計(jì)算 時(shí),必須將所有10個(gè)H-1計(jì)算偏離值:平均值與最小值之差為7.89-4.7 = 3.19;最大值與平均值之差為140-789 = 611。歐陽(yáng)家百創(chuàng)編確定一個(gè)可疑值:比較起來,最大值與平均值之差611大于平 均值與最小值之差319,因此認(rèn)為最大值140是可疑值。計(jì)算G值:G/ = (x/-x-)/5;其中i是可疑值的排列序號(hào)10 號(hào);因此 Gio = (xio -x-)/s = (14
3、.0 - 7.89)/2.704 = 2.260o 由 于xio-x是殘差,而$是標(biāo)準(zhǔn)差,因而可認(rèn)為Gio是殘差與標(biāo)準(zhǔn)差 的比值。下面要把計(jì)算值G與格拉布斯表給出的臨界值比 較,如果計(jì)算的Gi值大于表中的臨界值則能判斷該測(cè)量 數(shù)據(jù)是異常值,可以剔除。但是要提醒,臨界值Gp()與兩個(gè)參數(shù) 有關(guān):檢出水平0(與置信概率P有關(guān))和測(cè)量次數(shù)(與自由度/有 關(guān))。定檢出水平0:如果要求嚴(yán)格,檢出水平彳可以定得小一些, 例如定7=001,那么置信概率P=l- 7=0.99;如果要求不嚴(yán) 格,/可以定得大一些,例如定7=010,即P = 0.90;通常定a =0.05, P = 0.95o查格拉布斯表獲得臨
4、界值:根據(jù)選定的P值(此處為095)和測(cè)量 次數(shù)川此處為10),查格拉布斯表,橫豎相交得臨界值C95(10) = 2.176。比較計(jì)算值 G 和臨界值 695(10): G = 2260, G95(10) = 2.176,G/ G95(10)o歐陽(yáng)家百創(chuàng)編判斷是否為異常值:因?yàn)镚/695(10),可以判斷測(cè)量值140為 異常值,將它從10個(gè)測(cè)量數(shù)據(jù)中剔除。余下數(shù)據(jù)考慮:剩余的9個(gè)數(shù)據(jù)再按以上步驟計(jì)算,如果計(jì)算 的G5(9),仍然是異常值,剔除;如果G, 695(9),不是異常 值,則不剔除。本例余下的9個(gè)數(shù)據(jù)中沒有異常值。格拉布斯表臨界值GM/2)n0. 950. 99n0.950. 9931
5、.1351.155172.4752. 78541.4631.492182. 5042. 82151.6721.749192. 5322. 85461.8221.944202. 5572. 88471.9382. 097212. 5802.91282. 0322.231222. 6032. 93992.1102. 323232. 6242. 963102. 1762.410242. 6442. 987112. 2342.485252. 6633. 009122. 2852. 550302.7453.103132. 3312. 607352. 8113.178142. 3712.659402. 8
6、663. 240152.4092. 705452.9143. 292162.4432.747502. 9563. 336對(duì)異常值及統(tǒng)計(jì)檢驗(yàn)法的解釋測(cè)量過程杲對(duì)一個(gè)無限大總體的抽樣:對(duì)固定條件下的一種測(cè)量,理論上可以無限次測(cè)量下去,可以得到無窮多的測(cè)量數(shù)據(jù),歐陽(yáng)家百創(chuàng)編歐陽(yáng)家百創(chuàng)編這些測(cè)量數(shù)據(jù)構(gòu)成一個(gè)容量為無限大的總體;或者換一個(gè)角度 看,本來就存在一個(gè)包含無窮多測(cè)量數(shù)據(jù)的總體。實(shí)際的測(cè)量只 不過是從該無限大總體中隨機(jī)抽取一個(gè)容量為斤(例如/7=10)的樣 本。這種樣本也可以有無數(shù)個(gè),每個(gè)樣本相當(dāng)于總體所含測(cè)量數(shù) 據(jù)的不同隨機(jī)組合。樣本中的正常值應(yīng)當(dāng)來自該總體。通常的目 的是用樣本的統(tǒng)計(jì)量來估計(jì)
7、總體參量。總體一般假設(shè)為正態(tài)分 布。異常值區(qū)分:樣本中的正常值應(yīng)當(dāng)屬于同一總體;而異常值有 兩種情況:第一種情況異常值不屬于該總體,抽樣抽錯(cuò)了,從啟 外一個(gè)總體抽出一個(gè)(一些)數(shù)據(jù),其值與總體平均值相差較大;第 二種情況異常值雖屬于該總體,但可能是該總體固有隨機(jī)變異性 的極端表現(xiàn),比如說超過3(7的數(shù)據(jù),出現(xiàn)的概率很小。用統(tǒng)計(jì)判 斷方法就是將異常值找出來,舍去。犯錯(cuò)誤1:將本來不屬于該總體的、第一種情況的異常值判斷出 來舍去,不會(huì)犯錯(cuò)誤;將本來屬于該總體的、出現(xiàn)的概率小的、 第二種情況的異常值判斷出來舍去,就會(huì)犯錯(cuò)誤。犯錯(cuò)誤2:還有一種情況,不屬于該總體但數(shù)值又和該總體平均 值接近的數(shù)據(jù)被抽樣抽出來,統(tǒng)計(jì)檢驗(yàn)方法判斷不出它是異常 值,就合犯另外一種錯(cuò)誤。歐陽(yáng)家百創(chuàng)編異常值檢驗(yàn)法:判斷異常值的統(tǒng)計(jì)檢驗(yàn)法有很多種,例如格拉 布斯法、狄克遜法(Q法)、偏度-峰度法、拉依達(dá)法、奈爾法等 等。每種方法都有其適用范圍和優(yōu)缺點(diǎn)。格拉布斯法最佳:每種統(tǒng)計(jì)檢驗(yàn)法都會(huì)犯犯錯(cuò)誤1和錯(cuò)誤2。但 是有人做過統(tǒng)計(jì),在所有方法中,格拉布斯法犯這兩種錯(cuò)誤的概 率最小,所以推薦使
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 20MWh儲(chǔ)能電站項(xiàng)目社會(huì)效益分析
- 12MWh儲(chǔ)能電站項(xiàng)目選址與環(huán)境評(píng)估
- 年產(chǎn)3600萬套汽車制動(dòng)底板項(xiàng)目可行性研究報(bào)告
- 七年級(jí)地理知識(shí)點(diǎn)總結(jié)
- 中國(guó)散客旅游行業(yè)競(jìng)爭(zhēng)格局及市場(chǎng)發(fā)展?jié)摿︻A(yù)測(cè)報(bào)告
- 2025年蔗渣微粒板項(xiàng)目投資可行性研究分析報(bào)告
- 聚乙烯工藝安全分析報(bào)告
- 冠心病防與治
- 普通不干膠標(biāo)簽項(xiàng)目可行性研究報(bào)告
- 2020-2025年中國(guó)一次性手套行業(yè)發(fā)展?jié)摿Ψ治黾巴顿Y戰(zhàn)略咨詢報(bào)告
- 13.2《致大?!氛n件高中語(yǔ)文選擇性必修中冊(cè)
- 新質(zhì)生產(chǎn)力課件
- 傳播學(xué)研究方法
- 1.1公有制為主體 多種所有制經(jīng)濟(jì)共同發(fā)展 課件-高中政治統(tǒng)編版必修二經(jīng)濟(jì)與社會(huì)
- 青春期的婦科知識(shí)講座
- 《社區(qū)康復(fù)》課件-第三章 社區(qū)康復(fù)的實(shí)施
- 中職生心理健康教育全套教學(xué)課件
- JC-T 2704-2022 聚酯纖維裝飾吸聲板
- WTE朗文英語(yǔ)2B 單詞卡片
- 初三物理復(fù)習(xí)計(jì)劃詳細(xì)計(jì)劃
- 汽車懸架概述
評(píng)論
0/150
提交評(píng)論