參數(shù)估計與假設(shè)檢驗(yàn)2016-7-3_第1頁
參數(shù)估計與假設(shè)檢驗(yàn)2016-7-3_第2頁
參數(shù)估計與假設(shè)檢驗(yàn)2016-7-3_第3頁
參數(shù)估計與假設(shè)檢驗(yàn)2016-7-3_第4頁
參數(shù)估計與假設(shè)檢驗(yàn)2016-7-3_第5頁
已閱讀5頁,還剩87頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

參數(shù)估計與假設(shè)檢驗(yàn)實(shí)例結(jié)果

(1)現(xiàn)患狀況:瀏陽市18歲以上成年人糖尿病患病率為5.4%(95%CI:4.8%-5.9%),其中男性為5.0%(95%CI:4.3%-5.8%),女性為5.7%(95%CI:4.9%-6.7%);高血壓患病率為27.2%(95%CI:26.0%-28.4%),其中男性為26.5%(95%CI:24.9%-28.1%),女性為27.9%(95%CI:26.3%-29.7%);糖尿病患者合并高血壓的患病率為2.6%(95%CI:2.2%,3.1%),其中男性為2.4%(95%CI:1.9%,2.9%),女性為2.9%(95%CI:2.3%,3.6%),糖尿病患者中合并高血壓的比例為48.7%(148/304)。非條件多因素logistic回歸分析結(jié)果顯示與糖尿病有關(guān)的因素是:既往吸煙1.890(95%CI:1.175,3.040)、飲酒0.684(95%CI:0.482,0.970)、膽固醇1.411(95%CI:1.003,1.986)、甘油三酯2.190(95%CI:1.671,2.871)、腹型肥胖1.750(95%CI:1.358,2.253)、高血壓1.760(95%CI:1.362,2.274),

非條件多因素logistic回歸分析結(jié)果顯示有既往吸煙1.936(95%CI:1.059,3.540)、甘油三酯異常3.236(95%CI:2.267,4.619)、肥胖5.343(95%CI:1.174,24.325)、腹型肥胖1.737(95%CI:1.119,2.699),表3-1瀏陽市18歲以上不同性別、年齡糖尿病患病率年齡(歲)男

性女

性合

計調(diào)查數(shù)患病數(shù)率(%)調(diào)查數(shù)患病數(shù)率(%)調(diào)查數(shù)患病數(shù)率(%)18-2923710.423310.447020.430-39400

9

2.341281.98121721880374.21743643.750-59630447.0530427.91160867.760-69501336.63584011.2859738.570-792622911.1216209.34784910.280以上7268.37479.5146138.9合計29651495.027031555.756683045.4表3-5糖尿病合并高血壓單因素分析結(jié)果因素糖尿病組非糖尿病組檢驗(yàn)統(tǒng)計量P值性別:男70(3.2)21021.8010.180

女78(4.0)1871年齡(歲):18-291(0.2)456131.9760.00030-395(0.7)72640-4926(1.9)137350-5944(5.9)72360-6946(9.4)44270-7918(8.4)19780以上8(12.5)56婚姻:

未婚5(2.2)22027.0160.000已婚120(3.3)3504喪偶22(9.7)204離異1(2.4)40本章開始學(xué)習(xí)統(tǒng)計推斷(statisticalinference)方法,內(nèi)容涉及參數(shù)估計和假設(shè)檢驗(yàn)的基本概念和原理。

統(tǒng)計推斷參數(shù)估計假設(shè)檢驗(yàn)總體樣本抽取部分觀察單位

統(tǒng)計量

參數(shù)

統(tǒng)計推斷統(tǒng)計推斷

statisticalinference如:樣本均數(shù)樣本標(biāo)準(zhǔn)差S

樣本率P如:總體均數(shù)總體標(biāo)準(zhǔn)差總體率參數(shù)估計(estimationofparameters)

包括:點(diǎn)估計與區(qū)間估計假設(shè)檢驗(yàn)(testofhypothesis)

統(tǒng)計學(xué)中的統(tǒng)計推斷包括兩個重要的方面:一是利用樣本統(tǒng)計量的信息對相應(yīng)總體參數(shù)值做出推斷,如用樣本均數(shù)估計總體均數(shù),用樣本標(biāo)準(zhǔn)差S估計總體標(biāo)準(zhǔn)差等,稱之為點(diǎn)估計。另一個是利用樣本統(tǒng)計量來推斷我們是否接受一個事先的假設(shè),稱之為假設(shè)檢驗(yàn)。本章只討論參數(shù)估計,假設(shè)檢驗(yàn)將在下一章中討論。而參數(shù)估計又分為點(diǎn)估計與區(qū)間估計。

一、抽樣誤差在醫(yī)學(xué)研究中,絕大多數(shù)情況是由樣本信息推斷總體特征。由于個體存在差異,因此通過樣本推論總體時會存在一定的誤差,如樣本均數(shù)往往不等于總體均數(shù),這種由抽樣造成的樣本統(tǒng)計量與總體參數(shù)的差異稱為抽樣誤差(samplingerror)。第一節(jié)參數(shù)估計抽樣試驗(yàn)

從正態(tài)分布總體N(5.00,0.502)中,每次隨機(jī)抽取樣本含量n=5,并計算其均數(shù)與標(biāo)準(zhǔn)差;重復(fù)抽取1000次,獲得1000份樣本;計算1000份樣本的均數(shù)與標(biāo)準(zhǔn)差,并對1000份樣本的均數(shù)作直方圖。按上述方法再做樣本含量n=10、樣本含量n=30的抽樣實(shí)驗(yàn);比較計算結(jié)果。抽樣試驗(yàn)(n=5)抽樣試驗(yàn)(n=10)抽樣試驗(yàn)(n=30)1000份樣本抽樣計算結(jié)果總體的均數(shù)總體標(biāo)準(zhǔn)差s均數(shù)的均數(shù)均數(shù)標(biāo)準(zhǔn)差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.09133個抽樣實(shí)驗(yàn)結(jié)果圖示(一)均數(shù)的標(biāo)準(zhǔn)誤統(tǒng)計學(xué)中為了區(qū)別個體觀察值之間變異的標(biāo)準(zhǔn)差與反映樣本均數(shù)之間變異的標(biāo)準(zhǔn)差,將后者稱為均數(shù)的標(biāo)準(zhǔn)誤(standarderrorofthemean)。顯然,均數(shù)的標(biāo)準(zhǔn)誤小于原始測量值的標(biāo)準(zhǔn)差,均數(shù)的標(biāo)準(zhǔn)誤越小說明估計越精確,因此可以用均數(shù)的標(biāo)準(zhǔn)誤表示均數(shù)抽樣誤差的大小。均數(shù)的標(biāo)準(zhǔn)誤用符號表示,計算公式為:

在樣本含量一定的情況下,均數(shù)的標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比,均數(shù)的標(biāo)準(zhǔn)誤與樣本含量的平方根成反比,說明在同一總體中隨機(jī)抽樣,樣本含量越大,均數(shù)的標(biāo)準(zhǔn)誤越小。均數(shù)的標(biāo)準(zhǔn)誤反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均數(shù)的差異。

統(tǒng)計上通常將統(tǒng)計量(如樣本均數(shù)、樣本率p等)的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤(standarderror,SE)。所以,樣本均數(shù)的標(biāo)準(zhǔn)差又稱為樣本均數(shù)的標(biāo)準(zhǔn)誤,是反映樣本均數(shù)抽樣誤差大小的指標(biāo)。

特點(diǎn):

1.總體標(biāo)準(zhǔn)誤的大小與總體標(biāo)準(zhǔn)差成正比,與樣本含量的平方根成反比。即當(dāng)樣本含量n一定時,標(biāo)準(zhǔn)差越大,即樣本的個體差異越大,標(biāo)準(zhǔn)誤就越大,樣本均數(shù)的抽樣誤差就越大;標(biāo)準(zhǔn)差越小,標(biāo)準(zhǔn)誤就越小,即樣本均數(shù)抽樣誤差就越小。

2.當(dāng)標(biāo)準(zhǔn)差一定時,n越大,標(biāo)準(zhǔn)誤就越?。籲越小,標(biāo)準(zhǔn)誤就越大。故影響抽樣誤差大小的主要因素是樣本含量。作為總體參數(shù)(常數(shù))通常是未知的,因而,在實(shí)際工作中常用樣本標(biāo)準(zhǔn)差S來估計。

實(shí)際中,總體標(biāo)準(zhǔn)差往往未知,因而通常用樣本標(biāo)準(zhǔn)差代替,求得樣本均數(shù)標(biāo)準(zhǔn)誤的估計值,計算公式為:例3-1

在某地隨機(jī)抽查成年男子140人,得紅細(xì)胞均數(shù),標(biāo)準(zhǔn)差,試計算其標(biāo)準(zhǔn)誤。 按公式計算得:(二)率的標(biāo)準(zhǔn)誤樣本率的標(biāo)準(zhǔn)差也稱為率的標(biāo)準(zhǔn)誤(standarderrorofrate),可用來描述樣本率抽樣誤差的大小。率的標(biāo)準(zhǔn)誤越小,則率的抽樣誤差越小,率的標(biāo)準(zhǔn)誤越大,則率的抽樣誤差越大。公式為:在一般情況下,總體率往往是未知的,此時可用樣本率來代替總體率,其估計值為:二、可信區(qū)間的概念點(diǎn)估計:是使用單一的數(shù)值直接作為總體參數(shù)的估計值,如用估計相應(yīng)的,用估計相應(yīng)的。該法表達(dá)簡單,但未考慮抽樣誤差的影響,無法評價參數(shù)估計的準(zhǔn)確程度。區(qū)間估計(intervalestimation)是指按預(yù)先給定的概率,計算出一個區(qū)間,使它能夠包含未知的總體均數(shù)。事先給定的概率稱為可信度,計算得到的區(qū)間稱為可信區(qū)間(confidenceinterval,CI)??傮w均數(shù)的估計

總體均數(shù)的點(diǎn)估計(pointestimation)與區(qū)間估計參數(shù)的估計點(diǎn)估計:由樣本統(tǒng)計量直接估計總體參數(shù)區(qū)間估計:在一定可信度(Confidencelevel)下,同時考慮抽樣誤差區(qū)間估計總體均數(shù)的區(qū)間估計(intervalestimation)是利用樣本信息給出一個區(qū)間,并同時給出重復(fù)試驗(yàn)時該區(qū)間包含總體均數(shù)的概率。

1)可信區(qū)間的涵義

從總體中作隨機(jī)抽樣,對于含量為n的每個樣本而言,都可以算得一個區(qū)間。以95%的可信區(qū)間為例,意味著在同一總體中作100次重復(fù)抽樣,可得100個可信區(qū)間,平均有95個可信區(qū)間包含總體均數(shù)(估計正確),只有5個可信區(qū)間不包含總體均數(shù)(估計不正確),或?qū)τ谀骋粋€區(qū)間而言,它包含總體均數(shù)的可能性為95%,而不包含總體均數(shù)的可能性僅為5%。因此在實(shí)際應(yīng)用中,以這種方法估計總體均數(shù)犯錯誤的概率僅為5%。

2)可信區(qū)間具有兩個要素

(1)準(zhǔn)確度(accuracy),即可信區(qū)間包含的概率的大小,一般而言概率越大越好。

(2)精密度(precision),反映區(qū)間的長度,區(qū)間的長度越窄,估計的精密度越好,反之越差。

(一)已知一般情況其中為標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)界值。

95%可信區(qū)間:三、總體均數(shù)的區(qū)間估計(二)未知通常未知,這時可以用其估計量S代替,但已不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從著名的t分布。

圖6-1

不同自由度的t

分布圖

ConfidenceintervalWilliamGosset可信區(qū)間的計算:原理與前完全相同,僅僅是兩側(cè)概率的界值有些差別。即需要注意:在小樣本情況下,應(yīng)用這一公式的條件是原始變量服從正態(tài)分布。在大樣本下可以用替換??尚艆^(qū)間:Confidenceinterval例3-2

某醫(yī)生測得25名動脈粥樣硬化患者血漿纖維蛋白原含量的均數(shù)為3.32g/L,標(biāo)準(zhǔn)差為0.57g/L,試計算該種病人血漿纖維蛋白原含量總體均數(shù)的95%可信區(qū)間。下限:上限:Confidenceinterval例3-3

試計算例6-1中該地成年男子紅細(xì)胞總體均數(shù)的95%可信區(qū)間。本例屬于大樣本,可采用正態(tài)近似的方法計算可信區(qū)間。因?yàn)?,則95%可信區(qū)間為:

下限:上限:Confidenceinterval單側(cè)可信區(qū)間:前面涉及的都是雙側(cè)可信區(qū)間。但有些情況下,我們所關(guān)心的僅僅是單側(cè)的可信限。單側(cè)可信區(qū)間與雙側(cè)可信區(qū)間的計算公式基本相同,只需將公式中的抽樣分布的雙側(cè)界值換成單側(cè)界值,同時只取下限或上限。Confidenceinterval實(shí)際中,有時需要計算兩個總體均數(shù)差值的可信區(qū)間,例如通過計算兩種降壓藥物平均降壓的差值比較兩種藥物的差別,其雙側(cè)可信區(qū)間的計算公式為 其中,為自由度,為兩樣本均數(shù)之差的標(biāo)準(zhǔn)誤。

四、兩總體均數(shù)差的區(qū)間估計當(dāng)兩總體方差相同時,其中為兩樣本的合并方差。當(dāng)兩樣本的樣本含量均較大時,上述計算可信區(qū)間中的可用相應(yīng)的代替,而且無論兩總體的方差是否相同,有Confidenceinterval例3-4

評價復(fù)方纈沙坦膠囊與纈沙坦膠囊對照治療輕中度高血壓的有效性,將123名患者隨機(jī)分為兩組,其中試驗(yàn)組和對照組分別為54例和48例。經(jīng)六周治療后測量收縮壓,試驗(yàn)組平均下降15.77mmHg,標(biāo)準(zhǔn)差為13.17mmHg;對照組平均下降9.53mmHg,標(biāo)準(zhǔn)差為13.55mmHg。試估計兩組收縮壓平均下降差值的95%可信區(qū)間。Confidenceinterval由公式計算:下限:上限:五、總體率的區(qū)間估計

1.

樣本率的區(qū)間估計:利用二項(xiàng)分布可估計其總體率可信區(qū)間,一般取。對于,且接近于0或1時,可直接查附表6百分率的可信區(qū)間表得到其總體率的可信區(qū)間。例3-52003年4~6月某醫(yī)院重癥監(jiān)護(hù)病房收治重癥SARS患者38人,其中死亡14人,求SARS病死率的95%可信區(qū)間。(查附表6,95%的可信區(qū)間為22%~54%)。

2.當(dāng)較大,和均不太小,如和均大于5時,可利用樣本率近似服從正態(tài)分布的原理來估計總體率的可信區(qū)間,計算公式為

,例6-6

某區(qū)疾病預(yù)防控制中心2002年對該鄉(xiāng)鎮(zhèn)250名小學(xué)生進(jìn)行貧血的檢測,結(jié)果發(fā)現(xiàn)有86名貧血者,檢出率為34.40%,求貧血檢出率95%的可信區(qū)間。

六、兩總體率差值的區(qū)間估計在大樣本情況下,可采用正態(tài)近似法對兩總體率差值進(jìn)行可信區(qū)間估計,其計算公式為:X1和X2分別表示兩組中某事件發(fā)生的例數(shù)。例3-7

某醫(yī)院口腔科醫(yī)生用極固寧治療牙本質(zhì)過敏癥,以雙氟涂料作對照,進(jìn)行了1年的追蹤觀察,結(jié)果見表6-1所示,試估計兩組有效率差別95%的可信區(qū)間。

表6-1治療牙本質(zhì)過敏癥兩組有效率的比較組別總牙數(shù)有效數(shù)有效率(%)試驗(yàn)組776179.22對照組693855.07合計1469967.81Confidenceinterval本例:

兩組總體率差別95%的可信區(qū)間為

Confidenceinterval第二節(jié)假設(shè)檢驗(yàn)一、基本原理假設(shè)檢驗(yàn)(hypothesistest):統(tǒng)計推斷另一重要內(nèi)容,其目的是比較總體參數(shù)之間有無差別。

例3-8

使用黑加侖油軟膠囊治療高脂血癥,30名患者治療前后的血清甘油三酯檢測結(jié)果的差值為1.38±0.76(mmol/L),問治療后血清甘油三酯是否有所改善?假設(shè)檢驗(yàn)過去稱顯著性檢驗(yàn)。它是利用小概率反證法思想,從問題的對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。然后在H0成立的條件下計算檢驗(yàn)統(tǒng)計量,最后獲得P值來判斷。

假設(shè)檢驗(yàn)基本思想

樣本治療前后甘油三酯的變化(差值)問題歸納:樣本療效藥物作用+機(jī)遇

對上面問題可以作如下考慮:

問題:究竟多大能夠下“有效”的結(jié)論?Hypothesistest假設(shè)的基本思想是,首先對所需要比較的總體提出一個無差別的假設(shè),然后通過樣本數(shù)據(jù)去推斷是否拒絕這一假設(shè)。如服從t分布圖3-2

利用t分布進(jìn)行假設(shè)檢驗(yàn)原理示意圖Hypothesistest假設(shè)檢驗(yàn)步驟

Procedureofhypothesistesting

Step1:setuptesthypothesis(H0vs.H1)andsignificantlevel,Nullhypothesis:Theobserveddifferenceisduetochance(I.e.,thereisnorealdifference),Alternativehypothesis:Thereisarealdifference;Step2:selectandcalculatethestatistic;Step3:findthePvalueandmakeaconclusion.除t分布外,針對不同的資料還有其他各種檢驗(yàn)統(tǒng)計量及分布,如F分布、分布等,應(yīng)用這些分布對不同類型的數(shù)據(jù)進(jìn)行假設(shè)檢驗(yàn)的步驟相同,其差別僅僅是需要計算的檢驗(yàn)統(tǒng)計量不同。

二、基本步驟(一)建立假設(shè)和確定檢驗(yàn)水準(zhǔn)假設(shè)檢驗(yàn)中,包括原假設(shè)(nullhypothesis)和備擇假設(shè)(alternativehypothesis)兩種假設(shè)。Hypothesistest原假設(shè)符號為,指需要檢驗(yàn)的假設(shè),如治療前后血清甘油三酯沒有差別,即這一假設(shè)通常與我們要驗(yàn)證的結(jié)論相反,是計算檢驗(yàn)統(tǒng)計量和P值的依據(jù)。備擇假設(shè)符號為,是在成立證據(jù)不足的情況下而被接受的假設(shè),如拒絕治療前后血清甘油三酯相同的假設(shè),可表示為

Hypothesistest備擇假設(shè)有雙側(cè)和單側(cè)兩種情況。雙側(cè)檢驗(yàn)指無論是正方向還是負(fù)方向的誤差,若顯著地超出檢驗(yàn)水準(zhǔn)則拒絕,即為雙側(cè)檢驗(yàn)。單側(cè)檢驗(yàn)指僅在正方向或負(fù)方向誤差超出規(guī)定的水準(zhǔn)時則拒絕,如治療后血清甘油三酯下降的假設(shè)可表示為:或雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)應(yīng)如何選擇,需根據(jù)研究目的和專業(yè)知識而定。 Hypothesistest建立檢驗(yàn)假設(shè)的同時,還必須給出檢驗(yàn)水準(zhǔn)。檢驗(yàn)水準(zhǔn)亦稱顯著性水準(zhǔn)(significantlevel),用

表示,是預(yù)先規(guī)定的拒絕域的概率值,實(shí)際中一般取或。顯然,值越大越容易得出有差別的結(jié)論。Hypothesistest(二)選擇檢驗(yàn)方法和計算檢驗(yàn)統(tǒng)計量根據(jù)資料類型、研究設(shè)計方案和統(tǒng)計推斷的目的,選擇適當(dāng)?shù)臋z驗(yàn)方法和計算公式。許多假設(shè)檢驗(yàn)方法是以檢驗(yàn)統(tǒng)計量來命名的,如t檢驗(yàn)、z檢驗(yàn)、F檢驗(yàn)和檢驗(yàn)等。Hypothesistest(三)根據(jù)P值做出統(tǒng)計推斷查表得到檢驗(yàn)用的臨界值,然后將算得的統(tǒng)計量與拒絕域的臨界值作比較,確定值。如對雙側(cè)檢驗(yàn),則,按檢驗(yàn)水準(zhǔn)拒絕,接受;若,則不能拒絕

。HypothesistestJerzyNeyman若,不拒絕H0,但不能下“無差別”或“相等”的結(jié)論,只能下“根據(jù)目前試驗(yàn)結(jié)果,尚不能認(rèn)為有差別”的結(jié)論。

t檢驗(yàn)概述

BASICCONCEPTIONOFtTESTStudent'st-testAmethodoftestinghypothesesaboutthe

mean

ofasmallsampledrawnfromanormallydistributedpopulationwhenthepopulationstandarddeviationisunknown.In1908WilliamSealyGosset,publishingunderthepseudonymStudent,developedthet-testandtdistribution.Thetdistributionisafamilyofcurvesinwhichthenumberofdegreesoffreedomspecifiesaparticularcurve.Asthesamplesizeincreases,thetdistributionapproachesthebellshapeofthestandardnormaldistribution.Inpractice,fortestsinvolvingthemeanofasampleofsizegreaterthan30,thenormaldistributionisusuallyapplied.Preferablewhenthen<60Certainlyifn<30t檢驗(yàn)的應(yīng)用條件

AssumptionsNormaldistribution(正態(tài)分布)Equalvariance(兩總體方差相等(方差齊性)Randomsampling(隨機(jī)樣本)t檢驗(yàn)依據(jù)的檢驗(yàn)統(tǒng)計量是服從t分布的t值兩獨(dú)立樣本均數(shù)的t檢驗(yàn)

ttestforIndependentsamples

兩樣本的完全隨機(jī)分組設(shè)計,即將受試對象(試驗(yàn)單位)完全隨機(jī)地分為兩組,分別接受兩種不同的處理。由于當(dāng)兩組樣本含量相等,兩個樣本均數(shù)之差的抽樣誤差最小,檢驗(yàn)效能最高,故應(yīng)采用適當(dāng)?shù)碾S機(jī)分組方法,如隨機(jī)排列的分段隨機(jī)化,使兩組樣本含量相等。The2SampleIndependentt-TestUsedtocomparemeansbetweentwogroups.Assumesthedataarecontinuousandhaveasymmetric,uni-modal(onepeak)distribution.Assumesthetwogroupsareindependent.Thetteststatisticinvolvesthedifferencebetweenthesampleaveragesofthe2groups.Usingourknowledgeofthedistribution,wecancomputeap-valuetohelpdecidewhetherornottorejectthenullhypothesis.完全隨機(jī)設(shè)計資料的一般形式設(shè)有兩個平均數(shù)的差值-=d,統(tǒng)計學(xué)認(rèn)為,從樣本直接得出的結(jié)論是不可靠的。因?yàn)槌闃诱`差的隨機(jī)性,每次抽樣兩樣本平均數(shù)的差并不均等于d。造成這種差異可能有兩種原因

品種造成的差異,即是兩總體本質(zhì)不同所致

試驗(yàn)誤差(或抽樣誤差)The2SampleIndependentt-Test正常成年男性血紅蛋白

140g/L

130.83g/L男性鉛作業(yè)工人血紅蛋白

140g/L一種假設(shè)H0另一種假設(shè)H1抽樣誤差總體不同

本質(zhì)差異抽樣研究:通過樣本研究其所代表的總體。設(shè)兩個總體平均數(shù)分別為,試驗(yàn)研究的目的,就是要給、是否相同做出推斷。由于總體平均數(shù)、未知,在進(jìn)行顯著性檢驗(yàn)時只能以樣本平均數(shù)、作為檢驗(yàn)對象,更確切地說,是以(-)作為檢驗(yàn)對象。為什么以樣本平均數(shù)作為檢驗(yàn)對象呢?這是因?yàn)闃颖酒骄鶖?shù)具有下述特征:

1、離均差的平方和∑(-)2最小。說明樣本平均數(shù)與樣本各個觀測值最接近,平均數(shù)是資料的代表數(shù)。

2、樣本平均數(shù)是總體平均數(shù)的無偏估計值,即E()=μ。

3、根據(jù)統(tǒng)計學(xué)中心極限定理,樣本平均數(shù)服從或逼近正態(tài)分布。

由上所述,一方面我們有依據(jù)由樣本平均數(shù)和的差異來推斷總體平均數(shù)、相同與否,另一方面又不能僅據(jù)樣本平均數(shù)表面上的差異直接作出結(jié)論,其根本原因在于試驗(yàn)誤差(或抽樣誤差)的不可避免性

通過試驗(yàn)測定得到的每個觀測值,既由被測個體所屬總體的特征決定,又受個體差異和諸多無法控制的隨機(jī)因素的影響。所以觀測值由兩部分組成,即

=+

總體平均數(shù)反映了總體特征,表示誤差。若樣本含量為n,則可得到n

個觀測值:,,,。于是樣本平均數(shù)

說明樣本平均數(shù)并非總體平均數(shù),它還包含試驗(yàn)誤差的成分,對于接受不同處理的兩個樣本來說,則有:

=+,=+

這說明兩個樣本平均數(shù)之差(-)也包括了兩部分:一部分是兩個總體平均數(shù)的差(-),叫做試驗(yàn)的處理效應(yīng)(treatmenteffect);另一部分是試驗(yàn)誤差(-)。

樣本平均數(shù)的差(-)包含有試驗(yàn)誤差,它只是試驗(yàn)的表面效應(yīng)。因此,僅憑(-)就對總體平均數(shù)、是否相同下結(jié)論是不可靠的。只有通過顯著性檢驗(yàn)才能從(-)中提取結(jié)論。對(-)進(jìn)行顯著性檢驗(yàn)就是要分析:試驗(yàn)的表面效應(yīng)(-)主要由處理效應(yīng)(-)引起的,還是主要由試驗(yàn)誤差所造成。雖然處理效應(yīng)(-)未知,但試驗(yàn)的表面效應(yīng)是可以計算的,借助數(shù)理統(tǒng)計方法可以對試驗(yàn)誤差作出估計。所以,可從試驗(yàn)的表面效應(yīng)與試驗(yàn)誤差的權(quán)衡比較中間接地推斷處理效應(yīng)是否存在,這就是顯著性檢驗(yàn)的基本思想。例如:兩樣本比較的u檢驗(yàn)(two-sampleu-test)

適用于兩樣本含量較大(如n1>30且n2>30)時。檢驗(yàn)統(tǒng)計量為

兩均數(shù)之差的標(biāo)準(zhǔn)誤的估計值兩均數(shù)之差的標(biāo)準(zhǔn)誤的估計值由于u0.05/2=1.96,u0.01/2=2.58,|u|>u0.01/2,得P<0.01,按α=0.05水準(zhǔn),拒絕H0,接受H1,兩組間差別有統(tǒng)計學(xué)意義??梢哉J(rèn)為試驗(yàn)組和對照組退熱天數(shù)的總體均數(shù)不相等,兩組的療效不同。試驗(yàn)組的平均退熱天數(shù)比對照組短。例7-7已計算了的95%的可信區(qū)間:天,給出了兩總體均數(shù)差別的數(shù)量大小。

兩均數(shù)之差的標(biāo)準(zhǔn)誤的估計值I型錯誤和II型錯誤

假設(shè)檢驗(yàn)是利用小概率反證法思想,從問題的對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立,然后在假定H0成立的條件下計算檢驗(yàn)統(tǒng)計量,最后根據(jù)P值判斷結(jié)果,此推斷結(jié)論具有概率性,因而無論拒絕還是不拒絕H0,都可能犯錯誤。檢驗(yàn)水準(zhǔn)與兩類錯誤

I型錯誤:“實(shí)際無差別,但下了有差別的結(jié)論”,假陽性錯誤。犯這種錯誤的概率是(其值等于檢驗(yàn)水準(zhǔn))

II型錯誤:“實(shí)際有差別,但下了不拒絕H0的結(jié)論”,假陰性錯誤。犯這種錯誤的概率是(其值未知)

。

但n

一定時,

增大,則減少。

可能發(fā)生的兩類錯誤圖3-2I型錯誤與II型錯誤示意圖(以單側(cè)u檢驗(yàn)為例)

1-

:檢驗(yàn)效能(power):當(dāng)兩總體確有差別,按檢驗(yàn)水準(zhǔn)所能發(fā)現(xiàn)這種差別的能力。ab減少(增加)I型錯誤,將會增加(減少)II型錯誤增大n

同時降低a與ba與b間的關(guān)系減少I型錯誤的主要方法:假設(shè)檢驗(yàn)時設(shè)定

值。減少II型錯誤的主要方法:提高檢驗(yàn)效能。提高檢驗(yàn)效能的最有效方法:增加樣本量。如何選擇合適的樣本量:實(shí)驗(yàn)設(shè)計。假設(shè)檢驗(yàn)注意事項(xiàng)(1)可比性(2)正確選用假設(shè)檢驗(yàn)方法(3)差別的實(shí)際意義(4)判斷結(jié)論時不能絕對化(5)單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)(6)報告結(jié)果應(yīng)寫出統(tǒng)計量值、具體P值(1)可比性(2)正確選用假設(shè)檢驗(yàn)方法(3)差別的實(shí)際意義(4)判斷結(jié)論時不能絕對化(5)單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)(6)報告結(jié)果應(yīng)寫出統(tǒng)計量值、具體P值為了保證試驗(yàn)結(jié)果的可靠及正確,要有嚴(yán)密合理的試驗(yàn)或抽樣設(shè)計,保證各樣本是從相應(yīng)同質(zhì)總體中隨機(jī)抽取的。并且處理間要有可比性,即除比較的處理外,其它影響因素應(yīng)盡可能控制相同或基本相近。否則,任何顯著性檢驗(yàn)的方法都不能保證結(jié)果的正確(1)可比性(2)正確選用假設(shè)檢驗(yàn)方法(3)差別的實(shí)際意義(4)判斷結(jié)論時不能絕對化(5)單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)(6)報告結(jié)果應(yīng)寫出統(tǒng)計量值、具體P值選用的顯著性檢驗(yàn)方法應(yīng)符合其應(yīng)用條件由于研究變量的類型、問題的性質(zhì)、條件、試驗(yàn)設(shè)計方法、樣本大小等的不同,所用的顯著性檢驗(yàn)方法也不同,因而在選用檢驗(yàn)方法時,應(yīng)認(rèn)真考慮其適用條件,不能濫用。要正確理解差異顯著或極顯著的統(tǒng)計意義。顯著性檢驗(yàn)結(jié)論中的“差異顯著”或“差異極顯著”不應(yīng)該誤解為相差很大或非常大,也不能認(rèn)為在專業(yè)上一定就有重要或很重要的價值?!帮@著”或“極顯著”是指表面上如此差別的不同樣本來自同一總體的可能性小于0.05或0.01,已達(dá)到了可以認(rèn)為它們有實(shí)質(zhì)性差異的顯著水平。有些試驗(yàn)結(jié)果雖然差

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論