統(tǒng)計(jì)與軟件4課件_第1頁(yè)
統(tǒng)計(jì)與軟件4課件_第2頁(yè)
統(tǒng)計(jì)與軟件4課件_第3頁(yè)
統(tǒng)計(jì)與軟件4課件_第4頁(yè)
統(tǒng)計(jì)與軟件4課件_第5頁(yè)
已閱讀5頁(yè),還剩83頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

中醫(yī)藥統(tǒng)計(jì)學(xué)與軟件

czq9771@163.com第四章總體均數(shù)的估計(jì)、假設(shè)檢驗(yàn)總體均數(shù)的估計(jì)正態(tài)性檢驗(yàn)、方差齊性檢驗(yàn)T檢驗(yàn)構(gòu)成比不同的兩樣本均數(shù)比較假設(shè)檢驗(yàn)注意的問題假設(shè)檢驗(yàn)P>α?xí)r檢驗(yàn)效能1-β的估計(jì)置信區(qū)間與假設(shè)檢驗(yàn)的關(guān)系2總體均數(shù)的估計(jì)一、標(biāo)準(zhǔn)誤、樣本均數(shù)分布1.標(biāo)準(zhǔn)誤統(tǒng)計(jì)量的標(biāo)準(zhǔn)差稱標(biāo)準(zhǔn)誤(standarderror)

2.樣本均數(shù)的分布與均數(shù)的標(biāo)準(zhǔn)誤

在抽樣研究中,即使是嚴(yán)格遵守隨機(jī)抽樣原則,從同一總體中每次抽取樣本含量相等(都為n)的樣本,計(jì)算每一個(gè)樣本的樣本均數(shù),由于變異存在,樣本均數(shù)有大有小,不盡相同,是隨機(jī)變量,其分布稱為樣本均數(shù)的分布。3⑵設(shè)分布的均數(shù)是,則=⑶設(shè)的方差是,則=,是總體標(biāo)準(zhǔn)誤.即x~N(μ,σ)時(shí)

情形Ⅱ當(dāng)抽樣來(lái)自非正態(tài)分布總體時(shí),樣本均數(shù)的分布(抽樣分布)有下面的性質(zhì):5⑴的分布是近似正態(tài)的,隨樣本容量的增加,靠近正態(tài)的程度就越好.一般地,的抽樣分布靠近正態(tài)分布所需要的樣本容量取決于最初分布的外形.在幾乎所有的情形里面,對(duì)的抽樣分布,樣本容量在50或以上就可以得到很好的正態(tài)近似.(均數(shù)的這個(gè)性質(zhì)就是眾所周知的中心極限定理CentralLimitTheorem)(2)不是正態(tài)總體,n足夠大樣本均數(shù)近似服從正態(tài)分布.

二、t分布在公式中用代替得到:6用S替換σ產(chǎn)生了一個(gè)不同的樣本分布.如果σ值未知又必須估計(jì)它,用估計(jì)值s替換σ所得變量的分布稱為t分布.有時(shí)稱為Student’st分布,這個(gè)分布族取決于參數(shù)n-1.Z是具有μ=0,σ=1的標(biāo)準(zhǔn)正態(tài)分布,而t是具有μ=0,σ取決于樣本容量的t分布.隨樣本容量的增加.t分布漸近標(biāo)準(zhǔn)正態(tài)分布.見圖(4-3)(4-4)7t分布的準(zhǔn)確外形取決于被稱為自由度(degreesoffreedom)的數(shù)量.像正態(tài)分布一樣,t分布是對(duì)稱的鐘形曲線,但是有點(diǎn)平坦,例如,它們有大的標(biāo)準(zhǔn)差.對(duì)任何t分布,自由度恰好是樣本容量減1:df=n-1.

作為為多個(gè)t分布的部分累積分布函數(shù)的比較已經(jīng)列在附表3里.P43281.t分布有兩條重要性質(zhì):(1)從正態(tài)總體中每次隨機(jī)抽取例數(shù)為n的樣本,按(式4-4)計(jì)算的統(tǒng)計(jì)量服從自由度為df=n-1的t分布(即樣本均數(shù)與總體均數(shù)相差多少個(gè)標(biāo)準(zhǔn)誤服從自由度為n-1的t分布)。(2)從相互獨(dú)立,總體均數(shù)分別為μ1,μ2,而標(biāo)準(zhǔn)差都為σ的兩個(gè)正態(tài)總體中,隨機(jī)抽取樣本含量分別為n1,n2的兩個(gè)樣本,分別算出樣本均數(shù)和標(biāo)準(zhǔn)差為X1和S1,X2和S2,按(式4-5)計(jì)算的統(tǒng)計(jì)量服從自由度為df=n1+n2-2的t分布。自由度df=n1+n2-2(4-5)10三.

總體均數(shù)的估計(jì)由樣本觀察值算出總體參數(shù)的一個(gè)估計(jì)值(為統(tǒng)計(jì)量)稱為該參數(shù)的一個(gè)點(diǎn)估計(jì)(pointestimation)。點(diǎn)估計(jì)給出未知參數(shù)的一個(gè)近似值,但沒考慮試驗(yàn)誤差影響,也未指出這種估計(jì)的可靠程度。因?yàn)楣烙?jì)量是來(lái)自一個(gè)隨機(jī)抽取的樣本,每一次取值都有隨機(jī)性,剛好等于待估計(jì)參數(shù)的可能性極小,而在參數(shù)值左右的情況較多。1.點(diǎn)估計(jì)和區(qū)間估計(jì)總體參數(shù)的估計(jì)有點(diǎn)估計(jì)和區(qū)間估計(jì)。統(tǒng)計(jì)學(xué)上更合理的估計(jì)是在一定概率(1-α)下,由含有未知參數(shù)及其點(diǎn)估計(jì)值所構(gòu)成的統(tǒng)計(jì)量的分布規(guī)律估計(jì)出參數(shù)可能存在的范圍,稱為區(qū)間估計(jì)。(intervalestimation)12實(shí)踐中一般不會(huì)去抽取許多個(gè)樣本,通常只抽取一個(gè)樣本,計(jì)算出一個(gè)區(qū)間,雖然無(wú)法確認(rèn)這個(gè)區(qū)間是否包含了待估計(jì)的參數(shù),但可知這種估計(jì)可信的程度為95%,會(huì)冒5%犯錯(cuò)誤的風(fēng)險(xiǎn)。因5%是小概率,在實(shí)際應(yīng)用中就認(rèn)為待估計(jì)的總體參數(shù)在算得的區(qū)間內(nèi)。3.可信區(qū)間有兩要素:一是準(zhǔn)確度,反映在可信度(1-α)的大小,即區(qū)間包含總體參數(shù)的可能性(概率)的大小,準(zhǔn)確度越接近1越好,例如,可信度99%比95%犯錯(cuò)誤的風(fēng)險(xiǎn)小;二是精密度,反映在區(qū)間的長(zhǎng)度,區(qū)間的長(zhǎng)度愈小愈精密。在可信度確定的情況下,增大樣本含量,相應(yīng)的界值(如t界值)減少,標(biāo)準(zhǔn)誤也減小,可減小區(qū)間長(zhǎng)度,提高精密度。在樣本含量確定的情況下,可信度(1-α)愈大,總體參數(shù)估計(jì)的準(zhǔn)確度愈高,但精密度愈差。二者是矛盾的,為兼顧準(zhǔn)確度和精密度,常用95%可信區(qū)間。置信區(qū)間和置信限95%置信區(qū)間CICL144.單個(gè)總體均數(shù)的估計(jì)樣本均數(shù)是總體均數(shù)μ的一個(gè)點(diǎn)估計(jì)。σ已知時(shí),按(式4-3)計(jì)算的統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布,根據(jù)標(biāo)準(zhǔn)正態(tài)分布的規(guī)律

P(-uα/2<u<uα/2)=1-α,有

條件統(tǒng)計(jì)量的分布(1-α)可信區(qū)間公式縮寫σ已知正態(tài)分布σ未知小樣本t分布σ未知大樣本逼近正態(tài)分布15【例4.1】醫(yī)圣張仲景的處方中,用桂枝的量服從正態(tài)分布,標(biāo)準(zhǔn)差σ=3g,查《傷寒論》中桂枝處方39張,算得桂枝用量的樣本均數(shù)為=8.14g,試求醫(yī)圣張仲景桂枝用量總體均數(shù)μ的95%可信區(qū)間解計(jì)算得n=39,樣本均數(shù)=8.14,標(biāo)準(zhǔn)差s=3,df=38,u0.05/2=1.9616例4.2從同一批號(hào)的逍遙丸中隨機(jī)抽檢5丸,測(cè)得崩解時(shí)間(月)為21,18,20,16,15。已知藥丸崩解時(shí)間服從正態(tài)分布,求該批藥丸崩解時(shí)間總體均數(shù)的95%、99%可信區(qū)間。17置信區(qū)間(confidenceinternal)的意義

.在樣本被抽出之前計(jì)算總體均數(shù)μ的一個(gè)置信區(qū)間,人們聲稱在給定的概率下它包含μ.在樣本抽出后所計(jì)算的置信區(qū)間,如同前面所述,它或者包含μ(P=1)或者不包含μ(P=0).這就是在公式里使用C(confidence)而不是概率P(probability)的理由.換句話說(shuō),全部區(qū)間的95%實(shí)際上包含了μ.見圖18假設(shè)檢驗(yàn)一、假設(shè)檢驗(yàn)的的基本思想

假設(shè)檢驗(yàn)(hypothesistesting)亦稱顯著性檢驗(yàn)(significancetest),它和參數(shù)估計(jì)是統(tǒng)計(jì)推斷的兩個(gè)重要內(nèi)容。假設(shè)檢驗(yàn)是先對(duì)總體的特征(如總體的參數(shù)或分布、位置)提出某種假設(shè)(hypothesis),如假設(shè)總體均數(shù)(或總體率)為一定值、總體均數(shù)(或總體率)相等、總體服從某種分布、兩總體分布位置相同等等,然后根據(jù)隨機(jī)樣本提供的信息,運(yùn)用“小概率原理”推斷假設(shè)是否成立。假設(shè)檢驗(yàn)通過(guò)隨機(jī)樣本認(rèn)識(shí)總體的結(jié)論有助于作出正確的專業(yè)結(jié)論。假設(shè)檢驗(yàn)是對(duì)總體的特征提出假設(shè),根據(jù)樣本提供信息用“小概率原理”推斷假設(shè)是否成立20所謂小概率原理,就是“在一次試驗(yàn)中,概率很小(接近于零)的事件認(rèn)為是實(shí)際上不可能發(fā)生的事件”。例如,假設(shè)在1000支復(fù)方大青葉注射液針劑中只有一支是失效的,現(xiàn)在從中隨機(jī)抽取一支,則取得“失效的那支”概率為1/1000,這個(gè)概率是很小的,因此,可以認(rèn)為在一次抽取中是不會(huì)發(fā)生的,若從中任取一支恰好為“失效的那支”,我們就有理由懷疑“失效概率為1/1000”的假設(shè)不成立,而認(rèn)為失效率不是1/1000,從而否定假設(shè)。否定假設(shè)的依據(jù)就是小概率原理。例4-3:已知正常成年男子脈博平均為72次/分,現(xiàn)隨機(jī)檢查20名慢性胃炎所致脾虛男病人,其脈博均數(shù)為75次/分,標(biāo)準(zhǔn)差為6.4次/分,能否認(rèn)為此類脾虛男病人的脈博快于健康成年男子的脈博?21

如果出現(xiàn)了小概率事件,就拒絕這個(gè)假設(shè);如果沒有出現(xiàn)小概率事件,則沒有理由懷疑這個(gè)假設(shè),所以不拒絕這個(gè)假設(shè)。這種推斷方法的特點(diǎn)是依據(jù)小概率原理,采用類似于數(shù)學(xué)中邏輯論證的反證法,但又區(qū)別于純數(shù)學(xué)中邏輯推理的反證法。因?yàn)檫@里并不是形式邏輯中的絕對(duì)矛盾,而是基于人們?cè)趯?shí)踐中廣泛應(yīng)用的小概率原理。所以,可以說(shuō)假設(shè)檢驗(yàn)的基本思想是某種帶有概率性質(zhì)的反證法。假設(shè)檢驗(yàn)有兩種類型:(1)參數(shù)檢驗(yàn)(nparametric):在許多問題中,總體分布的類型為已知,只是一個(gè)或幾個(gè)參數(shù)未知,只對(duì)未知參數(shù)作出假設(shè),然后根據(jù)隨機(jī)樣本提供的信息,選取檢驗(yàn)統(tǒng)計(jì)量,按檢驗(yàn)統(tǒng)計(jì)量的分布規(guī)律,用“小概率原理”推斷假設(shè)是否成立。(2)非參數(shù)檢驗(yàn)(nonparametric):是一種與總體分布無(wú)關(guān)的統(tǒng)計(jì)檢驗(yàn)方法,它不比較參數(shù),而是比較分布的位置。當(dāng)不知道樣本來(lái)自的總體分布類型或已知總體分布與檢驗(yàn)所要求的條件不符,可用非參數(shù)檢驗(yàn)。23二、假設(shè)檢驗(yàn)的一般步驟1.建立假設(shè)并確定檢驗(yàn)水準(zhǔn)(1)建立假設(shè):①假設(shè)需根據(jù)研究的目的對(duì)總體的特征而提出。假設(shè)有兩種:一種是檢驗(yàn)假設(shè)(hypothesistobetested),假設(shè)差異完全由抽樣誤差造成,常稱無(wú)效假設(shè)(hullhypothesis),用H0表示。另一種是和H0相對(duì)立的備擇假設(shè)(alternativehypothesis),用H1表示,H1通常是希望證實(shí)的情況。假設(shè)檢驗(yàn)是針對(duì)H0進(jìn)行的,希望用樣本數(shù)據(jù)推斷H0是假的,從而證實(shí)H1是真的。假設(shè)檢驗(yàn)的結(jié)果是在零假設(shè)H0和對(duì)立假設(shè)H1之間作出抉擇。當(dāng)拒絕H0時(shí),接受H1,認(rèn)為差異有統(tǒng)計(jì)意義;當(dāng)不拒絕H0時(shí),認(rèn)為差異無(wú)統(tǒng)計(jì)意義,則不接受H1。24簡(jiǎn)言之:根據(jù)專業(yè)知識(shí)或研究目的H1不能肯定方向,則檢驗(yàn)是雙側(cè)的,稱雙側(cè)檢驗(yàn)。H1能肯定方向,則檢驗(yàn)是單側(cè)的,稱單側(cè)檢驗(yàn)。

例4-3的目的是推斷此類脾虛病人的脈博是否快于正常人(正常人的脈博總體均數(shù)為μ0=72次/分),H0為此類脾虛病對(duì)脈博數(shù)無(wú)影響,即此類脾虛病人的脈博總體均數(shù)等于正常人,用符號(hào)表示為:H0:μ=72次/分,即μ=μ0與之對(duì)應(yīng)的備擇假設(shè)為該類脾虛病的脈博數(shù)快于正常人,用符號(hào)表示為:

H1:μ>72次/分,即μ>μ026(2)確定檢驗(yàn)水準(zhǔn):檢驗(yàn)水準(zhǔn)(sizeofatest)亦稱顯著性水平(significancelevel),常用符號(hào)α表示。α是假設(shè)檢驗(yàn)時(shí)預(yù)先確定的,用以作為判斷多小的概率可以認(rèn)為是小概率的水準(zhǔn),故稱為檢驗(yàn)水準(zhǔn)。α的大小視具體情況而定,一般α取0.05或0.01,若按α=0.05拒絕H0,接受H1,作出這樣的判斷要冒5%錯(cuò)誤的風(fēng)險(xiǎn)。從圖4-2可以看出,同一資料、同一檢驗(yàn)水準(zhǔn)α?xí)r,因單側(cè)檢驗(yàn)的界值t0.025相當(dāng)于雙側(cè)檢驗(yàn)的界值t0.05,雙側(cè)P為單側(cè)P的兩倍,所以單側(cè)檢驗(yàn)比雙側(cè)檢驗(yàn)更易拒絕H0。一般認(rèn)為雙側(cè)檢驗(yàn)較為穩(wěn)妥,故較為常用。27強(qiáng)調(diào)指出,檢驗(yàn)水準(zhǔn)α的確定,以及選擇單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn),都應(yīng)結(jié)合專業(yè)知識(shí)和研究目的,在實(shí)驗(yàn)設(shè)計(jì)時(shí)決定,不能等到樣本結(jié)果計(jì)算完后再根據(jù)主觀愿望選定。2.選取檢驗(yàn)統(tǒng)計(jì)量,明確其分布,并由樣本計(jì)算檢驗(yàn)統(tǒng)計(jì)量值檢驗(yàn)統(tǒng)計(jì)量是指建立在無(wú)效假設(shè)H0基礎(chǔ)上的,用于抉擇是否拒絕H0而選定的樣本函數(shù)。參數(shù)檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量要求滿足以下條件:①在H0成立的條件下,它的分布函數(shù)是已知的;②它必須包含要檢驗(yàn)的總體參數(shù);③對(duì)于給定的樣本數(shù)據(jù),能計(jì)算出該檢驗(yàn)統(tǒng)計(jì)量的數(shù)值。假設(shè)檢驗(yàn)通常是以選定的檢驗(yàn)統(tǒng)計(jì)量來(lái)命名的,例如,以u(píng)值為檢驗(yàn)統(tǒng)計(jì)量的假設(shè)檢驗(yàn)稱為u檢驗(yàn),以t值為檢驗(yàn)統(tǒng)計(jì)量的假設(shè)檢驗(yàn)稱為t檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量的選取,因資料不同而不同。如例4-3,樣本均數(shù)與總體均數(shù)比較,如果H0(μ=μ0)成立,(-μ0)的絕對(duì)值應(yīng)比較小,一旦很大,就認(rèn)為H0不成立。28三、假設(shè)檢驗(yàn)的兩類錯(cuò)誤當(dāng)H0為真.

●如果我們接受H0,我們就做對(duì)了.

●如果我們拒絕H0,我們就犯了錯(cuò)誤.(Ⅰ型錯(cuò)誤)定義P(Ⅰ型錯(cuò)誤)=拒絕一個(gè)真實(shí)的零假設(shè)的概率這個(gè)概率用α表示,在第3步選擇顯著性水平時(shí)就確定了.顯著性水平是指在零假設(shè)為真的情況下,作為拒絕H0的稀有結(jié)果的度量.當(dāng)H0為假●如果我們接受H0,我們就犯了錯(cuò)誤.(Ⅱ型錯(cuò)誤)●如果我們拒絕H0,我們就做對(duì)了.

定義P(Ⅱ型錯(cuò)誤)=拒絕一個(gè)虛假的零假設(shè)的概率.

30這個(gè)概率用β表示,評(píng)價(jià)它困難多,因?yàn)樗Q于下面討論的一些因素.事實(shí)上當(dāng)H0為假的時(shí)候,拒絕H0的概率就是1-β,稱它為檢驗(yàn)效率(powerofthetest)客觀實(shí)際拒絕H0不拒絕H0H0為真H0為假Ⅰ型錯(cuò)誤(α)推斷正確(1-β)推斷正確(1-α)Ⅱ型錯(cuò)誤(β)統(tǒng)計(jì)推斷可能出現(xiàn)的4種結(jié)果α的含義是,兩總體無(wú)差別,按α水準(zhǔn)檢驗(yàn)為有差別的概率β的含義是,兩總體有差別,按α水準(zhǔn)檢驗(yàn)為無(wú)差別的概率1-α為可信度,是指兩總體確無(wú)差別,按α水準(zhǔn)能作出正確推斷的概率。即不出現(xiàn)Ⅰ型錯(cuò)誤的概率1-β為把握度,是指兩總體確有差別,按α水準(zhǔn)能檢驗(yàn)出差別的概率,故又有檢驗(yàn)效能之稱。31從圖中看出,當(dāng)樣本含量n確定時(shí),α愈小,β愈大;反之,α愈大,β愈小。若要同時(shí)減少Ⅰ型錯(cuò)誤和Ⅱ型錯(cuò)誤,則只有增加樣本含量。當(dāng)不可能同時(shí)達(dá)到較小的檢驗(yàn)水準(zhǔn)α和較大的檢驗(yàn)效能1-β時(shí),一般先確定檢驗(yàn)水準(zhǔn)α,然后決定檢驗(yàn)效能。檢驗(yàn)水準(zhǔn)稱顯著性水平,一般α取0.05或0.01。32正態(tài)性檢驗(yàn)、方差齊性檢驗(yàn)一、正態(tài)性檢驗(yàn)

正態(tài)性檢驗(yàn)的目的是檢驗(yàn)資料是否服從正態(tài)分布,確定樣本是否來(lái)自正態(tài)分布的總體正態(tài)分布特征:一是對(duì)稱,二是正態(tài)峰,描述對(duì)稱用偏度系數(shù)s,描述峰態(tài)用峰度系數(shù)k。33偏度系數(shù)=0表示與正態(tài)分布相同,偏度系數(shù)>0表示正或右偏態(tài),偏度系數(shù)<0表示負(fù)或左偏態(tài)。峰度系數(shù)=0表示與正態(tài)分布相同,峰度系數(shù)>0表示比正態(tài)分布陡峭,峰度系數(shù)<0表示比正態(tài)平坦34【例4-4】判斷例3-1資料正常人血糖的正態(tài)性解

H0:總體服從正態(tài)分布,H1:不服從正態(tài)分布

SPSS:→Analyze→Explore或→Analyze→NonparametricTests→1-SampleK-S(柯爾莫哥諾夫-斯米爾諾夫檢驗(yàn))

用統(tǒng)計(jì)軟件不方便時(shí),否定正態(tài)性的方法最簡(jiǎn)單的是將均數(shù)與中位數(shù)及標(biāo)準(zhǔn)差進(jìn)行比較,均數(shù)與中位數(shù)兩者不等且相差較大時(shí),分布不對(duì)稱;標(biāo)準(zhǔn)差大于均數(shù)時(shí),表示數(shù)據(jù)分散,曲線“矮、胖”,峰平闊,與正態(tài)峰度不同。這類資料,可以判定不符合正態(tài)分布。非偏態(tài)資料不一定具有正態(tài)峰,均數(shù)近于中位數(shù)或標(biāo)準(zhǔn)差小于均數(shù)的資料也不一定都符合正態(tài)分布。35【例4.4】判斷例3.1資料正常人血糖的正態(tài)性解

H0:總體服從正態(tài)分布,H1:不服從正態(tài)分布

SPSS:→Analyze→Explore或→Analyze→NonparametricTests→1-SampleK-S二、方差齊性檢驗(yàn)

1.2分布如果Z1,Z2,...,Zn是獨(dú)立的標(biāo)準(zhǔn)正態(tài)變量,則稱2=Z12+Z22+...+Zn2為自由度為df=n的2分布。36⑴2分布具有可加性若隨機(jī)變量12,22分別服從自由度為df1,df2的2分布,且它們相互獨(dú)立,則12±22服從自由度為df=df1±df2的2分布。⑵若從均數(shù)為μ,標(biāo)準(zhǔn)差為σ的正態(tài)總體中,抽取樣本含量為n的樣本,計(jì)算樣本標(biāo)準(zhǔn)差s,則2=(n-1)s2/σ2服從自由度為df=n-1的2分布。

2.F分布。

如果隨機(jī)變量X1、X2分別服從自由度為df1,df2的2分布,則稱隨機(jī)變量F=(X1/df1)/(X2/df2)服從自由度為df1,df2

的F分布。37P(F>Fα(df1,df2))=α表示F分布曲線下,界值Fα(df1,df2)

右側(cè)面積占總面積的百分?jǐn)?shù)

F分布具有倒數(shù)性質(zhì)分別從兩個(gè)正態(tài)總體N(μ1,σ1)和N(μ2,σ2)中隨機(jī)抽取含量為n1,n2的樣本,樣本方差分別為s12和s22,則統(tǒng)計(jì)量F=(s12/σ12)/(s22/σ22)服從自由度為df1=n1-1,df2=n2-1的F分布。

383.兩樣本或多樣本方差的齊性檢驗(yàn)法例4.5治療急性上消化道出血,抗血纖溶芳酸x1:n1=20,s12=47.61;大黃組x2:n2=30,s22=0.7744H0:σ12=σ22,H1:σ12

σ22

。正態(tài)分布時(shí),兩總體方差齊性檢驗(yàn):從方差分別為σ12,σ22的正態(tài)總體中隨機(jī)抽樣,則s12,s22分別是σ12,σ22

的估計(jì),在H0:σ12=σ22=σ2時(shí),F(xiàn)=s12/s22,df1=n1-1,df2=n2-1。df1=20–1=19,df2=30–1=29,查F界值表,P<0.05,按α=0.05水準(zhǔn)拒絕H0接受H1,兩個(gè)總體方差不齊394.樣本方差與已知總體方差比較

多樣本方差齊性檢驗(yàn)時(shí),有Bartlett、Levene、Brown&Forsythe、QBrien檢驗(yàn)等多種在H0:σ2=σ02假設(shè)下

【例4.6】含碳量服從均數(shù)為1.408,方差為0.0482的正態(tài)分布。某班產(chǎn)品隨機(jī)抽取5件,測(cè)得含碳量(%)為1.32,1.55,1.36,1.40和1.44,問生產(chǎn)是否正常40解

n=5,x-=1.414和規(guī)定的總體均數(shù)μ0=1.408差不多,但s2=0.0882比規(guī)定的總體方差0.0482波動(dòng)性大。要檢驗(yàn)s2=0.0882

是否來(lái)自σ02=0.0482的總體H0:σ2=0.0482;H1:σ2>0.04822=(5-1)×0.0882/0.0482=13.5,df=n-1=4查2界值表,得2

0.01(4)=13.28,P<0.01,按α=0.01水準(zhǔn)拒絕H0,可認(rèn)為這個(gè)班的生產(chǎn)是不正常的,含碳量的波動(dòng)性超過(guò)了標(biāo)準(zhǔn)第四節(jié)t檢驗(yàn)

41一、單樣本t檢驗(yàn)2.大樣本,或正態(tài)小樣本但σ已知,可用Z

檢驗(yàn)1.正態(tài)分布資料σ未知小樣本,可用t檢驗(yàn)

3.不服從正態(tài)分布或分布類型未知,用非參數(shù)檢驗(yàn)或作變量變換轉(zhuǎn)換為正態(tài)分布資料處理

42不滿足不滿足滿足滿足σ已知正態(tài)性非參數(shù)檢驗(yàn)變量替換結(jié)論不滿足單組資料大樣本u檢驗(yàn)t檢驗(yàn)滿足【例4.7】M含量服從正態(tài)分布,μ=63.5μg。測(cè)得40.0,41.0,41.5,41.8,42.4,43.1,43.5,43.8,44.2。這批培植人參含量與野生是否相同43解

H0:μ=63.5g,H1:μ≠63.5g計(jì)算得到n=9,x-=42.37,s=1.40

df=n-1=8,t0.01/2(8)=3.355,|t|>t0.01/2(8),P<0.01,拒絕H0,可以認(rèn)為人工培植人參中M物質(zhì)的含量低于野生人參?!維PSS操作】在數(shù)據(jù)編輯窗以M為變量名,輸入M物質(zhì)含量的9個(gè)數(shù)據(jù),建立數(shù)據(jù)文件L4-7.sav?!鶤nalyze→DescriptiveStatistics→Explore,M選入DependentList框,→Plots選Nomalityplotswithtests44P=0.840>0.05,可認(rèn)為M物質(zhì)含量服從正態(tài)分布。→Analyze→CompareMeans→One-SampleTTest,將M選入Testvariable[s]框,改TestValue框檢驗(yàn)值為63.5。45t=-45.142,自由度df=8,雙側(cè)P=0.000<0.05。故可認(rèn)為人工培植人參與野生人參的M物質(zhì)含量不同。差值的95%CI

為(-22.2129,-20.0538),不包含0,按α=0.05水準(zhǔn),可認(rèn)為人工培植人參與野生人參的M物質(zhì)含量不同。單組計(jì)量資料,調(diào)用univariate過(guò)程,使用格式為

procunivariatenormalmu0=常數(shù)

cibasicalpha=水平;var變量;freq頻數(shù);run;其中,參數(shù)mu0指定檢驗(yàn)常數(shù)(為0可省),cibasic為可信區(qū)間,alpha指定顯著水平(為0.05可?。琭req指定頻數(shù)變量(為1可?。?6例3101隨機(jī)抽取5丸測(cè)得崩解時(shí)間為:21、18、20、16、15。崩解時(shí)間不得超過(guò)60min,判斷是否合格。dataL3101;/*逍遙丸崩解時(shí)間*/

inputx@@;cards;2118201615;procunivariatemu0=60normalcibasic;varx;run;正態(tài)性檢驗(yàn)檢驗(yàn)----統(tǒng)計(jì)量-----------P值-------Shapiro-WilkW0.9437Pr<W0.6919Kolmogorov-SmirnovD0.1836Pr>D>0.1500Cramer-vonMisesW-Sq0.0314Pr>W-Sq>0.2500Anderson-DarlingA-Sq0.2139Pr>A-Sq>0.250047正態(tài)性檢驗(yàn)Shapiro-Wilk統(tǒng)計(jì)量=0.9437、P=0.6919>0.05,數(shù)據(jù)來(lái)自正態(tài)總體。

位置檢驗(yàn):Mu0=60檢驗(yàn)--------統(tǒng)計(jì)量------------------P值----------學(xué)生tt-36.8364Pr>|t|<.0001符號(hào)M-2.5Pr>=|M|0.0625符號(hào)秩S-7.5Pr>=|S|0.0625由位置檢驗(yàn)t=-36.8364、P<0.0001,以α=0.01水準(zhǔn)拒絕H0,有統(tǒng)計(jì)學(xué)意義。由均值=18<60,可以認(rèn)為,該批藥丸平均崩解時(shí)間低于60min。

48例31028名脾虛納呆患兒尿液淀粉酶含量為4,4,8,8,8,16,16,32,推斷脾虛納呆患兒尿液淀粉酶的含量是否低于10(U/10min)。

dataL3102;/*頻數(shù)資料的幾何均數(shù)檢驗(yàn)*/inputxf@@;y=log10(x);cards;4283162321;procunivariatemu0=1normalcibasic;vary;freqf;run;

正態(tài)性檢驗(yàn)Shapiro-Wilk統(tǒng)計(jì)量=0.9173、P=0.4082>0.05,脾虛納呆患兒尿液淀粉酶的含量取對(duì)數(shù)后的數(shù)據(jù)來(lái)自正態(tài)總體。49由位置檢驗(yàn)t=-0.1965、P=0.8498>0.05,不能以α=0.05水準(zhǔn)拒絕H0,無(wú)統(tǒng)計(jì)學(xué)意義。不能認(rèn)為脾虛納呆患兒尿液淀粉酶的含量低于10(U/10min)。三、配對(duì)設(shè)計(jì)資料的均數(shù)比較

50配對(duì)t檢驗(yàn)是把配對(duì)的兩組資料轉(zhuǎn)化為一組差值,假設(shè)配對(duì)差值d的總體均數(shù)μd為0,適用于配對(duì)設(shè)計(jì)成功,對(duì)子差值服從正態(tài)分布的資料。配對(duì)差值的標(biāo)準(zhǔn)誤與n1=n2=n的完全隨機(jī)設(shè)計(jì)兩均數(shù)之差的標(biāo)準(zhǔn)誤計(jì)算公式分別為式中r為配對(duì)數(shù)據(jù)的積差相關(guān)系數(shù)。

r>0時(shí),配對(duì)設(shè)計(jì)成功,用配對(duì)t檢驗(yàn)。r<0,配對(duì)設(shè)計(jì)失敗,實(shí)驗(yàn)效率低于完全隨機(jī)實(shí)驗(yàn)。51【例4.8】20只小白鼠配成10對(duì),隨機(jī)分到實(shí)驗(yàn)組和對(duì)照組,已知抑瘤效果滿足正態(tài)性,試比較兩組瘤體大小是否相同對(duì)子號(hào)12345678910對(duì)照組x7.04.15.04.5實(shí)驗(yàn)組y3.04.02.61.3d=x-y3.3-配對(duì)設(shè)計(jì)成功時(shí)52解H0:μd=0,n=10,x-=2.16,s=1.3209r=0.075>0,配對(duì)設(shè)計(jì)成功,可以用配對(duì)t檢驗(yàn)。t=2.16×100.5/1.3209=5.1709

df=9查t界值表,t0.01/2(9)=3.2498,│t│>t0.01/2(9),P<0.01,拒絕H0,可認(rèn)為三棱莪術(shù)液有抑瘤效果【SPSS操作】以實(shí)驗(yàn)和對(duì)照為變量名,建立2列10行的配對(duì)計(jì)量資料數(shù)據(jù)文件L4-8.sav。53→Transform→Compute,在TargetVariable框輸入d;在Numericexpression框輸入“實(shí)驗(yàn)-對(duì)照”。→Analyze→DescriptiveStatistics→Explore,將d送入DependentList框,→Plots選Nomalityplotswithtests。→Analyze→CompareMeans→Paired-SampleTTest,將實(shí)驗(yàn)和對(duì)照同時(shí)選入PairedVariables框。數(shù)據(jù)文件L4-8.sav增加新變量d。

P=0.819>0.05,可認(rèn)為配對(duì)差d服從正態(tài)分布。相關(guān)系數(shù)r=0.075>0,可認(rèn)為配對(duì)設(shè)計(jì)成功。54配對(duì)檢驗(yàn)統(tǒng)計(jì)量t=5.171,df=9,P=0.001,拒絕H0,可以認(rèn)為三棱莪術(shù)液有抑瘤效果

。差值的95%CI為(1.2151,3.1049),不包含配對(duì)差值的總體均數(shù)0,按α=0.05水準(zhǔn),拒絕H0。

55相關(guān)系數(shù)計(jì)算,可以調(diào)用corr過(guò)程語(yǔ)句,即proccorr;varx1x2;

例3103黃芪對(duì)健康人群小腸傳遞時(shí)間作用研究。中藥新藥與臨床藥理,2001年5月第12卷第3期。測(cè)得服藥前后的數(shù)據(jù),判斷傳遞時(shí)間是否不同。編號(hào)1234567891011121314151617181920藥前2321233822222838213121223322326721605029藥后2423303521212538213021223022306822645230編號(hào)2122232425262728293031323334353637383940藥前212811610638362164212862273922402121242626藥后212711010638212536232821233022326422605222配對(duì)比較,H0:μd=0,H1:μd≠0。

56dataL3103;/*黃芪對(duì)健康人群小腸傳遞時(shí)間*/inputxy@@;d=x-y;cards;2324212121232827……………29302622;proccorr;varxy;procunivariatenormal;vard;run;Shapiro-Wilk統(tǒng)計(jì)量0.7358,P<0.0001,d不服從正態(tài)分布,應(yīng)該選擇非參數(shù)檢驗(yàn)。57例3104某大學(xué)校醫(yī)院用銀楂丹桃合劑治療高血壓患者,測(cè)得治療前后舒張壓數(shù)據(jù),判斷該中藥治療高血壓是否有效。病人編號(hào)12345678治療前13.614.917.217.316.514.214.514.6治療后11.915.313.417.214.611.512.213.8打開程序L3103.sas,修改數(shù)據(jù),存為L(zhǎng)3104.sas。Shapiro-Wilk統(tǒng)計(jì)量0.9781,P=0.9528>0.05,服從正態(tài)分布。58Pearson相關(guān)系數(shù)r=0.6949>0,配對(duì)設(shè)計(jì)成功,可以使用配對(duì)t檢驗(yàn)。由t=3.2807,P=0.0135<0.05,檢驗(yàn)有統(tǒng)計(jì)學(xué)意義,治療前后的舒張壓不同。由t值>0,可認(rèn)為治療前的舒張壓高于治療后,銀楂丹桃合劑治療高血壓有效。例3105測(cè)得造模兔使用眼傷寧前及用藥后兩月的角膜厚度值,判斷眼傷寧對(duì)促進(jìn)家兔角膜傷口愈合有無(wú)作用。

59打開程序L3104.sas,修改數(shù)據(jù)并運(yùn)行。三、成組t檢驗(yàn)造模兔編號(hào)12345678910用藥前厚度0.740.740.720.720.760.720.720.760.640.68用藥后厚度0.560.580.580.580.560.600.600.600.580.60Shapiro-Wilk統(tǒng)計(jì)量0.9648,P=0.8384>0.05,服從正態(tài)分布。Pearson相關(guān)系數(shù)r=-0.2315<0,配對(duì)設(shè)計(jì)失敗,應(yīng)當(dāng)改用成組t檢驗(yàn)。60兩小樣本均數(shù)比較,滿足正態(tài)性和方差齊性時(shí)用t檢驗(yàn),不滿足方差齊性時(shí)用t’檢驗(yàn),也可變量轉(zhuǎn)換后用t檢驗(yàn)。資料分布類型未知或不滿足正態(tài)性和方差齊性時(shí),可以用非參數(shù)檢驗(yàn)方差齊性?成組t檢驗(yàn)非參數(shù)檢驗(yàn)不滿足正態(tài)性?變量變換滿足滿足不滿足變量變換t′檢驗(yàn)結(jié)論1、正態(tài)分布資料兩樣本均數(shù)比較的t檢驗(yàn)61當(dāng)兩樣本含量相等,即n1=n2=n時(shí)方差齊,在H0:μ1=μ2假設(shè)下,t檢驗(yàn)統(tǒng)計(jì)量為62方差不齊兩小樣本均數(shù)比較,H0:μ1=μ2

兩大樣本均數(shù)比較,可用u檢驗(yàn)

,H0:μ1=μ2

63【例4.9】12名正常人和15名病毒性肝炎患者血清轉(zhuǎn)鐵蛋白含量,已檢驗(yàn)兩組方差相等,問患者和健康人轉(zhuǎn)鐵蛋白含量是否有差異正常265.4271.5284.6291.3254.8275.9281.7268.6264.1273.2270.8260.5---患者256.9235.9215.4251.8224.7228.3231.1253.0221.7218.8233.8230.9240.7260.7224.4解

H0:σ12=σ22,H1:σ12≠σ22n1=12,x1-=271.8667,s1=10.3971n2=15,x2-=235.2067,s2=14.390764查F界值得F0.05(14,11)=2.7186,P>0.05,不能按α=0.05水準(zhǔn)拒絕H0,不能認(rèn)為兩組總體方差不同。df=12+15-2=25,查t界值表得t0.01/2(25)=2.7874,P<0.01,按α=0.01水準(zhǔn)拒絕H0,可以認(rèn)為病毒性肝炎患者的轉(zhuǎn)鐵蛋白量較低。H0:μ1=μ2,H1:μ1≠μ265【SPSS操作】以觀察對(duì)象(標(biāo)簽值用1=正常人,2=肝炎患者)和轉(zhuǎn)鐵蛋白為變量名,建立2列27行的完全隨機(jī)設(shè)計(jì)計(jì)量資料數(shù)據(jù)文件L4-9.sav?!鶤nalyze→DescriptiveStatistics→Explore,將觀察對(duì)象選入Factorlist框,轉(zhuǎn)鐵蛋白選入DependentList框;→Plots,選擇Normalityplotswithtest。樣本含量≤50,宜看Shapiro-Wilk。正常人的統(tǒng)計(jì)量=0.986,P=0.998;患者統(tǒng)計(jì)量=0.927,P=0.245,兩組均滿足正態(tài)性。66→Analyze→CompareMeans→Independent-SamplesTTest,將轉(zhuǎn)鐵蛋白選入TestVariables框,將觀察對(duì)象選入GroupingVariable框,→DefineGroups,在group1框中鍵入1,在group2框中鍵入2。Levene’sTestforEqualityofVariances統(tǒng)計(jì)量F=1.877,P=0.183>0.05,可認(rèn)為兩總體方差齊性。67用Equalvariancesassumed的t檢驗(yàn)結(jié)果,t=7.402,雙側(cè)P=0.000。故拒絕H0,接受H1,可以認(rèn)為正常人與病毒性肝炎患者的轉(zhuǎn)鐵蛋白含量不等,轉(zhuǎn)鐵蛋白測(cè)定對(duì)病毒性肝炎診斷有臨床意義。

68例2107測(cè)定功能性子宮出血癥中實(shí)熱組與虛寒組的免疫功能,其淋巴細(xì)胞轉(zhuǎn)化率如表所示。比較實(shí)熱組與虛寒組的淋巴細(xì)胞轉(zhuǎn)化率均數(shù)是否不同。

實(shí)熱組0.7090.7550.6550.7050.723-----虛寒組0.6170.6080.6230.6350.5930.6840.6950.7180.6060.618這是成組比較。H0:μ1=μ2,H1:μ1≠μ2。69當(dāng)資料與正態(tài)分布偏倚較大時(shí),可采用非參數(shù)檢驗(yàn),也可用適當(dāng)?shù)淖兞孔儞Q【例4.10】甲組24人用補(bǔ)益法加預(yù)防注射,乙組22人只用預(yù)防注射。測(cè)定抗體滴度倒數(shù),問兩組免疫效果有無(wú)差別滴度倒數(shù)x48163264128256甲組人數(shù)f14428132乙組人數(shù)f234372212、非正態(tài)分布的兩均數(shù)比較

70解觀察值呈倍數(shù)關(guān)系,不滿足正態(tài)性,可用對(duì)數(shù)變換達(dá)到正態(tài)性要求H0:σ12=σ22,H1:σ12≠σ22n1=24,x1-=3.2058,s1=1.3058n2=22,x2-=3.1192,s2=1.1667查F界值表得P>0.05,不能按α=0.05水準(zhǔn)拒絕H0,不能認(rèn)為兩組的總體方差不同

71H0:μ1=μ2,H1:μ1≠μ2df=24+22-2=44查t界值表得P>0.05,不能按α=0.05水準(zhǔn)拒絕H0,不能認(rèn)為兩組效果有差別【SPSS操作】分別以x和組別為變量名,在x的列中,先按所給甲組資料鍵入4個(gè)4,4個(gè)8,…,2個(gè)256,并在組別列鍵入1;接著按乙組資料鍵入3個(gè)4,4個(gè)8,…,1個(gè)256,并在組別列鍵入2;建立2列46行的數(shù)據(jù)文件L4-10.sav72對(duì)抗體滴度倒數(shù)按組別檢驗(yàn)正態(tài)性,甲組Shapiro-Wilk統(tǒng)計(jì)量=0.670,P=0.000;乙組Shapiro-Wilk=0.650,P值=0.000,均不滿足正態(tài)性。

→Transform→Compute,在TargetVariable框鍵入lnx,Numericexpression框輸入ln(x),對(duì)lnx按組別檢驗(yàn)正態(tài)性,甲組lnx的Shapiro-Wilk統(tǒng)計(jì)量=0.920,P=0.058;乙組=0.943,P=0.224,均滿足正態(tài)性。73Levene’sTestforEqualityofVariances的P=0.600>0.05,方差齊。成組t檢驗(yàn)t=0.236,P=0.834>0.05,不拒絕H0,故不能認(rèn)為兩組免疫效果有差別。故不能認(rèn)為兩組免疫效果有差別。74EqualityofVariances統(tǒng)計(jì)量F=1.25,P=0.6075>0.05,不能認(rèn)為兩組的總體方差不齊。由VariancesEqual,統(tǒng)計(jì)量t=0.24,P=0.8142>0.05,不能以α=0.05水準(zhǔn)拒絕H0,無(wú)統(tǒng)計(jì)意義。故,不能認(rèn)為兩組的免疫效果有差別。

兩樣本均數(shù)比較,如果資料不滿足齊同對(duì)比性,應(yīng)設(shè)法在統(tǒng)計(jì)分析時(shí)盡量消除影響因素的干擾兩組的Shapiro-Wilk統(tǒng)計(jì)量為0.9197、0.9426,P=0.0576、0.2244,均服從正態(tài)分布。

四、加權(quán)均數(shù)法75【例4.11】輕病人46例,重病人44例,用完全隨機(jī)方法分配到A、B兩種療法組治療輕病人(46例)重病人(44例)合計(jì)(90例)病例數(shù)x-±s病例數(shù)x-±s病例數(shù)x-±s甲療法3423.5±6.0813.5±4.64221.6±5.8乙療法1224.0±5.93612.5±4.54815.4±4.9不考慮兩組病情構(gòu)成比不同,用不分病情的合計(jì)數(shù)據(jù)比較兩樣本均數(shù),得t=5.497,P<0.01,認(rèn)為A療法療效優(yōu)于B療法,但結(jié)論是不正確的病情輕的患者療效較好,病情重的患者相對(duì)較差。76要消除病情因素構(gòu)成比不同的影響,綜合比較兩療法降低某酶的療效,或者要在綜合回答兩種療法差異有無(wú)統(tǒng)計(jì)學(xué)意義外,同時(shí)還了解病情因素的影響大小,可采用兩因素設(shè)計(jì)試驗(yàn)的方差分析或協(xié)方差分析。若僅僅為了刪除病情因素影響,則可用加權(quán)均值法來(lái)進(jìn)行分析先按不同構(gòu)成n=n1+n2計(jì)算權(quán)重系數(shù)w

wi=ni/n

再計(jì)算各比較組的加權(quán)均值xw-與加權(quán)標(biāo)準(zhǔn)差sw

77最后,對(duì)各比較組的加權(quán)均值進(jìn)行假設(shè)檢驗(yàn)解計(jì)算輕組與重組的權(quán)重系數(shù)

w1=(34+12)/(42+48)=0.5111w2=(8+36)/(42+48)=0.4889分別計(jì)算甲及乙療法的加權(quán)均值xw-與標(biāo)準(zhǔn)差sw

xwA-=0.5111×23.5+0.4889×13.5=18.6111

swA=0.5111×6+0.4889×4.6=5.3156

xwB-=0.5111×23.5+0.4889×13.5=18.6111

swB=0.5111×5.9+0.4889×4.5=5.2156

78對(duì)加權(quán)均值進(jìn)行檢驗(yàn)

查F界值得P>0.05,不能按α=0.05水準(zhǔn)拒絕H0,不能認(rèn)為兩組的總體方差不同df=42+48-2=88查t界值得P>0.05,不能按α=0.05水準(zhǔn)拒絕H0,不能認(rèn)為兩種療法療效有差別79一

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論