統(tǒng)計(jì)與軟件4課件

上傳人：小*** IP屬地：江蘇上傳時(shí)間：2022-12-28 格式：PPT 頁(yè)數(shù)：88 大?。?.76MB 積分：40 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩83頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

中醫(yī)藥統(tǒng)計(jì)學(xué)與軟件

czq9771@163.com第四章總體均數(shù)的估計(jì)、假設(shè)檢驗(yàn)總體均數(shù)的估計(jì)正態(tài)性檢驗(yàn)、方差齊性檢驗(yàn)T檢驗(yàn)構(gòu)成比不同的兩樣本均數(shù)比較假設(shè)檢驗(yàn)注意的問題假設(shè)檢驗(yàn)P>α?xí)r檢驗(yàn)效能1－β的估計(jì)置信區(qū)間與假設(shè)檢驗(yàn)的關(guān)系2總體均數(shù)的估計(jì)一、標(biāo)準(zhǔn)誤、樣本均數(shù)分布1.標(biāo)準(zhǔn)誤統(tǒng)計(jì)量的標(biāo)準(zhǔn)差稱標(biāo)準(zhǔn)誤(standarderror)

2.樣本均數(shù)的分布與均數(shù)的標(biāo)準(zhǔn)誤

在抽樣研究中，即使是嚴(yán)格遵守隨機(jī)抽樣原則，從同一總體中每次抽取樣本含量相等(都為n)的樣本，計(jì)算每一個(gè)樣本的樣本均數(shù)，由于變異存在，樣本均數(shù)有大有小，不盡相同，是隨機(jī)變量，其分布稱為樣本均數(shù)的分布。3⑵設(shè)分布的均數(shù)是,則=⑶設(shè)的方差是,則=,是總體標(biāo)準(zhǔn)誤.即x～N(μ，σ)時(shí)

情形Ⅱ當(dāng)抽樣來(lái)自非正態(tài)分布總體時(shí)，樣本均數(shù)的分布（抽樣分布）有下面的性質(zhì)：5⑴的分布是近似正態(tài)的，隨樣本容量的增加，靠近正態(tài)的程度就越好．一般地，的抽樣分布靠近正態(tài)分布所需要的樣本容量取決于最初分布的外形．在幾乎所有的情形里面，對(duì)的抽樣分布，樣本容量在50或以上就可以得到很好的正態(tài)近似．（均數(shù)的這個(gè)性質(zhì)就是眾所周知的中心極限定理CentralLimitTheorem)(2)不是正態(tài)總體,n足夠大樣本均數(shù)近似服從正態(tài)分布.

二、t分布在公式中用代替得到：6用S替換σ產(chǎn)生了一個(gè)不同的樣本分布．如果σ值未知又必須估計(jì)它，用估計(jì)值s替換σ所得變量的分布稱為t分布．有時(shí)稱為Student’st分布，這個(gè)分布族取決于參數(shù)n－1．Z是具有μ=0,σ=1的標(biāo)準(zhǔn)正態(tài)分布,而t是具有μ=0,σ取決于樣本容量的t分布.隨樣本容量的增加.t分布漸近標(biāo)準(zhǔn)正態(tài)分布.見圖(4-3)(4-4)7t分布的準(zhǔn)確外形取決于被稱為自由度（degreesoffreedom）的數(shù)量．像正態(tài)分布一樣，t分布是對(duì)稱的鐘形曲線，但是有點(diǎn)平坦，例如，它們有大的標(biāo)準(zhǔn)差．對(duì)任何t分布，自由度恰好是樣本容量減1:df=n－1．

作為為多個(gè)t分布的部分累積分布函數(shù)的比較已經(jīng)列在附表3里．P43281.t分布有兩條重要性質(zhì)：（1）從正態(tài)總體中每次隨機(jī)抽取例數(shù)為n的樣本，按（式4-4）計(jì)算的統(tǒng)計(jì)量服從自由度為df=n-1的t分布（即樣本均數(shù)與總體均數(shù)相差多少個(gè)標(biāo)準(zhǔn)誤服從自由度為n-1的t分布）。（2）從相互獨(dú)立，總體均數(shù)分別為μ1，μ2，而標(biāo)準(zhǔn)差都為σ的兩個(gè)正態(tài)總體中，隨機(jī)抽取樣本含量分別為n1，n2的兩個(gè)樣本，分別算出樣本均數(shù)和標(biāo)準(zhǔn)差為X1和S1，X2和S2，按（式4-5）計(jì)算的統(tǒng)計(jì)量服從自由度為df=n1+n2－2的t分布。自由度df=n1+n2－2(4-5)10三.

總體均數(shù)的估計(jì)由樣本觀察值算出總體參數(shù)的一個(gè)估計(jì)值（為統(tǒng)計(jì)量）稱為該參數(shù)的一個(gè)點(diǎn)估計(jì)（pointestimation）。點(diǎn)估計(jì)給出未知參數(shù)的一個(gè)近似值，但沒考慮試驗(yàn)誤差影響，也未指出這種估計(jì)的可靠程度。因?yàn)楣烙?jì)量是來(lái)自一個(gè)隨機(jī)抽取的樣本，每一次取值都有隨機(jī)性，剛好等于待估計(jì)參數(shù)的可能性極小，而在參數(shù)值左右的情況較多。1.點(diǎn)估計(jì)和區(qū)間估計(jì)總體參數(shù)的估計(jì)有點(diǎn)估計(jì)和區(qū)間估計(jì)。統(tǒng)計(jì)學(xué)上更合理的估計(jì)是在一定概率（1-α）下，由含有未知參數(shù)及其點(diǎn)估計(jì)值所構(gòu)成的統(tǒng)計(jì)量的分布規(guī)律估計(jì)出參數(shù)可能存在的范圍，稱為區(qū)間估計(jì)。（intervalestimation）12實(shí)踐中一般不會(huì)去抽取許多個(gè)樣本，通常只抽取一個(gè)樣本，計(jì)算出一個(gè)區(qū)間，雖然無(wú)法確認(rèn)這個(gè)區(qū)間是否包含了待估計(jì)的參數(shù)，但可知這種估計(jì)可信的程度為95％，會(huì)冒5%犯錯(cuò)誤的風(fēng)險(xiǎn)。因5%是小概率，在實(shí)際應(yīng)用中就認(rèn)為待估計(jì)的總體參數(shù)在算得的區(qū)間內(nèi)。3．可信區(qū)間有兩要素：一是準(zhǔn)確度，反映在可信度（1-α）的大小，即區(qū)間包含總體參數(shù)的可能性（概率）的大小，準(zhǔn)確度越接近1越好，例如，可信度99%比95%犯錯(cuò)誤的風(fēng)險(xiǎn)小；二是精密度，反映在區(qū)間的長(zhǎng)度，區(qū)間的長(zhǎng)度愈小愈精密。在可信度確定的情況下，增大樣本含量，相應(yīng)的界值（如t界值）減少，標(biāo)準(zhǔn)誤也減小，可減小區(qū)間長(zhǎng)度，提高精密度。在樣本含量確定的情況下，可信度（1-α）愈大，總體參數(shù)估計(jì)的準(zhǔn)確度愈高，但精密度愈差。二者是矛盾的，為兼顧準(zhǔn)確度和精密度，常用95%可信區(qū)間。置信區(qū)間和置信限95%置信區(qū)間CICL144.單個(gè)總體均數(shù)的估計(jì)樣本均數(shù)是總體均數(shù)μ的一個(gè)點(diǎn)估計(jì)。σ已知時(shí)，按（式4-3）計(jì)算的統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布，根據(jù)標(biāo)準(zhǔn)正態(tài)分布的規(guī)律

P（-uα/2<u<uα/2）=1-α，有

條件統(tǒng)計(jì)量的分布(1-α）可信區(qū)間公式縮寫σ已知正態(tài)分布σ未知小樣本t分布σ未知大樣本逼近正態(tài)分布15【例4.1】醫(yī)圣張仲景的處方中，用桂枝的量服從正態(tài)分布，標(biāo)準(zhǔn)差σ=3g，查《傷寒論》中桂枝處方39張，算得桂枝用量的樣本均數(shù)為=8.14g，試求醫(yī)圣張仲景桂枝用量總體均數(shù)μ的95%可信區(qū)間解計(jì)算得n＝39，樣本均數(shù)＝8.14，標(biāo)準(zhǔn)差s＝3，df＝38，u0.05/2＝1.9616例4.2從同一批號(hào)的逍遙丸中隨機(jī)抽檢5丸，測(cè)得崩解時(shí)間（月）為21，18，20，16，15。已知藥丸崩解時(shí)間服從正態(tài)分布，求該批藥丸崩解時(shí)間總體均數(shù)的95%、99%可信區(qū)間。17置信區(qū)間（confidenceinternal）的意義

．在樣本被抽出之前計(jì)算總體均數(shù)μ的一個(gè)置信區(qū)間，人們聲稱在給定的概率下它包含μ．在樣本抽出后所計(jì)算的置信區(qū)間，如同前面所述，它或者包含μ（P=1）或者不包含μ（P=0）．這就是在公式里使用C(confidence)而不是概率P（probability）的理由．換句話說(shuō)，全部區(qū)間的95%實(shí)際上包含了μ．見圖18假設(shè)檢驗(yàn)一、假設(shè)檢驗(yàn)的的基本思想

假設(shè)檢驗(yàn)(hypothesistesting)亦稱顯著性檢驗(yàn)(significancetest)，它和參數(shù)估計(jì)是統(tǒng)計(jì)推斷的兩個(gè)重要內(nèi)容。假設(shè)檢驗(yàn)是先對(duì)總體的特征(如總體的參數(shù)或分布、位置)提出某種假設(shè)(hypothesis)，如假設(shè)總體均數(shù)(或總體率)為一定值、總體均數(shù)(或總體率)相等、總體服從某種分布、兩總體分布位置相同等等，然后根據(jù)隨機(jī)樣本提供的信息，運(yùn)用“小概率原理”推斷假設(shè)是否成立。假設(shè)檢驗(yàn)通過(guò)隨機(jī)樣本認(rèn)識(shí)總體的結(jié)論有助于作出正確的專業(yè)結(jié)論。假設(shè)檢驗(yàn)是對(duì)總體的特征提出假設(shè)，根據(jù)樣本提供信息用“小概率原理”推斷假設(shè)是否成立20所謂小概率原理，就是“在一次試驗(yàn)中，概率很小(接近于零)的事件認(rèn)為是實(shí)際上不可能發(fā)生的事件”。例如，假設(shè)在1000支復(fù)方大青葉注射液針劑中只有一支是失效的，現(xiàn)在從中隨機(jī)抽取一支，則取得“失效的那支”概率為1/1000，這個(gè)概率是很小的，因此，可以認(rèn)為在一次抽取中是不會(huì)發(fā)生的，若從中任取一支恰好為“失效的那支”，我們就有理由懷疑“失效概率為1/1000”的假設(shè)不成立，而認(rèn)為失效率不是1/1000，從而否定假設(shè)。否定假設(shè)的依據(jù)就是小概率原理。例4-3：已知正常成年男子脈博平均為72次/分，現(xiàn)隨機(jī)檢查20名慢性胃炎所致脾虛男病人，其脈博均數(shù)為75次/分，標(biāo)準(zhǔn)差為6.4次/分，能否認(rèn)為此類脾虛男病人的脈博快于健康成年男子的脈博？21

如果出現(xiàn)了小概率事件，就拒絕這個(gè)假設(shè)；如果沒有出現(xiàn)小概率事件，則沒有理由懷疑這個(gè)假設(shè)，所以不拒絕這個(gè)假設(shè)。這種推斷方法的特點(diǎn)是依據(jù)小概率原理，采用類似于數(shù)學(xué)中邏輯論證的反證法，但又區(qū)別于純數(shù)學(xué)中邏輯推理的反證法。因?yàn)檫@里并不是形式邏輯中的絕對(duì)矛盾，而是基于人們?cè)趯?shí)踐中廣泛應(yīng)用的小概率原理。所以，可以說(shuō)假設(shè)檢驗(yàn)的基本思想是某種帶有概率性質(zhì)的反證法。假設(shè)檢驗(yàn)有兩種類型：(1)參數(shù)檢驗(yàn)（nparametric）：在許多問題中，總體分布的類型為已知，只是一個(gè)或幾個(gè)參數(shù)未知，只對(duì)未知參數(shù)作出假設(shè)，然后根據(jù)隨機(jī)樣本提供的信息，選取檢驗(yàn)統(tǒng)計(jì)量，按檢驗(yàn)統(tǒng)計(jì)量的分布規(guī)律，用“小概率原理”推斷假設(shè)是否成立。(2)非參數(shù)檢驗(yàn)（nonparametric）：是一種與總體分布無(wú)關(guān)的統(tǒng)計(jì)檢驗(yàn)方法，它不比較參數(shù)，而是比較分布的位置。當(dāng)不知道樣本來(lái)自的總體分布類型或已知總體分布與檢驗(yàn)所要求的條件不符，可用非參數(shù)檢驗(yàn)。23二、假設(shè)檢驗(yàn)的一般步驟1.建立假設(shè)并確定檢驗(yàn)水準(zhǔn)(1)建立假設(shè)：①假設(shè)需根據(jù)研究的目的對(duì)總體的特征而提出。假設(shè)有兩種：一種是檢驗(yàn)假設(shè)(hypothesistobetested)，假設(shè)差異完全由抽樣誤差造成，常稱無(wú)效假設(shè)(hullhypothesis)，用H0表示。另一種是和H0相對(duì)立的備擇假設(shè)(alternativehypothesis)，用H1表示，H1通常是希望證實(shí)的情況。假設(shè)檢驗(yàn)是針對(duì)H0進(jìn)行的，希望用樣本數(shù)據(jù)推斷H0是假的，從而證實(shí)H1是真的。假設(shè)檢驗(yàn)的結(jié)果是在零假設(shè)H0和對(duì)立假設(shè)H1之間作出抉擇。當(dāng)拒絕H0時(shí)，接受H1，認(rèn)為差異有統(tǒng)計(jì)意義；當(dāng)不拒絕H0時(shí)，認(rèn)為差異無(wú)統(tǒng)計(jì)意義，則不接受H1。24簡(jiǎn)言之：根據(jù)專業(yè)知識(shí)或研究目的H1不能肯定方向，則檢驗(yàn)是雙側(cè)的，稱雙側(cè)檢驗(yàn)。H1能肯定方向，則檢驗(yàn)是單側(cè)的，稱單側(cè)檢驗(yàn)。

例4-3的目的是推斷此類脾虛病人的脈博是否快于正常人(正常人的脈博總體均數(shù)為μ0=72次/分)，H0為此類脾虛病對(duì)脈博數(shù)無(wú)影響，即此類脾虛病人的脈博總體均數(shù)等于正常人,用符號(hào)表示為:H0:μ=72次/分，即μ=μ0與之對(duì)應(yīng)的備擇假設(shè)為該類脾虛病的脈博數(shù)快于正常人,用符號(hào)表示為：

H1：μ>72次/分，即μ>μ026(2)確定檢驗(yàn)水準(zhǔn)：檢驗(yàn)水準(zhǔn)(sizeofatest)亦稱顯著性水平(significancelevel)，常用符號(hào)α表示。α是假設(shè)檢驗(yàn)時(shí)預(yù)先確定的，用以作為判斷多小的概率可以認(rèn)為是小概率的水準(zhǔn)，故稱為檢驗(yàn)水準(zhǔn)。α的大小視具體情況而定，一般α取0.05或0.01，若按α=0.05拒絕H0，接受H1，作出這樣的判斷要冒5%錯(cuò)誤的風(fēng)險(xiǎn)。從圖4-2可以看出，同一資料、同一檢驗(yàn)水準(zhǔn)α?xí)r，因單側(cè)檢驗(yàn)的界值t0.025相當(dāng)于雙側(cè)檢驗(yàn)的界值t0.05，雙側(cè)P為單側(cè)P的兩倍，所以單側(cè)檢驗(yàn)比雙側(cè)檢驗(yàn)更易拒絕H0。一般認(rèn)為雙側(cè)檢驗(yàn)較為穩(wěn)妥，故較為常用。27強(qiáng)調(diào)指出，檢驗(yàn)水準(zhǔn)α的確定，以及選擇單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn)，都應(yīng)結(jié)合專業(yè)知識(shí)和研究目的，在實(shí)驗(yàn)設(shè)計(jì)時(shí)決定，不能等到樣本結(jié)果計(jì)算完后再根據(jù)主觀愿望選定。2．選取檢驗(yàn)統(tǒng)計(jì)量，明確其分布，并由樣本計(jì)算檢驗(yàn)統(tǒng)計(jì)量值檢驗(yàn)統(tǒng)計(jì)量是指建立在無(wú)效假設(shè)H0基礎(chǔ)上的，用于抉擇是否拒絕H0而選定的樣本函數(shù)。參數(shù)檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量要求滿足以下條件：①在H0成立的條件下，它的分布函數(shù)是已知的；②它必須包含要檢驗(yàn)的總體參數(shù)；③對(duì)于給定的樣本數(shù)據(jù)，能計(jì)算出該檢驗(yàn)統(tǒng)計(jì)量的數(shù)值。假設(shè)檢驗(yàn)通常是以選定的檢驗(yàn)統(tǒng)計(jì)量來(lái)命名的，例如，以u(píng)值為檢驗(yàn)統(tǒng)計(jì)量的假設(shè)檢驗(yàn)稱為u檢驗(yàn)，以t值為檢驗(yàn)統(tǒng)計(jì)量的假設(shè)檢驗(yàn)稱為t檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量的選取，因資料不同而不同。如例4-3，樣本均數(shù)與總體均數(shù)比較，如果H0(μ=μ0)成立，(－μ0)的絕對(duì)值應(yīng)比較小，一旦很大，就認(rèn)為H0不成立。28三、假設(shè)檢驗(yàn)的兩類錯(cuò)誤當(dāng)H0為真.

●如果我們接受H0，我們就做對(duì)了．

●如果我們拒絕H0，我們就犯了錯(cuò)誤．(Ⅰ型錯(cuò)誤)定義P(Ⅰ型錯(cuò)誤)=拒絕一個(gè)真實(shí)的零假設(shè)的概率這個(gè)概率用α表示,在第3步選擇顯著性水平時(shí)就確定了.顯著性水平是指在零假設(shè)為真的情況下，作為拒絕H0的稀有結(jié)果的度量．當(dāng)H0為假●如果我們接受H0，我們就犯了錯(cuò)誤．(Ⅱ型錯(cuò)誤)●如果我們拒絕H0，我們就做對(duì)了．

定義P(Ⅱ型錯(cuò)誤)=拒絕一個(gè)虛假的零假設(shè)的概率．

30這個(gè)概率用β表示，評(píng)價(jià)它困難多，因?yàn)樗Q于下面討論的一些因素．事實(shí)上當(dāng)H0為假的時(shí)候，拒絕H0的概率就是1－β，稱它為檢驗(yàn)效率（powerofthetest）客觀實(shí)際拒絕H0不拒絕H0H0為真H0為假Ⅰ型錯(cuò)誤(α)推斷正確(1-β)推斷正確(1-α)Ⅱ型錯(cuò)誤(β)統(tǒng)計(jì)推斷可能出現(xiàn)的4種結(jié)果α的含義是，兩總體無(wú)差別，按α水準(zhǔn)檢驗(yàn)為有差別的概率β的含義是，兩總體有差別，按α水準(zhǔn)檢驗(yàn)為無(wú)差別的概率1-α為可信度，是指兩總體確無(wú)差別，按α水準(zhǔn)能作出正確推斷的概率。即不出現(xiàn)Ⅰ型錯(cuò)誤的概率1-β為把握度，是指兩總體確有差別，按α水準(zhǔn)能檢驗(yàn)出差別的概率，故又有檢驗(yàn)效能之稱。31從圖中看出，當(dāng)樣本含量n確定時(shí)，α愈小，β愈大；反之，α愈大，β愈小。若要同時(shí)減少Ⅰ型錯(cuò)誤和Ⅱ型錯(cuò)誤，則只有增加樣本含量。當(dāng)不可能同時(shí)達(dá)到較小的檢驗(yàn)水準(zhǔn)α和較大的檢驗(yàn)效能1-β時(shí)，一般先確定檢驗(yàn)水準(zhǔn)α，然后決定檢驗(yàn)效能。檢驗(yàn)水準(zhǔn)稱顯著性水平，一般α取0.05或0.01。32正態(tài)性檢驗(yàn)、方差齊性檢驗(yàn)一、正態(tài)性檢驗(yàn)

正態(tài)性檢驗(yàn)的目的是檢驗(yàn)資料是否服從正態(tài)分布，確定樣本是否來(lái)自正態(tài)分布的總體正態(tài)分布特征：一是對(duì)稱，二是正態(tài)峰，描述對(duì)稱用偏度系數(shù)s，描述峰態(tài)用峰度系數(shù)k。33偏度系數(shù)＝0表示與正態(tài)分布相同，偏度系數(shù)＞0表示正或右偏態(tài)，偏度系數(shù)＜0表示負(fù)或左偏態(tài)。峰度系數(shù)＝0表示與正態(tài)分布相同，峰度系數(shù)＞0表示比正態(tài)分布陡峭，峰度系數(shù)＜0表示比正態(tài)平坦34【例4-4】判斷例3-1資料正常人血糖的正態(tài)性解

H0：總體服從正態(tài)分布，H1：不服從正態(tài)分布

SPSS:→Analyze→Explore或→Analyze→NonparametricTests→1-SampleK-S（柯爾莫哥諾夫-斯米爾諾夫檢驗(yàn)）

用統(tǒng)計(jì)軟件不方便時(shí)，否定正態(tài)性的方法最簡(jiǎn)單的是將均數(shù)與中位數(shù)及標(biāo)準(zhǔn)差進(jìn)行比較，均數(shù)與中位數(shù)兩者不等且相差較大時(shí)，分布不對(duì)稱；標(biāo)準(zhǔn)差大于均數(shù)時(shí)，表示數(shù)據(jù)分散，曲線“矮、胖”，峰平闊，與正態(tài)峰度不同。這類資料，可以判定不符合正態(tài)分布。非偏態(tài)資料不一定具有正態(tài)峰，均數(shù)近于中位數(shù)或標(biāo)準(zhǔn)差小于均數(shù)的資料也不一定都符合正態(tài)分布。35【例4.4】判斷例3.1資料正常人血糖的正態(tài)性解

H0：總體服從正態(tài)分布，H1：不服從正態(tài)分布

SPSS:→Analyze→Explore或→Analyze→NonparametricTests→1-SampleK-S二、方差齊性檢驗(yàn)

1．2分布如果Z1，Z2，...，Zn是獨(dú)立的標(biāo)準(zhǔn)正態(tài)變量，則稱2=Z12+Z22+...+Zn2為自由度為df=n的2分布。36⑴2分布具有可加性若隨機(jī)變量12，22分別服從自由度為df1，df2的2分布，且它們相互獨(dú)立，則12±22服從自由度為df=df1±df2的2分布。⑵若從均數(shù)為μ，標(biāo)準(zhǔn)差為σ的正態(tài)總體中，抽取樣本含量為n的樣本，計(jì)算樣本標(biāo)準(zhǔn)差s，則2=(n－1)s2/σ2服從自由度為df=n－1的2分布。

2.F分布。

如果隨機(jī)變量X1、X2分別服從自由度為df1，df2的2分布，則稱隨機(jī)變量F=(X1/df1)/(X2/df2)服從自由度為df1，df2

的F分布。37P(F＞Fα(df1，df2))＝α表示F分布曲線下，界值Fα(df1，df2)

右側(cè)面積占總面積的百分?jǐn)?shù)

F分布具有倒數(shù)性質(zhì)分別從兩個(gè)正態(tài)總體N（μ1,σ1）和N（μ2,σ2）中隨機(jī)抽取含量為n1，n2的樣本，樣本方差分別為s12和s22，則統(tǒng)計(jì)量F=(s12/σ12)/(s22/σ22)服從自由度為df1=n1-1，df2=n2-1的F分布。

383．兩樣本或多樣本方差的齊性檢驗(yàn)法例4.5治療急性上消化道出血，抗血纖溶芳酸x1：n1=20，s12=47.61；大黃組x2：n2=30，s22=0.7744H0：σ12=σ22，H1：σ12

σ22

。正態(tài)分布時(shí)，兩總體方差齊性檢驗(yàn)：從方差分別為σ12，σ22的正態(tài)總體中隨機(jī)抽樣，則s12，s22分別是σ12，σ22

的估計(jì)，在H0：σ12=σ22=σ2時(shí)，F(xiàn)＝s12/s22，df1＝n1-1，df2＝n2-1。df1=20–1=19，df2=30–1=29，查F界值表，P＜0.05，按α=0.05水準(zhǔn)拒絕H0接受H1，兩個(gè)總體方差不齊394.樣本方差與已知總體方差比較

多樣本方差齊性檢驗(yàn)時(shí)，有Bartlett、Levene、Brown&Forsythe、QBrien檢驗(yàn)等多種在H0：σ2＝σ02假設(shè)下

【例4.6】含碳量服從均數(shù)為1.408，方差為0.0482的正態(tài)分布。某班產(chǎn)品隨機(jī)抽取5件，測(cè)得含碳量(%)為1.32，1.55，1.36，1.40和1.44，問生產(chǎn)是否正常40解

n＝5，x-＝1.414和規(guī)定的總體均數(shù)μ0＝1.408差不多，但s2＝0.0882比規(guī)定的總體方差0.0482波動(dòng)性大。要檢驗(yàn)s2＝0.0882

是否來(lái)自σ02＝0.0482的總體H0：σ2＝0.0482；H1：σ2＞0.04822＝(5－1)×0.0882/0.0482＝13.5，df＝n－1＝4查2界值表，得2

0.01(4)＝13.28，P＜0.01，按α＝0.01水準(zhǔn)拒絕H0,可認(rèn)為這個(gè)班的生產(chǎn)是不正常的，含碳量的波動(dòng)性超過(guò)了標(biāo)準(zhǔn)第四節(jié)t檢驗(yàn)

41一、單樣本t檢驗(yàn)2.大樣本，或正態(tài)小樣本但σ已知，可用Z

檢驗(yàn)1.正態(tài)分布資料σ未知小樣本，可用t檢驗(yàn)

3.不服從正態(tài)分布或分布類型未知，用非參數(shù)檢驗(yàn)或作變量變換轉(zhuǎn)換為正態(tài)分布資料處理

42不滿足不滿足滿足滿足σ已知正態(tài)性非參數(shù)檢驗(yàn)變量替換結(jié)論不滿足單組資料大樣本u檢驗(yàn)t檢驗(yàn)滿足【例4.7】M含量服從正態(tài)分布，μ=63.5μg。測(cè)得40.0，41.0，41.5，41.8，42.4，43.1，43.5，43.8，44.2。這批培植人參含量與野生是否相同43解

H0：μ＝63.5g，H1：μ≠63.5g計(jì)算得到n＝9，x-＝42.37，s＝1.40

df＝n-1＝8，t0.01/2(8)＝3.355，|t|＞t0.01/2(8)，P＜0.01，拒絕H0，可以認(rèn)為人工培植人參中M物質(zhì)的含量低于野生人參?！維PSS操作】在數(shù)據(jù)編輯窗以M為變量名，輸入M物質(zhì)含量的9個(gè)數(shù)據(jù)，建立數(shù)據(jù)文件L4-7.sav?！鶤nalyze→DescriptiveStatistics→Explore，M選入DependentList框，→Plots選Nomalityplotswithtests44P=0.840＞0.05，可認(rèn)為M物質(zhì)含量服從正態(tài)分布。→Analyze→CompareMeans→One-SampleTTest，將M選入Testvariable[s]框，改TestValue框檢驗(yàn)值為63.5。45t=－45.142，自由度df=8，雙側(cè)P=0.000<0.05。故可認(rèn)為人工培植人參與野生人參的M物質(zhì)含量不同。差值的95%CI

為（-22.2129，-20.0538），不包含0，按α=0.05水準(zhǔn)，可認(rèn)為人工培植人參與野生人參的M物質(zhì)含量不同。單組計(jì)量資料，調(diào)用univariate過(guò)程，使用格式為

procunivariatenormalmu0=常數(shù)

cibasicalpha=水平;var變量;freq頻數(shù);run;其中，參數(shù)mu0指定檢驗(yàn)常數(shù)（為0可省），cibasic為可信區(qū)間，alpha指定顯著水平（為0.05可?。琭req指定頻數(shù)變量（為1可?。?6例3101隨機(jī)抽取5丸測(cè)得崩解時(shí)間為：21、18、20、16、15。崩解時(shí)間不得超過(guò)60min，判斷是否合格。dataL3101;/*逍遙丸崩解時(shí)間*/

inputx@@;cards;2118201615;procunivariatemu0=60normalcibasic;varx;run;正態(tài)性檢驗(yàn)檢驗(yàn)----統(tǒng)計(jì)量-----------P值-------Shapiro-WilkW0.9437Pr<W0.6919Kolmogorov-SmirnovD0.1836Pr>D>0.1500Cramer-vonMisesW-Sq0.0314Pr>W-Sq>0.2500Anderson-DarlingA-Sq0.2139Pr>A-Sq>0.250047正態(tài)性檢驗(yàn)Shapiro-Wilk統(tǒng)計(jì)量=0.9437、P=0.6919＞0.05，數(shù)據(jù)來(lái)自正態(tài)總體。

位置檢驗(yàn):Mu0=60檢驗(yàn)--------統(tǒng)計(jì)量------------------P值----------學(xué)生tt-36.8364Pr>|t|<.0001符號(hào)M-2.5Pr>=|M|0.0625符號(hào)秩S-7.5Pr>=|S|0.0625由位置檢驗(yàn)t＝－36.8364、P＜0.0001，以α＝0.01水準(zhǔn)拒絕H0，有統(tǒng)計(jì)學(xué)意義。由均值=18＜60，可以認(rèn)為，該批藥丸平均崩解時(shí)間低于60min。

48例31028名脾虛納呆患兒尿液淀粉酶含量為4，4，8，8，8，16，16，32，推斷脾虛納呆患兒尿液淀粉酶的含量是否低于10（U/10min）。

dataL3102;/*頻數(shù)資料的幾何均數(shù)檢驗(yàn)*/inputxf@@;y=log10(x);cards;4283162321;procunivariatemu0=1normalcibasic;vary;freqf;run;

正態(tài)性檢驗(yàn)Shapiro-Wilk統(tǒng)計(jì)量=0.9173、P=0.4082＞0.05，脾虛納呆患兒尿液淀粉酶的含量取對(duì)數(shù)后的數(shù)據(jù)來(lái)自正態(tài)總體。49由位置檢驗(yàn)t=-0.1965、P＝0.8498＞0.05，不能以α＝0.05水準(zhǔn)拒絕H0，無(wú)統(tǒng)計(jì)學(xué)意義。不能認(rèn)為脾虛納呆患兒尿液淀粉酶的含量低于10（U/10min）。三、配對(duì)設(shè)計(jì)資料的均數(shù)比較

50配對(duì)t檢驗(yàn)是把配對(duì)的兩組資料轉(zhuǎn)化為一組差值，假設(shè)配對(duì)差值d的總體均數(shù)μd為0，適用于配對(duì)設(shè)計(jì)成功，對(duì)子差值服從正態(tài)分布的資料。配對(duì)差值的標(biāo)準(zhǔn)誤與n1=n2=n的完全隨機(jī)設(shè)計(jì)兩均數(shù)之差的標(biāo)準(zhǔn)誤計(jì)算公式分別為式中r為配對(duì)數(shù)據(jù)的積差相關(guān)系數(shù)。

r＞0時(shí)，配對(duì)設(shè)計(jì)成功，用配對(duì)t檢驗(yàn)。r＜0，配對(duì)設(shè)計(jì)失敗，實(shí)驗(yàn)效率低于完全隨機(jī)實(shí)驗(yàn)。51【例4.8】20只小白鼠配成10對(duì)，隨機(jī)分到實(shí)驗(yàn)組和對(duì)照組，已知抑瘤效果滿足正態(tài)性，試比較兩組瘤體大小是否相同對(duì)子號(hào)12345678910對(duì)照組x7.04.15.04.5實(shí)驗(yàn)組y3.04.02.61.3d＝x－y3.3-配對(duì)設(shè)計(jì)成功時(shí)52解H0：μd＝0，n＝10，x-＝2.16，s＝1.3209r=0.075＞0，配對(duì)設(shè)計(jì)成功，可以用配對(duì)t檢驗(yàn)。t＝2.16×100.5/1.3209＝5.1709

df＝9查t界值表，t0.01/2(9)＝3.2498,│t│＞t0.01/2(9)，P＜0.01，拒絕H0，可認(rèn)為三棱莪術(shù)液有抑瘤效果【SPSS操作】以實(shí)驗(yàn)和對(duì)照為變量名，建立2列10行的配對(duì)計(jì)量資料數(shù)據(jù)文件L4-8.sav。53→Transform→Compute，在TargetVariable框輸入d；在Numericexpression框輸入“實(shí)驗(yàn)-對(duì)照”。→Analyze→DescriptiveStatistics→Explore，將d送入DependentList框，→Plots選Nomalityplotswithtests。→Analyze→CompareMeans→Paired-SampleTTest，將實(shí)驗(yàn)和對(duì)照同時(shí)選入PairedVariables框。數(shù)據(jù)文件L4-8.sav增加新變量d。

P=0.819＞0.05，可認(rèn)為配對(duì)差d服從正態(tài)分布。相關(guān)系數(shù)r=0.075＞0，可認(rèn)為配對(duì)設(shè)計(jì)成功。54配對(duì)檢驗(yàn)統(tǒng)計(jì)量t=5.171，df=9，P=0.001，拒絕H0，可以認(rèn)為三棱莪術(shù)液有抑瘤效果

。差值的95%CI為（1.2151，3.1049），不包含配對(duì)差值的總體均數(shù)0，按α=0.05水準(zhǔn)，拒絕H0。

55相關(guān)系數(shù)計(jì)算，可以調(diào)用corr過(guò)程語(yǔ)句，即proccorr;varx1x2;

例3103黃芪對(duì)健康人群小腸傳遞時(shí)間作用研究。中藥新藥與臨床藥理，2001年5月第12卷第3期。測(cè)得服藥前后的數(shù)據(jù)，判斷傳遞時(shí)間是否不同。編號(hào)1234567891011121314151617181920藥前2321233822222838213121223322326721605029藥后2423303521212538213021223022306822645230編號(hào)2122232425262728293031323334353637383940藥前212811610638362164212862273922402121242626藥后212711010638212536232821233022326422605222配對(duì)比較，H0：μd＝0，H1：μd≠0。

56dataL3103;/*黃芪對(duì)健康人群小腸傳遞時(shí)間*/inputxy@@;d=x-y;cards;2324212121232827……………29302622;proccorr;varxy;procunivariatenormal;vard;run;Shapiro-Wilk統(tǒng)計(jì)量0.7358，P＜0.0001，d不服從正態(tài)分布，應(yīng)該選擇非參數(shù)檢驗(yàn)。57例3104某大學(xué)校醫(yī)院用銀楂丹桃合劑治療高血壓患者，測(cè)得治療前后舒張壓數(shù)據(jù)，判斷該中藥治療高血壓是否有效。病人編號(hào)12345678治療前13.614.917.217.316.514.214.514.6治療后11.915.313.417.214.611.512.213.8打開程序L3103.sas，修改數(shù)據(jù)，存為L(zhǎng)3104.sas。Shapiro-Wilk統(tǒng)計(jì)量0.9781，P＝0.9528＞0.05，服從正態(tài)分布。58Pearson相關(guān)系數(shù)r＝0.6949＞0，配對(duì)設(shè)計(jì)成功，可以使用配對(duì)t檢驗(yàn)。由t＝3.2807，P=0.0135＜0.05，檢驗(yàn)有統(tǒng)計(jì)學(xué)意義，治療前后的舒張壓不同。由t值>0，可認(rèn)為治療前的舒張壓高于治療后，銀楂丹桃合劑治療高血壓有效。例3105測(cè)得造模兔使用眼傷寧前及用藥后兩月的角膜厚度值，判斷眼傷寧對(duì)促進(jìn)家兔角膜傷口愈合有無(wú)作用。

59打開程序L3104.sas，修改數(shù)據(jù)并運(yùn)行。三、成組t檢驗(yàn)造模兔編號(hào)12345678910用藥前厚度0.740.740.720.720.760.720.720.760.640.68用藥后厚度0.560.580.580.580.560.600.600.600.580.60Shapiro-Wilk統(tǒng)計(jì)量0.9648，P＝0.8384＞0.05，服從正態(tài)分布。Pearson相關(guān)系數(shù)r＝－0.2315＜0，配對(duì)設(shè)計(jì)失敗，應(yīng)當(dāng)改用成組t檢驗(yàn)。60兩小樣本均數(shù)比較，滿足正態(tài)性和方差齊性時(shí)用t檢驗(yàn)，不滿足方差齊性時(shí)用t’檢驗(yàn)，也可變量轉(zhuǎn)換后用t檢驗(yàn)。資料分布類型未知或不滿足正態(tài)性和方差齊性時(shí)，可以用非參數(shù)檢驗(yàn)方差齊性？成組t檢驗(yàn)非參數(shù)檢驗(yàn)不滿足正態(tài)性？變量變換滿足滿足不滿足變量變換t′檢驗(yàn)結(jié)論1、正態(tài)分布資料兩樣本均數(shù)比較的t檢驗(yàn)61當(dāng)兩樣本含量相等，即n1＝n2＝n時(shí)方差齊，在H0：μ1＝μ2假設(shè)下，t檢驗(yàn)統(tǒng)計(jì)量為62方差不齊兩小樣本均數(shù)比較，H0：μ1＝μ2

兩大樣本均數(shù)比較，可用u檢驗(yàn)

，H0：μ1＝μ2

63【例4.9】12名正常人和15名病毒性肝炎患者血清轉(zhuǎn)鐵蛋白含量，已檢驗(yàn)兩組方差相等，問患者和健康人轉(zhuǎn)鐵蛋白含量是否有差異正常265.4271.5284.6291.3254.8275.9281.7268.6264.1273.2270.8260.5---患者256.9235.9215.4251.8224.7228.3231.1253.0221.7218.8233.8230.9240.7260.7224.4解

H0：σ12＝σ22，H1：σ12≠σ22n1＝12，x1-＝271.8667，s1＝10.3971n2＝15，x2-＝235.2067，s2＝14.390764查F界值得F0.05(14,11)=2.7186，P＞0.05，不能按α=0.05水準(zhǔn)拒絕H0，不能認(rèn)為兩組總體方差不同。df=12+15-2=25，查t界值表得t0.01/2(25)=2.7874，P＜0.01，按α=0.01水準(zhǔn)拒絕H0，可以認(rèn)為病毒性肝炎患者的轉(zhuǎn)鐵蛋白量較低。H0：μ1＝μ2，H1：μ1≠μ265【SPSS操作】以觀察對(duì)象（標(biāo)簽值用1=正常人，2=肝炎患者）和轉(zhuǎn)鐵蛋白為變量名，建立2列27行的完全隨機(jī)設(shè)計(jì)計(jì)量資料數(shù)據(jù)文件L4-9.sav?！鶤nalyze→DescriptiveStatistics→Explore，將觀察對(duì)象選入Factorlist框，轉(zhuǎn)鐵蛋白選入DependentList框；→Plots，選擇Normalityplotswithtest。樣本含量≤50，宜看Shapiro-Wilk。正常人的統(tǒng)計(jì)量=0.986，P=0.998；患者統(tǒng)計(jì)量=0.927，P=0.245，兩組均滿足正態(tài)性。66→Analyze→CompareMeans→Independent-SamplesTTest，將轉(zhuǎn)鐵蛋白選入TestVariables框，將觀察對(duì)象選入GroupingVariable框，→DefineGroups，在group1框中鍵入1，在group2框中鍵入2。Levene’sTestforEqualityofVariances統(tǒng)計(jì)量F=1.877，P=0.183＞0.05，可認(rèn)為兩總體方差齊性。67用Equalvariancesassumed的t檢驗(yàn)結(jié)果，t=7.402，雙側(cè)P=0.000。故拒絕H0，接受H1，可以認(rèn)為正常人與病毒性肝炎患者的轉(zhuǎn)鐵蛋白含量不等，轉(zhuǎn)鐵蛋白測(cè)定對(duì)病毒性肝炎診斷有臨床意義。

68例2107測(cè)定功能性子宮出血癥中實(shí)熱組與虛寒組的免疫功能，其淋巴細(xì)胞轉(zhuǎn)化率如表所示。比較實(shí)熱組與虛寒組的淋巴細(xì)胞轉(zhuǎn)化率均數(shù)是否不同。

實(shí)熱組0.7090.7550.6550.7050.723－－－－－虛寒組0.6170.6080.6230.6350.5930.6840.6950.7180.6060.618這是成組比較。H0：μ1＝μ2，H1：μ1≠μ2。69當(dāng)資料與正態(tài)分布偏倚較大時(shí)，可采用非參數(shù)檢驗(yàn)，也可用適當(dāng)?shù)淖兞孔儞Q【例4.10】甲組24人用補(bǔ)益法加預(yù)防注射，乙組22人只用預(yù)防注射。測(cè)定抗體滴度倒數(shù)，問兩組免疫效果有無(wú)差別滴度倒數(shù)x48163264128256甲組人數(shù)f14428132乙組人數(shù)f234372212、非正態(tài)分布的兩均數(shù)比較

70解觀察值呈倍數(shù)關(guān)系，不滿足正態(tài)性，可用對(duì)數(shù)變換達(dá)到正態(tài)性要求H0：σ12＝σ22，H1：σ12≠σ22n1＝24，x1-＝3.2058，s1＝1.3058n2＝22，x2-＝3.1192，s2＝1.1667查F界值表得P＞0.05，不能按α＝0.05水準(zhǔn)拒絕H0，不能認(rèn)為兩組的總體方差不同

71H0：μ1＝μ2，H1：μ1≠μ2df＝24＋22－2＝44查t界值表得P＞0.05，不能按α=0.05水準(zhǔn)拒絕H0，不能認(rèn)為兩組效果有差別【SPSS操作】分別以x和組別為變量名，在x的列中，先按所給甲組資料鍵入4個(gè)4，4個(gè)8，…，2個(gè)256，并在組別列鍵入1；接著按乙組資料鍵入3個(gè)4，4個(gè)8，…，1個(gè)256，并在組別列鍵入2；建立2列46行的數(shù)據(jù)文件L4-10.sav72對(duì)抗體滴度倒數(shù)按組別檢驗(yàn)正態(tài)性，甲組Shapiro-Wilk統(tǒng)計(jì)量=0.670，P=0.000；乙組Shapiro-Wilk=0.650，P值=0.000，均不滿足正態(tài)性。

→Transform→Compute，在TargetVariable框鍵入lnx，Numericexpression框輸入ln(x)，對(duì)lnx按組別檢驗(yàn)正態(tài)性，甲組lnx的Shapiro-Wilk統(tǒng)計(jì)量=0.920，P=0.058；乙組=0.943，P=0.224，均滿足正態(tài)性。73Levene’sTestforEqualityofVariances的P=0.600>0.05，方差齊。成組t檢驗(yàn)t=0.236，P=0.834>0.05，不拒絕H0，故不能認(rèn)為兩組免疫效果有差別。故不能認(rèn)為兩組免疫效果有差別。74EqualityofVariances統(tǒng)計(jì)量F＝1.25，P＝0.6075＞0.05，不能認(rèn)為兩組的總體方差不齊。由VariancesEqual，統(tǒng)計(jì)量t＝0.24，P＝0.8142＞0.05，不能以α＝0.05水準(zhǔn)拒絕H0，無(wú)統(tǒng)計(jì)意義。故，不能認(rèn)為兩組的免疫效果有差別。

兩樣本均數(shù)比較，如果資料不滿足齊同對(duì)比性，應(yīng)設(shè)法在統(tǒng)計(jì)分析時(shí)盡量消除影響因素的干擾兩組的Shapiro-Wilk統(tǒng)計(jì)量為0.9197、0.9426，P＝0.0576、0.2244，均服從正態(tài)分布。

四、加權(quán)均數(shù)法75【例4.11】輕病人46例，重病人44例，用完全隨機(jī)方法分配到A、B兩種療法組治療輕病人（46例）重病人（44例）合計(jì)（90例）病例數(shù)x-±s病例數(shù)x-±s病例數(shù)x-±s甲療法3423.5±6.0813.5±4.64221.6±5.8乙療法1224.0±5.93612.5±4.54815.4±4.9不考慮兩組病情構(gòu)成比不同，用不分病情的合計(jì)數(shù)據(jù)比較兩樣本均數(shù)，得t＝5.497，P＜0.01，認(rèn)為A療法療效優(yōu)于B療法，但結(jié)論是不正確的病情輕的患者療效較好，病情重的患者相對(duì)較差。76要消除病情因素構(gòu)成比不同的影響，綜合比較兩療法降低某酶的療效，或者要在綜合回答兩種療法差異有無(wú)統(tǒng)計(jì)學(xué)意義外，同時(shí)還了解病情因素的影響大小，可采用兩因素設(shè)計(jì)試驗(yàn)的方差分析或協(xié)方差分析。若僅僅為了刪除病情因素影響，則可用加權(quán)均值法來(lái)進(jìn)行分析先按不同構(gòu)成n＝n1＋n2計(jì)算權(quán)重系數(shù)w

wi＝ni/n

再計(jì)算各比較組的加權(quán)均值xw-與加權(quán)標(biāo)準(zhǔn)差sw

77最后，對(duì)各比較組的加權(quán)均值進(jìn)行假設(shè)檢驗(yàn)解計(jì)算輕組與重組的權(quán)重系數(shù)

w1＝(34＋12)/(42＋48)＝0.5111w2＝(8＋36)/(42＋48)＝0.4889分別計(jì)算甲及乙療法的加權(quán)均值xw-與標(biāo)準(zhǔn)差sw

xwA-＝0.5111×23.5＋0.4889×13.5＝18.6111

swA＝0.5111×6＋0.4889×4.6＝5.3156

xwB-＝0.5111×23.5＋0.4889×13.5＝18.6111

swB＝0.5111×5.9＋0.4889×4.5＝5.2156

78對(duì)加權(quán)均值進(jìn)行檢驗(yàn)

查F界值得P＞0.05，不能按α=0.05水準(zhǔn)拒絕H0，不能認(rèn)為兩組的總體方差不同df＝42＋48－2＝88查t界值得P＞0.05，不能按α＝0.05水準(zhǔn)拒絕H0，不能認(rèn)為兩種療法療效有差別79一

人人文庫(kù)> 全部分類> 行業(yè)資料 > 醫(yī)學(xué)制藥

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

統(tǒng)計(jì)與軟件4課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

統(tǒng)計(jì)與軟件4課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔