![醫(yī)學(xué)統(tǒng)計(jì)學(xué)基本概念資料_第1頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-5/5/846ddfaa-ec49-495f-b709-1cf15f3e4837/846ddfaa-ec49-495f-b709-1cf15f3e48371.gif)
![醫(yī)學(xué)統(tǒng)計(jì)學(xué)基本概念資料_第2頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-5/5/846ddfaa-ec49-495f-b709-1cf15f3e4837/846ddfaa-ec49-495f-b709-1cf15f3e48372.gif)
![醫(yī)學(xué)統(tǒng)計(jì)學(xué)基本概念資料_第3頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-5/5/846ddfaa-ec49-495f-b709-1cf15f3e4837/846ddfaa-ec49-495f-b709-1cf15f3e48373.gif)
![醫(yī)學(xué)統(tǒng)計(jì)學(xué)基本概念資料_第4頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-5/5/846ddfaa-ec49-495f-b709-1cf15f3e4837/846ddfaa-ec49-495f-b709-1cf15f3e48374.gif)
![醫(yī)學(xué)統(tǒng)計(jì)學(xué)基本概念資料_第5頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-5/5/846ddfaa-ec49-495f-b709-1cf15f3e4837/846ddfaa-ec49-495f-b709-1cf15f3e48375.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、醫(yī)學(xué)統(tǒng)計(jì)學(xué)基本概念1 .醫(yī)學(xué)統(tǒng)計(jì)學(xué)是以醫(yī)學(xué)理論為指導(dǎo),應(yīng)用概率論與數(shù)理統(tǒng)計(jì)的有關(guān)原理和方法,研究醫(yī)學(xué)資料的搜集、整理、分析和推斷的一門應(yīng)用科學(xué)。2 .統(tǒng)計(jì)工作的步驟:(1)設(shè)計(jì)(2)收集資料(3)整理資料(4)分析資料;或者分三步:(1)研究設(shè)計(jì)(2)資料分析(3)結(jié)論。3 .定量資料:又稱為數(shù)值變量資料,特點(diǎn):(1)各觀察值之間有量的差別;(2)數(shù)據(jù)間有連續(xù)性。它是指變量的取值不止是可列個(gè),而是可取某區(qū)間a,b,(-oo,oo)上的一切值。4 .定性資料:又稱為分類資料、分類變量資料(包括二項(xiàng)分類、多項(xiàng)分類資料),特點(diǎn):(1)各觀察值之間有質(zhì)的差別;(2)數(shù)據(jù)間有離散性。它是指變量的取值有限
2、的,至多是可列多個(gè)。附:無(wú)序分類:二項(xiàng)分類、多項(xiàng)分類5 .等級(jí)資料:又稱為半定量資料,有序分類,指各類之間有程度的差別。特點(diǎn):()各觀察單位間或者相同,或者存在質(zhì)的差別;(2)各等級(jí)間只有順序,而無(wú)數(shù)值大小,故等級(jí)之間不可度量。6 .個(gè)體individual:即每個(gè)觀察單位。7 .總體population:根據(jù)研究目的確定的同質(zhì)觀察單位的全體。8 .樣本:是從總體中隨機(jī)抽取部分觀察單位,其實(shí)測(cè)值的集合。樣本包含的觀察單位數(shù)稱為樣本含量或樣本大小。9 .參數(shù)parameters:描述某總體特征的統(tǒng)計(jì)指標(biāo)稱為總體參數(shù),簡(jiǎn)稱參數(shù)。如總體均數(shù)、總體標(biāo)準(zhǔn)差等。特點(diǎn):參數(shù)是未知的,固有的,不變的!10 .
3、統(tǒng)計(jì)量:描述某樣本特征的的統(tǒng)計(jì)指標(biāo)稱為樣本統(tǒng)計(jì)量,簡(jiǎn)稱統(tǒng)計(jì)量。特點(diǎn):統(tǒng)計(jì)量是已知的,變化的,有誤差的!11 .概率probability:是描述隨機(jī)事件發(fā)生的可能性大小的數(shù)值。常用P表示。它的大小界于0和1之間。12 .隨機(jī)事件:(1)可重復(fù)性:相同條件下可重復(fù)進(jìn)行;(2)隨機(jī)性:出現(xiàn)兩種機(jī)兩種以上結(jié)果;(3)偶然性:實(shí)驗(yàn)前不能肯定將出現(xiàn)哪種結(jié)果。13 .頻率的穩(wěn)定性:在重復(fù)試驗(yàn)中,事件A的頻率隨著試驗(yàn)次數(shù)的不斷增加將愈來(lái)愈接近一個(gè)常數(shù)p,頻率的這一特性稱為頻率的穩(wěn)定性。14 .概率的統(tǒng)計(jì)定義:頻率的穩(wěn)定性充分說(shuō)明隨機(jī)事件出現(xiàn)的可能是事物本身固有的一種客觀屬性,因而是可以被認(rèn)識(shí)和度量的。這個(gè)常
4、數(shù)p就稱為事件A出現(xiàn)的概率(probability),記作P(A)或P。這一定義稱為概率的統(tǒng)計(jì)定義。它是事件A發(fā)生的可能性大小的一個(gè)度量。容易看出,頻率為一變量,是樣本統(tǒng)計(jì)量,而概率為常數(shù),是一總體參數(shù)。實(shí)踐中,當(dāng)試驗(yàn)次數(shù)足夠多時(shí),可以近似地將頻率作為概率的一個(gè)估計(jì)。15 .小概率原理:當(dāng)某事件發(fā)生的概率小于或等于0.05時(shí),統(tǒng)計(jì)學(xué)通常稱該事件為小概率事件,其涵義為該事件發(fā)生的可能性很小,進(jìn)而認(rèn)為其在一次抽樣中不可能發(fā)生,此即為小概率原理。16 .同質(zhì)(homogeneity):性質(zhì)相同的事物稱為同質(zhì)的。17 .變異(variation):同質(zhì)的事物內(nèi)個(gè)體之間或同一個(gè)體重復(fù)測(cè)量間的差別稱為變異
5、。18 .參考值范圍(referenceinterval)又稱正常值范圍(normalrange)。由于正常人的形態(tài)、功能、生化等各種指標(biāo)的數(shù)據(jù)因人而異,而且同一個(gè)人的某些指標(biāo)還會(huì)隨著時(shí)間、機(jī)體內(nèi)外環(huán)境的改變而變化,因此需要確定其波動(dòng)范圍,即正常值范圍,簡(jiǎn)稱正常值(normalvalue)。19 .正常值范圍(normalranges),是指絕大多數(shù)正常人的某指標(biāo)范圍。20 .抽樣誤差(samplingerror):由于抽樣造成的樣本統(tǒng)計(jì)量和總體參數(shù)之間的差異。21 .標(biāo)準(zhǔn)誤(standarderror):樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。樣本均數(shù)的標(biāo)準(zhǔn)差稱為均數(shù)的標(biāo)準(zhǔn)誤。22 .參數(shù)估計(jì):由樣本
6、信息估計(jì)總體參數(shù)稱為參數(shù)估計(jì),包括點(diǎn)估計(jì)和區(qū)間估計(jì)。23 .點(diǎn)估計(jì)(pointestimation):直接用樣本統(tǒng)計(jì)量作為總體參數(shù)的估計(jì)值。這種估計(jì)方法簡(jiǎn)單,但未考慮抽樣誤差的大小。24 .區(qū)間估計(jì)(intervalestimation):按一定的概率或可信度(1-)用一個(gè)區(qū)間估計(jì)總體參數(shù)所在范圍,這個(gè)范圍稱作可信度為1-的可信區(qū)間(confidenceinterval,CI),又稱置信區(qū)間。這種估計(jì)方法稱為區(qū)間估計(jì)。25 .可信度為1-的可信區(qū)間的確切涵義是:每100個(gè)樣本所算得的100(1-)%可信區(qū)間,平均有100(1-)個(gè)包含了總體參數(shù)。如取=0.05,則每100個(gè)樣本所算得的100個(gè)
7、95%可信區(qū)間,平均有95個(gè)包含總體參數(shù)在內(nèi),有5個(gè)不包含總體參數(shù)。26 .可信區(qū)間的兩個(gè)要素:第一個(gè)要素是可靠性,常用可信度1-的大小表示;第二個(gè)要素是精確性,常用可信區(qū)間的長(zhǎng)度CU-CL衡量。27 .均數(shù)95%可信區(qū)間,其涵義是:如果重復(fù)100次抽樣,每次樣本含量均為n,每個(gè)樣本均按(見(jiàn)課本P42)構(gòu)建可信區(qū)間,則在此100個(gè)可信區(qū)間內(nèi),理論上有95個(gè)包含總體土§數(shù),而有5個(gè)不包含總體均數(shù)。28 .可信度為95%的CI的涵義:每100個(gè)樣本,按同本方法計(jì)算95%的CI,平均有95%的CI包含了總體參數(shù)。這里的95%,指的是方法本身!而不是某個(gè)區(qū)間!29 .第一類錯(cuò)誤(I型錯(cuò)誤):
8、拒絕了實(shí)際上成立的H0假設(shè),稱為假陽(yáng)性”,用a來(lái)表示。30 .第二類錯(cuò)誤(II型錯(cuò)誤):不拒絕實(shí)際上不成立的H0,稱為假陰性”,用0來(lái)表示。31 .檢驗(yàn)效能(powerofatest)或檢驗(yàn)功效:1稱檢驗(yàn)效能(powerofatest),過(guò)去稱把握度。為當(dāng)兩總體確有差異,按檢驗(yàn)水準(zhǔn)所能發(fā)現(xiàn)該差異的能力。1只取單尾。32 .完全隨機(jī)設(shè)計(jì):根據(jù)某一試驗(yàn)因素,將試驗(yàn)對(duì)象完全按隨機(jī)設(shè)計(jì)分為若干個(gè)組,每個(gè)組的樣本例數(shù)可以相等,也可以不等,分別求出各組試驗(yàn)結(jié)果的均數(shù),即為單因素多個(gè)樣本均數(shù),單個(gè)因素可以有多個(gè)水平,R>233 .隨機(jī)區(qū)組設(shè)計(jì)又稱配伍組設(shè)計(jì)(RandomBlockDesign):即兩因
9、素多個(gè)樣本均數(shù)的比較(或稱兩因素方差分析,twowayanalysisofvariance)o34 .絕對(duì)數(shù):在計(jì)數(shù)資料中,各組的觀察數(shù)稱絕對(duì)數(shù)。35 .相對(duì)數(shù):是兩個(gè)有聯(lián)系的指標(biāo)的比,計(jì)數(shù)資料的統(tǒng)計(jì)描述主要是相對(duì)數(shù)(relativenumber)。以保留1-2位整數(shù)為宜。36 .率(rate):說(shuō)明某現(xiàn)象發(fā)生的頻率或強(qiáng)度,常用、%。、1/萬(wàn)、1/10萬(wàn)等作單位,表示在一定范圍內(nèi),某現(xiàn)象的發(fā)生數(shù)與可能發(fā)生某現(xiàn)象的總數(shù)之比。率的結(jié)果常發(fā)生某現(xiàn)象的觀察單位數(shù)率_Xk二可能發(fā)生某現(xiàn)象的觀察單位總數(shù)37 .構(gòu)成比(constituentratio):說(shuō)明一事物內(nèi)部各組成部分所占的比例,常以來(lái)表示。構(gòu)成
10、比=X100%基一組成部分的姍琮單位數(shù)同-由物各部分的觀察單位靜教38 .比:也稱相對(duì)比(relativeratio),兩個(gè)有關(guān)指標(biāo)之比。通常以某種現(xiàn)象的數(shù)量為1或100作基數(shù)看另一種現(xiàn)象的數(shù)量是多少,說(shuō)明一事物是另一事物的若干倍或百分之幾。兩個(gè)相比的指標(biāo)可以性質(zhì)相同,如時(shí)間比、性別比;也可性質(zhì)不同。比=A/B39 .秩次是指全部觀察值按某種順序排列的位序;秩和:是同組秩次之和。40 .秩變換:將等級(jí)變成秩次的方法稱為秩變換。41 .秩和檢驗(yàn):就是通過(guò)秩次的排列求出秩和,從而對(duì)總體的分布進(jìn)行假設(shè)檢驗(yàn)的方法。42 .確定性關(guān)系:是指兩變量間的關(guān)系是函數(shù)關(guān)系。非確定性關(guān)系:是指兩變量在宏觀上存在關(guān)
11、系,但并未精確到可以用函數(shù)關(guān)系來(lái)表達(dá)。相關(guān)關(guān)系:指既是必然的又是不確定的關(guān)系稱為相關(guān)關(guān)系。當(dāng)兩個(gè)變量之間出現(xiàn)如下關(guān)系,一個(gè)增大,另一個(gè)也同時(shí)增大,或縮小,我們稱這種現(xiàn)象為共變,也就是說(shuō)兩個(gè)變量之間有相關(guān)關(guān)系。相關(guān)關(guān)系不一定是因果關(guān)系。相關(guān)關(guān)系可以是因果關(guān)系,也可以是伴隨關(guān)系。43 .直線相關(guān)系數(shù):簡(jiǎn)稱為相關(guān)系數(shù)用符號(hào)r表示,是用于說(shuō)明具有直線關(guān)系兩個(gè)變量之間,相關(guān)關(guān)系的密切程度和相關(guān)方向的指標(biāo)。44 .等級(jí)相關(guān)的含義:等級(jí)相關(guān)反映的是兩變量等級(jí)間的相關(guān),并不反映兩變量間的數(shù)值關(guān)系。45 .直線相關(guān):這種直線關(guān)系,或分析這種直線關(guān)系的理論和方法,統(tǒng)稱為直線相關(guān)。46 .直線回歸:直線回歸是用于研
12、究?jī)蓚€(gè)變量x與y之間的線性依存關(guān)系的一種統(tǒng)計(jì)分析方法。47 .試驗(yàn)研究設(shè)計(jì):是指研究者根據(jù)研究目的、通過(guò)對(duì)受試對(duì)象施加干預(yù),嚴(yán)格控制各種影響因素,獲得干預(yù)研究結(jié)果。48 .雙盲臨床試驗(yàn):是指觀察者方和被觀察者方在整個(gè)試驗(yàn)過(guò)程中不知道受試者接受的是何種處理;單盲臨床試驗(yàn)是指僅被觀察者方處于盲態(tài)。觀察者方指的是研究者、參與試驗(yàn)效應(yīng)評(píng)價(jià)的研究人員、數(shù)據(jù)管理人員、統(tǒng)計(jì)分析人員;被觀察者方指的是受試對(duì)象及其親屬或監(jiān)護(hù)人。雙盲雙模擬:試驗(yàn)組:試驗(yàn)藥+陽(yáng)性對(duì)照藥的安慰劑;對(duì)照組:陽(yáng)性對(duì)照藥+試驗(yàn)藥的安慰劑。醫(yī)學(xué)統(tǒng)計(jì)學(xué)相關(guān)知識(shí)1.頻數(shù)分布表的用途:(1)看出頻數(shù)分布的兩個(gè)重要特征:集中趨勢(shì)、離散趨勢(shì)(2)揭示
13、資料的分布類型2. 描述定量資料集中趨勢(shì)的三個(gè)指標(biāo)及其應(yīng)用條件:(1)均數(shù)(也稱算術(shù)均數(shù)):適用于單峰對(duì)稱分布的資料;(2)幾何均數(shù):適用于等比資料、對(duì)數(shù)正態(tài)分布資料;(3)中位數(shù):適用于偏態(tài)分布資料、分布不規(guī)則或未知分布資料、一端或兩端有不確定數(shù)據(jù)(開(kāi)口資料)的資料。3. 描述定量資料離散程度的指標(biāo)(極差、四分位數(shù)間距、標(biāo)準(zhǔn)差、變異系數(shù))及其適用范圍:這四個(gè)指標(biāo)均反映定量資料的離散程度。極差和四分位數(shù)間距可用于任何分布(極差常用于描述單峰對(duì)稱分布小樣本分布資料的變異程度,或用于初步了解資料的變異程度;四分位數(shù)間距常用于描述偏態(tài)分布資料、兩端無(wú)確切值或分布不明確資料的離散程度),后者比前者穩(wěn)定
14、,但均不能綜合反映各觀察值的變異程度;標(biāo)準(zhǔn)差最常用,要求資料近似服從正態(tài)分布;變異系數(shù)可用于比較度量單位不同的兩組或多組資料的變異度或均數(shù)相差懸殊的兩組或多組資料的變異度。4. 正態(tài)分布的特征:(1)正態(tài)分布是一單峰分布,高峰位置在均數(shù)處;(2)正態(tài)分布以均數(shù)為中心,左右完全對(duì)稱;(3)正態(tài)分布取決于兩個(gè)參數(shù),即均數(shù)R和標(biāo)準(zhǔn)差aoR是位置參數(shù),R越大,則曲線沿橫軸向右移動(dòng);R越小,曲線沿橫軸向左移動(dòng)。b為形態(tài)參數(shù),表示數(shù)據(jù)的離散程度,若b小,則曲線形態(tài)“瘦高”;b大,則曲線形態(tài)“矮胖”。(4)有些指標(biāo)不服從正態(tài)分布,但通過(guò)適當(dāng)?shù)淖儞Q后服從正態(tài)分布;(5)正態(tài)分布曲線下的面積分布是有規(guī)律的。5.
15、 正態(tài)曲線下的面積規(guī)律?正態(tài)曲線下面積總和為1;正態(tài)曲線關(guān)于均數(shù)對(duì)稱;對(duì)稱的區(qū)域內(nèi)面積相等;?對(duì)任意正態(tài)曲線,按標(biāo)準(zhǔn)差為單位,對(duì)應(yīng)的面積相等;-1.64+1.64內(nèi)面積為90%;?-1.96+1.96內(nèi)面積為95%;-2.58+2.58內(nèi)面積為99%。?小于-3的面積為0.13%;小于-2的面積為2.28%;小于-的面積為15.87%。6. 標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的關(guān)系區(qū)別標(biāo)準(zhǔn)差s標(biāo)準(zhǔn)誤sx意義個(gè)體變異統(tǒng)計(jì)量的抽樣誤差用途正常值范圍(x土1.96s)總體均數(shù)的可信區(qū)間(x土t,sx)與n關(guān)系ns趨于穩(wěn)定nsx趨于0聯(lián)系1兩者都是變異指標(biāo),說(shuō)明個(gè)體之間的變異用標(biāo)準(zhǔn)差,說(shuō)明統(tǒng)計(jì)量之間的變異用標(biāo)準(zhǔn)誤。2.當(dāng)
16、樣本含量不變時(shí),標(biāo)準(zhǔn)差大,標(biāo)準(zhǔn)誤亦大,均數(shù)的標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤成正比。7 .下列說(shuō)法正確嗎?算得某95%的可信區(qū)間,則:總體參數(shù)有95%的可能落在該區(qū)間。(錯(cuò))有95%的總體參數(shù)在該區(qū)間內(nèi)。(錯(cuò))該區(qū)間包含95%的總體參數(shù)。(錯(cuò))該區(qū)間有95%的可能包含總體參數(shù)。(錯(cuò))該區(qū)間包含總體參數(shù),可信度為95%o(對(duì))(3)樣本含量:樣本含量越大,區(qū)間越窄8 .影響可信區(qū)間大小的因素:(1)可信度:可信度越大,區(qū)間越寬;(2)個(gè)體變異:變異越大,區(qū)間越寬;9,均數(shù)的可信區(qū)間和參考值范圍的區(qū)別區(qū)別可信區(qū)間參考值范圍意義未知參數(shù)的可能范圍正常值的波動(dòng)范圍公式已知或未知,但n足夠大(x±u/2,sx)
17、或(x±u/2,x)(x±u/2,sx)未知(x±t,sx)用途估計(jì)總體均數(shù)判斷正異常小結(jié):均數(shù)的可信區(qū)間:均數(shù)界值X標(biāo)準(zhǔn)誤個(gè)體的容許區(qū)間(參考值范圍):均數(shù)界值X標(biāo)準(zhǔn)差10 .可信區(qū)間與容許區(qū)間的區(qū)別:見(jiàn)P4411 .假設(shè)檢驗(yàn)的基本思想:?提出一個(gè)假設(shè)(H0);驗(yàn)證這個(gè)假設(shè)。如果假設(shè)成立,會(huì)得到現(xiàn)在的結(jié)果嗎??jī)煞N可能的情況:(1)得到現(xiàn)在的結(jié)果可能性很?。ㄐ「怕剩?拒絕H0(2)有可能得到現(xiàn)在的結(jié)果(不是小概率)-沒(méi)有理由拒絕H0假設(shè)檢驗(yàn)的步驟:(1)建立檢驗(yàn)假設(shè);(2)確定檢驗(yàn)水準(zhǔn)a;(3)計(jì)算檢驗(yàn)統(tǒng)計(jì)量并求P值;(5)界定P值并作結(jié)論。12 .I型錯(cuò)誤和II
18、型錯(cuò)誤實(shí)際情況假設(shè)檢驗(yàn)的結(jié)果拒絕H0不拒絕H0H0成立I型錯(cuò)誤()H0不成立把握度(1-)II型錯(cuò)誤()13 .差異檢驗(yàn)和優(yōu)度檢驗(yàn):差異檢驗(yàn)之意義在于是否能夠確認(rèn)H1成立,故希望所得P值很小,因?yàn)镻值越小,表示手頭樣本從H0總體隨機(jī)獲得之概率越小,即否定H0而確認(rèn)H1成立的把握越大。優(yōu)度檢驗(yàn)之意義在于是否能夠確認(rèn)H0成立,故希望所得P值較大,因?yàn)镻值越大,表示手頭樣本從H0總體隨機(jī)獲得之概率越大。14 .可信區(qū)間與假設(shè)檢驗(yàn)區(qū)別和聯(lián)系:可信區(qū)間說(shuō)明量的大小即推斷總體均數(shù)范圍,假設(shè)檢驗(yàn)推斷質(zhì)的不同即判斷兩總體均數(shù)是否不等;可信區(qū)間可回答假設(shè)檢驗(yàn)問(wèn)題,可信區(qū)間若包含了H0,按水準(zhǔn),不拒絕H0;若不包
19、含H0,按水準(zhǔn),拒絕H0,接受H1;可信區(qū)間不但能回答差別有無(wú)統(tǒng)計(jì)學(xué)意義,還能提示差別有無(wú)實(shí)際專業(yè)意義;可信區(qū)間不能夠完全代替假設(shè)檢驗(yàn)??尚艆^(qū)間只能在預(yù)先規(guī)定概率的前提下進(jìn)行計(jì)算,假設(shè)檢驗(yàn)?zāi)塬@得一較為確切的P值。15,下列說(shuō)法正確嗎?P是H0成立的概率。(錯(cuò))P是I型誤差的概率。(錯(cuò))P是H0成立時(shí),獲得現(xiàn)有差別的概率。(錯(cuò))P是H0成立時(shí),獲得現(xiàn)有差別以及更大的差別的概率。(對(duì))統(tǒng)計(jì)推斷時(shí)的風(fēng)險(xiǎn)。(錯(cuò))拒絕H0時(shí)所冒的風(fēng)險(xiǎn)。(對(duì))(2)正態(tài)性:兩組均數(shù)比較時(shí),要求兩組數(shù)據(jù)服從正態(tài)分布;配16.t檢驗(yàn)的應(yīng)用條件:(1)獨(dú)立性:各觀察個(gè)體間是相互獨(dú)立的,不能互相影響,亦不能一方影響另一方;對(duì)設(shè)計(jì)
20、時(shí),要求差值服從正態(tài)分布。(3)方差齊性:兩樣本所對(duì)應(yīng)的正態(tài)總體之方差相等。17.總體方差不相等的t檢驗(yàn):(1激據(jù)變換后進(jìn)行t檢驗(yàn);(2)秩轉(zhuǎn)換的非參數(shù)檢驗(yàn);(3)近似t檢驗(yàn)t'檢驗(yàn)。18 .兩樣本均數(shù)比較方法的選擇方差齊方差不齊小樣本t檢驗(yàn)t檢驗(yàn)大樣本u檢驗(yàn)u檢驗(yàn)19 .方差分析的基本思想:方差分析(analysisofvariance)又稱為變異數(shù)分析,采用F檢驗(yàn)統(tǒng)計(jì)量,也稱F檢驗(yàn)。這種方法的基本思想是對(duì)變異進(jìn)行分解和分析,把全部觀察值之間的變異一總變異,按照設(shè)計(jì)和需要分為兩個(gè)或多個(gè)組成部分,再作分析,從而達(dá)到統(tǒng)計(jì)推斷之目的??傋儺?組內(nèi)變異+組間變異;組內(nèi)變異:抽樣(隨機(jī))誤差(
21、個(gè)體差異和測(cè)量誤差);組間變異:組間本質(zhì)差別+抽樣(隨機(jī))誤差;如果組間無(wú)本質(zhì)差別,則組間變異=組內(nèi)變異或F=MSBetween1MSWithin|20 .方差分析的優(yōu)點(diǎn):(1)不受比較組數(shù)的限制;(2)可同時(shí)分析多個(gè)因素的作用;(3)可分析因素間的交互作用。21 .方差分析的意義:是按照實(shí)驗(yàn)設(shè)計(jì)把總變異分成若干部分,劃分得越細(xì),各部分的涵義越明確,對(duì)結(jié)論亦較易解釋;同時(shí),殘余的變異即誤差部分越小,因而能夠提高檢驗(yàn)的靈敏度和結(jié)論的準(zhǔn)確性。22 .F分布是方差比的分布,常用于方差齊性檢驗(yàn),方差分析等。F分布特征:(1)F分布為一簇單峰正偏態(tài)分布曲線,與兩個(gè)自由度有關(guān)。(2)若F服從自由度為(1,
22、2)的F分布,則其倒數(shù)1/F服從自由度為(2,1)的F分布。(3)自由度為(1,2)的F分布,其均數(shù)為2/(2-2),與第一自由度無(wú)關(guān)。(4)第一自由度1=1時(shí),F(xiàn)分布實(shí)際上是t分布之平方;第二自由度2=8時(shí),F(xiàn)分布實(shí)際上等于2分布。(5)每一對(duì)自由度下的F分布曲線下的面積分布規(guī)律,見(jiàn)方差分析用F界值表,表中橫標(biāo)目為第一自由度,縱標(biāo)目為第二自由度,表中分別給出了右側(cè)尾部概率為0.05和0.01時(shí)的F界值23.方差分析表,異來(lái)源SSvMSFP卜間SS組間k-1SS組間/v組間MS組間/MS組內(nèi)|且內(nèi)SS組內(nèi)N-kSS組內(nèi)/v組內(nèi)總SS總N-124方差分析與t檢驗(yàn)的關(guān)系當(dāng)比較兩個(gè)均數(shù)時(shí),從同一資料
23、算得之F值與t值有如下關(guān)系:F=t2可見(jiàn)在兩組均數(shù)比較時(shí),方差分析與t檢驗(yàn)的效果是完全一樣的。25 .方差分析后的兩兩比較(多重比較)的幾種方法:一、SNKq檢驗(yàn)(多個(gè)均數(shù)間全面比較)二、LSDt檢驗(yàn)(有專業(yè)意義的均數(shù)間比較)三、Dunnett檢驗(yàn)(多個(gè)實(shí)驗(yàn)組與對(duì)照組比較)還有TUKEY、DUNCAN、SCHEFFE、WALLER、BON等比較方法各組間的比較用SNK法;各試驗(yàn)組與某一對(duì)1組間的比較用Dunnet法。26 .方差分析應(yīng)用條件:各樣本是相互獨(dú)立的隨機(jī)樣本:各樣本來(lái)自正態(tài)總體:各組總體方差相等,即方差齊。方差分析和t檢驗(yàn)要求:獨(dú)立性、正態(tài)性、方差齊性。27 .總結(jié):均數(shù)、方差的比較
24、:樣本均數(shù)與總體均數(shù)的比較(t檢驗(yàn))配對(duì)設(shè)計(jì)樣本均數(shù)的比較(配又tt檢9)兩樣本均數(shù)的比較(t檢驗(yàn),u檢驗(yàn),F(xiàn)檢驗(yàn),SNK,Duncan)多樣本均數(shù)的比較(F檢驗(yàn),ANOVA)?各組間白比較(SNK法);各試驗(yàn)組與某一對(duì)照組間的比較用(Duncan法)兩個(gè)方差的比較(F檢驗(yàn))多個(gè)方差的比較(Bartlett檢驗(yàn)28 .二項(xiàng)分布應(yīng)用條件:醫(yī)學(xué)領(lǐng)域有許多二分類記數(shù)資料都符合二項(xiàng)分布(傳染病和遺傳病除外),但應(yīng)用時(shí)仍應(yīng)注意考察是否滿足以下應(yīng)用條件:(1)每次實(shí)驗(yàn)只有兩類對(duì)立的結(jié)果;如陽(yáng)性或陰性、生存或死亡,不允許考慮可疑”等模糊結(jié)果,屬于二項(xiàng)分類的資料。(2)n次事件相互獨(dú)立;即每個(gè)觀察單位的觀察結(jié)
25、果不會(huì)影響到其它觀察單位的結(jié)果。如要求疾病無(wú)傳染性、無(wú)家族聚集性等。(3)每次實(shí)驗(yàn)?zāi)愁惤Y(jié)果的發(fā)生的概率是一個(gè)常數(shù)。已知發(fā)生某一結(jié)果(如陽(yáng)性)的概率為TT,其對(duì)應(yīng)的概率必然是(1-兀),我們知道總體率TT一般是未知的,在實(shí)際工作中要求%是從大量觀察中獲得的比較穩(wěn)定的數(shù)值。29. 二項(xiàng)分布的應(yīng)用:(1)樣本率與總體率的比較;(2)兩樣本率的比較。30. Poisson分布特征:非對(duì)稱,但R增大時(shí)趨于對(duì)稱;均數(shù)與方差均為c分布的可加性,n個(gè)獨(dú)立的Poisson分布相加仍符合Poisson分布,可使科>20,使得可用正態(tài)近似。31. Poisson分布應(yīng)用條件:(1)平穩(wěn)性:X的取值與觀察單位的
26、位置無(wú)關(guān);(2)獨(dú)立增量性:在某個(gè)觀察單位X的取值與前面各觀察單位上X的取值獨(dú)立.;(3)普通性:在充分小的觀察單位上X的取值最多為1。32. Possion分布的應(yīng)用:(1)總體均數(shù)估計(jì);(2)樣本均數(shù)與總體均數(shù)的比較;(3)兩樣本均數(shù)的比較。33. x2檢驗(yàn)的用途:(1)推斷多個(gè)總體率之間有無(wú)差別(2)推斷幾組總體構(gòu)成比之間有無(wú)差別(3)兩個(gè)變量之間有無(wú)關(guān)聯(lián)性(4)頻數(shù)分布的擬合優(yōu)度檢驗(yàn)。34. x2檢驗(yàn)的基本思想:x2=如果H0假設(shè)成立,那么實(shí)際頻數(shù)與理論頻數(shù)應(yīng)該比較接近。如果實(shí)際頻數(shù)與理論頻數(shù)相差很大,超出了抽樣誤差所能解釋的范圍,則可認(rèn)為H0假設(shè)不成立,即兩樣本對(duì)應(yīng)的總體率不等。x2
27、值反映了實(shí)際頻數(shù)與理論頻數(shù)吻合的程度。如果兩總體率相同的假設(shè)成立,則實(shí)際頻數(shù)與理論頻數(shù)之差異純系抽樣誤差所致,故一般不會(huì)很大,x2值也就不會(huì)很大;在一次隨機(jī)試驗(yàn)中,出現(xiàn)大的x2值的I«率P是很小的。因此,若根據(jù)實(shí)際樣本資料求得一個(gè)很小的P,且PVa(檢驗(yàn)水準(zhǔn)),根據(jù)小概率原理,就有理由懷疑H0假設(shè)的真實(shí)性,因而拒絕它;若P>a,則沒(méi)有理由拒絕HCLx2值的大小除取決于1A-T的差值外,還與基本數(shù)據(jù)的格子數(shù)有關(guān),嚴(yán)格地說(shuō)是與自由度有關(guān)。在x2檢驗(yàn)中,自由度指在表中周邊合計(jì)不變的前提下,基本數(shù)據(jù)可以自由變動(dòng)的格子數(shù)。35. x2檢驗(yàn)的精髓:檢驗(yàn)實(shí)際頻數(shù)和理論頻數(shù)的吻合程度。如果實(shí)際
28、頻數(shù)和理論頻數(shù)越吻合,說(shuō)明H0假設(shè)成立的可能性就越大,反之,如果實(shí)際頻數(shù)和理論頻數(shù)相差越遠(yuǎn),說(shuō)明H0越不可能成立。36. 普通四個(gè)表資料卡方檢驗(yàn)公式的選用條件:1)n>40,且T上5時(shí),用未校正的值2I2(adbc)n(ab)(cd)(ac)(bd)2) 1VT<5,且n上40時(shí),宜用校正x2值2|AT|52|adbCn/2nTabcdacbd3) T<1或n<40時(shí),宜用確切概率計(jì)算法p(ab)!(cd)!(ac)!(vd)!a!b!c!d!n!37 .行x列表的x2值計(jì)算專用公式:22=nA1nrnc38 .行X列表資料采用2檢驗(yàn)時(shí),注意事項(xiàng):(1)注意理論數(shù)的大小
29、。行X列表資料采用x2檢驗(yàn)時(shí),對(duì)理論數(shù)的要求與四格表資料相同,不能有T<1,T<5的個(gè)數(shù)不能超過(guò)所有理論數(shù)個(gè)數(shù)的1/5(四格表中有一個(gè)T<5即超過(guò)1/5),如出現(xiàn)上述情況,可用以下辦法解決:1)增加觀察例數(shù)可使實(shí)際頻數(shù)增加,從而使T增大。2)合并相鄰行或列的實(shí)際數(shù),從而使T增大。合并時(shí)應(yīng)注意合理性,一般有序分類可合并,無(wú)序分類則不可合并。3)采用精確概率檢驗(yàn)法或似然比x2檢驗(yàn)法,(2)最小理論數(shù)求法。上述x2檢驗(yàn)時(shí),采用專用公式計(jì)算x2值無(wú)須理論數(shù),但也必須求出最小理論數(shù),觀察其大小是否滿足上述各項(xiàng)條件。最小理論數(shù)位于最小行列合計(jì)數(shù)相對(duì)應(yīng)的位置上,因此可用行、列合計(jì)數(shù)中小者相
30、乘除以總例數(shù)即得到最小理論數(shù)。(3)多組資料比較經(jīng)x2檢驗(yàn)拒絕H0時(shí)只能認(rèn)為多組間總的看差別有統(tǒng)計(jì)學(xué)意義,并不說(shuō)明兩兩之間差別均有統(tǒng)計(jì)學(xué)意義。若需分析兩兩之間構(gòu)成差別有無(wú)統(tǒng)計(jì)學(xué)意義,可采用x2分割法或改變檢驗(yàn)水準(zhǔn)法進(jìn)行分析等。39 .配對(duì)四格表資料的2檢驗(yàn)步驟:(H0、H1寫(xiě)法特殊)一.H0:兩法檢出陽(yáng)性率相同,總體B=C;H1:兩法檢出陽(yáng)性率不同,總體BC。=0.05。二.計(jì)算統(tǒng)計(jì)量:2。三.查2界值表,判斷P與a大小四.按=0.05水準(zhǔn),拒絕H0或接受H1o得出結(jié)論。40 .列聯(lián)表:將單一樣本的每個(gè)觀察單位,同時(shí)按兩種因素,進(jìn)行分組,分組以后就得到RXC表。然后對(duì)這個(gè)表進(jìn)行x2檢驗(yàn),以判斷
31、兩個(gè)因素的關(guān)聯(lián)性。而這種配對(duì)設(shè)計(jì)而形成的雙向交叉排列的統(tǒng)計(jì)表,用以描述行變量和列變量之間的關(guān)系,特稱為列聯(lián)表。關(guān)于列聯(lián)表內(nèi)兩個(gè)分類變量是否有關(guān)聯(lián)性的統(tǒng)計(jì)推斷,仍然是用x2檢驗(yàn),但是它的檢驗(yàn)假設(shè)有所不同。一.列聯(lián)表關(guān)聯(lián)性分析的2檢驗(yàn)步驟:(結(jié)合課件看)H0:不同矽肺期次的患者肺門密度分布相同;H1:不同矽肺期次的患者肺門密度分布不同或不全相同。=0.05。二.計(jì)算統(tǒng)計(jì)量:2,v。三.P=?四.按=0.05水準(zhǔn),拒絕H0,接受H1。認(rèn)為肺門密度與矽肺期次有關(guān)。結(jié)合本資料,肺門密度有隨矽肺期次增高而增加的趨勢(shì)。41 .RXC表資料中的行一般為研究因素的不同水平分組,列一般為研究結(jié)果(效應(yīng)指標(biāo))的分類
32、。根據(jù)行和列的分組或分類情況,可將RXC表資料分為以下幾種情況:1)雙向無(wú)序RXC表行和列的分組或分類均為無(wú)序。此時(shí)可采用x2檢驗(yàn)處理。2)單向有序RXC表若行的分組為有序(如藥物劑量、患者年齡、病情輕重等),但率的效應(yīng)為無(wú)序分類(如染色體損傷的類型、疾病的證型等),此時(shí)仍可按雙向無(wú)序處理,采用12檢驗(yàn);若行的分組為無(wú)序(如三種藥物處理),而列的效應(yīng)為有序(如痊愈、顯效、好轉(zhuǎn)、無(wú)效),此時(shí)應(yīng)采用秩和檢驗(yàn)或Ridit檢驗(yàn)方可判斷療效上的優(yōu)劣。因?yàn)閤2檢驗(yàn)不考慮有序分類變量的順序。如果固定有序分類變量的順序,將列的頻數(shù)互換后,檢驗(yàn)的結(jié)論相同,顯然不合理。3)雙向有序RXC表若行的分組為有序(如年齡
33、),效應(yīng)分類也為有序(如療效等級(jí)),可按單向有序RXC表中.列為有序分類時(shí)的處理方法.采用秩和檢驗(yàn)或Ridit檢驗(yàn)。若行和列均為同一觀察對(duì)象的兩個(gè)有序變量,如矽肺的期次和肺門密度的級(jí)別,病程與療效等,此時(shí)為配對(duì)設(shè)計(jì),可先采用x2檢驗(yàn)。42.資料的分類數(shù)值變量資料分類資料二分類多分類無(wú)序多分類有序多分類(等級(jí)資料)43.參數(shù)統(tǒng)計(jì)和非參數(shù)統(tǒng)計(jì)參數(shù)統(tǒng)計(jì)(parametricstatistics)J已知總體分布類型,對(duì)未知參數(shù)進(jìn)行統(tǒng)計(jì)推斷非參數(shù)統(tǒng)計(jì)(nonparametricstatistics)對(duì)總體的分布類型不作任何要求不受總體參數(shù)的影響,比較分布或分布位置依賴于特定分布類型,比較的是參色J適用范
34、圍廣;可用于任何類型資料(等級(jí)資料,或">50mg")44 .非參數(shù)檢驗(yàn)適用情況:總體分布形式未知或分布類型不明;偏態(tài)分布的資料:等級(jí)資料:不能精確測(cè)定,只能以嚴(yán)重程度、優(yōu)劣等級(jí)、次序先后等表示;不滿足參數(shù)檢驗(yàn)條件的資料:各組方差明顯不齊。數(shù)據(jù)的一端或兩端是不確定數(shù)值,如">50mg等。45 .秩和檢驗(yàn)的適用范圍:(1)等級(jí)資料;(2)定量資料,但數(shù)據(jù)的某一端或兩端無(wú)確定數(shù)值(開(kāi)口資料);(3)定量資料,但數(shù)值的分布是極度偏態(tài)的,如L形分布,或個(gè)別數(shù)值偏離過(guò)大而不屬于“過(guò)失誤差”者;(4)定量資料,但各組離散程度相差懸殊,即使經(jīng)變量變換,也難以達(dá)到方差
35、齊性;(5)定量資料,但分布型尚未確知,此時(shí)可先用秩和檢驗(yàn)法進(jìn)行分析;(6)兼有等級(jí)和定量性質(zhì)的資料。46 .秩和檢驗(yàn)的優(yōu)缺點(diǎn):優(yōu)點(diǎn):不論樣本所來(lái)自的總體分布的形式如何,甚至是未知的,都能適用。某些非參數(shù)方法計(jì)算簡(jiǎn)便。因此在急需獲得初步結(jié)果時(shí)可采用。易于理解和掌握??捎糜诓荒芑蛭醇泳_測(cè)量的資料,如等級(jí)資料或某些記數(shù)資料。缺點(diǎn):對(duì)適宜用參數(shù)方法的資料,若用非參數(shù)法處理,常損失部分信息,降低效率。雖然許多非參數(shù)法計(jì)算簡(jiǎn)單,但不少問(wèn)題的計(jì)算仍嫌繁冗。47 .樣本的相關(guān)系數(shù)r的特征:(1)-1VrV1,沒(méi)有單位;(2)r的絕對(duì)值大小表示相關(guān)關(guān)系的密切程度;(3)r的符號(hào)表示相關(guān)的方向:r>0為
36、正相關(guān);r<0為負(fù)相關(guān);r=0為零相關(guān)或無(wú)相關(guān)48 .回歸系數(shù)和回歸方程的意義及性質(zhì):bX(1) b的意義:回歸系數(shù)b稱為斜率,表示自變量增加一個(gè)單位時(shí),應(yīng)變量的平均改變量。(2) a的意義:a為截距或常數(shù)項(xiàng),a的值表示當(dāng)X=0時(shí),應(yīng)變量丫的估計(jì)值。從坐標(biāo)軸上看,a對(duì)應(yīng)回歸直線延伸至X=0時(shí)與丫軸的交點(diǎn),故稱為截距。(3)人丫(Y-hat)的意義:人丫表示給定X時(shí)丫的平均值的估計(jì)。人Y的涵義是均數(shù)一不同X時(shí)丫均數(shù)的估計(jì)值,與一般的均數(shù)的計(jì)算方法不同,這里的均數(shù)是給定X的條件下,由回歸方程估計(jì)得到的,故又稱為條件均數(shù)。(4) 丫-人丫的意義:丫-八丫稱為剩余,又稱殘差,是丫的觀察值與對(duì)應(yīng)的
37、估計(jì)值之差,在回歸圖中表示各散點(diǎn)到回歸直線的縱向距離。(5) (丫?丫朋意義:稱為殘差平方和(residualsumofsquares或剩余平方和,是所有剩余之平方和,綜合表示點(diǎn)距直線的距離。在所有的直線中,回歸直線的殘差平方和是最小的。(最小二乘)49 .回歸直線的有關(guān)性質(zhì):(1) 直線通過(guò)均點(diǎn)(X丫)(2) 直線上方各點(diǎn)到直線的縱向距離之和=直線下方各點(diǎn)到直線的縱向距離之和即:(YW)0(3)各點(diǎn)到該回歸線縱向距離平方和較到其它任何直線者為小。Y丫?2丫?abX250 .應(yīng)變量Y的總變異分解:22-2?總回剩決定系數(shù)r2SS上SS、v總=曠回+曠乘J,v回=1,曠剩二門刀。51 .直線回歸
38、中三種假設(shè)檢驗(yàn)間的關(guān)系:在直線回歸中,相關(guān)系數(shù)的假設(shè)檢驗(yàn),回歸系數(shù)的假設(shè)檢驗(yàn),以及回歸方程的方差分析結(jié)果等價(jià)。52 .5可信區(qū)間與丫的容許區(qū)間:Lh可信區(qū)間是針對(duì)條件均數(shù)的,而容許區(qū)間是針對(duì)Y的取值范圍的。圖容許區(qū)間估計(jì):給定X時(shí)丫的估計(jì)值是Y的均數(shù)的一個(gè)估計(jì)。給定X時(shí)丫值的容許區(qū)間是Y值的可能范圍。53 .回歸方程的應(yīng)用:(1)描述兩個(gè)變量間的依存關(guān)系。(2)利用回歸方程進(jìn)行預(yù)測(cè)。(3)利用回歸方程進(jìn)行估計(jì)。(4)利用回歸方程獲得更高精度的參考值。(5)利用回歸方程進(jìn)行控制。54 .應(yīng)用直線回歸的注意點(diǎn):(1) .回歸分析要有實(shí)際意義:?要有實(shí)際意義;充分利用散點(diǎn)圖,判斷:(1)線性趨勢(shì)(2)離群值?當(dāng)樣本含量較大時(shí),統(tǒng)計(jì)學(xué)檢驗(yàn)的作用減弱;回歸關(guān)系可以內(nèi)插,不宜外延;?自變量的選擇:原因容易測(cè)量的變異小的年齡、身高、體重、體表面積(2)在作回歸前應(yīng)先作散點(diǎn)圖(3)內(nèi)插和外延55 .回歸分析的正確應(yīng)用:.回歸系數(shù)是有單位的,不能根據(jù)b的大小判斷回歸關(guān)系的密切程度。.應(yīng)用條件(LINE):(1)線性(linear)(2)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 光纖熔接合同范本
- 醫(yī)用口腔耗材采購(gòu)合同范本
- 二手農(nóng)村土地買賣合同范本
- 某公安局業(yè)務(wù)技術(shù)用房建設(shè)工程項(xiàng)目可行性研究報(bào)告(可編輯)
- 買房補(bǔ)充合同范本
- 代理產(chǎn)品區(qū)域合同范本
- 供銷煤炭合同范本
- 2025年度保障性住房回遷房銷售合同
- 中外合作公司合同范本
- 烏魯木齊代理記賬合同范例
- 浮力及浮力的應(yīng)用
- 公司培訓(xùn)員工職務(wù)犯罪預(yù)防講座之職務(wù)侵占
- 化學(xué)選修4《化學(xué)反應(yīng)原理》(人教版)全部完整PP課件
- 《煤礦安全規(guī)程》專家解讀(詳細(xì)版)
- 建筑公司工程財(cái)務(wù)報(bào)銷制度(精選7篇)
- 工程設(shè)計(jì)方案定案表
- 最新2022年減肥食品市場(chǎng)現(xiàn)狀與發(fā)展趨勢(shì)預(yù)測(cè)
- 第一章-天氣圖基本分析方法課件
- 暖氣管道安裝施工計(jì)劃
- 體育實(shí)習(xí)周記20篇
- 初二物理彈力知識(shí)要點(diǎn)及練習(xí)
評(píng)論
0/150
提交評(píng)論