醫(yī)學(xué)統(tǒng)計(jì)學(xué)名詞解釋2_第1頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)名詞解釋2_第2頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)名詞解釋2_第3頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)名詞解釋2_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 醫(yī)學(xué)統(tǒng)計(jì)學(xué)名詞解釋1.總體:總體(population)是根據(jù)研究目的確定的同質(zhì)的觀察單位的全體,更確切的說,是同質(zhì)的所有觀察單位某種觀察值(變量值)的集合??傮w可分為有限總體和無限總體??傮w中的所有單位都能夠標(biāo)識(shí)者為有限總體,反之為無限總體。樣本:從總體中隨機(jī)抽取部分觀察單位,其測量結(jié)果的集合稱為樣本(sample)。樣本應(yīng)具有代表性。所謂有代表性的樣本,是指用隨機(jī)抽樣方法獲得的樣本。2.隨機(jī)抽樣:隨機(jī)抽樣(random sampling)是指按照隨機(jī)化的原則(總體中每一個(gè)觀察單位都有同等的機(jī)會(huì)被選入到樣本中),從總體中抽取部分觀察單位的過程。隨機(jī)抽樣是樣本具有代表性的保證。3.變異:在自

2、然狀態(tài)下,個(gè)體間測量結(jié)果的差異稱為變異(variation)。變異是生物醫(yī)學(xué)研究領(lǐng)域普遍存在的現(xiàn)象。嚴(yán)格的說,在自然狀態(tài)下,任何兩個(gè)患者或研究群體間都存在差異,其表現(xiàn)為各種生理測量值的參差不齊。4.計(jì)量資料:對(duì)每個(gè)觀察單位用定量的方法測定某項(xiàng)指標(biāo)量的大小,所得的資料稱為計(jì)量資料(measurement data)。計(jì)量資料亦稱定量資料、測量資料。.其變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。如某一患者的身高(cm)、體重(kg)、紅細(xì)胞計(jì)數(shù)(1012/L)、脈搏(次/分)、血壓(KPa)等計(jì)數(shù)資料:將觀察單位按某種屬性或類別分組,所得的觀察單位數(shù)稱為計(jì)數(shù)資料(count data)。計(jì)

3、數(shù)資料亦稱定性資料或分類資料。其觀察值是定性的,表現(xiàn)為互不相容的類別或?qū)傩浴H缯{(diào)查某地某時(shí)的男、女性人口數(shù);治療一批患者,其治療效果為有效、無效的人數(shù);調(diào)查一批少數(shù)民族居民的A、B、AB、O 四種血型的人數(shù)等。等級(jí)資料:將觀察單位按測量結(jié)果的某種屬性的不同程度分組,所得各組的觀察單位數(shù),稱為等級(jí)資料(ordinal data)。等級(jí)資料又稱有序變量。如患者的治療結(jié)果可分為治愈、好轉(zhuǎn)、有效、無效或死亡,各種結(jié)果既是分類結(jié)果,又有順序和等級(jí)差別,但這種差別卻不能準(zhǔn)確測量;一批腎病患者尿蛋白含量的測定結(jié)果分為 +、+、+等。等級(jí)資料與計(jì)數(shù)資料不同:屬性分組有程度差別,各組按大小順序排列。等級(jí)資料與計(jì)

4、量資料不同:每個(gè)觀察單位未確切定量,故亦稱為半計(jì)量資料。5概率:概率(probability)又稱幾率,是度量某一隨機(jī)事件A發(fā)生可能性大小的一個(gè)數(shù)值,記為P(A),P(A)越大,說明A事件發(fā)生的可能性越大。0P(A)1。頻率:在相同的條件下,獨(dú)立重復(fù)做n 次試驗(yàn),事件A 出現(xiàn)了m 次,則比值m/n 稱為隨機(jī)事件A 在n 次試驗(yàn)中出現(xiàn)的頻率(freqency)。當(dāng)試驗(yàn)重復(fù)很多次時(shí)P(A)= m/n。6. 隨機(jī)誤差:隨機(jī)誤差(random error)又稱偶然誤差,是指排除了系統(tǒng)誤差后尚存的差。它受多種因素的影響,使觀察值不按方向性和系統(tǒng)性而隨機(jī)的變化。誤差變量一般服從正態(tài)分布。隨機(jī)誤差可以通過統(tǒng)

5、計(jì)處理來估計(jì)。抽樣誤差(sampling error )是指樣本統(tǒng)計(jì)量與總體參數(shù)的差別。在總體確定的情況下,總體參數(shù)是固定的常數(shù),統(tǒng)計(jì)量是在總體參數(shù)附近波動(dòng)的隨機(jī)變量。7系統(tǒng)誤差:系統(tǒng)誤差(systematic error)是指由于儀器未校正、測量者感官的某種偏差、醫(yī)生掌握療效標(biāo)準(zhǔn)偏高或偏低等原因,使觀察值不是分散在真值的兩側(cè),而是有方向性、系統(tǒng)性或周期性地偏離真值。系統(tǒng)誤差可以通過實(shí)驗(yàn)設(shè)計(jì)和完善技術(shù)措施來消除或使之減少。8隨機(jī)變量:隨機(jī)變量(random variable)是指取指不能事先確定的觀察結(jié)果。隨機(jī)量的具體內(nèi)容雖然是各式各樣的,但共同的特點(diǎn)是不能用一個(gè)常數(shù)來表示,而且,理論上講,每

6、個(gè)變量的取值服從特定的概率分布。9參數(shù):參數(shù)(paramater)是指總體的統(tǒng)計(jì)指標(biāo),如總體均數(shù)、總體率等??傮w參數(shù)是固定的常數(shù)。多數(shù)情況下,總體參數(shù)是不易知道的,但可通過隨機(jī)抽樣抽取有代表性的樣本,用算得的樣本統(tǒng)計(jì)量估計(jì)未知的總體參數(shù)。10統(tǒng)計(jì)量:統(tǒng)計(jì)量(statistic)是指樣本的統(tǒng)計(jì)指標(biāo),如樣本均數(shù)、樣本率等。樣本統(tǒng)計(jì)量可用來估計(jì)總體參數(shù)。總體參數(shù)是固定的常數(shù),統(tǒng)計(jì)量是在總體參數(shù)附近波動(dòng)的隨機(jī)變量。11.頻數(shù)表(frequency table)用來表示一批數(shù)據(jù)各觀察值或在不同取值區(qū)間的出現(xiàn)的頻繁程度(頻數(shù))。對(duì)于離散數(shù)據(jù),每一個(gè)觀察值即對(duì)應(yīng)一個(gè)頻數(shù),如某醫(yī)院某年度一日內(nèi)死亡0,1,2個(gè)

7、病人的天數(shù)。對(duì)于散布區(qū)間很大的離散數(shù)據(jù)和連續(xù)型數(shù)據(jù),數(shù)據(jù)散布區(qū)間由若干組段組成,每個(gè)組段對(duì)應(yīng)一個(gè)頻數(shù)。12.算術(shù)均數(shù)(arithmetic mean)描述一組數(shù)據(jù)在數(shù)量上的平均水平。總體均數(shù)用表示,樣本均數(shù)用X 表示。13.幾何均數(shù)(geometric mean)用以描述對(duì)數(shù)正態(tài)分布或數(shù)據(jù)呈倍數(shù)變化資料的水平。記為G。14.中位數(shù)(median)Md將一組觀察值由小到大排列,n 為奇數(shù)時(shí)取位次居中的變量值;為偶數(shù)時(shí),取位次居中的兩個(gè)變量的平均值。反映一批觀察值在位次上的平均水平。15.極差(range)亦稱全距,即最大值與最小值之差,用于資料的粗略分析,其計(jì)算簡便但穩(wěn)定性較差。16.百分位數(shù)(

8、percentile)是將n 個(gè)觀察值從小到大依次排列,再把它們的位次依次轉(zhuǎn)化為百分位。百分位數(shù)的另一個(gè)重要用途是確定醫(yī)學(xué)參考值范圍。17.四分位數(shù)間距(inter-quartile range)是由第3 四分位數(shù)和第1 四分位數(shù)相減計(jì)算而得,常與中位數(shù)一起使用,描述偏態(tài)分布資料的分布特征,較極差穩(wěn)定。18.方差(variance):方差表示一組數(shù)據(jù)的平均離散情況,由離均差的平方和除以樣本個(gè)數(shù)得到。19.標(biāo)準(zhǔn)差(standard deviation)是方差的正平方根,使用的量綱與原量綱相同,適用于近似正態(tài)分布的資料,大樣本、小樣本均可,最為常用。20.變異系數(shù)(coefficient of v

9、ariation)用于觀察指標(biāo)單位不同或均數(shù)相差較大時(shí)兩組資料變異程度的比較。用CV 表示。計(jì)算:標(biāo)準(zhǔn)差/均數(shù)*100% 21.統(tǒng)計(jì)推斷:通過樣本指標(biāo)來說明總體特征,這種從樣本獲取有關(guān)總體信息的過程稱為統(tǒng)計(jì)推斷(statistical inference)。22.抽樣誤差:由個(gè)體變異產(chǎn)生的,抽樣造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差異,稱為抽樣誤差(sampling error)。23.標(biāo)準(zhǔn)誤及X s :通常將樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。許多樣本均數(shù)的標(biāo)準(zhǔn)差X s稱為均數(shù)的標(biāo)準(zhǔn)誤(standard error of mean,SEM ),它反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均數(shù)的差異

10、,說明均數(shù)抽樣誤差的大小。24.可信區(qū)間:按預(yù)先給定的概率確定的包含未知總體參數(shù)的可能范圍。該范圍稱為總體參數(shù)的可信區(qū)間(confidence interval,CI)。它的確切含義是:可信區(qū)間包含總體參數(shù)的可能性是1- ,而不是總體參數(shù)落在該范圍的可能性為1- 。25.參數(shù)估計(jì):指用樣本指標(biāo)值(統(tǒng)計(jì)量)估計(jì)總體指標(biāo)值(參數(shù))。參數(shù)估計(jì)有兩種方法:點(diǎn)估計(jì)和區(qū)間估計(jì)。26.假設(shè)檢驗(yàn)中P 的含義:指從H0 規(guī)定的總體隨機(jī)抽得等于及大于(或等于及小于)現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計(jì)量值的概率。27.I 型和II 型錯(cuò)誤:I 型錯(cuò)誤(type I error ),指拒絕了實(shí)際上成立的H0,這類“棄真”的錯(cuò)誤稱

11、為I 型錯(cuò)誤,其概率大小用表示;II 型錯(cuò)誤(type II error),指接受了實(shí)際上不成立的H0,這類“存?zhèn)巍钡恼`稱為II 型錯(cuò)誤,其概率大小用表示。28.檢驗(yàn)效能:1- 稱為檢驗(yàn)效能(power of test),它是指當(dāng)兩總體確有差別,按規(guī)定的檢驗(yàn)水準(zhǔn)a 所能發(fā)現(xiàn)該差異的能力。29.檢驗(yàn)水準(zhǔn):是預(yù)先規(guī)定的,當(dāng)假設(shè)檢驗(yàn)結(jié)果拒絕H0,接受H1,下“有差別”的結(jié)論時(shí)犯錯(cuò)誤的概率稱為檢驗(yàn)水準(zhǔn)(level of a test),記為 。 30.率(rate)又稱頻率指標(biāo),說明一定時(shí)期內(nèi)某現(xiàn)象發(fā)生的頻率或強(qiáng)度。計(jì)算公式為:發(fā)生某現(xiàn)象的觀察單位數(shù)/可能發(fā)生某現(xiàn)象的觀察單位總數(shù)*100%,表示方式有

12、:百分率(%)、千分率()等。31.構(gòu)成比(proportion)又稱構(gòu)成指標(biāo),說明某一事物內(nèi)部各組成部分所占的比重或分布。計(jì)算公式為:某一組成部分的觀察單位數(shù)/同一事物各組成部分的觀察單位總數(shù)*100%,表示方式有:百分?jǐn)?shù)等。32.比(ratio)又稱相對(duì)比,是A、B 兩個(gè)有關(guān)指標(biāo)之比,說明A 是B 的若干倍或百分之幾。計(jì)算公式為:A/B ,表示方式有:倍數(shù)或分?jǐn)?shù)等。 33.非參數(shù)統(tǒng)計(jì):針對(duì)某些資料的總體分布難以用某種函數(shù)式來表達(dá),或者資料的總體分布的函數(shù)式是未知的,只知道總體分布是連續(xù)型的或離散型的,用于解決這類問題的一種不依賴總體分布的具體形式的統(tǒng)計(jì)分析方法。由于這類方法不受總體參數(shù)的限

13、制,故稱非參數(shù)統(tǒng)計(jì)法(non-parametric statistics),或稱為不拘分布(distribution-free statistics)的統(tǒng)計(jì)分析方法,又稱為無分布型式假定(assumption free statistics)的統(tǒng)計(jì)分析方法。34.參數(shù)統(tǒng)計(jì):通常要求樣本來自總體分布型是已知的(如正態(tài)分布),在這種假設(shè)的基礎(chǔ)上,對(duì)總體參數(shù)(如總體均數(shù))進(jìn)行估計(jì)和檢驗(yàn),稱為參數(shù)統(tǒng)計(jì)(parametric statistics)35.秩次:變量值按照從小到大順序所編的秩序號(hào)稱為秩次(rank)。36.秩和:各組秩次的合計(jì)稱為秩和(rank sum),是非參數(shù)檢驗(yàn)的基本統(tǒng)計(jì)量。37.直

14、線回歸(linear regression)建立一個(gè)描述應(yīng)變量依自變量變化而變化的直線方程,并要求各點(diǎn)與該直線縱向距離的平方和為最小。直線回歸是回歸分析中最基本、最簡單的一種,故又稱簡單回歸(simple regression)。38.回歸系數(shù)(regression coefficient )即直線的斜率(slope),在直線回歸方程中用b 表示,b 的統(tǒng)計(jì)意義為X每增(減)一個(gè)單位時(shí),Y平均改變b 個(gè)單位。39.相關(guān)系數(shù)r:用以描述兩個(gè)隨機(jī)變量之間線性相關(guān)關(guān)系的密切程度與相關(guān)方向的統(tǒng)計(jì)指標(biāo)。 40、抽樣誤差:是指樣本指標(biāo)值與被推斷的總體指標(biāo)值之差。主要包括:樣本平均數(shù)與總體平均數(shù)之差;樣本成

15、數(shù)與總體成數(shù)之差。41、正態(tài)分布:概率論中最重要的一種分布,也是自然界最常見的一種分布。該分布由兩個(gè)參數(shù)平均值和方差決定。概率密度函數(shù)曲線以均值為對(duì)稱中線,方差越小,分布越集中在均值附近。42、標(biāo)準(zhǔn)正態(tài)分布:標(biāo)準(zhǔn)正態(tài)分布又稱為u分布,是以0為均數(shù)、以1為標(biāo)準(zhǔn)差的正態(tài)分布,記為N(0,1)。標(biāo)準(zhǔn)正態(tài)分布曲線下面積分布規(guī)律是:在-1.961.96范圍內(nèi)曲線下的面積等于0.9500,在-2.582.58范圍內(nèi)曲線下面積為0.9900。43、動(dòng)態(tài)數(shù)列:將某種現(xiàn)象在時(shí)間上變化發(fā)展的一系列同類的統(tǒng)計(jì)指標(biāo),按照時(shí)間先后順序排列,就形成了一個(gè)動(dòng)態(tài)數(shù)列,也稱時(shí)間數(shù)列,時(shí)間序列。44、率的標(biāo)準(zhǔn)誤:反映率的抽樣誤差

16、大小的指標(biāo):率的標(biāo)準(zhǔn)誤,它實(shí)際上是樣本率的標(biāo)準(zhǔn)差。率的標(biāo)準(zhǔn)誤可用來估計(jì)率的抽樣誤差。率的標(biāo)準(zhǔn)誤越小,率的抽樣誤差也越小。45、擬合優(yōu)度(Goodness of Fit)是指回歸直線對(duì)觀測值的擬合程度。46、秩和檢驗(yàn):從兩個(gè)非正態(tài)總體中所得到的兩個(gè)樣本之間的比較,其零假設(shè)為兩個(gè)樣本從同一總體中抽取的。47、直線相關(guān):又稱線性相關(guān),是指兩列變量中的一列變量在增加(或減少)時(shí),而另一列變量隨之而增加(或減少),或這一列變量在增加時(shí),而另一列變量則相應(yīng)地減少。它們之間存在一種直線關(guān)系。直線相關(guān)可用直線擬合。48、零相關(guān):即沒有關(guān)系,變量x和y之間的關(guān)系十分散亂,無法找出它們之間的聯(lián)系,各現(xiàn)象間表現(xiàn)為相

17、互獨(dú)立。這種關(guān)系稱為零相關(guān)。49、決定系數(shù):決定系數(shù)是指在x或y的總變異中,可以相互以直線關(guān)系說明的部分所占的比率。即隨x的改變而呈線性改變的平方和,對(duì)y總變異平方和的比率等于隨y的改變而呈線性改變的平方和占x變數(shù)總平方和的比率。 50、秩相關(guān):秩相關(guān)是一種非參數(shù)統(tǒng)計(jì)方法,適用于資料不是正態(tài)雙變量或總體分布未知;數(shù)據(jù)一端或兩端有不確定值的資料或等級(jí)資料。51、多元線性回歸:在回歸分析中,如果有兩個(gè)或兩個(gè)以上的自變量,就稱為多元回歸。事實(shí)上,一種現(xiàn)象常常是與多個(gè)因素相聯(lián)系的,由多個(gè)自變量的最優(yōu)組合共同來預(yù)測或估計(jì)因變量,比只用一個(gè)自變量進(jìn)行預(yù)測或估計(jì)更有效,更符合實(shí)際。52、偏回歸系數(shù):在多元回

18、歸分析中,隨機(jī)因變量對(duì)各個(gè)自變量的回歸系數(shù),表示各自變量對(duì)隨機(jī)變量的影響程度。53、負(fù)相關(guān)系數(shù):在多元回歸分析中,衡量某一變量與由多個(gè)變量線形組合后,對(duì)該變量作估計(jì)的變量之間線形關(guān)系密切程度的量,或表征由多個(gè)變量作某一變量的回歸時(shí)的回歸方差與該變量的方差的比例。54、確定系數(shù):如果因變量的一組統(tǒng)計(jì)觀測數(shù)據(jù)y i(i=0,1,n)的平方值為y¯,所有統(tǒng)計(jì)觀測數(shù)據(jù)值都分布在這個(gè)均值的上下,我們可以求出其總的誤差平方和S總。計(jì)算公式為: 。55、統(tǒng)計(jì)表和統(tǒng)計(jì)圖:統(tǒng)計(jì)表:數(shù)據(jù)經(jīng)整理后使之進(jìn)一步表格化,便形成統(tǒng)計(jì)表(statistical table)。統(tǒng)計(jì)圖:表現(xiàn)統(tǒng)計(jì)數(shù)字大小和變動(dòng)的各種圖形

19、總稱。56、安慰劑對(duì)照:又稱“假藥對(duì)照”,僅給予安慰劑的對(duì)照。所謂安慰劑是外形、顏色、大小均與試藥相近,但不含任何有效成分的制劑。使用安慰劑主要解決試驗(yàn)新藥時(shí)疾病自愈和安慰劑效應(yīng)問題,排除試藥以外因素的干擾,它常與盲法結(jié)合使用,便于保密。57、混雜因素:亦稱混雜因子或外來因素,是指與研究因素和研究疾病均有關(guān),若在比較的人群組中分布不勻,可以歪曲(掩蓋或夸大)因素與疾病之間真正聯(lián)系的因素。58、抽樣調(diào)查:抽樣調(diào)查是,一種非全面調(diào)查,它是從全部調(diào)查研究對(duì)象中,抽選一部分單位進(jìn)行調(diào)查,并據(jù)以對(duì)全部調(diào)查研究對(duì)象作出估計(jì)和推斷的一種調(diào)查方法。59、簡單隨機(jī)抽樣:也稱為單純隨機(jī)抽樣、純隨機(jī)抽樣、SPS抽樣

20、 ,是指從總體N個(gè)單位中任意抽取n個(gè)單位作為樣本,使每個(gè)可能的樣本被抽中的概率相等的一種抽樣方式。60、系統(tǒng)抽樣:總體中各單位按一定順序排列,根據(jù)樣本容量要求確定抽選間隔,然后隨機(jī)確定起點(diǎn),每隔一定的間隔抽取一個(gè)單位的一種抽樣方式。61、分層抽樣:先將總體的單位按某種特征分為若干次級(jí)總體(層),然后再從每一層內(nèi)進(jìn)行單純隨機(jī)抽樣,組成一個(gè)樣本。62、整群抽樣又稱聚類抽樣。是將總體中各單位歸并成若干個(gè)互不交叉、互不重復(fù)的集合,稱之為群;然后以群為抽樣單位抽取樣本的一種抽樣方式。63、相對(duì)危險(xiǎn)度(relative risk,RR):又稱率比(rate ratio),是暴露組發(fā)病率(Ie)與非暴露組發(fā)病率(Iu)的比值。64、病例對(duì)照研究:病例

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論