統(tǒng)計(jì)復(fù)習(xí)資料_第1頁
統(tǒng)計(jì)復(fù)習(xí)資料_第2頁
統(tǒng)計(jì)復(fù)習(xí)資料_第3頁
統(tǒng)計(jì)復(fù)習(xí)資料_第4頁
統(tǒng)計(jì)復(fù)習(xí)資料_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、醫(yī)學(xué)統(tǒng)計(jì)學(xué)一、名詞解釋1、總體(population):根據(jù)研究目的確定的同質(zhì)研究對象的全體(集合)。2、樣本(sample):從總體中隨機(jī)抽取的部分觀察單位。3、抽樣(sampling):從總體抽取部分有代表性個(gè)體的過程。4、參數(shù):描述總體特征的統(tǒng)計(jì)指標(biāo)稱為參數(shù)??傮w一旦確定下來,參數(shù)便是固定不變的恒量,用希臘字母表示 。5、統(tǒng)計(jì)量:樣本的統(tǒng)計(jì)描述指標(biāo)稱為統(tǒng)計(jì)量。統(tǒng)計(jì)量屬于變量,它在參數(shù)附近波動的隨機(jī)變量,用英文字母表示。6、同質(zhì)(homogeneity ):指事物的性質(zhì)、影響條件或背景相同或非常相近。7、變異(heterogeneity/variance):指同質(zhì)的個(gè)體之間的差異 。來源于

2、一些未加控制或無法控制的甚至不明原因的因素。8、誤差(error):統(tǒng)計(jì)上所說的誤差,泛指觀測值與真實(shí)值之差,以及樣本統(tǒng)計(jì)量與總體參數(shù)之差,主要有系統(tǒng)誤差、隨機(jī)測量誤差、抽樣誤差。9、抽樣誤差(sampling error):在同一總體中反復(fù)多次隨機(jī)抽取樣本含量相同的若干個(gè)體,由于個(gè)體差異與偶然性的影響,樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異稱為抽樣誤差。10、概率(probability):是描述某一事件發(fā)生的可能性大小的一個(gè)量度。11、幾何均數(shù)(geometric mean,G):原始觀察值分布不對稱,經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的資料。例如抗體滴度。12、中位數(shù)(median,M):將原始觀察值從小到

3、大排序后,居于中間位置的那個(gè)值或兩個(gè)中間值的平均值。13、百分位數(shù)(percentile,Px):將N個(gè)觀察值從小到大依次排列,再分成100等份,對應(yīng)于X%位的數(shù)值即為第X百分位數(shù)。中位數(shù)是百分位的特殊形式。同樣的例子還有四分位數(shù)。 P50就是中位數(shù)。14、四分位數(shù)間距(quartile range,Q):上四分位數(shù)( P75 )與下四分位數(shù)( P25 )之差。總體中數(shù)值居中的50%個(gè)體散布在此范圍。 Q= P75 -P25 15、變異系數(shù)(coefficient of variation ,CV):適用于觀察指標(biāo)單位不同,如身高、體重或同單位資料,但均數(shù)相差懸殊。16、醫(yī)學(xué)參考值范圍(Ref

4、erence Value Range):通常指大多數(shù)正常人的解剖、生理、生化、免疫及組織代謝產(chǎn)物的含量等各種數(shù)據(jù)的波動范圍。17、標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution):是均數(shù)為0,標(biāo)準(zhǔn)差為1的正態(tài)分布。記為N(0,1) ,標(biāo)準(zhǔn)正態(tài)分布是一條曲線 。18、標(biāo)準(zhǔn)誤:反映樣本均數(shù)之間差異的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤,用于描述樣本統(tǒng)計(jì)量之間的離散程度,也反映樣本均數(shù)與總體均數(shù)的差異。標(biāo)準(zhǔn)誤計(jì)算公式為實(shí)際工作中總體標(biāo)準(zhǔn)差往往未知,因而通常用樣本標(biāo)準(zhǔn)差s代替,求的樣本均數(shù)標(biāo)準(zhǔn)誤的估計(jì)值19、可信區(qū)間(confidence interval, CI):按一定的概率或可信度(1-)用

5、一個(gè)區(qū)間來估計(jì)總體參數(shù)所在的范圍,該范圍通常稱為參數(shù)的可信區(qū)間或者置信區(qū)間。20、小概率事件:習(xí)慣上將P0.01或P0.05稱為小概率事件,表示在一次試驗(yàn)或觀察中該事件發(fā)生的可能性很小,可以視為很可能不發(fā)生。21、方差分析的基本思想:全部觀察值的總變異按影響因素分解為相應(yīng)的若干部分變異,在此基礎(chǔ)上計(jì)算假設(shè)檢驗(yàn)的統(tǒng)計(jì)量F值,實(shí)現(xiàn)對總體均數(shù)是否有差別的推斷。22、方差應(yīng)用的條件(基本假設(shè)):1.獨(dú)立隨機(jī)樣本,即任何兩個(gè)觀察值之間均不相關(guān);2.各樣本均來自正態(tài)總體;3.各總體方差相等,即具有方差齊性。23、相對數(shù)(Relative number):關(guān)聯(lián)的絕對數(shù)之比,可以說明事物的相對關(guān)系,便于對比分

6、析。常用相對數(shù)有率、構(gòu)成比、相對比。24、率(rate):是指在一定范圍內(nèi)某種現(xiàn)象實(shí)際發(fā)生的觀察單位數(shù)與可能發(fā)生該現(xiàn)象的總觀察單位數(shù)之比。25、構(gòu)成比(constituent ratio ):也叫構(gòu)成指標(biāo),是指一事物內(nèi)部某一組成部分的觀察單位數(shù)與該事物各組成部分的觀察單位總數(shù)之比,常用百分?jǐn)?shù)表示。用以說明某一事物內(nèi)部各組成部分所占的比重或分布。26、相對比(relative ratio ,R):表示A、B兩個(gè)有關(guān)聯(lián)指標(biāo)之比,說明A指標(biāo)是B指標(biāo)的幾倍或幾分之幾。27、相對危險(xiǎn)度(relative risk,RR ):是流行病學(xué)中常用的指標(biāo),表示在兩種不同條件下某疾病發(fā)生的概率之比。28、比數(shù)比或

7、優(yōu)勢比(odds ratio,OR):常用于流行病學(xué)中病例-對照研究資料。29、率的標(biāo)準(zhǔn)化的基本思想:采用統(tǒng)一的內(nèi)部構(gòu)成計(jì)算標(biāo)準(zhǔn)化率,以消除內(nèi)部構(gòu)成不同對指標(biāo)的影響,使得計(jì)算出來的標(biāo)準(zhǔn)化率具有可比性。30、死亡率(death rate):表示某地某年每1000人中的死亡人數(shù) 。 死亡率= 某年死亡人口總數(shù)/同年年平均人口數(shù)100031、死亡構(gòu)成 :也稱相對死亡比,表示某種死因引起的死亡人數(shù)占總死亡數(shù)的百分比 。某種死因的構(gòu)成比=因某種死因死亡的人數(shù)/總死亡人數(shù)100%32、發(fā)病率(incidence):表示在某一時(shí)期內(nèi)特定人群中某病新病例的頻率 。發(fā)病率=某時(shí)期某病新病例數(shù)/同時(shí)期內(nèi)平均人口數(shù)

8、k33、患病率(prevalence):表示在某一時(shí)間點(diǎn)某人群中某病頻率 患病率=某地某時(shí)間點(diǎn)某病患病例數(shù)/同時(shí)期內(nèi)平均人口數(shù)k34、病死率(cause fatality) :表示在某期間內(nèi),某病患者中因某病死亡的頻率。 病死率=某期間因某病死亡人數(shù)/同期某病的患病人數(shù)100%35、率的標(biāo)準(zhǔn)誤 由于抽樣引起的樣本率之間及樣本率與總體率之間的誤差,稱為率的抽樣誤差。式中為總體率,n為樣本例數(shù)。36、率的區(qū)間估計(jì):1.正態(tài)近似法:n足夠大,且np和n(1-p)均大于5時(shí),總體均數(shù)置信區(qū)間為 2.查表法 課本p20237、卡方檢驗(yàn)(c2檢驗(yàn))的基本公式:A實(shí)際頻數(shù)(actual frequency)

9、,為觀察所得數(shù)據(jù)T理論頻數(shù)(theoretical frequency),如果檢驗(yàn)假設(shè)(H0)成立,推算出來的頻數(shù)。c2值的大小反映了實(shí)際數(shù)與理論數(shù)的吻合程度。如果檢驗(yàn)假設(shè)成立,c2不會太大。計(jì)算出來的c2值越小說明檢驗(yàn)假設(shè)成立的可能性越大,計(jì)算出來的c2值越大說明檢驗(yàn)假設(shè)成立的可能性越小. 自由度 n=(行數(shù)-1)(列數(shù)-1) 四格表資料c2檢驗(yàn)的校正:或 c2檢驗(yàn):用于兩組或多組率或構(gòu)成比的比較。四格表資料: n40,T5,用基本公式或?qū)S霉剑?n40,1T<5時(shí),需計(jì)算校正的c2值; 或n<40,或T<1時(shí),需用確切概率法。配對資料:用四格表中不一致對子數(shù)b和c計(jì)算c

10、2值。38.完全隨機(jī)設(shè)計(jì):將受試對象隨機(jī)分配到各處理組或?qū)φ战M中,或分別從不同總體中隨機(jī)抽樣進(jìn)行研究。39.配對設(shè)計(jì):將受試對象按影響實(shí)驗(yàn)效應(yīng)非主要因素配對,將他們隨機(jī)分到兩個(gè)組中,分別給予不同的處理。40.隨機(jī)區(qū)組設(shè)計(jì):又稱區(qū)組設(shè)計(jì)或稱配伍組設(shè)計(jì),它是配對設(shè)計(jì)的擴(kuò)展。是把條件相同(或相近)的幾個(gè)受試對象配成區(qū)組,然后把這一組隨機(jī)分配,分別接受不同處理的設(shè)計(jì)。二、簡答題1.衡量集中趨勢及變異程度指標(biāo)的適用條件集中趨勢的統(tǒng)計(jì)描述:(1) 算數(shù)均數(shù):特征 各離均差的總和等于0離均差的平方和小于各觀察值與任何數(shù)a差的平方和(a )對極端值太敏感。 適用條件 它主要適用于對稱分布或偏態(tài)度不大的資料,尤

11、其適合正態(tài)分布資料或近似正態(tài)分布資料。(2)幾何均數(shù): 適用條件:原始觀察值分布不對稱,經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的資料。例如抗體滴度。(3)中位數(shù):適用條件 適合各種類型的資料,尤其偏態(tài)分布的資料資料末端有不確定數(shù)值資料分布不明(4)百分位數(shù):百分位數(shù)可用于任何頻數(shù)分布的資料離散水平的統(tǒng)計(jì)描述:(1)四分位間距: 適用條件 各種分布資料,特別是偏峰分布資料,常把中位數(shù)與四分位間距集合起來描述數(shù)據(jù)的集中趨勢和離散趨勢。(與中位數(shù)的使用條件相同)(2) 標(biāo)準(zhǔn)差:適用條件 與算數(shù)均數(shù)的適用條件相同,常與均數(shù)結(jié)合使用描述正態(tài)分布資料或近似正態(tài)分布資料的集中趨勢與離散趨勢。(3) 變異系數(shù):適用條件觀察指

12、標(biāo)單位不同,如身高、體重。同單位資料,但均數(shù)相差懸殊。2.正態(tài)曲線下的面積規(guī)律(1)X軸與正態(tài)曲線所夾面積恒等于1 。(2)對稱區(qū)域面積相等。3.正態(tài)分布的特點(diǎn)(課本P20)4.正態(tài)分布應(yīng)用(1)正態(tài)分布是最常見連續(xù)性變量分布。如誤差。(2)正態(tài)分布是最重要、研究最完善的分布: 1)很多統(tǒng)計(jì)推斷以正態(tài)分布為基礎(chǔ),如區(qū)間估計(jì)、u 檢驗(yàn),方差分析,相關(guān)與回歸分析等 2)非正態(tài)分布資料 、n正態(tài)分布,如二項(xiàng)分布 3)還有一些分布可由正態(tài)分布導(dǎo)出,如t分布 5.均數(shù)標(biāo)準(zhǔn)誤的用途(1)說明抽樣誤差的大小(2)標(biāo)準(zhǔn)誤越大,說明樣本統(tǒng)計(jì)量(樣本均數(shù),樣本率)的離散程度越大,即用樣本統(tǒng)計(jì)量來直接估計(jì)總體參數(shù)越

13、不可靠。反之亦然。(3)求 的置信區(qū)間(4)作均數(shù)的假設(shè)檢驗(yàn)6.假設(shè)檢驗(yàn)中的兩類錯(cuò)誤可能發(fā)生的兩類錯(cuò)誤I 型錯(cuò)誤:假陽性錯(cuò)誤,指拒絕了實(shí)際上成立的H0,這類“棄真”的錯(cuò)誤稱為I型錯(cuò)誤,犯這種錯(cuò)誤的概率是a(其值等于檢驗(yàn)水準(zhǔn))。II型錯(cuò)誤:假陰性錯(cuò)誤,指接受了實(shí)際上不成立的H0,這類“存?zhèn)巍钡腻e(cuò)誤稱為II類錯(cuò)誤,犯這種錯(cuò)誤的概率是b(其值未知)。a愈小,b愈大;相反,a愈大,b愈小。若要同時(shí)減小I 型錯(cuò)誤a和II型錯(cuò)誤b,唯一的方法就是增加樣本含量n。7.方差分析的條件(1)各樣本是相互獨(dú)立的隨機(jī)樣本,均服從正態(tài)分布;(2)各樣本的總體方差相等,即方差齊性(homogeneity of vari

14、ance)。所以方差分析前,要先進(jìn)行正態(tài)性檢驗(yàn)和方差齊性檢驗(yàn)。8.q檢驗(yàn)的前提:多個(gè)均數(shù)的兩兩比較均應(yīng)以方差分析拒絕H0為前提。9.相對數(shù)應(yīng)注意的問題(1)正確區(qū)分構(gòu)成比和率(2)計(jì)算相對數(shù)時(shí),觀察單位數(shù)應(yīng)足夠多(分母不應(yīng)太小)(3)合并率(平均率)的計(jì)算不是直接求率的均數(shù)(4)對率和構(gòu)成比進(jìn)行比較時(shí),應(yīng)注意資料的可比性(5)率的標(biāo)準(zhǔn)化(6)考慮存在抽樣誤差,比較兩個(gè)樣本率或構(gòu)成比時(shí),對于樣本之間的差異應(yīng)作統(tǒng)計(jì)學(xué)檢驗(yàn)10.率的標(biāo)準(zhǔn)化意義消除其他因素的影響11.非參數(shù)檢驗(yàn)的適用條件(1)總體分布類型不明 (2)總體分布呈明顯偏態(tài)分布,而又無適當(dāng)?shù)恼龖B(tài)轉(zhuǎn)換法 (3)有些分組數(shù)據(jù)一端或兩端有不確定的

15、數(shù)值 (4)總體方差不齊 (5)等級資料12.線性相關(guān)與線性回歸的注意事項(xiàng),區(qū)別與聯(lián)系(課本P93、p97)13.統(tǒng)計(jì)表的編制原則(1)重點(diǎn)突出,一個(gè)表只表達(dá)一個(gè)中心內(nèi)容。(2)主謂分明,層次清楚,從左至右構(gòu)成一句完整的話,主語在左,謂語在右,不要倒置。(3)簡單明了,文字、數(shù)字、線條盡量從簡。14.統(tǒng)計(jì)表的結(jié)構(gòu) (課本P113)15.置信區(qū)間與參考值范圍的比較16.簡述非參檢驗(yàn)的優(yōu)缺點(diǎn)?優(yōu)點(diǎn):1.不受總體分布的限制 2.適用范圍廣 3.方法簡單缺點(diǎn):非參數(shù)檢驗(yàn)由于損失了部分信息,檢驗(yàn)效率降低了,即在資料服從正態(tài)分布時(shí),當(dāng)H0不真的時(shí)候,非參數(shù)檢驗(yàn)不如參數(shù)檢驗(yàn)更靈敏地拒絕H0 ,即犯第二類錯(cuò)誤的可能性更大。17.標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別與聯(lián)系18.假設(shè)檢驗(yàn)和區(qū)間估計(jì)有何聯(lián)系?(1)置信區(qū)間具有假設(shè)檢驗(yàn)的主要功能,如果區(qū)間包含了H0則不拒絕H

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論