醫(yī)學(xué)統(tǒng)計(jì)學(xué) 總結(jié) 重點(diǎn) 筆記 復(fù)習(xí)資料_第1頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué) 總結(jié) 重點(diǎn) 筆記 復(fù)習(xí)資料_第2頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué) 總結(jié) 重點(diǎn) 筆記 復(fù)習(xí)資料_第3頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué) 總結(jié) 重點(diǎn) 筆記 復(fù)習(xí)資料_第4頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué) 總結(jié) 重點(diǎn) 筆記 復(fù)習(xí)資料_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第一章2選1總體:總體(population)是根據(jù)研究目的確定的同質(zhì)觀察單位(研究對(duì)象)的全體,實(shí)際上是某一變量值的集合??煞譃橛邢蘅傮w和無限總體??傮w中的所有單位都能夠標(biāo)識(shí)者為有限總體,反之為無限總體。樣本:從總體中隨機(jī)抽取部分觀察單位,其測(cè)量結(jié)果的集合稱為樣本(sample)。樣本應(yīng)具有代表性。所謂有代表性的樣本,是指用隨機(jī)抽樣方法獲得的樣本。3選1小概率事件:我們把概率很接近于0(即在大量重復(fù)試驗(yàn)中出現(xiàn)的頻率非常低)的事件稱為小概率事件。P值:P 值即概率,反映某一事件發(fā)生的可能性大小。統(tǒng)計(jì)學(xué)根據(jù)顯著性檢驗(yàn)方法所得到的P 值反應(yīng)結(jié)果真實(shí)程度,一般以P 0.05 認(rèn)為有統(tǒng)計(jì)學(xué)意義, P

2、0.01 認(rèn)為有高度統(tǒng)計(jì)學(xué)意義,其含義是樣本間的差異由抽樣誤差所致的概率等于或小于0.05 或0.01。 P值是:1) 一種概率,一種在原假設(shè)為真的前提下出現(xiàn)觀察樣本以及更極端情況的概率。2) 拒絕原假設(shè)的最小顯著性水平。3) 觀察到的(實(shí)例的) 顯著性水平。4) 表示對(duì)原假設(shè)的支持程度,是用于確定是否應(yīng)該拒絕原假設(shè)的另一種方法。小概率原理:一個(gè)事件如果發(fā)生的概率很小的話,那么可認(rèn)為它在一次實(shí)際實(shí)驗(yàn)中是不會(huì)發(fā)生的,數(shù)學(xué)上稱之小概率原理,也稱為小概率的實(shí)際不可能性原理。統(tǒng)計(jì)學(xué)中,一般認(rèn)為等于或小于0.05或0.01的概率為小概率。資料的類型(3選1)(1)計(jì)量資料:對(duì)每個(gè)觀察單位用定量的方法測(cè)定

3、某項(xiàng)指標(biāo)量的大小,所得的資料稱為計(jì)量資料(measurement data)。計(jì)量資料亦稱定量資料、測(cè)量資料。.其變量值是定量的,表現(xiàn)為數(shù)值大小,一般12有度量衡單位。如某一患者的身高(cm)、體重(kg)、紅細(xì)胞計(jì)數(shù)(10/L)、脈搏(次/分)、血壓(KPa)等。(2)計(jì)數(shù)資料:將觀察單位按某種屬性或類別分組,所得的觀察單位數(shù)稱為計(jì)數(shù)資料(count data)。計(jì)數(shù)資料亦稱定性資料或分類資料。其觀察值是定性的,表現(xiàn)為互不相容的類別或?qū)傩浴H缯{(diào)查某地某時(shí)的男、女性人口數(shù);治療一批患者,其治療效果為有效、無效的人數(shù);調(diào)查一批少數(shù)民族居民的A、B、AB、O 四種血型的人數(shù)等。(3)等級(jí)資料:將觀

4、察單位按測(cè)量結(jié)果的某種屬性的不同程度分組,所得各組的觀察單位數(shù),稱為等級(jí)資料(ordinal data)。等級(jí)資料又稱有序變量。如患者的治療結(jié)果可分為治愈、好轉(zhuǎn)、有效、無效或死亡,各種結(jié)果既是分類結(jié)果,又有順序和等級(jí)差別,但這種差別卻不能準(zhǔn)確測(cè)量;一批腎病患者尿蛋白含量的測(cè)定結(jié)果分為 +、+、+等。等級(jí)資料與計(jì)數(shù)資料不同:屬性分組有程度差別,各組按大小順序排列。等級(jí)資料與計(jì)量資料不同:每個(gè)觀察單位未確切定量,故亦稱為半計(jì)量資料。兩種誤差(2選1)抽樣誤差(sampling error )由于抽樣而引起的總體指標(biāo)(參數(shù))與樣本指標(biāo)(統(tǒng)計(jì)數(shù))之間的差異。抽樣誤差是由個(gè)體變異或其它隨機(jī)因素造成的,是

5、不可避免的,但誤差分布有規(guī)律可循,可進(jìn)行估計(jì)和分析。系統(tǒng)誤差(systematic error):由于測(cè)量儀器結(jié)構(gòu)本身的問題、刻度不準(zhǔn)確或測(cè)量環(huán)境改變等原因,在多次測(cè)量時(shí)所產(chǎn)生的,總是偏大或總是偏小的誤差,稱為系統(tǒng)誤差。它帶有規(guī)律性,經(jīng)過校正和處理,通??梢詼p少或消除。統(tǒng)計(jì)的步驟(考填空題,四個(gè)空)統(tǒng)計(jì)工作的步驟設(shè)計(jì):設(shè)計(jì)內(nèi)容包括資料收集、整理和分析全過程總的設(shè)想和安排。設(shè)計(jì)是整個(gè)研究中最關(guān)鍵的一環(huán),是今后工作應(yīng)遵循的依據(jù)。收集資料:應(yīng)采取措施使能取得準(zhǔn)確可靠的原始數(shù)據(jù)。整理資料:簡化數(shù)據(jù),使其系統(tǒng)化、條理化,便于進(jìn)一步分析計(jì)算。分析資料:計(jì)算有關(guān)指標(biāo),反映事物的綜合特征,闡明事物的內(nèi)在聯(lián)系和

6、規(guī)律。分析資料包括統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷。實(shí)驗(yàn)設(shè)計(jì)的基本原則 (考填空題,三個(gè)空)隨機(jī)化原則、對(duì)照的原則、重復(fù)的原則。2選1參數(shù):參數(shù)()是指總體的統(tǒng)計(jì)指標(biāo),如總體均數(shù)、總體率等??傮w參數(shù)是固定的常數(shù)。多數(shù)情況下,總體參數(shù)是不易知道的,但可通過隨機(jī)抽樣抽取有代表性的樣本,用算得的樣本統(tǒng)計(jì)量估計(jì)未知的總體參數(shù)。統(tǒng)計(jì)量:統(tǒng)計(jì)量()是指樣本的統(tǒng)計(jì)指標(biāo),如樣本均數(shù)、樣本率等。樣本統(tǒng)計(jì)量可用來估計(jì)總體參數(shù)。總體參數(shù)是固定的常數(shù),統(tǒng)計(jì)量是在總體參數(shù)附近波動(dòng)的隨機(jī)變量。第二章頻數(shù)表的制作步驟以及頻數(shù)分布表的用途(問答題)頻數(shù)分布表的編制步驟:例:某市1982年50名7歲男童的身高(cm)資料如下,試編制頻數(shù)表。

7、114.4 117.2 122.7 124.0 114.0 110.8 118.2 116.7 118.9 118.1 123.5 118.3 120.3 116.2 114.7 119.7 114.8 119.6 113.2 120.0 119.8 116.8 119.8 122.5 119.7 120.7 114.3 122.0 117.0 122.5119.7 124.9 126.1 120.0 124.6 120.0 121.5 114.3 124.1 117.2 120.2 120.8 126.6 121.5 126.1 117.7 124.1 128.3 121.8 118.71、

8、找出觀察值中的最大值(largest value)、最小值(smallest value),求極差(range)。 極差等于最大值減最小值。本例最大值=128.3,最小值=110.8,則極差=128.3-110.8=17.5(cm )2、確定分組數(shù)和組距(class interval)。組數(shù)的多少是根據(jù)例數(shù)的多少來確定的,以能夠反映出頻數(shù)分布的特征為原則,一般分1015組。組距為相鄰兩組的間隔,組距=極差/組數(shù)。本例擬分10組,則組距=17.5/10=1.752,為劃記方便,可取稍大或稍小的數(shù)(當(dāng)然本例組距也可取1.5)。3、確定組段。第一組段包括要最小值,取較最小值稍小且劃分方便的數(shù),本例取

9、“110”。最后組段包括最大值并寫出其上限值。4、劃記。將各觀察值以劃“正”字的方法,一筆代表一例,劃在相應(yīng)組段中。例如第一個(gè)數(shù)l14.4應(yīng)在組段“114”處劃,第二個(gè)數(shù)117.2應(yīng)在“116”處劃,以此類推。5、統(tǒng)計(jì)各組段的頻數(shù)。全部數(shù)據(jù)劃記完后,清點(diǎn)各組段的人數(shù)。根據(jù)編制出的頻數(shù)表即可了解該數(shù)值變量資料的頻數(shù)分布特征。頻數(shù)分布表的用途1、描述資料的分布特征和分布類型。頻數(shù)分布有兩個(gè)重要特征:集中趨勢(shì)和離散趨勢(shì)。大部分觀察值向某一數(shù)值集中的趨勢(shì)稱為集中趨勢(shì),常用平均數(shù)指標(biāo)來表示,各觀察值之間大小參差不齊。頻數(shù)由中央位置向兩側(cè)逐漸減少,稱離散趨勢(shì),是個(gè)體差異所致,可用一系列的變異指標(biāo)來反映。2

10、、便于進(jìn)一步計(jì)算有關(guān)指標(biāo)或進(jìn)行統(tǒng)計(jì)分析。當(dāng)數(shù)據(jù)較多且需手工計(jì)算時(shí),常先編制頻數(shù)表,再進(jìn)行統(tǒng)計(jì)計(jì)算。3、發(fā)現(xiàn)特大、特小的可疑值。如果頻數(shù)表的一端或兩端出現(xiàn)連續(xù)幾個(gè)組段的頻數(shù)為零后,又出現(xiàn)少數(shù)幾個(gè)特大值或特小值,使人懷疑其是否準(zhǔn)確,需進(jìn)一步檢查和核對(duì)并做相應(yīng)處理。4、據(jù)此繪制頻數(shù)分布圖。描述數(shù)據(jù)分布集中趨勢(shì)的指標(biāo)和描述數(shù)據(jù)分布離散程度的指標(biāo) (考選擇或者填空) 描述數(shù)據(jù)分布集中趨勢(shì)的指標(biāo)算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)。 描述數(shù)據(jù)分布離散程度的指標(biāo)極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)。正態(tài)分布的特征(考選擇題 、對(duì)圖形的影響)服從正態(tài)分布的變量的頻數(shù)分布由 、 完全決定。(1) 是正態(tài)分布的位置參

11、數(shù),描述正態(tài)分布的集中趨勢(shì)位置。正態(tài)分布以 x =為對(duì)稱軸,左右完全對(duì)稱。正態(tài)分布的均數(shù)、中位數(shù)、眾數(shù)相同,均等于 。(2) 描述正態(tài)分布資料數(shù)據(jù)分布的離散程度,越大,數(shù)據(jù)分布越分散,越小,數(shù)據(jù)分布越集中。也稱為是正態(tài)分布的形狀參數(shù),越大,曲線越扁平,反之,越小,曲線越瘦高。標(biāo)準(zhǔn)正態(tài)分布(填空)21標(biāo)準(zhǔn)正態(tài)分布是一種特殊的正態(tài)分布,標(biāo)準(zhǔn)正態(tài)分布的 =0, =1 ,通常用u(或Z)表2示服從標(biāo)準(zhǔn)正態(tài)分布的變量,記為N(0,1)。 正態(tài)分布的應(yīng)用(簡答)某些醫(yī)學(xué)現(xiàn)象,如同質(zhì)群體的身高、紅細(xì)胞數(shù)、血紅蛋白量,以及實(shí)驗(yàn)中的隨機(jī)誤差,呈現(xiàn)為正態(tài)或近似正態(tài)分布;有些指標(biāo)(變量)雖服從偏態(tài)分布,但經(jīng)數(shù)據(jù)轉(zhuǎn)換

12、后的新變量可服從正態(tài)或近似正態(tài)分布,可按正態(tài)分布規(guī)律處理。其中經(jīng)對(duì)數(shù)轉(zhuǎn)換后服從正態(tài)分布的指標(biāo),被稱為服從對(duì)數(shù)正態(tài)分布。1. 估計(jì)頻數(shù)分布 一個(gè)服從正態(tài)分布的變量只要知道其均數(shù)與標(biāo)準(zhǔn)差就可根據(jù)公式即可估計(jì)任意取值范圍內(nèi)頻數(shù)比例。2. 制定參考值范圍(1)正態(tài)分布法 適用于服從正態(tài)(或近似正態(tài))分布指標(biāo)以及可以通過轉(zhuǎn)換后服從正態(tài)分布的指標(biāo)。(2)百分位數(shù)法 常用于偏態(tài)分布的指標(biāo)。表3-1中兩種方法的單雙側(cè)界值都應(yīng)熟練掌握。3. 質(zhì)量控制:為了控制實(shí)驗(yàn)中的測(cè)量(或?qū)嶒?yàn))誤差,常以 作為上、下警戒值,以 作為上、下控制值。這樣做的依據(jù)是:正常情況下測(cè)量(或?qū)嶒?yàn))誤差服從正態(tài)分布。4. 正態(tài)分布是許多統(tǒng)

13、計(jì)方法的理論基礎(chǔ)。 檢驗(yàn)、方差分析、相關(guān)和回歸分析等多種統(tǒng)計(jì)方法均要求分析的指標(biāo)服從正態(tài)分布。許多統(tǒng)計(jì)方法雖然不要求分析指標(biāo)服從正態(tài)分布,但相應(yīng)的統(tǒng)計(jì)量在大樣本時(shí)近似正態(tài)分布,因而大樣本時(shí)這些統(tǒng)計(jì)推斷方法也是以正態(tài)分布為理論基礎(chǔ)的。醫(yī)學(xué)參考值范圍的制定(計(jì)算題 )確定參考值范圍的單雙側(cè):一般生理物質(zhì)指標(biāo)多為雙側(cè)、毒物指標(biāo)則多為單側(cè)。確定百分位點(diǎn):一般取95%或99%。例題某市 20 歲男學(xué)生 160 人的脈搏數(shù)(次/分鐘),經(jīng)正態(tài)性檢驗(yàn)服從正態(tài)分布。求得= 76.10,S =9.32。試估計(jì)脈搏數(shù)的95%、99%參考值范圍。解:脈搏數(shù)的95%正常值范圍為: ±1.96 S=76.10

14、 ± 1.96(9.32)=57.8394.37脈搏數(shù)的99%正常值范圍為:±2.58 S =76.10 ± 2.58(9.32)=52.05100.37第三章標(biāo)準(zhǔn)誤的概念,計(jì)算公式。標(biāo)準(zhǔn)誤:抽樣研究中,樣本統(tǒng)計(jì)量與總體參數(shù)間的差別稱為抽樣誤差(sampling error)。統(tǒng)計(jì)上用標(biāo)準(zhǔn)誤(standard error,SE)來衡量抽樣誤差的大小,即樣本均數(shù)的標(biāo)準(zhǔn)差,是描述均數(shù)抽樣分布的離散程度及衡量均數(shù)抽樣誤差大小的尺度。t分布的圖形特征及其與正態(tài)分布的區(qū)別(簡答)t分布的圖形特征1以0為中心,左右對(duì)稱的單峰分布;2t分布是一簇曲線,其形態(tài)變化與n(確切地說與

15、自由度)大小有關(guān)。自由度越小,t分布曲線越低平;自由度越大,t分布曲線越接近標(biāo)準(zhǔn)正態(tài)分布(u分布)曲線。t分布對(duì)應(yīng)于每一個(gè)自由度,就有一條t分布曲線,每條曲線都有其曲線下統(tǒng)計(jì)量t的分布規(guī)律,計(jì)算較復(fù)雜。t 分布與正態(tài)分布比較的區(qū)別t 分布與標(biāo)準(zhǔn)正態(tài)分布相比有以下特點(diǎn):都是單峰、對(duì)稱分布;t 分布峰值較低,而尾部較高;隨自由度增大,t 分布趨近與標(biāo)準(zhǔn)正態(tài)分布;當(dāng)趨向,t 分布的極限分布是標(biāo)準(zhǔn)正態(tài)分布。置信區(qū)間和參數(shù)估計(jì) (名解2選1)置信區(qū)間:在統(tǒng)計(jì)學(xué)中,一個(gè)概率樣本的置信區(qū)間(Confidence interval)是對(duì)這個(gè)樣本的某個(gè)總體參數(shù)的區(qū)間估計(jì)。置信區(qū)間展現(xiàn)的是這個(gè)參數(shù)的真實(shí)值有一定概

16、率落在測(cè)量結(jié)果的周圍的程度。給出的是被測(cè)量參數(shù)的測(cè)量值的可信程度。1、對(duì)于具有特定的發(fā)生概率的隨機(jī)變量,其特定的價(jià)值區(qū)間-一個(gè)確定的數(shù)值范圍(“一個(gè)區(qū)間”)。2、在一定置信水平時(shí),以測(cè)量結(jié)果為中心,包括總體均值在內(nèi)的可信范圍。3、該區(qū)間包含了參數(shù)真值的可信程度。4、參數(shù)的置信區(qū)間可以通過點(diǎn)估計(jì)量構(gòu)造,也可以通過假設(shè)檢驗(yàn)構(gòu)造。參數(shù)估計(jì):指用樣本指標(biāo)值(統(tǒng)計(jì)量)估計(jì)總體指標(biāo)值(參數(shù))。參數(shù)估計(jì)有兩種方法:點(diǎn)估計(jì)和區(qū)間估計(jì)??尚艆^(qū)間與參考值范圍的不同點(diǎn)(簡答)應(yīng)注意:可信區(qū)間與參考值范圍的意義、計(jì)算公式和用途均不同。1.從意義和用途來看95參考值范圍是指同質(zhì)總體內(nèi)包括95個(gè)體值的估計(jì)范圍,而總體均數(shù)

17、95可信區(qū)間是指按95可信度估計(jì)的總體均數(shù)的所在范圍。可信區(qū)間用于估計(jì)總體參數(shù),總體參數(shù)只有一個(gè) 。參考值范圍用于估計(jì)變量值的分布范圍,變量值可能很多甚至無限 。2.從計(jì)算公式看若指標(biāo)服從正態(tài)分布,95參考值范圍的公式是:±1.96s??傮w均數(shù)95可信區(qū)間的公式是:。前者用標(biāo)準(zhǔn)差,后者用標(biāo)準(zhǔn)誤。前者用1.96,后者用為0.05,自由度為v的t界值。t檢驗(yàn)的應(yīng)用條件和類型(填空)t檢驗(yàn)的應(yīng)用條件:要求各樣本來自相互獨(dú)立的正態(tài)總體且各總體方差齊。t檢驗(yàn)的類型:單樣本t檢驗(yàn),獨(dú)立t檢驗(yàn),配對(duì)t檢驗(yàn)配對(duì)設(shè)計(jì)和完全隨機(jī)設(shè)計(jì)(名解2選1)完全隨機(jī)設(shè)計(jì)(completely random desi

18、gn):完全隨機(jī)設(shè)計(jì)僅涉及一個(gè)處理因素(但可為多水平),故又稱單因素(one-way)設(shè)計(jì)。它是將受試對(duì)象按隨機(jī)化的方法分配到各個(gè)處理組中,觀察實(shí)驗(yàn)效應(yīng),臨床試驗(yàn)中的隨機(jī)對(duì)照試驗(yàn)也屬于此類設(shè)計(jì)。配對(duì)設(shè)計(jì)(paired design):是將受試對(duì)象按一定條件匹配成對(duì),再隨機(jī)分配每對(duì)中的兩個(gè)受試對(duì)象到不同處理組。配對(duì)的因素是影響實(shí)驗(yàn)效應(yīng)的主要非處理兇素。假設(shè)檢驗(yàn)的基本求解步驟或者注意事項(xiàng)。(簡答2選1)假設(shè)檢驗(yàn)的基本步驟1.建立假設(shè),確定檢驗(yàn)水準(zhǔn)假設(shè)有零假設(shè)(H0)和備擇假設(shè)(H1)兩個(gè),零假設(shè)又叫作無效假設(shè)或檢驗(yàn)假設(shè)。H0和H1的關(guān)系是互相對(duì)立的,如果拒絕H0,就要接受H1.根據(jù)備擇假設(shè)不同,假

19、設(shè)檢驗(yàn)有單、雙側(cè)檢驗(yàn)兩種。檢驗(yàn)水準(zhǔn)用表示,通常取0.05或0.10.檢驗(yàn)水準(zhǔn)說明了該檢驗(yàn)犯第一類錯(cuò)誤的概率。2.根據(jù)研究目的和設(shè)計(jì)類型選擇適合的檢驗(yàn)方法這里的檢驗(yàn)方法,是指參數(shù)檢驗(yàn)方法,有u檢驗(yàn)、t檢驗(yàn)和方差分析三種,對(duì)應(yīng)于不同的檢驗(yàn)公式。對(duì)雙樣本資料,要注意區(qū)分成組設(shè)計(jì)和配對(duì)設(shè)計(jì)的資料類型。如果資料里有"配成對(duì)子"字樣,或者是對(duì)同一對(duì)象用兩種方法來處理,一般就可以判定是配對(duì)設(shè)計(jì)資料。3.確定P值并作出統(tǒng)計(jì)結(jié)論u檢驗(yàn)得到的是u統(tǒng)計(jì)量或稱u值,t檢驗(yàn)得到的是t統(tǒng)計(jì)量或稱t值。方差分析得到的是F統(tǒng)計(jì)量或稱F值。將求得的統(tǒng)計(jì)量絕對(duì)值與界值相比,可以確定P值。當(dāng)0.05時(shí),u值要和

20、u界值1.96相比較,確定P值。如果u1.96,則P0.05.反之,如u1.96,則P0.05.t值 要和某自由度的t界值相比較,確定P值。如果t值t界值,故P0.05.反之,如tt界值,則P0.05.相同自由度的情況下,單側(cè)檢驗(yàn)的t界值 要小于雙側(cè)檢驗(yàn)的t界值,因此有可能出現(xiàn)算得的t值大于單側(cè)t界值,而小于雙側(cè)t界值的情況,即單側(cè)檢驗(yàn)顯著,雙側(cè)檢驗(yàn)未必就顯著,反之,雙側(cè)檢驗(yàn)顯著, 單側(cè)檢驗(yàn)必然會(huì)顯著。即單側(cè)檢驗(yàn)更容易出現(xiàn)陽性結(jié)論。當(dāng)P0.05時(shí),接受零假設(shè),認(rèn)為差異無統(tǒng)計(jì)學(xué)意義,或者說二者不存在質(zhì)的區(qū)別。當(dāng)P0.05時(shí),拒絕零假設(shè),接受備擇假設(shè),認(rèn)為差異有統(tǒng) 計(jì)學(xué)意義,也可以理解為二者存在質(zhì)

21、的區(qū)別。但即使檢驗(yàn)結(jié)果是P0.01甚至P0.001,都不說明差異相差很大,只表示更有把握認(rèn)為二者存在差異。假設(shè)檢驗(yàn)時(shí)應(yīng)注意的事項(xiàng)(一)要有嚴(yán)密的抽樣研究設(shè)計(jì);樣本必須是從同質(zhì)總體中隨機(jī)抽取的;要保證組間的均衡性和資料的可比性。(二)根據(jù)現(xiàn)有的資料的性質(zhì)、設(shè)計(jì)類型、樣本含量大小正確選用檢驗(yàn)方法。(三)對(duì)差別有無統(tǒng)計(jì)學(xué)意義的判斷不能絕對(duì)化,因檢驗(yàn)水準(zhǔn)只是人為規(guī)定的界限,是相對(duì)的。差別有統(tǒng)計(jì)學(xué)意義時(shí),是指無效假設(shè)h0被接受的可能性只有5%或不到5%,甚至不到1%,根據(jù)小概率事件一次不可能拒h0,但尚不能排除有5%或1%出現(xiàn)的可能,所以可能產(chǎn)生第一類錯(cuò)誤;同樣,若不拒絕h0,可能產(chǎn)生第二類錯(cuò)誤。(四)

22、統(tǒng)計(jì)學(xué)上差別顯著與否,與實(shí)際意義是有區(qū)別的。如應(yīng)用某藥治療高血壓,平均降低舒張壓0.5kpa,并得出差別有高度統(tǒng)計(jì)學(xué)意義的結(jié)論。從統(tǒng)計(jì)學(xué)角度,說明該藥有降壓作用,但實(shí)際上,降低0.5kpa是無臨床意義。因此要結(jié)合專業(yè)作出恰如其分的結(jié)論。第一類錯(cuò)誤與第二類錯(cuò)誤(名解 2選1)型錯(cuò)誤又稱第一類錯(cuò)誤(type error):拒絕了實(shí)際上成立的,為“棄真”的錯(cuò)誤,其概率通常用表示??扇挝惨部扇‰p尾,假設(shè)檢驗(yàn)時(shí)研究者可以根據(jù)需要確定值大小,一般規(guī)定0.05或0.01,其意義為:假設(shè)檢驗(yàn)中如果拒絕時(shí),發(fā)生型錯(cuò)誤的概率為5或1,即100次拒絕的結(jié)論中,平均有5次或1次是錯(cuò)誤的。型錯(cuò)誤又稱第二類錯(cuò)誤(typ

23、e error):不拒絕實(shí)際上不成立的,為“存?zhèn)巍钡腻e(cuò)誤,其概率通常用表示。只取單尾,假設(shè)檢驗(yàn)時(shí)值一般不知道,在一定情況下可以測(cè)算出,如已知兩總體的差值(如)、樣本含量和檢驗(yàn)水準(zhǔn)。以下圖說明兩類錯(cuò)誤:第四章為什么等級(jí)資料不可用方差分析?資料不相互獨(dú)立方差分析的基本思想 應(yīng)用條件(簡答)方差分析(analysis of variance,ANOVA )的基本思想就是根據(jù)資料的設(shè)計(jì)類型,即變異的不同來源將全部觀察值總的離均差平方和(sum of squares of deviations from mean,SS)和自由度分解為兩個(gè)或多個(gè)部分,除隨機(jī)誤差外,其余每個(gè)部分的變異可由某個(gè)因素的作用(或

24、某幾個(gè)因素的交互作用)加以解釋,如各組均數(shù)的變異SS 組間可由處理因素的作用加以解釋。通過各變異來源的均方與誤差均方比值的大小,借助F 分布作出統(tǒng)計(jì)推斷,判斷各因素對(duì)各組均數(shù)有無影響。方差分析的應(yīng)用條件(1) 各樣本是相互獨(dú)立的隨機(jī)樣本,且來自正態(tài)分布總體。(2) 各樣本的總體方差相等,即方差齊性(homoscedasticity)。第五章分類資料的統(tǒng)計(jì)描述(幾個(gè)常用相對(duì)數(shù)指標(biāo) 填空題)率(強(qiáng)度相對(duì)數(shù),頻率相對(duì)數(shù))、構(gòu)成比、相對(duì)比應(yīng)用相對(duì)數(shù)時(shí)應(yīng)注意的問題(簡答題 六條) 計(jì)算相對(duì)數(shù)的分母一般不宜過小。 分析時(shí)不能以構(gòu)成比代替率。 不能用構(gòu)成比的動(dòng)態(tài)分析代替率的動(dòng)態(tài)分析。 對(duì)觀察單位數(shù)不等的幾個(gè)

25、率,不能直接相加求其總率。 在比較相對(duì)數(shù)時(shí)應(yīng)注意可比性。 對(duì)樣本率(或構(gòu)成比)的比較應(yīng)隨機(jī)抽樣,并做假設(shè)檢驗(yàn)。率的標(biāo)準(zhǔn)化的基本思想,應(yīng)注意的問題(分析題)率的標(biāo)準(zhǔn)化的基本思想 :要比較兩個(gè)總率時(shí),發(fā)現(xiàn)兩組資料的內(nèi)部構(gòu)成(如年齡、性別構(gòu)成等)存在明顯不同,而且影響到了總率的結(jié)果,這時(shí)就不宜再直接比較總率,而應(yīng)考慮采用標(biāo)準(zhǔn)化法。標(biāo)準(zhǔn)化法的基本思想,就是采用統(tǒng)一的標(biāo)準(zhǔn)(統(tǒng)一的內(nèi)部構(gòu)成)計(jì)算出消除內(nèi)部構(gòu)成不同影響后的標(biāo)準(zhǔn)化率(調(diào)整率),然后再進(jìn)行比較。二、直接標(biāo)準(zhǔn)化法的計(jì)算方法當(dāng)已知所比較資料各組率Pi,可選用直接法計(jì)算標(biāo)化率。三、間接標(biāo)準(zhǔn)化死亡比的計(jì)算方法當(dāng)所比較的資料已知各自某現(xiàn)象總發(fā)生數(shù)r及各分

26、組觀察單位數(shù)時(shí),宜采用間接法計(jì)算標(biāo)化率。第六章二項(xiàng)分布,Piosson分布 在什么條件下接近正態(tài)分布(選擇或填空)第七章(考計(jì)算題)配對(duì)與完全隨機(jī)設(shè)計(jì)下的四格表的計(jì)算列四格表公式選擇給個(gè)例題把為研究靜脈曲張是否與肥胖有關(guān),觀察 122 對(duì)同胞兄弟,每對(duì)同胞兄弟中有一個(gè)屬肥胖,另一個(gè)屬正常體重,記錄得靜脈曲張發(fā)生情況見表8-2,試分析之。評(píng)析這是一個(gè)配對(duì)設(shè)計(jì)的資料,因此用配對(duì)檢驗(yàn)公式計(jì)算。第八章參數(shù)統(tǒng)計(jì)與非參數(shù)統(tǒng)計(jì)(名解 2選1)1 參數(shù)統(tǒng)計(jì)樣本所來自的總體分布具有某個(gè)已知的函數(shù)形式,而其中有的參數(shù)是未知的,統(tǒng)計(jì)分析的目的就是對(duì)這些未知的參數(shù)進(jìn)行估計(jì)或檢驗(yàn)。此類方法稱為參數(shù)統(tǒng)計(jì)。2 非參數(shù)統(tǒng)計(jì)樣

27、本所來自的總體分布難以用某種函數(shù)式來表達(dá), 還有一些資料的總體分布的函數(shù)式是未知的,只知道總體分布是連續(xù)型的或離散型的,解決這類問題的一種不依賴總體分布的具體形式的統(tǒng)計(jì)方法。由于這類方法不受總體參數(shù)的限制,故稱非參數(shù)統(tǒng)計(jì)法(non-parametric statistics),或稱為不拘分布(distribution-free statistics)的統(tǒng)計(jì)分析方法,又稱為無分布型式假定(assumption freestatistics)的統(tǒng)計(jì)分析方法。它檢驗(yàn)的是分布,而不是參數(shù)。非參數(shù)統(tǒng)計(jì)不需對(duì)總體分布(總體參數(shù))作出特殊假設(shè)。非參數(shù)統(tǒng)計(jì)的特點(diǎn)和適用范圍 (簡答)1特點(diǎn)(1)樣本所來自的總體

28、的分布形式為任何形式,甚至是未知的,都能適用。(2)收集資料方便,可用“等級(jí)”或“符號(hào)”來評(píng)定觀察結(jié)果。(3)多數(shù)非參數(shù)方法比較簡便,易于理解和掌握。(4)缺點(diǎn)是損失信息量,適用于參數(shù)統(tǒng)計(jì)法的資料用非參數(shù)統(tǒng)計(jì)方法進(jìn)行檢驗(yàn)將降低檢驗(yàn)效能。2適用范圍(1)等級(jí)資料。(2)偏態(tài)分布資料。當(dāng)觀察資料呈偏態(tài)或極度偏態(tài)分布而又未作變量變換,或雖經(jīng)變量變換仍未達(dá)到正態(tài)或近似正態(tài)分布時(shí),宜用非參數(shù)檢驗(yàn)。(3)各組離散程度相差懸殊,即方差明顯不齊,且不能變換達(dá)到齊性。(4)個(gè)別數(shù)據(jù)偏離過大,或資料為單側(cè)或雙側(cè)沒有上限或下限值。(5)分布類型不明。(6)初步分析。有些醫(yī)學(xué)資料由于統(tǒng)計(jì)工作量大,可采用非參數(shù)統(tǒng)計(jì)方法

29、進(jìn)行初步分析,挑選其中有意義者再進(jìn)一步分析(包括參數(shù)統(tǒng)計(jì)內(nèi)容)。(7)對(duì)于一些特殊情況,如從幾個(gè)總體所獲得的數(shù)據(jù),往往難以對(duì)其原有總體分布作出估計(jì),在這種情況下可用非參數(shù)統(tǒng)計(jì)方法。非參數(shù)檢驗(yàn)的優(yōu)缺點(diǎn):(簡答)非參數(shù)統(tǒng)計(jì)與傳統(tǒng)的參數(shù)統(tǒng)計(jì)相比,有以下優(yōu)點(diǎn):1、非參數(shù)統(tǒng)計(jì)方法要求的假定條件比較少,因而它的適用范圍比較廣泛。2、多數(shù)非參數(shù)統(tǒng)計(jì)方法要求的運(yùn)算比較簡單,可以迅速完成計(jì)算取得結(jié)果,因而比較節(jié)約時(shí)間。3、大多數(shù)非參數(shù)統(tǒng)計(jì)方法在直觀上比較容易理解,不需要太多的數(shù)學(xué)基礎(chǔ)知識(shí)和統(tǒng)計(jì)學(xué)知識(shí)。4、大多數(shù)非參數(shù)統(tǒng)計(jì)方法可用來分析如象由等級(jí)構(gòu)成的數(shù)據(jù)資料,而對(duì)計(jì)量水準(zhǔn)較低的數(shù)據(jù)資料,參數(shù)統(tǒng)計(jì)方法卻不適用。5

30、、當(dāng)推論多達(dá)3個(gè)以上時(shí),非參數(shù)統(tǒng)計(jì)方法尤具優(yōu)越性。但非參數(shù)統(tǒng)計(jì)方法也有以下缺點(diǎn):1、由于方法簡單,用的計(jì)量水準(zhǔn)較低,因此,如果能與參數(shù)統(tǒng)計(jì)方法同時(shí)使用時(shí),就不如參數(shù)統(tǒng)計(jì)方法敏感。若為追求簡單而使用非參數(shù)統(tǒng)計(jì)方法,其檢驗(yàn)功效就要差些。這就是說,在給定的顯著性水平下進(jìn)行檢驗(yàn)時(shí),非參數(shù)統(tǒng)計(jì)方法與參數(shù)統(tǒng)計(jì)方法相比,第類錯(cuò)誤的概率要大些。2、對(duì)于大樣本,如不采用適當(dāng)?shù)慕?,?jì)算可能變得十分復(fù)雜。注 意:凡符合或經(jīng)過變換后符合參數(shù)檢驗(yàn)條件的資料,最好用參數(shù)檢驗(yàn)。當(dāng)資料不具備參數(shù)檢驗(yàn)的條件時(shí),非參數(shù)檢驗(yàn)是一種有效的分析方法。配對(duì)設(shè)計(jì)的符號(hào)秩和檢驗(yàn)方法(簡答)(1)假設(shè):H0:差值總體中位數(shù)Md=0H1:Md

31、0 =0.05(2)求差值(3)編秩次:依差值的絕對(duì)值從小到大編秩次。編秩次時(shí)遇差數(shù)等于 0,舍去不計(jì),同時(shí)樣本例數(shù)減1;遇絕對(duì)值相等差數(shù),符號(hào)相同順次編秩次,符號(hào)相反取平均秩次,且符號(hào)相反。(4)求秩和并確定檢驗(yàn)統(tǒng)計(jì)量:分別求出正負(fù)秩次之和,正秩和以 T+表示,負(fù)秩和的絕對(duì)值以T-表示。T+及T-之和應(yīng)等于 n(n+1)/2,任取T+(或 T-)作檢驗(yàn)統(tǒng)計(jì)量T 。(5)確定 P 值和作出推斷結(jié)論:當(dāng) n50 時(shí),查 T 界值表,得出 P值。若檢驗(yàn)統(tǒng)計(jì)量T值在上、下界值范圍內(nèi),其 P值大于表上方相應(yīng)概率水平;若 T值在上、下界值上若范圍外,其 P值小于表上方相應(yīng)概率水平。第九章線性相關(guān)系數(shù)(名

32、解)線性相關(guān)系數(shù):表示兩個(gè)變數(shù)線性相關(guān)方向及程度的統(tǒng)計(jì)數(shù)或參數(shù)。又叫直線相關(guān)系數(shù),簡稱相關(guān)系數(shù)。,|R|的極值為1,|R|越大(接近1),則直線關(guān)系越好。線性相關(guān)系數(shù)取值范圍(填空)-1r1樣本相關(guān)系數(shù) r的假設(shè)檢驗(yàn)(填空題)(1)r 界值表法;(2)t檢驗(yàn)法。線性相關(guān)或回歸應(yīng)用應(yīng)注意的問題(簡答)作回歸分析和相關(guān)分析時(shí)要有實(shí)際意義,不能把毫無關(guān)聯(lián)的兩種現(xiàn)象作回歸、相關(guān)分析,必須對(duì)兩種現(xiàn)象間的內(nèi)在聯(lián)系有所認(rèn)識(shí)。在進(jìn)行回歸分析和相關(guān)分析之前,應(yīng)繪制散點(diǎn)圖。但觀察點(diǎn)的分布有直線趨勢(shì)時(shí),才適宜作回歸、相關(guān)分析。如果散點(diǎn)圖呈明顯曲線趨勢(shì),應(yīng)使之直線化再行分析。散點(diǎn)圖還能提示資料有無可疑異常點(diǎn)。直線回歸方程的應(yīng)用范圍一般以自變量的取值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論