護理研究 醫(yī)學統(tǒng)計學基礎與科研分析思路_第1頁
護理研究 醫(yī)學統(tǒng)計學基礎與科研分析思路_第2頁
護理研究 醫(yī)學統(tǒng)計學基礎與科研分析思路_第3頁
護理研究 醫(yī)學統(tǒng)計學基礎與科研分析思路_第4頁
護理研究 醫(yī)學統(tǒng)計學基礎與科研分析思路_第5頁
已閱讀5頁,還剩148頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、醫(yī)學統(tǒng)計學基礎知識內(nèi)容一、醫(yī)學統(tǒng)計學的定義二、統(tǒng)計學中的基本概念三、統(tǒng)計工作的步驟四、常見的抽樣分布 五、描述性指標六、總體參數(shù)的估計 七、假設檢驗一、醫(yī)學統(tǒng)計學的定義 統(tǒng)計學(statistics)是認識社會和自然界中隨機現(xiàn)象的數(shù)量特征的一門科學。自然界中存在的各種現(xiàn)象可歸納為兩類: 必然現(xiàn)象在一定條件下必然發(fā)生的現(xiàn)象。(一定條件下其發(fā)生與否是確定的) 隨機現(xiàn)象在同一條件下進行實驗,一次實驗結果不確定,而在一定數(shù)量的重復試驗后呈現(xiàn)統(tǒng)計規(guī)律性的現(xiàn)象。industrygovernmentbusinesseducationresearchfinancehealththe natural world

2、Statistics in .醫(yī)學統(tǒng)計學的定義醫(yī)學統(tǒng)計學 (medical statistics) 是運用概率論和數(shù)理統(tǒng)計學的原理與方法,研究醫(yī)學和衛(wèi)生學領域中隨機現(xiàn)象有關數(shù)據(jù)的搜集、整理、分析與推斷,進而闡明其客觀規(guī)律的一門應用科學。醫(yī)學統(tǒng)計學的定義二、統(tǒng)計學中的基本概念同質(zhì)與變異變量 總體與樣本抽樣誤差概率 同質(zhì)與變異 - 同質(zhì)(homogeneity) 影響研究指標較大的、可以控制的主要因素盡可能相同。 - 變異 (variation) 同質(zhì)基礎上的各觀察值間的差異稱為變異。 變異可理解為同質(zhì)基礎上的個體差異?;靖拍钭兞?- 變量 (variable)搜集資料時,先要根據(jù)研究目的確定同

3、質(zhì)觀察單位,再對每個觀察單位的某項特征進行測量或觀察,這種特征稱為變量。 - 變量值(value of variable) 變量的觀察結果或測量值稱為變量值,亦稱為資料(data) - 變量按其值的性質(zhì)可分為不同類型?;靖拍?變量 - 變量的類型數(shù)值變量 (numerical variable)分類變量(categorical variable) - 無序分類變量(unordered categorical variable) 二項分類(binomial)、多項分類(multinomial) - 有序分類變量(ordinal categorical variable) 基本概念 變量數(shù)值變量

4、 其變量值是定量的,表現(xiàn)為數(shù)值大小,多有度量單位。由數(shù)值變量的測定值構成的資料稱為計量資料(measurement data)或數(shù)值變量資料(numerical variable data)。 多數(shù)的數(shù)值變量為連續(xù)型變量,如身高、體重、血壓;但有的數(shù)值變量的測定值只是正整數(shù),如心率、白細胞計數(shù)等,在醫(yī)學統(tǒng)計學中也視為連續(xù)型變量?;靖拍?變量分類變量 表現(xiàn)為互不相容的類別或?qū)傩裕喾Q定性變量。- 無序分類變量的各類別或?qū)傩灾g無程度(或順序)上的差別;所得資料稱為計數(shù)資料(enumeration data)或無序分類變量資料(unordered categorical variable dat

5、a);又有二項分類和多項分類之分。- 有序分類變量的各類別之間有程度(或順序)的差別。所得資料稱為等級資料(ranked data)或有序分類變量資料(ordinal categorical variable data)。基本概念 變量 注意!變量類型不是一成不變的,可根據(jù)分析的需要進行轉化。 例,白細胞計數(shù)原屬數(shù)值變量 若按正常、異常分組,則為無序分類變量; 若按過低(10000)分組,則為有序分類變量。 分類變量也可數(shù)量化:有序分類變量可用0、1、2、3、4表示;無序分類變量可用啞變量(dummy variable)表示?;靖拍?總體與樣本 總體(population)根據(jù)研究目的所確定

6、的同質(zhì)研究對象中所有觀察單位某變量值的集合??傮w所包含的范圍隨研究目的的不同而變化。 在醫(yī)學科學研究中,研究對象可以是人、實驗動物、微生物等;觀察單位可以是一個地區(qū)、一個家庭、一個人、一只眼睛、一個細胞株、一個基因片段等。基本概念 總體與樣本 有限總體與無限總體在某特定的時間與空間范圍內(nèi),同質(zhì)研究對象的所有觀察單位的某變量值的個數(shù)為有限的,稱為有限總體 (finite population)。 總體是假設的,無時間和空間的限制,觀察單位數(shù)是無限的,稱為無限總體(infinite population)。 基本概念 總體與樣本樣本(sample)樣本是按隨機化原則從同質(zhì)總體中抽取的部分觀察單位其

7、變量值的集合。樣本須具有代表性?!按硇浴钡那疤崾莵碜酝|(zhì)總體、足夠的觀察單位數(shù)和隨機抽樣。樣本中所含的觀察單位個數(shù)稱為樣本含量 n 。隨機化原則通常是指總體中的每個個體都有同樣的機會被抽到樣本中;但不同的研究目的,所采用的抽樣方法不同,如單純隨機抽樣、系統(tǒng)抽樣、整群抽樣和分層抽樣等。基本概念 總體與樣本 抽樣研究的目的是用樣本信息去推斷總體特征。描述樣本特征的指標稱為統(tǒng)計量(statistics);描述總體特征的指標稱為參數(shù)(parameter)基本概念 抽樣誤差 抽樣誤差(sampling error) 由于個體變異的存在,抽樣研究時,樣本的統(tǒng)計量與總體參數(shù)往往不等;即使若干個樣本是從同一

8、總體中隨機抽取的,各樣本統(tǒng)計量也往往不等。這種因抽樣研究所引起的各統(tǒng)計量之間以及統(tǒng)計量與參數(shù)之間的差異,稱為抽樣誤差。 抽樣誤差在抽樣研究中是不可避免的,但只要遵循隨機化原則抽樣的話,抽樣誤差的大小是可以估計的?;靖拍?抽樣誤差基本概念 概率隨機事件概率小概率事件基本概念 概率隨機事件 (random event)對隨機現(xiàn)象進行實驗或觀察稱為隨機試驗(random trial)。隨機試驗的各種可能結果的集合稱為隨機事件(random event ),簡稱事件( event )。在一次隨機試驗中,某隨機事件可能發(fā)生,也可能不發(fā)生;但在一定數(shù)量的重復試驗后,某隨機事件的發(fā)生與否是有規(guī)律的?;靖?/p>

9、念 概率概率(probability)是描述隨機事件在一定條件下發(fā)生的可能性大小的一個度量,通常用P表示。對事件A,若有 ,則稱A為必然事件;若 ,稱A為不可能事件。隨機事件A的概率為 ?;靖拍?概率小概率事件(small probability event)若隨機事件A的概率 ,則稱隨機事件A為小概率事件。其統(tǒng)計學意義是小概率事件在一次隨機試驗中認為不可能發(fā)生。 “小概率”的標準 是人為規(guī)定的。在醫(yī)學統(tǒng)計學中,通常設 ;但對于可能引起嚴重后果的事件,如術中大出血等,可設 ,甚至更小?;靖拍钊⒔y(tǒng)計工作的步驟設計搜集資料整理資料分析資料 設計(design) 在保證科學性、可重復性和高效性

10、的前提下,為驗證研究假說而進行的周密安排。明確研究目的和研究假說,確定研究內(nèi)容、觀察對象與觀察單位、樣本含量和抽樣方法,擬定研究方案、預期分析指標、誤差控制措施、進度與費用。根據(jù)醫(yī)學研究類型,有調(diào)查設計和實驗設計之分。統(tǒng)計工作的步驟 搜集資料(collection of data)遵循統(tǒng)計學原理原則:及時、準確、完整來源:統(tǒng)計報表 經(jīng)常性工作記錄 專題調(diào)查(或?qū)嶒灒┵Y料儲存:所搜集的原始記錄,要妥善保存,并定期備份復制。統(tǒng)計工作的步驟 整理之前的資料稱為原始資料(raw data)目的:經(jīng)科學分組與歸納,使原始資料系統(tǒng)化、條理化,便于計算統(tǒng)計指標和分析。過程:準確性審查(邏輯審查與技術審查)和

11、完整性審查;擬定整理表,按照“同質(zhì)者合并,非同質(zhì)者分開”的原則對資料進行質(zhì)量分組,并在同質(zhì)基礎上根據(jù)數(shù)值大小進行數(shù)量分組;統(tǒng)計歸納。 整理資料(sorting data)統(tǒng)計工作的步驟 分析資料(analysis of data)目的 計算有關指標,反映數(shù)據(jù)的綜合特征,闡明事物的內(nèi)在聯(lián)系和規(guī)律。統(tǒng)計描述 (descriptive statistics)用描述性指標、統(tǒng)計表與統(tǒng)計圖等,對樣本資料的數(shù)量特征及其分布規(guī)律進行描述。統(tǒng)計推斷(inferential statistics)如何抽樣?如何用樣本信息推斷總體特征。統(tǒng)計分析時,要根據(jù)研究目的、設計類型、樣本含量、資料類型及其分布特征選擇恰當?shù)?/p>

12、統(tǒng)計指標和分析方法。統(tǒng)計工作的步驟四、常見的抽樣分布抽樣分布 分布和 分布N(,2)N(0,1)標準正態(tài)分布以固定樣本含量n抽樣N(,2/n)Xt 分布00抽樣分布t 值的分布稱為 t 分布,由于s 隨 n 的增大漸穩(wěn)定于,故 越大,t 分布越逼近 u 分布。抽樣分布抽樣分布抽樣分布t 分布的分位數(shù)( t 界值)/2/21-t/2,-t/2,陰影部分表示 的概率抽樣分布1-t,t 分布的分位數(shù)( t 界值)陰影部分表示 的概率抽樣分布抽樣分布二項分布(binomial distribution)二項分布的應用條件 試驗中只有對立的兩類結果,每一個觀察單位只能發(fā)生兩種對立結果之一(即兩分類資料)

13、; 已知其中一類結果的發(fā)生率為 ,其對立結果的發(fā)生率為 ; 在同一條件下,n 次試驗是相互獨立的,即各觀察單位的觀察結果相互獨立。抽樣分布抽樣分布 Poisson分布抽樣分布抽樣分布 五、描述性指標 需根據(jù)研究目的、資料類型及其分布、樣本含量選用恰當?shù)拿枋鲂灾笜?。?shù)值變量資料的描述性指標分類變量資料的描述性指標數(shù)值變量資料的描述性指標集中趨勢指標(central tendency)反映一組變量值的平均水平或中心位置。 - 均數(shù)、幾何均數(shù)、中位數(shù)、調(diào)和均數(shù)和眾數(shù)離散趨勢指標(dispersion tendency) 反映一組變量值的變異(分散)程度。 - 全距、四分位數(shù)間距、方差、標準差、變異系

14、數(shù)描述性指標集中趨勢指標(數(shù)值變量)均數(shù)(mean) 適用于正態(tài)及近似正態(tài)分布的數(shù)值變量資料。 符號:樣本均數(shù)( )、總體均數(shù)( ) 計算公式:直接法公式加權法公式(用于小樣本資料)(用于頻數(shù)表資料)描述性指標例 隨機抽取某地10名2030歲健康男性居民血清鐵含量分別為:6.58,7.42,15.32,15.78,17.60,17.98 ,15.21,17.53,20.11,22.64。試求其平均血清鐵含量。例 計算某地100名男大學生身高平均數(shù)描述性指標集中趨勢指標(數(shù)值變量)幾何均數(shù)(geometric mean) 適用于對數(shù)正態(tài)分布資料或等比級數(shù)資料。 符號:G 計算公式: 直接法(小樣

15、本資料)加權法(頻數(shù)表資料)描述性指標集中趨勢指標(數(shù)值變量)例 9名麻疹易感兒接種麻疹疫苗一個月后,其血凝抑制抗體滴度為: 1:4,1:8,1:16,1:32,1:64,1:128,1:256,1:512,1:1024。試求其平均滴度。9名麻疹易感兒的平均抗體滴度為1:64。描述性指標集中趨勢指標(數(shù)值變量)例 某地區(qū)50名麻疹易感兒童接種麻疹疫苗1個月后,測其血凝抑制抗體滴度,如表中(1)、(2)欄,求平均抗體滴度。其血凝抗體滴度的平均滴度為1:57。 描述性指標中位數(shù)(median) 適用于任何分布類型的數(shù)值變量資料,常用于偏態(tài)分布資料及頻數(shù)分布一端或兩端無確切數(shù)值的數(shù)值變量資料。符號:

16、M計算公式:加權法(頻數(shù)表資料)(n為奇數(shù)時)直接法(小樣本資料)(n為偶數(shù)時)描述性指標集中趨勢指標(數(shù)值變量)例 5名成年男子的體重(kg)分別為 60、70、75、80、90,求中位數(shù) 例 6名成年男子的體重(kg)分別為 60,70, 75,80,82,90,求中位數(shù) =(X3+X4)/2=(75+80)/2=77.5(kg)=75(kg)描述性指標集中趨勢指標(數(shù)值變量)例 某疾病控制中心記錄了199名沙門氏菌屬食物中毒患者發(fā)病的潛伏期,并整理成表2-3中(1)、(2)欄,試計算其平均發(fā)病潛伏期。 (h)描述性指標離散趨勢指標(數(shù)值變量)全距(range) 亦稱極差,適用于任何分布類

17、型的資料。 符號:R 計算公式:描述性指標四分位數(shù)間距(quartile range) 適用資料類型同中位數(shù)。符號:Q或QR計算公式:描述性指標離散趨勢指標(數(shù)值變量)方差 (variance) 適用于正態(tài)和近似正態(tài) 分布資料計算公式:符號: ,樣本方差 總體方差描述性指標離散趨勢指標(數(shù)值變量)標準差(standard deviation) 適用于正態(tài)和 近似正態(tài)分布資料計算公式:符號: ,樣本標準差 總體標準差直接法(小樣本資料)加權法(小樣本資料)描述性指標離散趨勢指標(數(shù)值變量)例 求表2-1中100名18歲男大學生身高的標準差。 描述性指標離散趨勢指標(數(shù)值變量)描述性指標離散趨勢指

18、標(數(shù)值變量)變異系數(shù)(coefficient of variation)適用于比較度量單位不同或均數(shù)相差懸殊的兩組(或多組)資料的變異度。符號:CV計算公式:描述性指標離散趨勢指標(數(shù)值變量)分類變量資料的統(tǒng)計描述相對數(shù):兩個有關數(shù)值之比稱為相對數(shù)常用的相對數(shù):構成比、率、相對比描述性指標構成比(proportion),又稱構成指標,它說明某事物(或現(xiàn)象)內(nèi)部各組成部分所占的比重或分布,常以百分數(shù)表示。計算公式: 注意:所有組成部分的構成比之和應等于100%; 同一事物內(nèi)部各組成部分的構成比,計算時 小數(shù)點后保留位數(shù)應相同。描述性指標分類變量資料率(rate),又稱頻率指標或強度指標,它說明

19、某現(xiàn)象發(fā)生的頻率或強度。計算公式:式中,K為比例基數(shù),常用的K 有100%或1000、 10000/萬、100000/10萬等。選擇K的要點:根據(jù)習慣用法以便于比較,如治愈率、某病病死率、人工流產(chǎn)率等用百分率;出生率、嬰兒死亡率等用千分率;惡性腫瘤死亡率用十萬分率;使算得的率至少保留12位整數(shù)。描述性指標分類變量資料相對比(relative ratio),亦稱比(ratio),是A、B 2個有關指標之比,說明A為B的若干倍或百分之幾。A、B兩個指標可以是性質(zhì)相同的,也可以是性質(zhì)不同的;兩個指標可以是絕對數(shù),也可以是相對數(shù)或平均數(shù)。計算公式為:描述性指標分類變量資料A、B為同類指標時,相對比用以

20、說明兩事物的相對水平。常以百分數(shù)或倍數(shù)表示,如人口出生性別比、兩病區(qū)病床數(shù)之比。流行病學中常用: 相對危險度(RR)、比數(shù)比(OR)也為此類。A、B為不同類指標時,如人口密度(人/平方公里)、醫(yī)生數(shù)/千人口、病床數(shù)/千人口、小鼠肝重與體重之比、變異系數(shù)等。相對比是相對數(shù)的最簡單形式,常用于動態(tài)數(shù)列的分析。描述性指標分類變量資料描述性指標分類變量資料 應用相對數(shù)時應注意的問題計算相對數(shù)的分母不宜過小 當分母觀察例數(shù)足夠多時,計算的相對數(shù)比較穩(wěn)定,能夠正確反映實際情況;當分母觀察例數(shù)很少(如少于30)時,易受偶然因素的影響,不宜計算相對數(shù),可用絕對數(shù)表示。如必須計算率,應同時列出可信區(qū)間。某文章報

21、道“5 名患者, 治愈3 人, 治愈率為60%”。該結論恰當否?分析: 該結論不恰當,當觀察例數(shù)很少時, 分子每改變一個單位對結果的影響很大, 此時不宜計算相對數(shù), 直接用絕對數(shù)描述即可。描述性指標分類變量資料分析時不能以構成比代替率 構成比是說明某現(xiàn)象中各組成部分的比重或分布的指標,率則反映某現(xiàn)象發(fā)生的頻率或強度的指標。應用時兩者不能混淆。 描述性指標分類變量資料以比代率應用相對數(shù)的注意事項描述性指標觀察單位數(shù)不等的幾個率,不能直接相加求其平均率 對觀察單位數(shù)不等的幾個率求平均率時,要用各率的分子之和與分母之和來計算?!坝媚朝煼ㄖ委煾窝? 甲醫(yī)院治療150 人,治愈30 人, 治愈率為20%

22、; 乙醫(yī)院治療100 人, 治愈30 人, 治愈率為30%。則兩個醫(yī)院平均治愈率為( 20%+30%) /2=25%。”上述計算方法有無問題?分析: 該作者平均率的計算方法有誤。兩個醫(yī)院共治療250 人, 其中治愈60 人, 則平均治愈率為60/250=24%。應用相對數(shù)的注意事項描述性指標分類變量資料比較相對數(shù)時應注意其可比性 影響率和構成比的因素很多。兩個或多個率(構成比)比較時,各組間除研究因素外,其它影響因素要基本相同,即各組間要具有可比性。 注意: 各組的研究對象要同質(zhì),研究方法要相同,觀察時間 相等以及內(nèi)外環(huán)境條件相近。 所比較資料的內(nèi)部構成要相同。 同一地區(qū)不同時期資料的對比,應

23、注意客觀條件有無變化。應用相對數(shù)的注意事項描述性指標分類變量資料對樣本率(或構成比)的比較應遵循隨機抽樣,并做假設檢驗 遵循隨機抽樣的原則才能保證樣本具有代表性,才能用該樣本信息推斷總體特征。 抽樣研究中,樣本率或構成比也存在抽樣誤差,因此在比較兩個或多個率(構成比)時,要做假設檢驗。應用相對數(shù)的注意事項描述性指標分類變量資料六、總體參數(shù)的估計數(shù)值變量資料 - 總體均數(shù)的估計 - 總體幾何均數(shù)的估計 - 總體中位數(shù)的估計分類變量資料 - 總體率的估計 - 總體平均數(shù)的估計總體均數(shù)的估計點值估計 (point estimation) : 用樣本均數(shù) 作為總體均數(shù) 的點值估計。由于抽樣誤差的存在,

24、 往往不等于 。 區(qū)間估計 (interval estimation) : 按一定的概率100(1)%估計總體均數(shù) 所在的范圍,亦稱可信區(qū)間 (confidence interval, CI)。 常取95%和99%的可信度,即95%CI和99%CI。 總體參數(shù)估計數(shù)值變量資料總體均數(shù)的區(qū)間估計未知且n 小時, 按 t 分布原理計算, 總體均數(shù)(1-)100%的可信區(qū)間為:未知,但 n足夠大時( n 100),t 分布近似 u 分布,按正態(tài)分布的原理估計可信區(qū)間。總體 均數(shù)(1-)100%的可信區(qū)間為:總體參數(shù)估計數(shù)值變量資料總體均數(shù)的區(qū)間估計已知時,按正態(tài)分布的原理估計可信區(qū)間。總體均數(shù)(1-

25、)100%的可信區(qū)間為:總體參數(shù)估計數(shù)值變量資料由20名18歲男大學生身高均數(shù)資料得, cm, cm,試估計該地18歲男大學生身高總體均數(shù)的95%可信區(qū)間。 n = 20 ,且 未知,雙側 即該地18歲男大學生身高總體均數(shù)的95%可信區(qū)間為170.70173.80cm 總體參數(shù)估計總體均數(shù)的區(qū)間估計數(shù)值變量資料總體幾何均數(shù)的估計點值估計 用樣本幾何均數(shù)作為總體幾何均數(shù)的點值估計。區(qū)間估計 總體參數(shù)估計數(shù)值變量資料總體中位數(shù)的區(qū)間估計 先求第50百分位數(shù)的上、下限: 下限 上限 再按 分別求 和總體參數(shù)估計數(shù)值變量資料總體率的估計點值估計:p 為 的點值估計。 由于抽樣誤差的存在,p 往往不等于

26、 ,故通常用區(qū)間估計。區(qū)間估計:根據(jù)樣本含量n的大小以及 p 是否遠離0.5,可用查表法和正態(tài)近似法??傮w參數(shù)估計分類變量資料總體率的區(qū)間估計-查表法當樣本含量n較小,如 ,特別是 p 很接近于0或1 (遠離0.5)時,根據(jù) n 和陽性數(shù) X 查 “百分率的可信區(qū)間”表。某醫(yī)院眼科醫(yī)生用某種方法矯正30名近視眼患者的視力,其中8人近期有效,求該法近期有效率的95%CI。注意:由于附表7中X值只列出了 的部分, 當 時,應以 查表,再從100中減去查得的數(shù)值即為所求可信區(qū)間??傮w參數(shù)估計分類變量資料總體率的區(qū)間估計-正態(tài)近似法當樣本含量 n 足夠大(如 ),且樣本率p和 1-p均不太小,一般 n

27、 p 與n(1-p)均大于5時,樣本率 p 的抽樣分布近似正態(tài)分布,可用正態(tài)近似法。總體率 的可信區(qū)間可按下式進行估計 : 95CI為總體參數(shù)估計分類變量資料在某鎮(zhèn)按人口的1/20隨機抽取520人,作漢坦病毒IgG抗體滴度實驗,得腎綜合癥出血熱隱性感染率為5.17,求該鎮(zhèn)人群中腎綜合癥出血熱隱性感染率的95%可信區(qū)間。本例 P=0.0517,該鎮(zhèn)人群中腎綜合癥出血熱隱性感染率的95%可信區(qū)間為3.27%7.07%。 總體參數(shù)估計分類變量資料總體率的區(qū)間估計-正態(tài)近似法總體平均數(shù)的估計點值估計:以 X 作為為 的點值估計。 由于抽樣誤差的存在,X往往不等于 ,通常用區(qū)間估計。區(qū)間估計:根據(jù)樣本平

28、均數(shù)X是否大于50,可用 查表法和正態(tài)近似法??傮w參數(shù)估計分類變量資料總體平均數(shù)區(qū)間估計-查表法當樣本陽性數(shù) 時,用 查Poisson分布 的可信區(qū)間,可得總體平均數(shù) 的95%或99%可信區(qū)間。 例 將一個面積為100cm2的培養(yǎng)皿置于病房中,1h后取出,培養(yǎng)24h,查得8個菌落,試估計該病房平均每100cm2細菌數(shù)的95CI。 本例 ,查附表4 ,得 的95%下限為3.4,上限為15.8,即該病房平均每100cm2細菌數(shù)的95可信區(qū)間為3.415.8??傮w參數(shù)估計分類變量資料總體平均數(shù)區(qū)間估計-正態(tài)近似法當樣本陽性數(shù) 時,可按正態(tài)近似法估計 的可信區(qū)間: 總體參數(shù)估計分類變量資料總體平均數(shù)區(qū)

29、間估計-正態(tài)近似法用計數(shù)器測得某放射性物質(zhì)2小時內(nèi)發(fā)出的脈沖數(shù)為400個, 據(jù)此估計該放射性物質(zhì)平均每小時發(fā)出的脈沖數(shù)的95%可信區(qū)間。x=400,則平均每 2小時發(fā)出的脈沖數(shù)的95%CI為:平均每小時發(fā)出的脈沖數(shù)的95%CI為總體參數(shù)估計分類變量資料七、假設檢驗假設檢驗的基本思想與步驟假設檢驗的數(shù)值變量資料的假設檢驗 - t 檢驗與u 檢驗 - 方差分析分類變量資料的假設檢驗 - 服從二項分布與poisson分布的假設檢驗 - 卡方檢驗秩和檢驗 由于個體變異的普遍存在,抽樣研究時,不可避免地存在著抽樣誤差。當根據(jù)樣本資料求出樣本統(tǒng)計量后,遇到樣本統(tǒng)計量與某一總體參數(shù)不等,或兩個(多個)樣本統(tǒng)

30、計量不等時,首先要考慮到抽樣誤差的問題,還要考慮到樣本統(tǒng)計量可能不是來自該總體。即有兩種可能性:一種可能:樣本是從該總體(或同一總體)中隨機抽取的,其差異僅僅是由抽樣誤差造成的;另一種可能:樣本不是從該總體(或同一總體)中隨機抽取的,而是有本質(zhì)上的不同,單純用抽樣誤差解釋不了。 如何判斷?需進行假設檢驗。 假設檢驗假設檢驗的基本思想假設檢驗假設檢驗的基本思想假設檢驗假設檢驗的基本思想 2確定單、雙側檢驗 根據(jù)研究目的或?qū)I(yè)知識確 定單側檢驗(one-sided test)或雙側檢驗(two-sided test)。單側檢驗要注明 假設檢驗假設檢驗的基本步驟(一)建立假設和確定檢驗水準(二)選定

31、檢驗方法和計算統(tǒng)計量 根據(jù)研究目的、設計類型、資料類型及其分布特征等選用適當?shù)慕y(tǒng)計檢驗方法,并計算出相應的檢驗統(tǒng)計量。 假設檢驗假設檢驗的基本步驟假設檢驗假設檢驗的基本步驟假設檢驗數(shù)值變量資料的假設檢驗 t 檢驗假設檢驗 t 檢驗-數(shù)值變量假設檢驗 t 檢驗-數(shù)值變量單樣本 t 檢驗 ( one sample t-test)假設檢驗 t 檢驗-數(shù)值變量單樣本 t 檢驗隨機測得26名男性汽車司機的脈搏平均數(shù)為73.7次/分,標準差為8.8/分。據(jù)此能否認為男性汽車司機的脈搏平均數(shù)高于一般男性脈搏數(shù)(72次/分)?假設檢驗 t 檢驗-數(shù)值變量單樣本 t 檢驗假設檢驗 t 檢驗-數(shù)值變量配對t 檢驗

32、(paired t-test for dependent samples ) t 檢驗-數(shù)值變量配對t 檢驗假設檢驗 t 檢驗-數(shù)值變量配對t 檢驗假設檢驗假設檢驗 t 檢驗-數(shù)值變量配對t 檢驗 t 檢驗-數(shù)值變量配對t 檢驗假設檢驗兩樣本t 檢驗(two-sample/group t-test for independent samples)假設檢驗 t 檢驗-數(shù)值變量假設檢驗 t 檢驗-數(shù)值變量兩樣本t 檢驗 u檢驗數(shù)值變量資料的假設檢驗假設檢驗假設檢驗單樣本u 檢驗(one sample u test) u檢驗-數(shù)值變量假設檢驗兩樣本u 檢驗 two-sample u-test for

33、 independent samples u檢驗-數(shù)值變量 用途:兩個或多個樣本均數(shù)間的比較分析兩個或多個因素間的交互作用直線回歸方程的假設檢驗多元線性回歸方程的假設檢驗兩個方差的齊性檢驗假設檢驗數(shù)值變量資料的假設檢驗 方差分析 應用條件:方差分析的應用條件基本同 檢驗:各樣本是相互獨立的隨機樣本;各樣本來自正態(tài)分布總體;各總體方差相等,即 。假設檢驗 方差分析-數(shù)值變量假設檢驗分類變量資料的假設檢驗假設檢驗分類變量資料的假設檢驗 檢驗假設檢驗 檢驗-分類變量假設檢驗 檢驗-分類變量假設檢驗 檢驗-分類變量 屬非參數(shù)檢驗。 常用的方法有:配對設計的符號秩和檢驗成組設計的兩樣本比較的秩和檢驗成組設計的多樣本比較的秩和檢驗隨機區(qū)組設計資料的秩和檢驗假設檢驗秩和檢驗假設檢驗時應注意的事項 1.要有嚴密的抽樣研究設計 樣本必須是從同質(zhì)總體中隨機抽取的;要保證組間的均衡性和資料的可比性,即對比組間除處理因素(如新藥和常規(guī)藥)外,非處理因素(如年齡、性別、病程、病情輕重等)應盡可能相同。2.正確選

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論