版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
最新資料推薦1/1口腔統(tǒng)計臨床研究資料統(tǒng)計分析方法-1課件臨床研究資料統(tǒng)計分析方法-1基本內容統(tǒng)計描述:
反映樣本結果的基本特征統(tǒng)計圖表(各類表格或圖示)基本指標(均數(shù)/標準差;率、構成比)統(tǒng)計推斷:
樣本推斷總體參數(shù)參數(shù)估計(點估計及其95%可信區(qū)間)假設檢驗:
差別(均數(shù)、率)推斷;相關性推斷。
FrancisGaltonKarlPearson貢獻:
重要術語和方法,包括SD、相關與回歸、卡方檢驗等1890-1920RonaldFisher貢獻:
小樣本統(tǒng)計推斷方法、假設檢驗、確切概率法、方差分析(1915-33)JerzyNeymanEgonPearson貢獻:
I、II型錯誤;檢驗效能Power可信區(qū)間(置信)(1937-1949)AbrahamWald貢獻:
統(tǒng)計決策理論1950-生物統(tǒng)計在國內外臨床研究中的應用1747年英國Lind醫(yī)生對船員壞血病進行干預研究。
1835年法國研究者Louis對放血療法治療肺炎進行研究,否定了該種療法。
1948年在英國發(fā)表了用鏈霉素治療肺結核的隨機對照試驗報告,使用生物統(tǒng)計方法進行分析。
1960年Doll和Hill等利用隊列研究首次證實了肺癌與吸煙有關,RR=23.7。
1948年原四軍大郭祖超教授編寫出版了全國首部教材《醫(yī)學與生物統(tǒng)計方法》FrancisGaltonKarlPearson貢獻:
重要術語和方法,包括SD、相關與回歸、卡方檢驗等1890-1920RonaldFisher貢獻:
小樣本統(tǒng)計推斷方法、假設檢驗、確切概率法、方差分析(1915-33)JerzyNeymanEgonPearson貢獻:
I、II型錯誤;檢驗效能Power可信區(qū)間(置信)(1937-1949)AbrahamWald貢獻:
統(tǒng)計決策理論1950-BIGDATA大數(shù)據(jù)隨著云計算、物聯(lián)網(wǎng)等新技術的推廣應用,大量新型數(shù)據(jù)、種類多元化數(shù)據(jù)出現(xiàn),數(shù)據(jù)量呈爆炸式增長;全球大數(shù)據(jù)時代:
220萬TB/day+++。
(相當于3億張DVD)兆字節(jié)(megabyte,MB)吉字節(jié)(gigabyte,GB)太字節(jié)(terabyte,TB)1PB(Petabyte拍)=1024TB;1EB(Exabyte艾)=1024PB;1ZB(Zettabyte澤)=1024EB;1YB(Yottabyte堯)=1024ZB;1BB(Brontobyte布)=1024YB。
日漸成熟的數(shù)字技術和網(wǎng)絡技術,可采集C、傳輸T、存儲S、隨時調用全球范圍內的一切信息S,而對這些大數(shù)據(jù)用不同的工具和算法進行計算統(tǒng)計A、歸類加工C,挖掘出其中的規(guī)律、結論,并用以指導人類的活動,將改變世界。
云物移大智時代。
云是云計算物是物聯(lián)網(wǎng)移是移動互聯(lián)大是大數(shù)據(jù)智是智慧城市或智慧地球。
5V+3S+2C+1T+1A大數(shù)據(jù)(bigdata)的定義與特點定義:
是指體量龐大且數(shù)據(jù)類型復雜多樣的數(shù)據(jù)集,難以用傳統(tǒng)數(shù)據(jù)庫工具對其內容進行截取、管理、處理、并整理成為人類所能解讀的信息。
特點:
4個V‖Volume(體量巨大)Variety(類型多樣)Value(密度低、價值高)Velocity(處理速度快):
時效性。
JGinsbergetal.Nature000,1-3(2008)doi:10.1038/nature07634Acomparisonofmodelestimatesforthemid-Atlanticregion(black)againstCDC-reportedILIpercentages(red),includingpointsoverwhichthemodelwasfitandvalidated.通過Google搜索流感相關主題的人數(shù)與實際患有流感癥狀的人數(shù)之間存在著密切的關系:
bigdata大數(shù)據(jù)研究成功案例大數(shù)據(jù)研究成功案例啤酒+尿布的數(shù)據(jù)分析成果早已成了大數(shù)據(jù)技術應用的經(jīng)典案例。
塔吉特百貨就是靠著分析用戶所有的購物數(shù)據(jù),然后通過相關關系分析得出事情的真實狀況。
明尼蘇達州一家塔吉特門店被客戶投訴,一位中年男子指控塔吉特將嬰兒產(chǎn)品優(yōu)惠券寄給他的女兒-一個高中生。
但很快又來電道歉,確實懷孕了。
大數(shù)據(jù)分析的方法學挑戰(zhàn)對于大數(shù)據(jù)分析,常規(guī)統(tǒng)計分析方法往往無能為力:
大數(shù)據(jù)對科學研究方法論的變革(因果性相關性),線性因果分析往往僅適合于基于小數(shù)據(jù)的、簡單封閉的系統(tǒng),開放復雜的大數(shù)據(jù)系統(tǒng)時,尋找線性因果往往徒勞無功(全基因組關聯(lián)研究,GWAS)關聯(lián)分析:
machine-learning,―reverseengineeringandforwardsimulation‖(REFS).無預設假設的因果分析:
貝葉斯網(wǎng)絡分析(Bayesiannetworkanalysis:hypothesis-freeprobabilisticcausalapproaches)GOINGHYPOTHESIS-FREE:
不預設假設,lettingthetechnologyrunwildandseeingwhatitcomesupwith。
讓數(shù)據(jù)說話臨床研究的基本數(shù)據(jù)類型計量資料數(shù)值變量資料numericaldata計數(shù)資料分類變量資料categoricaldata二分類變量資料binarydata有序多分類變量資料等級資料ordinaldata無序多分類變量資料nominaldata變量類型的判斷病例號年齡(歲)性別身高(m)血型心電圖尿WBC職業(yè)RBC1012/L135女1.65A正常-教師4.67244男1.74B正常-工人5.21326男1.80O正常+職員4.10425女1.61AB正常+農(nóng)民3.92541男1.71A異常++工人3.49645女1.58B正常++工人5.48750女1.60O異常++干部6.78828男1.76AB正常+++干部7.10931女1.62O正常+軍人5.24基于不同資料分型的分析方法數(shù)值變量資料(計量資料)統(tǒng)計描述(頻數(shù)表/直方圖、均數(shù)/標準差)統(tǒng)計推斷(均數(shù)估計、t和u檢驗)分類變量資料(計數(shù)資料)統(tǒng)計描述(頻數(shù)表/直條圖、率/比)統(tǒng)計推斷(總體率估計、卡方檢驗)中華醫(yī)學系列雜志80篇治療性研究的論文使用統(tǒng)計方法匯總統(tǒng)計方法篇數(shù)比例t檢驗290.36卡方檢驗230.29秩和檢驗100.13其他26未做統(tǒng)計分析13注:
2019年測評結果,BMJ44%(t檢驗)評價實例[CJIM;16(5)]假設檢驗頻數(shù)頻率(100%)t檢驗13062%方差分析3115%卡方檢驗2713%秩和檢驗178%生存分析10.5%直線回歸/相關10.5%未做假設檢驗21%合計209100%未見多元分析方法使用評價實例[CJIM;16(5)]假設檢驗頻數(shù)正確率錯誤t檢驗13026%方法不當:
重復測量方差分析\方差分析方差分析3194%數(shù)據(jù)類型混用、未考慮設計方案卡方檢驗2774%P、FISHER、生存分析、秩和檢驗、檢驗水準未校正秩和檢驗1712%重復測量生存分析11/1直線回歸/相關10/1回歸、相關混淆未做假設檢驗2合計209一、計量資料的統(tǒng)計描述及結果表達統(tǒng)計圖表:
頻數(shù)表、直方圖、箱圖定量描述臨床研究中對于服從正態(tài)分布者用均數(shù)標準差;服從對數(shù)正態(tài)分布者改用幾何均數(shù)對于其它不服從以上分布者,用中位數(shù)和四分位間距(IQR)表達(interquartilerange,IQR)血清總膽固醇(mmol/L)6.005.004.003.002.00正態(tài)性判斷正態(tài)性檢驗:判斷資料是否服從正態(tài)分布。
正態(tài)性檢驗偏度系數(shù)(Skewness)峰度系數(shù)(Kurtosis)W檢驗或D檢驗法(Shapiro-Wilk/DAgostino)圖形法(P-P圖/Q-Q圖)正態(tài)性判斷正態(tài)性判斷其它判斷方法:
比較均數(shù)與中位數(shù)(收入差距)比較均數(shù)與標準差(均數(shù)1S或2S中樣本例數(shù))借助醫(yī)學專業(yè)知識對資料的正態(tài)性進行估計。
(齲齒數(shù)、患者年齡)某地居民發(fā)汞含量的頻數(shù)直方圖22.018.014.010.06.02.0頻數(shù)3020100Std.Dev=4.99Mean=8.0N=86.00患者頭孢唑啉鈉藥物動力學參數(shù)組別(h-1)老年組(n=7)0.620.1260歲以下組(n=5)3.553.56二、計量資料的假設檢驗t檢驗u檢驗t檢驗方差分析秩和檢驗規(guī)則一:
與比較組別和設計類型有關數(shù)值資料兩組間的比較可以考慮使用t、u、方差分析、t檢驗或者秩和檢驗。
結合不同的設計類型又分為:
樣本與總體比較、配對設計、兩組完全隨機設計的假設檢驗。
數(shù)值資料三組及三組以上間的比較則不能使用t檢驗和u檢驗。
可考慮使用方差分析、秩和檢驗等方法。
結合不同的設計類型又進一步分為:
多組成組設計、配伍設計、析因設計、交叉設計等設計方案假設檢驗。
規(guī)則二:
與樣本含量有關當樣本含量n較大時,其抽樣分布服從正態(tài)分布(中心極限定理):
*可考慮使用u檢驗當樣本含量n較小時,其抽樣分布服從t分布;*可考慮使用t檢驗當樣本含量n較小時,若樣本來源于偏態(tài)或未知分布,其抽樣分布未知。
*則不能使用t、u檢驗,選用秩和檢驗n=30/40/50/60/100?規(guī)則三:
選用假設檢驗方法當且僅當用樣本均數(shù)推斷總體均數(shù)比較是否相等時;否則可直接或校正后比較。
我校2019級研究生統(tǒng)計成績男生(210人)80分6分我校2019級研究生統(tǒng)計成績女生(190人)88分6分男生抽取20人866分女生20人806分總體樣本t檢驗概述1908年,統(tǒng)計學家戈塞特(WilliamGosset)以Student筆名發(fā)表他發(fā)現(xiàn)統(tǒng)計量t的分布,他指出若X為正態(tài)分布,則t為自由度n-1的studentt分布;開創(chuàng)了小樣本統(tǒng)計推斷的新紀元。
1926年,由費雪(Fisher)加以嚴格證明.當未知,尤其當樣本數(shù)n值很小時,非常適宜采用t分布。
t檢驗是以t分布為理論基礎,以t值為統(tǒng)計量的假設檢驗方法,適用于例數(shù)較少,來源于正態(tài)分布資料.ttXX0t分布=(標準正態(tài)分布:
u分布)=30=5Gosset假設檢驗目的:
推斷一個樣本所代表的未知總體均數(shù)與已知總體均數(shù)0(常為理論值或標準值)有無差別。
應用條件:
已知樣本服從正態(tài)分布一)單樣本與總體比較的t檢驗實例分析:
36名一線抗SARS醫(yī)生的血紅蛋白含量(150.8310.5)是否不同于一般水平?150.83g/l140g/l150.83~=140推斷總體兩總體均數(shù)相等H0兩總體均數(shù)不等P值小概率事件拒絕H0不拒絕H0假設檢驗基本思想小概率+反證法1:
建立假設,確定檢驗水準H0:
=140g/LH1:
140g/L檢驗水準=0.052:
選定t檢驗,計算統(tǒng)計量統(tǒng)計量t=4.11,自由度=353:
確定P值,作出推斷結論P0.001,按照=0.05水準,拒絕H0,接受H1,可以認為臨床一線醫(yī)生的血紅蛋白含量高于一般水平。
(自由度為36-1)95%可信區(qū)間:
146.8153.6(g/L),而一般水平為140g/L。
是一種比較獨特的設計方式,能很好控制非實驗因素對結果的影響,有以下類別:
①對同對兩個受試對象分別給予不同處理(異體配對);②對同一受試對象分別給予不同處理(自身配對),目的都是推斷兩種處理的效果有無差別(窩溝封閉)二)配對設計的t檢驗檢驗目的、資料特點與應用條件假設檢驗目的:
推斷兩總體均數(shù)相等,即配對差值的總體均數(shù)是否等于0‖。
兩組比較的配對計量資料,檢驗效能較高。
應用條件:
配對差值服從正態(tài)分布。
實例分析某單位研究飲食中缺乏維生素E與肝中維生素A含量的關系,將同種屬的大白鼠按性別相同,年齡、體重相近者配成對子,共8對,并將每對中的兩只動物隨機分到正常飼料組和維生素E缺乏組,過一定時期將大白鼠殺死,測得其肝中維生素A的含量,見下表,問不同飼料的大白鼠肝中維生素A含量有無差別?不同飼料大白鼠肝中維生素A含量大白鼠對號正常飼料組VE缺乏組差值1355024501100220192400-400330001800120043950320075053800325055063750270010507345025009508305017501300合計6500差值均數(shù)=6500/8=812.5s=546.25(1)建立假設H0:
d=0,即差值的總體均數(shù)為0‖,不同飼料的大白鼠肝中維生素A含量相同。
H1:
d0,即差值的總體均數(shù)不為0‖,不同飼料的大白鼠肝中維生素A含量不相同。
檢驗水準=0.05(雙側)(2)計算統(tǒng)計量t=d-Sd/n=812.5546.25/8=4.207自由度v(對子數(shù)減-1)=8-1=7(3)確定P值,作出結論查t界值表,t0.05,7=2.365,tt0.05,7,得P0.05,按=0.05水準,拒絕H0,接受H1,可認為兩種飼料所得肝中維生素A含量有差別,即維生素E缺乏對大白鼠肝中維生素A含量有影響。
注意當樣本含量n較大時,可用u檢驗.三)成組設計的t檢驗成組設計又稱為完全隨機設計假設檢驗目的:
推斷兩個樣本所代表的總體均數(shù)是否相等。
資料特點:
成組設計兩組比較的計量資料應用條件:
(1)兩獨立樣本均來自服從正態(tài)分布總體(2)兩獨立樣本的總體方差齊性(方差相等)實例分析目的:觀察伢典(Carisolv)去腐法治療老年人根面齲的療效及對老年人血壓、心率、治療心理反應的影響。
方法:選擇老年根面齲患者64例,隨機分為伢典(Carisolv)治療組和對照組。
伢典(Carisolv)治療組30例,采用伢典(Carisolv)去腐法治療患牙;對照組34例,采用傳統(tǒng)牙鉆去腐法治療患牙,比較2種方法的治療效果,并且去腐前后測量患者血壓、心率及了解患者對治療的心理反應,采用統(tǒng)計學方法進行比較。
結果:2組患者治療1年后復查,成功率無統(tǒng)計學差異(P0.05);2組患者去腐治療前后血壓、心率的變化及對治療的心理反應有統(tǒng)計學差異(P0.05)。
結論:伢典(Carisolv)對老年人根面齲的治療安全、有效,可大大降低患者對口腔治療的緊張和恐懼,有利于維護老年人的牙齒健康。
(1)建立假設H0:
1=2兩組去腐后DBP變化總體均數(shù)相等。
H1:
12兩組去腐后DBP變化總體均數(shù)不等。
檢驗水準:
=0.05(雙側)(2)計算統(tǒng)計量t=X--1-X--2SX1---X2--=3.89-9.830.827=-6.5,n=n1+n2-2=62SX1---X2--=(3.13)2(30-1)+(4.02)2(34-1)30+34-2(130+134)=0.827(3)確定P值,作出結論查t界值表t0.05,62=1.99,tt0.05,62P0.05,按=0.05水準,拒絕H0,接受H1,可以認為兩組的DBP變化均數(shù)不等。
注意當樣本含量n較大時,可用u檢驗成組設計t檢驗的要求(兩獨立樣本均數(shù)比較)應用條件:
獨立性、正態(tài)性、方差齊性獨立性:
應確保兩組樣本是相互獨立的,如應有明確的診斷標準等兩樣本同時滿足:
代表性、均衡性。
代表性:
(樣本量、隨機化)均衡性:
除欲研究因素外,其它因素盡可能的均衡:
對于臨床資料,兩組應在性別、年齡、病情輕重、診斷分期分級、有無并發(fā)癥等方面基線比較具有均衡性。
因此在設計階段應控制混雜與偏倚。
實例分析四)u檢驗u檢驗是以標準正態(tài)分布為理論基礎,以u值為統(tǒng)計量的假設檢驗方法,適用于例數(shù)較多的數(shù)值資料。
應用條件:
樣本例數(shù)較大,n50或100,或n雖小而總體標準差已知。
實例分析某地男女紅細胞數(shù)(1012/L)的抽查資料:
如下表資料,問該地男女紅細胞數(shù)有無差別?組別例數(shù)均數(shù)標準差男性3604.660.58女性2554.180.291.建立假設H0:
1=2該地男、女紅細胞數(shù)均數(shù)相等H1:
12該地男、女紅細胞數(shù)均數(shù)不相等檢驗水準=0.05(雙側)2.計算統(tǒng)計量u=X-1-X-2(S1)2n1+(S2)2n2=4.660-4.1780.5752360+0.2912255=13.633.確定P值,作出結論查u值表u0.01=2.58,uu0.01,P0.01,按=0.05水準拒絕H0,接受H1,可認為該地男、女紅細胞數(shù)的均數(shù)不相等。
u檢驗的三種形式。
1.正態(tài)性檢驗在做t、u檢驗前,首先應判斷資料是否服從正態(tài)分布,不服從正態(tài)分布的資料不能使用這類方法。
判斷資料是否服從正態(tài)分布,可用正態(tài)性檢驗、統(tǒng)計圖和表、其它專業(yè)估計。
三、t和u檢驗注意事項2.方差齊性檢驗在兩小樣本均數(shù)的t檢驗之前,要推斷兩樣本代表的總體方差是否相等,若方差相等,可用t檢驗;否則應使用t檢驗或秩和檢驗等。
方差齊性檢驗的方法使
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度三方合同主體變更與專有技術保密協(xié)議3篇
- 高中數(shù)學 第一章 三角函數(shù) 1.1 任意角、弧度 1.1.2 弧度制教學實錄 蘇教版必修4
- 市場變化下的應對策略計劃
- 2024年古董交易市場自律公約3篇
- 2024版城市綜合體夜間巡邏安保合同2篇
- 2024年度物業(yè)服務合同(含社區(qū)安全巡邏)2篇
- 2024年校車服務獨家承包合同
- 2024版醫(yī)藥研發(fā)合作合同范本2篇
- 2024全國高校畢業(yè)生就業(yè)跟蹤服務與聘用合同細則3篇
- 六盤水幼兒師范高等??茖W?!稛o訟社區(qū)建設》2023-2024學年第一學期期末試卷
- (新版)高級考評員職業(yè)技能鑒定考試題庫(含答案)
- 醫(yī)療機構消防安全突出火災風險和檢查要點
- 《寧夏閩寧鎮(zhèn):昔日干沙灘今日金沙灘》教案- 2023-2024學年高教版(2023)中職語文職業(yè)模塊
- 碳排放監(jiān)測員(高級)技能鑒定考試題及答案
- 2024-2030年中國消防安裝和維保市場經(jīng)營發(fā)展及運行狀況分析報告
- 數(shù)學家華羅庚課件
- 專項訓練:坐標的變化(30題)(原卷版+解析)
- 2024年新人教版一年級數(shù)學上冊課件 第六單元 復習與關聯(lián) 1.數(shù)與運算
- Unit 4 Ready for school(教學設計)-2024-2025學年人教PEP版(一起)(2024)英語一年級上冊
- 2024秋期國家開放大學《公共政策概論》一平臺在線形考(形考任務1至4)試題及答案
- 《2024版 CSCO非小細胞肺癌診療指南》解讀
評論
0/150
提交評論