下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、醫(yī)學(xué)論文中統(tǒng)計(jì)設(shè)計(jì)的聚類分析醫(yī)學(xué)論文中統(tǒng)計(jì)設(shè)計(jì)的聚類分析摘要:本文應(yīng)用系統(tǒng)聚類方法,對醫(yī)學(xué)中常用的統(tǒng)計(jì)設(shè)計(jì)方案按其使用情況進(jìn)展分類,通過對類間的分析與比擬,找出存在的問題,綜合評價(jià)三年醫(yī)學(xué)統(tǒng)計(jì)設(shè)計(jì)方案的缺乏與可取之處,通過對醫(yī)學(xué)常用的統(tǒng)計(jì)設(shè)計(jì)方案進(jìn)展聚類,以便引起有關(guān)人員應(yīng)該對哪些統(tǒng)計(jì)設(shè)計(jì)方案更加重視,從而為進(jìn)步中醫(yī)學(xué)論文的質(zhì)量提供一點(diǎn)建議,對如何改良并進(jìn)步醫(yī)學(xué)論文統(tǒng)計(jì)設(shè)計(jì)方案提供一點(diǎn)參考價(jià)值。關(guān)鍵詞:醫(yī)學(xué)論文;統(tǒng)計(jì)設(shè)計(jì)方案;聚類分析1前言在醫(yī)學(xué)科研中,設(shè)計(jì)主要包括專業(yè)設(shè)計(jì)和統(tǒng)計(jì)學(xué)設(shè)計(jì)兩個(gè)方面。近年來,統(tǒng)計(jì)設(shè)計(jì)方案存在著很大的問題1,如統(tǒng)計(jì)設(shè)計(jì)方案過于簡單,沒有充分表達(dá)處理因素間的效應(yīng);統(tǒng)計(jì)設(shè)
2、計(jì)方案使用不當(dāng),與目的和處理因素的程度數(shù)不符。在定量資料的假設(shè)檢驗(yàn)中,誤用統(tǒng)計(jì)方法最常見的原因是無視資料所對應(yīng)的設(shè)計(jì)類型2。醫(yī)學(xué)統(tǒng)計(jì)設(shè)計(jì)是進(jìn)展臨床醫(yī)學(xué)實(shí)驗(yàn)的重要前提,只有一個(gè)好的統(tǒng)計(jì)設(shè)計(jì),才能使實(shí)驗(yàn)用比擬經(jīng)濟(jì)的人力、物力和時(shí)間得到一個(gè)準(zhǔn)確、可靠、重現(xiàn)性好的結(jié)果。而要得到一個(gè)好的統(tǒng)計(jì)設(shè)計(jì),必須嚴(yán)格遵循統(tǒng)計(jì)設(shè)計(jì)的4個(gè)原那么:對照、平衡、隨機(jī)化、重復(fù)的原那么,然后制定一個(gè)合理的統(tǒng)計(jì)設(shè)計(jì)方案3,它直接影響到醫(yī)學(xué)質(zhì)量上下,目前國內(nèi)外對醫(yī)學(xué)統(tǒng)計(jì)設(shè)計(jì)方案的研究只是針對某個(gè)設(shè)計(jì)類型應(yīng)用方法進(jìn)展分析,而對醫(yī)學(xué)中統(tǒng)計(jì)設(shè)計(jì)方案的使用質(zhì)量并未系統(tǒng)地進(jìn)展分析。為此,本文采用樣品聚類方法,對醫(yī)學(xué)中常用的9種統(tǒng)計(jì)設(shè)計(jì)方案進(jìn)
3、展分析,通過類內(nèi)與類間的比擬,找出其中存在的問題,對改良研究設(shè)計(jì)提供一點(diǎn)參考價(jià)值。2材料與方法從河北省圖書館和河北醫(yī)科大學(xué)圖書館藏書中,用單純隨機(jī)抽樣的方法抽取2000年、2001年和2002年登載的需要進(jìn)展統(tǒng)計(jì)設(shè)計(jì)的臨床醫(yī)學(xué)研究、根底醫(yī)學(xué)研究文章657篇,其樣本量用率的抽樣方法進(jìn)展計(jì)算,公式如下4:n-所需樣本量大校本次調(diào)查=0.05,那么0.05=1.96;為容許誤差(即所希望檢出的差值)。本次調(diào)查根據(jù)以往的經(jīng)歷取0.04;預(yù)調(diào)查了100篇文章,其中48篇文章的統(tǒng)計(jì)設(shè)計(jì)方案存在缺乏之處,故本次調(diào)查p取值為0.5;為了剔除與本研究無關(guān)的文章,本文抽取了1000篇根底研究與臨床研究中的醫(yī)學(xué)論文
4、,最后剔除了非本文研究的設(shè)計(jì)類型343篇,剩余657篇,所以有效樣本量為657篇,滿足了本文需要的601篇文章。3統(tǒng)計(jì)方法2.1指標(biāo)確實(shí)定及其賦值本次調(diào)查的樣品為醫(yī)學(xué)中常用的統(tǒng)計(jì)設(shè)計(jì)類型(成組設(shè)計(jì)、配對設(shè)計(jì)、隨機(jī)區(qū)組設(shè)計(jì)、穿插設(shè)計(jì)、拉丁方設(shè)計(jì)、析因設(shè)計(jì)、正交設(shè)計(jì)、重復(fù)測量設(shè)計(jì)和序貫設(shè)計(jì)),統(tǒng)計(jì)設(shè)計(jì)方案的指標(biāo)依次為無、不正確、不明確和正確5-7,其數(shù)據(jù)結(jié)果用百分比表示8,本次調(diào)查的統(tǒng)計(jì)設(shè)計(jì)方案主要從以下幾方面進(jìn)展判斷:與實(shí)驗(yàn)?zāi)康氖欠裣喾?處理因素的程度數(shù);區(qū)組因素的個(gè)數(shù);處理因素間有無交互作用;非處理因素的平衡情況。無:指文章中沒有統(tǒng)計(jì)設(shè)計(jì)過程,沒有遵循統(tǒng)計(jì)設(shè)計(jì)的四個(gè)原那么;不正確:指論文中寫明
5、了統(tǒng)計(jì)設(shè)計(jì)方案但與上述任一方面不符者;不明確:指論文中沒有寫明詳細(xì)的統(tǒng)計(jì)設(shè)計(jì)方案名稱,僅是對受試對象進(jìn)展了隨機(jī)分配并分組,無法判斷的;正確:指論文中寫明了統(tǒng)計(jì)設(shè)計(jì)方案的詳細(xì)名稱,且全部條件都符合的。無、不正確、不明確和正確分別賦值為1、2、3和4。2.2Q型系統(tǒng)聚類本次調(diào)查采用系統(tǒng)聚類法,聚類統(tǒng)計(jì)量用歐氏間隔 ,類與類的間隔 定義為類平均法,數(shù)據(jù)處理用SAS8.0,在樣本聚類分析中,兩個(gè)樣本之間的間隔 越小,說明兩個(gè)樣本的性質(zhì)越相似。類間間隔 是用來度量一個(gè)類(一組樣本)與另一個(gè)類(另一組樣本)之間間隔 的統(tǒng)計(jì)量。令類A中有a個(gè)樣本,類B中有b個(gè)樣本,D(i,j)為A中的第i個(gè)樣本與類B中的第
6、j個(gè)樣本之間的間隔 ,那么稱D(i,j)為類A和類B中一對樣本之間的間隔 ,i=1,2,a;j=1,2,b。假設(shè)D(A,B)為類A和類B之間的間隔 ,本次調(diào)查的類平均法,其類間間隔 等于兩類中所有樣本對之間間隔 的平均值,即D(A,B)=suD(i,j)/(ab),在樣本聚類分析中兩個(gè)類的類間間隔 越大,那么兩個(gè)類的類內(nèi)所有樣本的性質(zhì)越不相似;反之,兩個(gè)類的類間間隔 越小,那么兩個(gè)類的類內(nèi)所有樣本的性質(zhì)越相似。系統(tǒng)聚類的根本思想是先把n個(gè)聚類樣本看成n類,然后按類間間隔 將相似程度最大的兩個(gè)類合并為一類,再將所有的類(包括新類)中相似程度最大的兩個(gè)類合并為一類,重復(fù)此過程,直至所有類間間隔 到
7、達(dá)一定的要求為止,或直至所有n個(gè)樣本被合并成一類為止,然后根據(jù)類間間隔 的要求以及實(shí)際意義選擇一個(gè)適當(dāng)?shù)姆诸?。把醫(yī)學(xué)常用的統(tǒng)計(jì)設(shè)計(jì)方案進(jìn)展聚類后,可以進(jìn)一步對類間及類內(nèi)進(jìn)展系統(tǒng)分析,以便找出問題所在,提醒有關(guān)人員應(yīng)該對哪些統(tǒng)計(jì)設(shè)計(jì)方案更加重視。2.3三年之間的比擬三年的論文使用情況在3類的構(gòu)成比的比擬用2檢驗(yàn),兩兩比擬的檢驗(yàn)水準(zhǔn)用校正的,其計(jì)算公式如上,統(tǒng)計(jì)處理用S2000統(tǒng)計(jì)軟件。4一致性檢驗(yàn)一致性的檢驗(yàn)或盲評法復(fù)審是質(zhì)量控制的重要方法,本次調(diào)查采用一致檢驗(yàn),它可以評價(jià)本次樣品分析結(jié)果的可靠性。其評價(jià)指標(biāo)用kappa值來表示,其公式如下:所有被評閱的文章均由作者按統(tǒng)一的評價(jià)標(biāo)準(zhǔn)進(jìn)展評閱,并經(jīng)
8、另一專業(yè)人士復(fù)查,如遇意見不一致之處,由兩人共同討論分析,以求獲得一致的結(jié)論。兩人對657篇文章的設(shè)計(jì)方案的評閱一致率為95.74%(結(jié)果見Table1),Kappa值=0.9227,兩人對657篇論文的判斷存在一致性(u=35.1507,p0.05),可見本次所調(diào)查的657篇文章結(jié)果是可靠的,數(shù)據(jù)處理過程使用S2000統(tǒng)計(jì)軟件。4結(jié)果與討論4.1統(tǒng)計(jì)設(shè)計(jì)方案的聚類過程及樣品聚類結(jié)果的解釋本次研究也對各種方法進(jìn)展嘗試,其中以平均間隔 法的分類結(jié)果最為理想。統(tǒng)計(jì)設(shè)計(jì)方案的聚類過程及樣品聚類結(jié)果的解釋(見表1和表2)如下:有2個(gè)特征值大于1,因此至少應(yīng)分成2類。列出了聚類過程:第一步,將第5號樣本
9、和第6號樣本合并成一類,稱為類8,記為L8;第二步,將第1號樣本和第4號樣本合并成一類,稱為類7,記為L7;第三步,將第7號樣本和第9號樣本合并成一類,稱為類6,記為L6,可見L6含有2個(gè)樣本,它們是7、9;第四步,將第3號樣本和L8合并成一類,稱為類5,記為L5;第五步,將L5和第8號樣本合并成一類,稱為類4,記為L4,可以看出,L4含有4個(gè)樣本,它們是3、5、6、8;第六步,將L7和第2號樣本合并成一類,稱為類3,記為L3,此時(shí)L3含有個(gè)樣本,它們是1、4、2;第七步,L3和L4合并居一類,稱為類2,記為L2;第八步,L2和L6合并成一類,記為L1。這樣所有9個(gè)樣本合并為一類。其中SPRS
10、Q是半偏統(tǒng)計(jì)量,說明此次合并類對信息的損失程度,半偏值越小,說明此次合并的效果越好;RSQ是統(tǒng)計(jì)量,用來評價(jià)聚類的累計(jì)效果,值越大,聚類效果越好。在這個(gè)分類結(jié)果中,根據(jù)判別指標(biāo)值,可以清楚地看到,在倒數(shù)第3行,即聚類到第6步時(shí),SPRSQ值急劇增加,從0.0967增加到0.3111,而RSQ值急劇減少,從0.759減少到0.447,因?yàn)榇藭r(shí)SPRSQ和RSQ值突然波動,所以可以決定,樣本分成3類比擬適宜。聚類樹狀圖結(jié)果(見Fig.1)。從直觀上看,將這9個(gè)統(tǒng)計(jì)設(shè)計(jì)方案分為3類是比擬適宜的,這時(shí)類間平均間隔 不小于2.2164。總體變異的75.9%被類成分所解釋。從樹狀圖中還可以直接得到分類的結(jié)
11、果,這就是:第類包含1、4、2三個(gè)樣本,即重復(fù)測量設(shè)計(jì)、拉丁方設(shè)計(jì)、序貫設(shè)計(jì);第類包含3、5、6、8四個(gè)樣本,即穿插設(shè)計(jì)、析因設(shè)計(jì)、正交設(shè)計(jì)、配對設(shè)計(jì);第類包含7、9兩個(gè)樣本,即成組設(shè)計(jì)、隨機(jī)區(qū)組設(shè)計(jì)。4.2三年的統(tǒng)計(jì)設(shè)計(jì)方案的使用情況及在3類中構(gòu)成比的比擬結(jié)果657篇論文中,2000年、2001年和2002年的文章各占293篇、183篇、181篇。2000年、2001年和2002年在3類中的構(gòu)成比比擬差異顯著(2=44.0895,p=0.0000),說明3年在3類中的總體分布是不同的(見Table11),進(jìn)一步兩兩比擬的校正=0.0125,經(jīng)2檢驗(yàn),2000年與2001年的構(gòu)成比比擬差異無顯
12、著性(2=3.0721,p=0.2154);2000年與2002年比擬差異有顯著性(2=41.8902,p=0.0000);2001年與2002年比擬差異有顯著性(2=18.2208,p=0.0000)。對每一類中年的兩兩比擬,其檢驗(yàn)水準(zhǔn)用校正=0.0125。2000年與2002年相比,類和類的構(gòu)成比差異顯著(p0.0125),類差異不顯著(p0.0125)。2001年與2002年相比,類和類的構(gòu)成比差異顯著(p0.0125),類差異不顯著(p0.0125)。其中,2002年在第類的有46篇,占25.41%,2000年和2001年在第類中的各為7.51%、11.42%,所以2002年醫(yī)學(xué)論文的
13、使用情況要好于2000年和2001年,說明醫(yī)學(xué)論文在這三年中的使用質(zhì)量是有所進(jìn)步的。第類,即析因設(shè)計(jì)、正交設(shè)計(jì)和穿插設(shè)計(jì)存在的問題較少,但不明確的論文占的比例最高,為30.30%,所以這三種設(shè)計(jì)方案應(yīng)在以后的論文發(fā)表中將設(shè)計(jì)類型的名稱標(biāo)明。配對統(tǒng)計(jì)設(shè)計(jì)、拉丁方統(tǒng)計(jì)設(shè)計(jì)、重復(fù)測量統(tǒng)計(jì)設(shè)計(jì)存在的問題應(yīng)用正確的程度較高,但不明確的比例也相對較高,應(yīng)注意這方面的問題,論文聯(lián)盟.Ll.成組統(tǒng)計(jì)設(shè)計(jì)和隨機(jī)區(qū)組設(shè)計(jì)的應(yīng)用情況最差,出現(xiàn)的問題也最多,無的占11.55%,論文聯(lián)盟.Ll.不正確的占17.94%,不明確的占20.35%,在三類中占的比例較高,應(yīng)該引起有關(guān)人員的注意。統(tǒng)計(jì)設(shè)計(jì)方案的使用情況不同,較好的為第類和第類,最差的為第類,但三類文章中均存在一定的問題。所以重視并加強(qiáng)科研人員的統(tǒng)計(jì)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年北京公交有軌電車有限公司招聘筆試參考題庫含答案解析
- 2025年冀少新版八年級地理下冊月考試卷含答案
- 2025年浙江嘉興海寧市康源再生資源科技有限公司招聘筆試參考題庫附帶答案詳解
- 2025年遼寧葫蘆島市興城市城建交通集團(tuán)有限公司招聘筆試參考題庫附帶答案詳解
- 2025年外研版2024高二地理下冊月考試卷含答案
- 2025年人教B版九年級生物上冊階段測試試卷含答案
- 商品房開發(fā)和銷售管理
- 2025年度個(gè)人租房合同范本(含家具家電清單)
- 2025年粵人版選修4地理上冊月考試卷含答案
- 2025年蘇教版九年級歷史下冊月考試卷含答案
- 拆遷評估機(jī)構(gòu)選定方案
- 趣味知識問答100道
- 鋼管豎向承載力表
- 2024年新北師大版八年級上冊物理全冊教學(xué)課件(新版教材)
- 人教版數(shù)學(xué)四年級下冊核心素養(yǎng)目標(biāo)全冊教學(xué)設(shè)計(jì)
- JJG 692-2010無創(chuàng)自動測量血壓計(jì)
- 三年級下冊口算天天100題(A4打印版)
- 徐州市2023-2024學(xué)年八年級上學(xué)期期末地理試卷(含答案解析)
- CSSD職業(yè)暴露與防護(hù)
- 飲料對人體的危害1
- 移動商務(wù)內(nèi)容運(yùn)營(吳洪貴)項(xiàng)目三 移動商務(wù)運(yùn)營內(nèi)容的策劃和生產(chǎn)
評論
0/150
提交評論