科研數(shù)據(jù)的分析與處理_第1頁
科研數(shù)據(jù)的分析與處理_第2頁
科研數(shù)據(jù)的分析與處理_第3頁
科研數(shù)據(jù)的分析與處理_第4頁
科研數(shù)據(jù)的分析與處理_第5頁
已閱讀5頁,還剩72頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

醫(yī)學科研數(shù)據(jù)整頓與分析DataSortingandAnalysisinMedicalResearch李志春新鄉(xiāng)醫(yī)學院公共衛(wèi)生學院1/77醫(yī)學科研數(shù)據(jù)整頓與分析2/77醫(yī)學科研數(shù)據(jù)整頓與分析第一節(jié)科研數(shù)據(jù)檢查與整頓第二節(jié)科研數(shù)據(jù)描述第三節(jié)統(tǒng)計分析辦法選擇第四節(jié)科研數(shù)據(jù)綜合分析第五節(jié)統(tǒng)計分析成果解釋與體現(xiàn)3/77一、對象檢查二、缺項與差錯三、資料整頓第一節(jié)科研數(shù)據(jù)檢查與整頓4/77一、對象檢查首先要鑒別所調(diào)查或研究個體是否屬于所要求調(diào)查對象或研究對象。在進行臨床研究時,要尤其注意疾病診斷、分類正確性,這對于確保研究成果正確性是十分必要。5/77由于多種原因在某些調(diào)查表中經(jīng)常能夠見到缺項存在,缺項存在嚴重地影響到資料完整性。通過檢查發(fā)覺研究資料中差錯也是十分必要,應(yīng)對研究數(shù)據(jù)作認真檢查。二、缺項與差錯檢查6/77專業(yè)檢查統(tǒng)計檢查二、缺項與差錯檢查7/77人工檢查計算機檢查二、缺項與差錯檢查8/77在周密試驗設(shè)計指導(dǎo)下取得試驗數(shù)據(jù),不應(yīng)隨意舍棄,不然試驗成果真實性與完整性就會受到破壞??梢蓴?shù)據(jù)處理9/7710/77在該數(shù)據(jù)指標服從正態(tài)分布前提下,可用統(tǒng)計辦法檢查個別“可疑值”是否應(yīng)當舍棄。當n>10時,能夠用“”作為舍棄可疑值準則。當n≤10時,能夠采取Q檢查法、Dixon檢查法或Grubbs檢查法,進行測量值一致性檢查,從而判斷是否剔除可疑值??梢蓴?shù)據(jù)處理11/7712/77在對資料做好檢查、查對后,就需要把雜亂無章資料條理化,方便于進行統(tǒng)計計算與分析,即整頓資料。三、資料整頓13/77數(shù)據(jù)計算機管理數(shù)據(jù)庫選擇數(shù)據(jù)錄入數(shù)據(jù)核查與清理數(shù)據(jù)加工(如編碼、標準化、根據(jù)原始統(tǒng)計產(chǎn)生新研究變量等)數(shù)據(jù)最后鎖定并進入分析14/7715/77醫(yī)學科研數(shù)據(jù)整頓與分析第一節(jié)科研數(shù)據(jù)檢查與整頓第二節(jié)科研數(shù)據(jù)描述第三節(jié)統(tǒng)計分析辦法選擇第四節(jié)科研數(shù)據(jù)綜合分析第五節(jié)統(tǒng)計分析成果解釋與體現(xiàn)16/77一、統(tǒng)計指標二、統(tǒng)計表三、統(tǒng)計圖第二節(jié)科研數(shù)據(jù)描述體現(xiàn)17/77(一)總量指標與相對數(shù)指標(二)平均數(shù)指標(三)變異指標一、統(tǒng)計指標18/77統(tǒng)計表是用表格方式體現(xiàn)統(tǒng)計資料和指標。在編制統(tǒng)計表時,應(yīng)當遵循下列標準:1.重點突出,簡單明了。即一張表只包括一種中心內(nèi)容,使人一目了然,不要包羅萬象。2.主謂分明,層次清楚。二、統(tǒng)計表19/77一、統(tǒng)計指標二、統(tǒng)計表三、統(tǒng)計圖第二節(jié)科研數(shù)據(jù)描述體現(xiàn)20/7721/7722/77醫(yī)學科研數(shù)據(jù)整頓與分析第一節(jié)科研數(shù)據(jù)檢查與整頓第二節(jié)科研數(shù)據(jù)描述第三節(jié)統(tǒng)計分析辦法選擇第四節(jié)科研數(shù)據(jù)綜合分析第五節(jié)統(tǒng)計分析成果解釋與體現(xiàn)23/77(一)假設(shè)檢查(二)區(qū)間估計(三)變量間關(guān)系研究(四)鑒別分析一、統(tǒng)計分析辦法概述24/77包括有計量資料分布類型假設(shè)檢查、計量資料方差假設(shè)檢查、計量資料均數(shù)假設(shè)檢查、等級資料分布或位置假設(shè)檢查、兩種屬性間獨立性檢查以及兩種辦法判斷成果一致性檢查等。(一)假設(shè)檢查25/77(二)區(qū)間估計▲概念:根據(jù)樣本均數(shù),按一定可信度計算出總體均數(shù)很也許在一種數(shù)值范圍,這個范圍稱為總體均數(shù)可信區(qū)間?!k法:(1)u分布法(2)t分布法26/77總體均數(shù)(μ)100(1-α)%置信區(qū)間(CI):(1)已知總體標準差σ,按正態(tài)分布原理,計算公式為:(2)σ未知,n較小,按t分布原理計算:(3)σ未知,n足夠大(如n>100),按正態(tài)分布原理計算:(二)區(qū)間估計27/77總體率置信區(qū)間估計查表法當n≤50時正態(tài)近似法當樣本含量足夠大,且樣本率p和(1-p)均不太小。一般以為np和n(1-p)≥5。p±uαsp

28/77(一)假設(shè)檢查(二)區(qū)間估計(三)變量間關(guān)系研究(四)鑒別分析一、統(tǒng)計分析辦法概述29/771.各指標之間無自變量與因變量之分(1) 研究變量之間互相關(guān)系有直線有關(guān)分析、典型有關(guān)分析等。(2) 研究多種變量內(nèi)部從屬關(guān)系,并尋找綜合指標,減少變量維數(shù),其常用辦法主要有主成份分析、因子分析和對應(yīng)分析。(3) 研究多種變量內(nèi)部或多種樣品之間親疏關(guān)系有聚類分析。(4) 研究多種變量內(nèi)部多種復(fù)雜關(guān)系有線性構(gòu)造方程協(xié)方差分析。(三)變量間關(guān)系研究30/772.各指標之間有自變量與因變量之分研究變量之間依存關(guān)系有直線回歸分析、曲線回歸分析、多項式回歸分析、多元線性回歸分析、概率模型回歸分析、生存資料參數(shù)模型回歸分析、COX模型回歸分析和對數(shù)線性模型分析。(三)變量間關(guān)系研究31/77(一)假設(shè)檢查(二)區(qū)間估計(三)變量間關(guān)系研究(四)鑒別分析根據(jù)某些明確分類總體所提供信息,對未知個體歸屬進行分類鑒別分析。一、統(tǒng)計分析辦法概述32/77分析目資料類型設(shè)計方案數(shù)理統(tǒng)計條件選擇統(tǒng)計分析辦法需考慮原因33/77二、計量資料假設(shè)檢查辦法選擇例:欲理解某地城鎮(zhèn)嬰兒營養(yǎng)情況有沒有差異,測量了其血紅蛋白含量,見下表。34/77首先要明確每次擬分析定性變量個數(shù)是多少?其次要弄清定性變量屬性、列聯(lián)表中頻數(shù)多少以及資料搜集方式。三、計數(shù)資料假設(shè)檢查辦法選擇35/7736/77每次只分析兩個變量時,可將資料整頓為2×2表、2×k表和R×C表形式。常用統(tǒng)計分析辦法有Pearsonχ2檢查、校正χ2檢查、配對計數(shù)資料McNemarχ2檢查、Fisher精確概率法檢查、秩和檢查、Ridit分析、等級有關(guān)分析、典型有關(guān)分析、一般趨勢和線性趨勢檢查、Kappa檢查等;假如需要同步分析研究定性變量個數(shù)≥3時,常用統(tǒng)計分析辦法有加權(quán)χ2檢查、Mantel-haenszelχ2檢查、logistic回歸模型和對數(shù)線性模型等。37/77在計數(shù)資料分析過程中,對于R×C表形式資料分析是一種難點,存在問題比較多。根據(jù)二維列聯(lián)表中兩個分組變量類型以及分析目標,對R×C表資料進行分類,由于不一樣類型R×C表資料和不一樣分析目標,就有不一樣分析辦法。R×C表檢查辦法選擇38/77雙向無序R×C表資料及其統(tǒng)計分析辦法選擇單向有序R×C表資料及其統(tǒng)計分析辦法選擇雙向有序且屬性不一樣R×C表資料及其統(tǒng)計分析辦法選擇雙向有序且屬性相同R×C表資料及其統(tǒng)計分析辦法選擇R×C表檢查辦法選擇39/7740/7741/77對單向有序R×C表兩個分組變量,其中一種是無序(試驗分組變量——不一樣藥品);另一種卻是有序(指標分組變量——處理效果)。此時不適合選用χ2檢查分析資料,由于χ2檢查與“療效”有序性之間沒有任何聯(lián)系,故應(yīng)采取與“有序性”有聯(lián)系秩和檢查或Ridit分析。R×C表檢查辦法選擇42/7743/77對雙向有序且屬性不一樣R×C表兩個分組變量,如年紀組別與某種疾病發(fā)生程度都是有序,但屬性不一樣,此時,也不適合選用χ2檢查分析資料,由于χ2檢查與兩個變量有序性之間沒有任何聯(lián)系,應(yīng)改用與兩個變量“有序性”有聯(lián)系等級有關(guān)分析、典型有關(guān)分析或線性趨勢檢查。R×C表檢查辦法選擇44/7745/77對雙向有序且屬性相同R×C表兩個分組變量,如兩種辦法對某種疾病發(fā)病程度診斷成果,它們都是有序,且屬性也相同。此時,研究目標是要考查兩種測定辦法測定成果之間是否具有一致性,故仍不適合選用一般χ2檢查分析資料,應(yīng)采取與兩個變量有序性有聯(lián)系一致性檢查或稱Kappa檢查,還能夠用特殊模型分析辦法。R×C表檢查辦法選擇46/77醫(yī)學科研數(shù)據(jù)整頓與分析第一節(jié)科研數(shù)據(jù)檢查與整頓第二節(jié)科研數(shù)據(jù)描述第三節(jié)統(tǒng)計分析辦法選擇第四節(jié)科研數(shù)據(jù)綜合分析第五節(jié)統(tǒng)計分析成果解釋與體現(xiàn)47/77對于同一份統(tǒng)計資料,由于研究目標不一樣,處理辦法不一樣,能夠從多種方面進行分析,此即“綜合分析”。通過對數(shù)據(jù)資料綜合分析,能夠充足利用、挖掘資料所內(nèi)涵信息。第四節(jié)科研數(shù)據(jù)綜合分析48/77【實例】某醫(yī)師將20名失眠患者隨機等分為兩組,一組服用安眠藥,另一組服用撫慰劑,研究者要評價某安眠藥催眠效果,治療失眠前后睡眠時間及其差值成果見表,試作統(tǒng)計分析。49/7750/77平行組對照設(shè)計分析思緒試驗組:療前療后=>差值同質(zhì)性比較組間比較

對照組:療前療后=>差值51/77療前是否均衡可比?

–兩組療前比較每種藥品是否有療效?

–各組療效組內(nèi)比較療效間有沒有差異?

–療效差異比較本例分析中三個步驟是環(huán)環(huán)相扣。52/77平行組對照設(shè)計分析思緒試驗組:療前療后=>差值

同質(zhì)性比較組間比較

對照組:療前療后=>差值53/77【實例】對一組胃癌病人先后用兩種泌酸刺激劑,然后分別測定其最大酸排量(mEq/h),以分析兩藥效果,見表。54/7755/77配對資料t檢查分析。按α=0.05水準回絕H0,接收H1,差異有統(tǒng)計學意義,胃癌病人用加大組織胺后最大酸排量與用五肽胃泌素后最大酸排量間差異有統(tǒng)計學意義。56/77五肽胃泌素引發(fā)最大酸排量是加大組織胺百分之多少?57/77?胃癌病人用加大組織胺后最大酸排量比用五肽胃泌素者平均多1.30(95%CI:1.02~1.57)mEq/h。而兩次測定值之間回歸分析顯示:若加大組織胺引發(fā)最大酸排量升高1mEq/h,則五肽胃泌素引發(fā)者將平均遞升0.90(95%CI:0.88~0.92)mEq/h,即五肽胃泌素引發(fā)最大酸排量只是加大組織胺90%。綜合分析結(jié)論58/77針對差值分析配對t檢查與說明變量線性依存關(guān)系回歸分析相結(jié)合,假設(shè)檢查與區(qū)間估計互補,使所得結(jié)論愈加豐富、愈加詳細。59/77例研究放射線對嗜酸粒細胞影響。對一批同一種系體重接近小白鼠,以完全隨機抽樣方法抽取了11只小白鼠,在注射腎上腺素前、后二次測定其嗜酸粒細胞數(shù),然后用一定劑量放射線照射,通過二十四小時,再反復(fù)上述試驗,每一只小白鼠都有4個測定值。二、進行綜合分析辦法60/7761/771.單純腎上腺素作用

放射線照射之前,測定嗜酸粒細胞數(shù)(×106個/L),然后注射一定劑量腎上腺素,再測其嗜酸性粒細胞,將⑵、⑶按本身對照設(shè)計作t檢查(t=3.767,P<0.01)。2.照射放射線后腎上腺素作用在照射一定劑量放射線后,反復(fù)上述試驗,將⑷、⑸按本身對照設(shè)計作t檢查(t=6.921,P<0.001)。綜合分析62/773.單純照射放射線作用將尚未注射腎上腺素時,照射放射線前、后測定值,即⑵、⑷按本身對照設(shè)計作t檢查(t=4.219,P<0.01)。4.照射放射線是否變化腎上腺素作用

將放射線照射前差值[⑶―⑵]與放射線照射后差值[⑸―⑷],按本身對照設(shè)計作t檢查(t=0.849,P>0.40)。

綜合分析63/771.小白鼠受到放射線照射后,血液中嗜酸性粒細胞減少;2.小白鼠注射腎上腺素后,血液中嗜酸性粒細胞減少;3.小白鼠受放射線照射二十四小時內(nèi),并未變化腎上腺素減少嗜酸性粒細胞數(shù)作用和程度。結(jié)論64/77例7.2下面就是該科研資料較為完整背景介紹:某研究者搜集到103例冠心病患者和100例正常對照者多項指標,其中有組別(G)、性別(X1)、年紀(X2)、高血壓史(X3)、吸煙史(X4)、膽固醇含量(X5)、甘油三酯含量(X6)、低密度脂蛋白含量(X7)、密度脂蛋白含量(X8)、脂蛋白(X9)、載脂蛋白A1含量(X10)、載脂蛋白B含量(X11)、基因型Xbal(X12)、基因型EcoRl(X13)、用藥情況(X14),資料格式見表7.5所示。65/7766/77(1)對冠心病人而言,直接分析某種基因型(X12或X13)取不一樣水平時7項血脂指標均值和均值向量之間差異有沒有顯著性意義?(2)對冠心病人而言,同步分析“性別、吸煙史、高血壓史、某種基因型(X12或X13)”對7項血脂指標均值和均值向量影響有沒有顯著性意義?(3)對冠心病人而言,在設(shè)法排除“年紀、性別、吸煙史、高血壓史和用藥情況”等原因影響前提下,分析某種基因型(X12或X13)取不一樣水平時7項血脂指標均值之間差異有沒有顯著性意義?67/7768/77(4)對冠心病人而言,試對7項血脂指標間內(nèi)部從屬性做客觀評價。(5)對冠心病人而言,試對7項血脂指標間親疏關(guān)系做客觀評價。(6)對冠心病人而言,假定病情輕重可通過7項血脂指標較好地反應(yīng)出來,試根據(jù)7項

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論