版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
一、緒論基本數(shù)據(jù)類型:計量資料,計數(shù)資料,等級資料總體:根據(jù)研究目的確定的同質研究對象的全體。當研究有具體而明確的指標時,總體是指該項變量值的全體。樣本(sample):是總體中抽取的有代表性的一部分。頻率(relativefreguency):一次隨機試驗有幾種可能結果,在重復進行試驗時,個別結果看來是偶然發(fā)生的,但當重復試驗次數(shù)相當多時,將顯現(xiàn)某種規(guī)律性。概率:描述隨機事件發(fā)生的可能性大小的數(shù)值,用大寫的P表示;取值[0,1]。二、計量資料的統(tǒng)計描述(一)、描述集中趨勢的特征數(shù)(平均指標)總稱為平均數(shù)(average)反映了資料的集中趨勢(centraltendency)。常用的有:
1.算術均數(shù)(arithmeticmean),簡稱均數(shù)(mean)符號:總體u樣本
適用條件:資料呈對稱分布,尤其是正態(tài)或近似正態(tài)。
計算:
(1)直接法(2)頻數(shù)表法
2.幾何均數(shù)(geometricmean)適用條件:呈倍數(shù)關系的等比資料或對數(shù)正態(tài)分布(正偏態(tài))資料;如抗體滴度資料
3.中位數(shù)(median)適用條件:適合各種類型的資料。尤其適合于①大樣本偏態(tài)分布的資料;②資料有不確定數(shù)值;③資料分布不明等。先將觀察值按從小到大順序排列,再按以下公式計算:頻數(shù)表資料的中位數(shù)均數(shù)、中位數(shù)二者關系正態(tài)分布時:均數(shù)=中位數(shù)正偏態(tài)分布時:均數(shù)>中位數(shù)負偏態(tài)分布時:均數(shù)<中位數(shù)(二)、描述離散趨勢的特征數(shù)反映數(shù)據(jù)的離散度(Dispersion)。即個體觀察值的變異程度。常用的指標有:
1.極差(Range)(全距)適用范圍:任何計量資料;是參考變異指標
2.百分位數(shù)與四分位數(shù)間距PercentileandQuartilerange適用條件:可用于各種分布的資料,特別對偏峰分布資料,常把中位數(shù)和四分位數(shù)間距結合起來描述資料的集中趨勢和離散趨勢。
3.方差Variance適用條件:見標準差4.標準差StandardDeviation適用條件:方差和標準差適用于對稱分布的資料,特別對正態(tài)分布或近似正態(tài)分布資料,常把均數(shù)和標準差結合起來全面描述資料集中趨勢和離散趨勢標準差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布5.變異系數(shù)CoefficientofVariation適用條件:①觀察指標單位不同,如身高、體重②同單位資料,但均數(shù)相差懸殊三、定性資料的統(tǒng)計描述常用相對數(shù)指標1、構成比又稱構成指標,說明某一事物內部各組成部分所占的比重或分布,常以百分數(shù)表示。2、強度通常指一段時間內的平均概率。強度是單位時間內某現(xiàn)象發(fā)生的頻率。3、相對比是指任何兩個相關聯(lián)的變量A和B之比,說明A為B的若干倍或百分之幾。兩個指標可以是性質相同,也可以是性質不同。A和B可以是絕對數(shù)、相對數(shù)和平均數(shù)。四、常用統(tǒng)計圖各常用統(tǒng)計圖的適用場合(1)條圖:適用資料:相互獨立的資料(資料有明確分組,不連續(xù))。(2)圓圖:適用資料:構成比資料(3)百分條圖:百分條圖的作用與圓圖相同。但更適用于多組百分比的比較。(4)線圖:適用于隨時間變化的連續(xù)性資料。(用線段的升降表示某事物在時間上的發(fā)展變化趨勢。)半對數(shù)線圖:適用于隨時間變化的連續(xù)性資料,尤其比較數(shù)值相差懸殊的多組資料時采用。(半對數(shù)線圖中線段的升降是用來表示某事物發(fā)展速度(或者說是相對比)。)(5)直方圖:用于表達連續(xù)性資料的頻數(shù)分布。(6)箱式圖:用于描述連續(xù)型變量資料的分布特征。(7)散點圖:適用資料:雙變量資料。(8)統(tǒng)計地圖:適宜描述研究指標的地理分布。(9)誤差線圖:計量資料五抽樣誤差和幾種常見分布1、抽樣誤差的概念:由于抽樣原因造成的樣本指標與總體指標之間的差別。標準差VS標準誤內容SDSE性質表示個體變異大小統(tǒng)計量的標準差,表示抽樣誤差大小控制個體變異或自然變異,增大樣本含量可減少方法不可通過統(tǒng)計方法來控制。算式用途求參考值范圍求可信區(qū)間與n關系隨n增大漸趨于穩(wěn)定隨n增大漸趨于0聯(lián)系同為變異指標,n不變時標準差增大→標準誤增大2、正態(tài)分布、t分布、卡方分布的特征和聯(lián)系(一)正態(tài)分布的特征(1)正態(tài)分布的形式是對稱的,對稱軸是經(jīng)過平均數(shù)點的垂線。(2)中央點最高,然后逐漸向兩側下降,曲線的形式是先向內彎,再向外彎。(3)正態(tài)曲線下的面積為1。。(4)正態(tài)分布有兩個參數(shù),即均數(shù)和標準差。是位置參數(shù),當固定不變時,越大,曲線沿橫軸越向右移動;反之,越小,則曲線沿橫軸越向左移動。是形狀參數(shù),當固定不變時,越大,曲線越平闊;越小,曲線越尖峭。(二)t分布的圖形特征?分布特征①t分布曲線是單峰的②關于t=0對稱③t分布與正態(tài)分布的關系:自由度v較小時,t分布與標準正態(tài)分布相差較大,并且t分布曲線的尾部面積大于標準正態(tài)分布曲線的尾部面積;當自由度ν→∞時,t分布逼近于標準正態(tài)分布。(三)卡方分布特征①卡方曲線所圍的面積和為1②卡方分布為在大于等于0(正數(shù))范圍的正偏分布③不同的自由度決定不同的卡方分布④卡方分布只有一個參數(shù)即自由度,為ν??ǚ椒植嫉钠骄鶖?shù)ν與方差2ν⑤卡方分布隨著自由度增加而逐漸趨于對稱,當自由度趨近于無窮大時,卡方分布趨近于正態(tài)分布⑥卡方分布的加法定理:兩個獨立的卡方隨機變量相加所得的隨機變量仍滿足卡方分布,其自由度為其自由度之和。3、幾個常用的界值概率0.050.01雙側1.962.33單側1.642.58六、可信區(qū)間與參考值范圍的區(qū)別與聯(lián)系參考值范圍可信區(qū)間含義當α=0.05時,CI以95%的可“正常人”的解剖、生理、生能性包含總體均數(shù)?;稠椫笜藗€體值的波動范圍。算σ未知:計正態(tài)分布:式σ已知或σ未知但為大樣本:偏態(tài)分布:PX~P100?X用途總體均數(shù)的區(qū)間估計絕大多數(shù)(如95%)觀察對象某項指標的分布范圍七假設檢驗的一般步驟和注意事項1.建立假設、確定單雙側檢驗和檢驗水準α2.求檢驗統(tǒng)計量(及自由度)3.求P值,下結論(統(tǒng)計/專業(yè)結論)何謂ⅠⅡ類錯誤,其聯(lián)系P114假設檢驗時,拒絕實際上成立的H0,犯Ⅰ類錯誤,俗稱“棄真”錯誤;不拒絕實際上不成立的H0,犯Ⅱ類錯誤,俗稱“取偽”錯誤。犯第Ⅰ類錯誤的概率用α表示,假設檢驗時,根據(jù)研究者的要求來定;犯第Ⅱ類錯誤的概率用β表示,假設檢驗時,它只有與特定的H1結合起來才有意義。對于某一具體的檢驗來說,當樣本量n一定時α越小β越大;α越大β越小。P值:在H0成立前提下,某事件(如“︱t︱≥2.138”八、計量統(tǒng)計量分析一組:樣本與總體→單樣本t檢驗兩組:配對→配對t檢驗/配對Wilcoxon符號秩和檢驗非配對→兩樣本t檢驗/Wilcoxon符號秩和檢驗九、計量資料的統(tǒng)計分析多組均數(shù):完全隨機設計→方差分析/Kruskal-Wallistest配伍組方差分析→方差分析多因素分析:析因設計、拉丁方設計、重復測量資料的ANOVA十、計數(shù)資料的統(tǒng)計分析一組:樣本率與總體率比較→u檢驗兩組:配對→配對McNemar檢驗非配對→卡方檢驗/u檢驗/確切概率法多組:兩個(多個)構成比→卡方檢驗多個率比較→卡方檢驗十一、等級資料的統(tǒng)計分析兩組:配對→配對符號秩和檢驗非配對→Wilcoxon秩和檢驗多組:完全隨機設計→Kruskal-Wallistest配伍組設計十二、相關與回歸重點是二者的區(qū)別與聯(lián)系(如應用、檢驗方法、決定系數(shù)等)直線相關與回歸的區(qū)別與聯(lián)系?區(qū)別資料類型不同:相關分析要求兩個變量均服從正態(tài)分布。而回歸分析則有兩種不同的模型:一是事先規(guī)定X值的Y值必需服從正態(tài)分布,此為I型回歸;另一類是X和Y都服從正態(tài)分布,稱為II型回歸。應用情況不同系數(shù)的求法不同對于同一份資料,只能計算一個相關系數(shù)而II型回歸可以建立由X推Y,或由Y推X的兩個不同的回歸方程。系數(shù)的意義:-1≤r≤1,沒有單位;b的取值沒有限制,b有單位?聯(lián)系對于同一樣本資料若同時計算r與b,二者的正負號是一致的。對于同一樣本資料r與b的假設檢驗結果是等價的r與b可以互相換算相關系數(shù)的平方,成為決定系數(shù)。r2是回歸平方和在總平方和中所占的比重,即應變量YZ在多大程度上決定于自變量X的變化。r2愈接近1,說明回歸效果愈好。在實際應用時,分析兩變量之間的相關關系不能只看其r相關是否顯著,還要看其r2大小。十三、生存分析何謂生存資料生存資料包括是否生存以及生存長短兩個方面生存資料的類型;完全數(shù)據(jù)和刪失數(shù)據(jù)常見刪失原因失訪、退出、其他與研究無關的原因、研究終止生存率的估計方法壽命表法、Kaplan-Meier兩條生存曲線的比較Log-rank檢驗是生存曲線的非參數(shù)方法之一,其基本思想是當H0成立時,根據(jù)ti時點的死亡率,可以計算各組的理論死亡數(shù)十四、觀察性研究如何區(qū)分觀察性研究和實驗研究根本區(qū)別在于研究者是否人為地設置處理因素,即是否對研究對象施加了干預措施常見的幾種觀察性研究方法按調查涉及的對象多少可分為:全面調查(普查)、抽樣調查和典型調查按調查的時間順序可分為:回顧性調查、現(xiàn)況調查、前瞻性調查、歷史前瞻性調查按時間的長短可分為:橫斷面調查和縱向調查按抽取樣本的方式可分為:概率抽樣調查(簡單隨機抽樣、系統(tǒng)抽樣、分層隨機抽樣、整群抽樣等)和非概率抽樣調查(偶遇抽樣、判斷抽樣、定額抽樣、雪球抽樣)。常見的幾種隨機抽樣調查方法各有何優(yōu)缺點P289表15-2病例-對照研究資料的分析:假設檢驗及OR的計算假設檢驗:H0:OR=1,H1:OR≠1OR=ad/bc(配對:OR=b/c)隊列研究資料的分析:假設檢驗及RR的計算假設檢驗:H0:RR=1,H1:RR≠1RR=P1/P0RR和OR的區(qū)別與聯(lián)系(本題僅供參考)RR表明暴露組發(fā)病/死亡的危險是對照組的多少倍,RR↑暴露的效應↑暴露與結局關聯(lián)強度↑——RR=1,相同、>1,是RR倍、小于1,暴露是保護因素
OR即比值比,表示疾病與暴露之間關聯(lián)強度的指標,含義類似RR,指暴露者的疾病危險性是非暴露者的多少倍。OR=病例組暴露值/對照組暴露值=(a/c)/(b/d)=ad/bc
OR>1—疾病的危險度因暴露而增加,暴露與疾病之間正關聯(lián),<1—疾病的危險度因暴露而減少,暴露與疾病之間是負關聯(lián)。疾病率<5‰,OR是RR極好的近似值。OR恒=ad/bc十五、實
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年電子商務平臺股權質押擔保合同
- 2024年草種收集與保護項目合作協(xié)議
- 2025版食品安全標準制定與修訂合作合同3篇
- 二零二五年休閑農業(yè)鴨苗生態(tài)養(yǎng)殖合作協(xié)議
- 2024年礦山施工責任承包合同版B版
- 2025版第2章房地產合同違約金計算與支付合同3篇
- 2024年電力分包工程勞務合作協(xié)議
- 港口碼頭施工分包協(xié)議
- 2025版農業(yè)專項借款合同樣本(含扶貧政策)3篇
- 地下商場供電系統(tǒng)線路施工合同
- 廣西河池市宜州區(qū)2023-2024學年七年級上學期期末考試數(shù)學試卷(含解析)
- 2024高考政治真題-哲學-匯集(解析版)
- 對承租方有利的商鋪租賃合同
- 國外幼兒園自主游戲研究現(xiàn)狀
- 浙江大學2011–2012學年冬季學期《高級數(shù)據(jù)結構與算法分析》課程期末考試試卷
- 職業(yè)生涯規(guī)劃-體驗式學習智慧樹知到期末考試答案章節(jié)答案2024年華僑大學
- 手術保護性約束
- AQ4230-2013 糧食平房倉粉塵防爆安全規(guī)范
- (正式版)JBT 10437-2024 電線電纜用可交聯(lián)聚乙烯絕緣料
- 建筑節(jié)能與綠色建筑監(jiān)理細則
- 2024法務部門合規(guī)風險管理實踐模板
評論
0/150
提交評論