版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第十章
兩變量關(guān)聯(lián)性分析
本章內(nèi)容
第一節(jié)線性相關(guān)
第二節(jié)秩相關(guān)第三節(jié)分類變量的關(guān)聯(lián)性分析
第一節(jié)線性相關(guān)
一線性相關(guān)的概念線性相關(guān)(linearcorrelation)又稱簡單相關(guān)(simplecorrelation),用于雙變量正態(tài)分布(bivariatenormaldistribution)資料。其性質(zhì)可由圖11-2散點圖直觀的說明。目的:研究兩個變量X,Y數(shù)量上的依存(或相關(guān))關(guān)系。特點:統(tǒng)計關(guān)系圖10-1兩變量散點圖二、相關(guān)系數(shù)的意義與計算意義:相關(guān)(correlationcoefficient)又稱Pearson積差相關(guān)系數(shù),用來說明具有直線關(guān)系的兩變量間相關(guān)的密切程度與相關(guān)方向。2.計算:樣本相關(guān)系數(shù)的計算公式為例1例10-1在某地一項膳食調(diào)查中,隨機(jī)抽取了14名40~60歲的健康婦女,測得每人40~60歲的健康婦女,測得每人的基礎(chǔ)代謝(kj/d)與體重(kg)數(shù)據(jù),見表10-1。據(jù)此數(shù)據(jù)如何判斷這兩項指標(biāo)間有無關(guān)聯(lián)?表10-1
14名健康婦女的基礎(chǔ)代謝率與體重編號基礎(chǔ)代謝(kJ/d)體重(kg)編號基礎(chǔ)代謝(kJ/d)體重(kg)14175.650.783970.648.624435.053.793983.244.633460.237.1105050.158.644020.851.7115355.571.053987.447.8124560.659.764970.662.8134874.462.175359.767.3145029.261.5圖10-214例中年健康婦女基礎(chǔ)代謝與體重的散點圖相關(guān)系數(shù)的特點1.相關(guān)系數(shù)r是一個無量綱的數(shù)值,且-1<r<1;2.r>0為正相關(guān),r<0為負(fù)相關(guān);3./r/越接近于1,說明相關(guān)性越好./r/越接近于0,說明相關(guān)性越差.相關(guān)系數(shù)的統(tǒng)計推斷(一)相關(guān)系數(shù)的假設(shè)檢驗
例10-2繼例10-2中算得r=0.964后,試檢驗相關(guān)是否具有統(tǒng)計學(xué)意義檢驗步驟
本例
n=14,r=0.964,計算t值10215(二)總體相關(guān)系數(shù)的可信區(qū)間
10216具體步驟如下10217
例10-3對例10-1所得r值,估計總體相關(guān)系數(shù)的95%可信區(qū)間。
再按公式(10-22)將z作反變換,得到基礎(chǔ)代謝與體重的總體相關(guān)系數(shù)95%可信區(qū)間為(0.8872,0.9888)。
線性相關(guān)中應(yīng)注意的問題1.樣本的相關(guān)系數(shù)接近零并不意味著兩變量間一定無相關(guān)性.2.一個變量的數(shù)值人為選定時莫作相關(guān).3.出現(xiàn)異常值時甚用相關(guān).4.相關(guān)未必真有內(nèi)在聯(lián)系.5.分層資料盲目合并易出假象.6.線性相關(guān)分析雙變量是隨機(jī)且服從正態(tài)分布第二節(jié)秩相關(guān)適用條件:①資料不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析;②總體分布型未知,一端或兩端是不確定數(shù)值(如<10歲,≥65歲)的資料;③原始數(shù)據(jù)用等級表示的資料。一、Spearman秩相關(guān)1.意義:等級相關(guān)系數(shù)rs用來說明兩個變量間直線相關(guān)關(guān)系的密切程度與相關(guān)方向。2.計算公式例10-5某地研究2~7歲貧血病患兒的血紅蛋白含量與出血癥狀程度之間的相關(guān)性,結(jié)果見表10-2,試用秩相關(guān)進(jìn)行分析表10-2貧血患兒的血紅蛋白含量(g/l)和出血癥狀病人編號血小板數(shù)秩次p2出血癥狀秩次q2pqXpYq(1)(2)(3)(4)(5)(6)(7)(8)=(3).(6)5.011+++10100105.824++864366.139+636187.3416-39128.8525++864409.1636++8644811.1749-392112.3864-392413.5981-392713.810100-3930合計—55385-55373266利用表10-2中的數(shù)據(jù)容易算得
秩相關(guān)系數(shù)為負(fù),說明兩變量間有負(fù)相關(guān)關(guān)系,同樣由樣本算得的秩相關(guān)系數(shù)是否有統(tǒng)計學(xué)意義,也應(yīng)做檢驗秩相關(guān)系數(shù)的統(tǒng)計推斷
檢驗步驟假設(shè)檢驗統(tǒng)計推斷當(dāng)時,可查書后的臨界值表,
若秩相關(guān)系數(shù)超過臨界值,則拒絕;當(dāng)時,也可采用公式(10-5)或(10-6)式做檢驗例10-5對例1-4的秩相關(guān)系數(shù)作假設(shè)檢驗例10-4中算得查臨界值表,,按的水準(zhǔn),拒絕,可以認(rèn)為貧血病患兒的出血癥狀與血紅蛋
白量之間呈負(fù)相關(guān)關(guān)系五、簡單線性相關(guān)的樣本量估算簡單線性相關(guān)的樣本量估算公式為:例10-4根據(jù)以往調(diào)查,某地某年大學(xué)生女大學(xué)生的體重(kg)與肺活量(L)的線性相關(guān)系數(shù)0.7165,若想在α=0.05,β=0.90水平下得到相關(guān)系數(shù)有統(tǒng)計學(xué)意義的結(jié)論,至少應(yīng)調(diào)查多少人?據(jù)已知條件代入公式:第三節(jié)分類變量的關(guān)聯(lián)性分析交叉分類2×2表的關(guān)聯(lián)分析例10-7
為觀察大學(xué)生專業(yè)與艾滋病知曉程度之間是否有關(guān),某研究者調(diào)查了某一年級不同專業(yè)的500名學(xué)生,對每個個體分別觀察專業(yè)與艾滋病知曉程度兩種屬性,2×2種結(jié)果分類記述如表10-3所示,試分析兩種屬性的關(guān)聯(lián)性。適用條件對定性變量之間的聯(lián)系通用的方法是根據(jù)兩個定性變量交叉分類基數(shù)所得的頻數(shù)資料(列聯(lián)表)作關(guān)聯(lián)性分析,即關(guān)于兩種屬性獨立性的卡方檢驗計算公式表10-3專業(yè)與艾滋病知曉程度之間的關(guān)系大學(xué)生專業(yè)
艾滋病知曉程度合計
高低醫(yī)學(xué)預(yù)科3191121其它19359合計50
450
500假設(shè)檢驗
:大學(xué)生專業(yè)與與艾滋病知曉程度之間相互獨立
:大學(xué)生專業(yè)與與艾滋病知曉程度之間關(guān)聯(lián)將表中各數(shù)據(jù)代入公式得拒絕原假設(shè),說明大學(xué)生專業(yè)與與艾滋病知曉程度之間存在關(guān)聯(lián)性.關(guān)于兩分類變量之間的關(guān)聯(lián)程度,可采用(phicoefficient)、GramerV系數(shù)、Gramer‘sVcoefficient)和Pearson列聯(lián)系數(shù)(contingencycoefficient),三個系數(shù)愈近1說明關(guān)系愈密切,三個愈近0,說明兩分類變量幾乎沒有關(guān)系。只適用于四格表資料,對于多行多列只能采用后兩種.本列二2×2配對資料的關(guān)聯(lián)性分析例10-8
有132食品標(biāo)本,把每份標(biāo)本一分為二,分別用兩種檢測方法作沙門菌檢驗,觀察結(jié)果如表10-5,問兩種檢測方法的結(jié)果有無關(guān)聯(lián)?表10-5兩種檢測方法結(jié)果甲法
乙法合計+-+8010
90-31
11
42合計111
21
132假設(shè)檢驗
:兩種檢測方法的結(jié)果之間互相獨立
:兩種檢測方法的結(jié)果之間有關(guān)聯(lián)將本例數(shù)據(jù)代入公式得有理由拒絕零假設(shè),可以認(rèn)為甲、乙兩種方法檢測方法之間存在關(guān)聯(lián)性,進(jìn)一步計算三R×C表分類資料的關(guān)聯(lián)性分析例10-9
欲探討職業(yè)類型與胃癌,得表10-6的資料。問職業(yè)類型與胃癌是否關(guān)聯(lián)?表10-6310胃病患者按胃病類型與職業(yè)兩種屬性的交叉分類表職業(yè)
胃病合計淺表型慢性胃炎胃潰瘍機(jī)關(guān)干部80
484
132工人52
62
12
126公交車司機(jī)20221052合設(shè)檢驗
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度集裝箱購置與綠色港口運營合同3篇
- 二零二五年度集資房項目審計與財務(wù)報表編制合同3篇
- 2024年海南經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測試歷年參考題庫含答案解析
- 二零二五年戶外廣告安裝工程量清單及結(jié)算合同3篇
- 吉林省農(nóng)安縣九年級物理全冊182電功率課件新版新人教版
- 2024年河南質(zhì)量工程職業(yè)學(xué)院高職單招職業(yè)技能測驗歷年參考題庫(頻考版)含答案解析
- 2024年河南工業(yè)和信息化職業(yè)學(xué)院高職單招職業(yè)技能測驗歷年參考題庫(頻考版)含答案解析
- 2024年河北政法職業(yè)學(xué)院高職單招職業(yè)技能測驗歷年參考題庫(頻考版)含答案解析
- 2024年滄州醫(yī)學(xué)高等??茖W(xué)校高職單招職業(yè)適應(yīng)性測試歷年參考題庫含答案解析
- DAM10KW中波發(fā)射機(jī)各單元的檢測與調(diào)整指導(dǎo)示意圖
- 二年級美術(shù)復(fù)習(xí)計劃
- 物業(yè)采購工作總結(jié)
- 組織文化與領(lǐng)導(dǎo)力
- 膠粘性不良改善報告
- 電子商務(wù)客服全套培訓(xùn)方案
- 河北省石家莊市橋西區(qū)2023-2024學(xué)年九年級上冊期末英語模擬試題(附答案)
- 《產(chǎn)品價值點》課件
- 2023年燃?xì)獍踩a(chǎn)工作匯報材料
- 考研英語5500大綱詞匯亂序打印版
- 供貨商合同協(xié)議書簡單版正規(guī)范本(通用版)
評論
0/150
提交評論