版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第六講
非參數(shù)統(tǒng)計分析與
直線相關(guān)回歸分析浙江大學(xué)流行病與衛(wèi)生統(tǒng)計教研室?Fall2002,XiuyangLiB99,MedStat參數(shù)統(tǒng)計和非參數(shù)統(tǒng)計參數(shù)統(tǒng)計:假設(shè)樣本所來自的總體分布具有某個已知的函數(shù)形式,而其中有的參數(shù)是未知的,統(tǒng)計分析的目的就是對這些未知的參數(shù)進行估計或檢驗。此類方法稱為參數(shù)統(tǒng)計。非參數(shù)統(tǒng)計:不受總體分布的限制,用于檢驗分布而不是參數(shù)的一種統(tǒng)計方法。秩和檢驗:通過秩次的排列求出秩和進行假設(shè)檢驗的一種非參數(shù)檢驗的統(tǒng)計方法。?Fall2002,XiuyangLiB99,MedStat非參數(shù)統(tǒng)計的特點樣本所來自的總體的分布形式為任何形式,甚至是未知的。收集資料方便,可用“等級”或“符號”來評定觀察結(jié)果。多數(shù)非參數(shù)方法比較簡便,易于理解和掌握。如“秩和檢驗”計算的統(tǒng)計量是“秩和(等級之和)”。損失信息量,適用于參數(shù)統(tǒng)計法的資料用非參數(shù)統(tǒng)計方法進行檢驗將降低檢驗效能。確定p值的方法與參數(shù)檢驗不一樣?Fall2002,XiuyangLiB99,MedStat非參數(shù)統(tǒng)計的適用范圍半定量資料偏態(tài)分布資料方差不齊的資料開口資料有特異點的資料分布類型不明?Fall2002,XiuyangLiB99,MedStat常用非參數(shù)統(tǒng)計方法配對資料秩和檢驗(Wilcoxon配對秩和檢驗)成組設(shè)計兩樣本比較的秩和檢驗(Wilcoxon法)成組設(shè)計多個樣本比較的秩和檢驗(Kruskal-Wallis法)多個樣本的兩兩比較配伍組設(shè)計的多個樣本比較的秩和檢驗Ridit法等級相關(guān)?Fall2002,XiuyangLiB99,MedStat配對資料比較的秩和檢驗?Fall2002,XiuyangLiB99,MedStat假設(shè)檢驗的基本步驟建立健設(shè)和確定檢驗水準
H0:兩采樣點測得空氣中鈾濃度結(jié)果相同
=0.05。計算統(tǒng)計量T值求差:計算每對數(shù)據(jù)之差編秩求秩和:分別求正、負秩次之和求T值:T=min(T+,T-)=23.5確定P值T=23.5>T11,0.05=10,P>0.05判斷結(jié)果?Fall2002,XiuyangLiB99,MedStat?Fall2002,XiuyangLiB99,MedStat兩樣本比較的秩和檢驗(Wilcoxon法)
?Fall2002,XiuyangLiB99,MedStat基本步驟建立假設(shè)和確定檢驗水準
H0:兩種手術(shù)方法治療肝癌者術(shù)后生存月數(shù)總體分布
=0.05求統(tǒng)計量T
排隊:兩組數(shù)據(jù)分別從小到大排隊,以便于編秩編秩求秩:分別以n1和n2代表兩樣本例數(shù)求T值,T=Tmin(n1,n2)=23.5(ifn1=n2,T=min(T1,T2))確定P值T=23.5∈(18,42),P>0.05判斷結(jié)果按=0.05水準,不拒絕H0,還不能認為兩種手術(shù)方法治療肝癌患者后生存月數(shù)總體分布不同。?Fall2002,XiuyangLiB99,MedStat?Fall2002,XiuyangLiB99,MedStat?Fall2002,XiuyangLiB99,MedStat?Fall2002,XiuyangLiB99,MedStat?Fall2002,XiuyangLiB99,MedStat?Fall2002,XiuyangLiB99,MedStat?Fall2002,XiuyangLiB99,MedStat?Fall2002,XiuyangLiB99,MedStat線性回歸與相關(guān)直線回歸直線回歸的概念直線回歸方程的建立回歸系數(shù)的假設(shè)檢驗線性回歸方程的應(yīng)用直線回歸分析應(yīng)注意的問題直線相關(guān)直線相關(guān)的概念相關(guān)系數(shù)的意義相關(guān)系數(shù)的計算和假設(shè)檢驗直線相關(guān)分析的注意事項?Fall2002,XiuyangLiB99,MedStat直線回歸的概念回歸(regression)是研究多個變量之間的某種數(shù)量依存關(guān)系的統(tǒng)計方法,當研究只涉及兩個變量X和Y,而且它們之間呈直線關(guān)系即為直線回歸(linearregression).其統(tǒng)計學(xué)模型:Y=+X+,其中為誤差項,假定為獨立的隨機變量,服從E()=0,方差為2的正態(tài)分布。?Fall2002,XiuyangLiB99,MedStat直線回歸方程的建立(1)變量X和Y的散點圖呈現(xiàn)直線趨勢,但X和Y之間的線性關(guān)系具有不確定性,不同與數(shù)學(xué)函數(shù)式X和Y有嚴格的意義對應(yīng)關(guān)系,用一組實際資料得到回歸方程的和的估計值a和b后就可建立起直線回歸方程(linearregressionequation)。其通式為:,式中x為自變量(independentvariable),Y為因變量(dependentvariable)是Y的估計值,亦稱回歸值或預(yù)報值。a為直線在Y軸上的截距(intercept),即X=0時Y值;b為直線的斜率(slope),又稱回歸系數(shù)(regressioncoefficient),表示X變動一個單位時,Y平均變動的單位數(shù)。?Fall2002,XiuyangLiB99,MedStatLinearEquationsHighSchoolTeacher?Fall2002,XiuyangLiB99,MedStatSampleLinearRegressionModelUnsampledobservationi
=RandomerrorObservedvalue^?Fall2002,XiuyangLiB99,MedStat02040600204060XYScattergram1. PlotofAll(Xi,Yi)Pairs2. SuggestsHowWellModelWillFit?Fall2002,XiuyangLiB99,MedStatThinkingChallengeHowwouldyoudrawalinethroughthepoints?Howdoyoudeterminewhichline‘fitsbest’??Fall2002,XiuyangLiB99,MedStatThinkingChallengeHowwouldyoudrawalinethroughthepoints?Howdoyoudeterminewhichline‘fitsbest’??Fall2002,XiuyangLiB99,MedStatThinkingChallengeHowwouldyoudrawalinethroughthepoints?Howdoyoudeterminewhichline‘fitsbest’??Fall2002,XiuyangLiB99,MedStatThinkingChallengeHowwouldyoudrawalinethroughthepoints?Howdoyoudeterminewhichline‘fitsbest’??Fall2002,XiuyangLiB99,MedStatThinkingChallengeHowwouldyoudrawalinethroughthepoints?Howdoyoudeterminewhichline‘fitsbest’??Fall2002,XiuyangLiB99,MedStatThinkingChallengeHowwouldyoudrawalinethroughthepoints?Howdoyoudeterminewhichline‘fitsbest’??Fall2002,XiuyangLiB99,MedStatThinkingChallengeHowwouldyoudrawalinethroughthepoints?Howdoyoudeterminewhichline‘fitsbest’??Fall2002,XiuyangLiB99,MedStat直線回歸方程的建立(2)求回歸直線就是計算方程中a和b的值,常用最小二乘法原理,即求使得剩余平方和達到最小的a和b.其計算公式:?Fall2002,XiuyangLiB99,MedStatLeastSquaresGraphically?Fall2002,XiuyangLiB99,MedStat回歸系數(shù)的假設(shè)檢驗(1)檢驗的意義:各觀察值Y1,Y2,﹍,Yn之間的變異產(chǎn)生的原因:①由自變量X的變異引起;②除X以外的一切因素引起的變異。為了檢驗X和Y之間是否有直線關(guān)系,就要檢驗Y的變異有多大部分是由X的變異引起。?Fall2002,XiuyangLiB99,MedStat回歸系數(shù)的假設(shè)檢驗(2)將Y的變異的總離均差平方和SS總分解為兩部分,即SS總=SS回+SS剩。其中SS回稱為回歸平方和,它是由X的變化所引起的,SS回/回為回歸方面的均方(MS回),在直線回歸中自由度為1;SS剩稱為剩余平方和,SS剩/剩為剩余均方(MS剩),表示觀察點與直線的偏離(縱向距離),它是由除X以外的一切因素所引起的,自由度為n-2。?Fall2002,XiuyangLiB99,MedStatVariationMeasuresTotalsumofsquares(Yi-Y)2
Unexplainedsumofsquares(Yi-Yi)2
^Explainedsumofsquares(Yi-Y)2
^Yi
?Fall2002,XiuyangLiB99,MedStat直線回歸方程的區(qū)間估計的95%CI:條件均數(shù)的估計:個體y值的95%容許區(qū)間:總體中x為某一定值時,個體y的波動范圍y/x?Fall2002,XiuyangLiB99,MedStat回歸系數(shù)的假設(shè)檢驗(3)如果Y與X之間無直線關(guān)系,那么樣本所來自的總體的回歸均方與剩余均方應(yīng)相等,即回歸系數(shù)=0;反之,≠0。所以,要檢驗Y與X之間是否有直線關(guān)系,就是要檢驗回歸系數(shù)是否為0。?Fall2002,XiuyangLiB99,MedStatTestofSlopeCoefficient1. ShowsIfThereIsaLinearRelationshipBetweenX&Y
2. InvolvesPopulationSlope13. HypothesesH0:1=0(NoLinearRelationship)Ha:1
0(LinearRelationship)4. TheoreticalBasisIsSamplingDistributionofSlope?Fall2002,XiuyangLiB99,MedStatSamplingDistribution
ofSampleSlopesAllPossible
SampleSlopes Sample1: 2.5 Sample2: 1.6 Sample3: 1.8 Sample4: 2.1
::
VerylargenumberofsampleslopesSamplingDistribution11S^^?Fall2002,XiuyangLiB99,MedStatSlopeCoefficient
TestStatistic?Fall2002,XiuyangLiB99,MedStat回歸系數(shù)的假設(shè)檢驗檢驗方法:可用F檢驗或t檢驗。H0:=0H1:≠0=0.05F=MS回/MS剩,回=1,剩=n-2t=|b|/Sb=|b|/(Syx/(lxy)?),=n-2式中Sb為回歸系數(shù)b的標準誤,Syx為剩余標準差,即剩余均方的平方根,Syx=(SS剩/(n-2))?=(∑(Y-)2/(n-2))?對同一資料,這兩種檢驗的結(jié)論是一致的,∵在回=1時,t=(F)??Fall2002,XiuyangLiB99,MedStat線性回歸方程的應(yīng)用描述兩變量之間的線性依存關(guān)系利用回歸方程進行預(yù)測利用回歸方程進行統(tǒng)計控制?Fall2002,XiuyangLiB99,MedStatWhatIsPredicted?Fall2002,XiuyangLiB99,MedStat直線回歸分析應(yīng)注意的問題兩變量之間的關(guān)系必須有實際意義變量X是選定的,變量Y服從正態(tài)分布,回歸分析為Ⅰ型回歸,只能建立一個回歸方程:,變量X和Y服從雙變量正態(tài)分布,回歸分析為Ⅱ型回歸,可以建立兩個回歸方程:與進行回歸分析時,資料應(yīng)滿足假設(shè)條件,如不滿足時,要作變量變換.利用回歸方程對Y進行預(yù)測時一般只適用與自變量X的原觀察值的數(shù)據(jù)范圍,不能隨意外延.?Fall2002,XiuyangLiB99,MedStat直線相關(guān)的概念相關(guān)是研究多個變量之間相互關(guān)系的一種統(tǒng)計方法,它是研究隨機變量之間相關(guān)的密切程度以及相關(guān)的方向。直線相關(guān)是只涉及兩個變量X、Y,且它們之間呈直線關(guān)系。?Fall2002,XiuyangLiB99,MedStat1. PearsonProductMomentCoefficientofCorrelation,r:SampleCoefficient
ofCorrelation?Fall2002,XiuyangLiB99,MedStatCoefficientofCorrelationValues?Fall2002,XiuyangLiB99,MedStatCoefficientofCorrelationValues-1.0+1.00-.5+.5?Fall2002,XiuyangLiB99,MedStatCoefficientofCorrelationValues-1.0+1.00-.5+.5NoCorrelation?Fall2002,XiuyangLiB99,MedStatCoefficientofCorrelationValues-1.0+1.00Increasingdegreeofnegativecorrelation-.5+.5NoCorrelation?Fall2002,XiuyangLiB99,MedStatCoefficientofCorrelationValues-1.0+1.00-.5+.5PerfectNegativeCorrelationNoCorrelation?Fall2002,XiuyangLiB99,MedStatCoefficientofCorrelationValues-1.0+1.00-.5+.5PerfectNegativeCorrelationNoCorrelationIncreasingdegreeofpositivecorrelation?Fall2002,XiuyangLiB99,MedStatCoefficientofCorrelationValues-1.0+1.00PerfectPositiveCorrelation-.5+.5PerfectNegativeCorrelationNoCorrelation?Fall2002,XiuyangLiB99,MedStatCoefficientofCorrelation
Examplesr=1r=-1r=.89r=0?Fall2002,XiuyangLiB99,MedStat相關(guān)系數(shù)的意義兩變量之間直線相關(guān)的性質(zhì)和密切程度用直線相關(guān)系數(shù)表示,簡稱相關(guān)系數(shù)(correlationcoefficient)用r表示。r∈[-1,1],沒有單位。r值與相關(guān)性質(zhì)的關(guān)系:
r>0,為正相關(guān);r=1,為完全正相關(guān);
r<0,為負相關(guān);r=-1,為完全負相關(guān);r=0,為零相關(guān)。r值與相關(guān)的密切程度的關(guān)系:
|r|越接近1,相關(guān)密切程度越高;|r|越接近0,相關(guān)密切程度越低。?Fall2002,XiuyangLiB99,MedStat總體相關(guān)系數(shù)的估計z=artanhr或r=tanhz
或z的95%CI:的95%CI:將上式得到的z作反變換即可。?Fall2002,XiuyangLiB99,MedStatTestof
CoefficientofCorrelation1. ShowsIfThereIsaLinearRelationshipBetween2NumericalVariables2. SameConclusionasTestingPopulationSlope13. HypothesesH0:
=0(NoCorrelation)Ha:
0(Correlation)r的假設(shè)檢驗:常用方法有查r值表法和t檢驗法。t=|r|/[(1-r2)/(n-2)]?,=n-2。?Fall2002,XiuyangLiB99,MedStat直線相關(guān)分析的注意事項相關(guān)分析要求X、Y服從雙變量正態(tài)分布不能只憑相關(guān)系數(shù)的絕對值的大小來判斷相關(guān)的密切程度,還要考慮自由度的大小。相關(guān)可能是因果關(guān)系,也可能是伴隨關(guān)系,因此不能根據(jù)相關(guān)的密切程度來判斷事物之間是否存在因果關(guān)系。?Fall2002,XiuyangLiB99,MedStat相關(guān)與回歸的區(qū)別與聯(lián)系(1)區(qū)別:對資料的要求:回歸要求Y服從正態(tài)分布,X可以是人為控制的,也可以是服從正態(tài)分布的隨機變量;相關(guān)要求X、Y服從雙變量正態(tài)分布?;貧w說明兩變量數(shù)量上的依存關(guān)系,相關(guān)說明變量間的相關(guān)關(guān)系。?Fall20
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版苗木種植與農(nóng)業(yè)綜合開發(fā)合同樣本4篇
- 二零二五年度教育培訓(xùn)股東股權(quán)轉(zhuǎn)讓與合作辦學(xué)合同2篇
- 二零二五版嬰幼兒奶粉國際市場拓展與出口合同4篇
- 2025版綠色環(huán)保型商品房預(yù)售買賣合同3篇
- 2025年度校服品牌授權(quán)與校園形象塑造合同3篇
- 2025年度事業(yè)單位合同工勞動法執(zhí)行監(jiān)督評估合同3篇
- 2025年度生鮮配送冷鏈物流承包合同范本3篇
- 2025年度個人傭金提成與長期激勵合同2篇
- 課題申報參考:能源數(shù)據(jù)要素賦能可再生能源電力生產(chǎn)的機制與對策研究
- 課題申報參考:民族傳統(tǒng)體育與體育非物質(zhì)文化遺產(chǎn)的傳承與保護研究
- 2025年N1叉車司機考試試題(附答案)
- 《醫(yī)院財務(wù)分析報告》課件
- 2025老年公寓合同管理制度
- 2024-2025學(xué)年人教版數(shù)學(xué)六年級上冊 期末綜合卷(含答案)
- 2024中國汽車后市場年度發(fā)展報告
- 感染性腹瀉的護理查房
- 天津市部分區(qū)2023-2024學(xué)年高二上學(xué)期期末考試 物理 含解析
- 《人工智能基礎(chǔ)》全套英語教學(xué)課件(共7章)
- GB/T 35613-2024綠色產(chǎn)品評價紙和紙制品
- 2022-2023學(xué)年五年級數(shù)學(xué)春季開學(xué)摸底考(四)蘇教版
- 【螞蟻?!?024中國商業(yè)醫(yī)療險發(fā)展研究藍皮書
評論
0/150
提交評論