版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第十相關與回歸分析演示文稿本文檔共65頁;當前第1頁;編輯于星期六\12點46分(優(yōu)選)第十相關與回歸分析本文檔共65頁;當前第2頁;編輯于星期六\12點46分相關關系是指變量之間確實存在的但關系值不固定的相互依存關系。在這種關系中,當一個(或幾個)變量的值確定以后,另一個變量的值雖與它(或它們)有關,但卻不能完全確定。這是一種非確定性的關系。例如,電視機的擁有率與人均收入水平有關,但對于人均收入水平相同的地區(qū),其電視機的擁有率可能不盡相同。在客觀事物中,尤其是在社會現象中,相關關系普遍存在。統(tǒng)計分析很有必要對這種關系進行研究。本文檔共65頁;當前第3頁;編輯于星期六\12點46分(2)相關關系的特性對相關關系的分析,主要是把握相關關系三個方面的特性:其一,相關的強度。即兩個變量相關關系的確定程度。其二,相關的方向。其三,線性相關與非線性相關。(3)相關關系的種類A、正相關與負相關從相關的方向看,相關關系可以分為正相關和負相關。本文檔共65頁;當前第4頁;編輯于星期六\12點46分正相關是指相關變量之間的變化趨勢相同,即當自變量的值增加,因變量的值也隨之增加;當自變量的值減少,因變量的值也隨之減少。例如,汽車的使用年限與汽車的修理費用之間的關系。負相關是指相關變量之間的變化趨勢相反,即當自變量的值增加,因變量的值隨之減少;當自變量的值減少,因變量的值隨之增加。例如,產品產量與單位產品成本之間的關系。本文檔共65頁;當前第5頁;編輯于星期六\12點46分B、線性相關與非線性相關從相關的形式上來看,相關關系可分為線性相關和非線性相關。線性相關也稱直線相關,是指相關的兩個變量之間變化的趨勢呈線性或近似于線性。即自變量發(fā)生變動,因變量隨之發(fā)生變動,其增加或減少量是大致均等的,從圖形上看,其觀察點的分布近似表現為直線形式。非線性相關也稱曲線相關,是指相關的兩個變量之間變化的趨勢呈非線性。即自變量發(fā)生變動,因變量隨之發(fā)生變動,但其增加或減少量不是均等的,從圖形上看,其觀察點的分布表現為各種曲線形式。本文檔共65頁;當前第6頁;編輯于星期六\12點46分C、單相關和復相關從相關變量的個數來看,相關關系可分為單相關和復相關。單相關是指兩個變量之間的相關關系。復相關是三個或三個以上變量之間的相關關系。例如,僅僅考慮施肥量對產量的影響,這就是一種單相關;如果除了施肥量之外,再考慮降雨量及深耕程度對產量的影響,則這種相關關系就是一種復相關。本文檔共65頁;當前第7頁;編輯于星期六\12點46分2、因果關系:是指某一變量的變化可以確定為另一變量變化原因的關系。在相關關系中,通常,在相互聯系的現象之間存在著一定的因果關系,這時就把其中的起著影響作用的現象具體化,通過一定的變量反映出來,這樣的變量稱為自變量。由于受到自變量變動的影響而發(fā)生變動的變量稱為因變量。相關關系確定為因果關系必須滿足三個條件:其一,兩變量之間必須存在相關關系;其二,必須確定自變量變化在前,因變量變化在后;其三,必須確定變量X與變量Y之間的關系,不是由于第三個變量的存在而呈現出來的一種虛假關系。本文檔共65頁;當前第8頁;編輯于星期六\12點46分例如,在糧食畝產量與施肥量之間,施肥量這一變量是自變量,畝產量這一變量是因變量。當研究的是兩個變量之間的關系時,通常以符號X表示自變量,以符號Y表示因變量。在相關關系中,有時兩個變量之間只存在相互聯系而并不存在明顯的因果關系。確定哪一個是自變量,哪一個是因變量,主要決定于研究的目的。對不同層次的統(tǒng)計變量進行相關關系分析的方法是不同的,下面我們分不同的變量類型來講。本文檔共65頁;當前第9頁;編輯于星期六\12點46分二、定距或定比變量的回歸與相關分析(一)回歸分析與相關分析的含義及聯系在對定距或定比變量之間存在的相關關系進行分析研究時,最常用的方法就是回歸分析和相關分析?;貧w分析和相關分析是相互聯系的,它們從不同方面研究變量之間相關關系的本質?;貧w分析是用來研究變量之間關系的可能形式的統(tǒng)計方法。它把兩個或兩個以上變量之間的變動關系加以模型化,用數學函數表達變量之間的關系。運用這種方法時,最終的目的通常在于預測或估計與某一個或某幾個變量的給定值相對應的另一變量的數值。本文檔共65頁;當前第10頁;編輯于星期六\12點46分相關分析是研究如何計量變量之間關系方向和強度的統(tǒng)計方法。它能確定變量之間相關的方向及程度,即變量之間某種關系的確切程度有多大?;貧w分析和相關分析既有聯系,又有區(qū)別。就其研究對象來說,兩者都是研究變量之間的相關關系。但就彼此研究變量之間關系的性質來看,兩者存在明顯的區(qū)別?;貧w分析中,必須將相關變量區(qū)分為自變量和因變量,以確定其關系的可能形式,所研究變量屬于非對等關系。相關分析中,計量變量之間關系的強度,不必區(qū)分自變量與因變量,所研究變量屬于對等的關系。本文檔共65頁;當前第11頁;編輯于星期六\12點46分(二)相關圖表對現象變量之間是否存在相關關系以及存在怎樣的相關關系進行分析、作出判斷,這是進行回歸和相關分析的前提。對于定距或定比變量通過編制相關表和相關圖,可以直觀地、大致地判斷現象變量之間是否存在相關關系以及關系的類型。本文檔共65頁;當前第12頁;編輯于星期六\12點46分(1)相關表相關表是表現現象變量之間相關關系的表格。例如,為研究商店人均月銷售額和利潤率的關系,調查10家商店取得10對數據,以人均銷售額為自變量,利潤率為因變量,編制簡單相關表如下表。本文檔共65頁;當前第13頁;編輯于星期六\12點46分人均銷售額與和利潤率相關表編號人均月銷售額(千元)利潤率(%)1234567891013345667783.06.26.68.110.412.612.316.316.818.5本文檔共65頁;當前第14頁;編輯于星期六\12點46分(2)相關圖所謂相關圖,是把相關的兩個變量之間的關系在平面直角坐標中反映出來。通常將自變量(x)置于橫軸上,因變量(y)置于縱軸上,而將兩個變量相對應的變量值用坐標點形式描繪出來。相關圖就是用相關點的分布狀況來描述相關關系的,所以又稱為散點圖。根據相關圖,可以直觀地看出變量之間相關關系的模式。本文檔共65頁;當前第15頁;編輯于星期六\12點46分例如,前述人均月銷售額與利潤率的關系,可用相關圖表示如下:利潤率(%)人均銷售額(千元)1
20人均銷售額與利潤率相關圖51015
2
3
84
567本文檔共65頁;當前第16頁;編輯于星期六\12點46分從圖中,我們可以清楚地看出,這兩個變量之間相關的方向(即正相關或負相關)以及相關的具體形式(線性相關或非線性相關)(a)正直線關系(b)反直線關系(c)正曲線關系本文檔共65頁;當前第17頁;編輯于星期六\12點46分(e)較分散的
反直線關系(d)反曲線關系(f)沒有關系x與y的一些可能關系的散點圖本文檔共65頁;當前第18頁;編輯于星期六\12點46分上圖說明了相關圖中的一些可能關系。圖(a)和(b)表示的是正的和反的直線關系,即正線性相關和負線性相關。圖(c)和(d)分別表示的是正的和反的曲線關系,即正非線性相關和負非線性相關。圖(e)中是散布域很寬的反直線關系。散布域越寬,則表明變量之間的聯系程度越差。圖(f)中的圖象表明兩個變量之間沒有什么關系。本文檔共65頁;當前第19頁;編輯于星期六\12點46分(三)簡單線性回歸(1)回歸直線的確定如果變量x和y相關并可區(qū)分自變量與因變量,如果從相關圖表中可以看出它們之間大致形成一種直線關系,我們就可在相關圖上求出一條與各點最相配合的直線。本文檔共65頁;當前第20頁;編輯于星期六\12點46分由于這些點所代表的若干對數據——觀察值,只是相互有一定關系的變量x、y的總體中的一個樣本,故這樣求出的直線是總體回歸直線的估計線。在估計線上的點的縱坐標是相應于x的y的估計值。y=a+bx如果這個y的估計值用y表示,則估計線的方程可寫為本文檔共65頁;當前第21頁;編輯于星期六\12點46分這叫做樣本回歸直線。它是y對x的回歸線,表明y對x的平均關系。式中x為受控制的自變量,通常由研究者事先選定數值。a為樣本回歸直線y的截距,它是樣本回歸直線通過縱軸的點的y坐標;b為樣本回歸直線的斜率,它表示當x增加一個單位時y的平均增加數量,b又稱回歸系數。本文檔共65頁;當前第22頁;編輯于星期六\12點46分如何確定回歸直線方程呢?也就是說怎樣確定方程中的參數a、b呢?若用(xi,yi)(i=1,2,…n)表示n組觀察值,則對任意給定的xi
,可得y的估計值為這些數值同實際值yi之間存在著誤差;yi=a+bxii=yi
yi=
yi
a
bxi本文檔共65頁;當前第23頁;編輯于星期六\12點46分Q(a,b)=2=(yabx)2為最小。這樣便把尋找適當直線問題轉化為使Q(a,b)達到最小條件下求出a、b的問題。在回歸分析中,人們普遍采用的是最小二乘法原則。根據最小二乘法的原則,欲使所求回歸直線y=a+bx最適合于實際資料,必須使每個xi對應的指標實測值yi與回歸直線確定的估計值yi的離差平方之和為最小,即必須使本文檔共65頁;當前第24頁;編輯于星期六\12點46分因為Q(a,b)是a、b的非負二元函數,所以其最小值無疑是存在的。根據數學中的極值原理,令:滿足上述條件的a、b即為所求的未知參數。由化簡得(yabx)=0(yabx)x=0本文檔共65頁;當前第25頁;編輯于星期六\12點46分即:y=na+bxxy=ax+bx2上述方程組稱為標準方程組。解之,得:a=ybx本文檔共65頁;當前第26頁;編輯于星期六\12點46分因此即可確定回歸方程式為:y=a+bx這個方程稱為在給定樣本條件下的一元線性回歸方程,對應的直線稱為樣本回歸直線。顯然,回歸方程對于不同的樣本是有差別的,因而,它具有經驗的特征,所以在實用上,也將它叫做經驗公式。為了簡化上述回歸系數b的表達形式,引入如下離差乘積的和式:Lxy=(xx)(yy)本文檔共65頁;當前第27頁;編輯于星期六\12點46分Lxx=(xx)2于是,回歸系數可簡化為為了相關性檢驗的需要,順便引入關于y的離差平方和:Lyy=(yy)2本文檔共65頁;當前第28頁;編輯于星期六\12點46分求回歸方程式的系數往往是通過列表進行的。這里,我們以下表資料為倒,通過求某鋼鐵廠煉鋼精煉時間對含碳量的回歸方程,說明回歸方程的確定。10.9100爐次含碳量(%)
(x)精煉時間(分)
(y)某鋼鐵廠十個爐次鋼液含碳量和精煉時間10234567892.01.01.21.41.51.61.71.81.9105235130145170175190190220本文檔共65頁;當前第29頁;編輯于星期六\12點46分可以看出,x與y之間的關系近似為直線關系。我們可以對其配合一條回歸直線。為計算回歸方程的系數a、b,我們先對原始數據進行加工。本文檔共65頁;當前第30頁;編輯于星期六\12點46分yx2y2xy1001051301451701751901902202350.811.001.441.962.252.562.893.243.614.001000011025169002102528900306253610036100484005522590105156203255280323342418470166023.762943002642爐次x123456789100.91.01.21.41.51.61.71.81.92.015.0原始數據加工表本文檔共65頁;當前第31頁;編輯于星期六\12點46分于是:本文檔共65頁;當前第32頁;編輯于星期六\12點46分所以:故精煉時間關于含碳量的回歸方程為:y=14.9525+120.635x本文檔共65頁;當前第33頁;編輯于星期六\12點46分計算結果表明,這個方程顯示著鋼水溶液的含碳量每增加0.1%,則精煉時間平均來說大約要延長12.06分。根據回歸方程,可以給出自變量的任一數值估計或預測因變量的平均可能值。y=14.9525+120.6352.2=150.4445(分)例如,求含碳量2.2%所需的精煉時間:本文檔共65頁;當前第34頁;編輯于星期六\12點46分(四)相關系數相關分析是用以說明變量之間相關程度的統(tǒng)計工具。相關分析常常與回歸分析聯合使用,以衡量回歸方程所表示的因變量變化的精確度如何。相關分析也可單獨用于衡量變量之間的聯系程度。本節(jié)我們討論兩個變量之間線性相關程度問題。兩個變量之間線性相關程度的描述通常采用相關系數。本文檔共65頁;當前第35頁;編輯于星期六\12點46分(1)相關系數的意義我們回過頭來考察一下線性回歸中指標y的值yi與回歸估計值yi的離差平方和。記于是有:Q=Lyy(1r2)r稱為相關系數。它是在線性相關條件下用來說明兩個變量之間相關關系密切程度的指標。本文檔共65頁;當前第36頁;編輯于星期六\12點46分因為Q≥0,Lyy≥0,故相關系數有一個重要性質:|r|≤1r=1(1)1<r=0(2)r=0(3)r=0(4)0<r<1(5)r=1(6)相關圖與相關系數經驗關系本文檔共65頁;當前第37頁;編輯于星期六\12點46分由于Lyy對于一組實測數據來講是定值,故由Q=Lyy(1r2)可知,當|r|較大接近于1時,離差平方和Q就較小而接近于0,此時,y與x高度相關。特別當|r|=1時,稱它們是完全相關的,上圖(1)、(6)所示。當|r|較小而接近于0時,Q就大,y與x的相關關系很弱,特別當r=0時,稱它們線性無關。如上圖(3)、(4)所示本文檔共65頁;當前第38頁;編輯于星期六\12點46分由于Lxy可正可負,所以相關系數r也可正可負。若r>0則稱y與x正相關,如上圖(5)、(6)所示。此時,隨著x的增大(或減小),y將呈現增大(或減小)的趨勢。特別對于上圖(6)的情形,由于r=1,故稱完全正相關。若r<0,則稱y與x負相關,如上圖(1)、(2)所示。此時,隨著x的增大(或減小),y將呈現減小(或增大)的趨勢。特別對于圖(1)的情形。由于r=1,故稱為完全負相關。一般認為相關系數的絕對值在0.7以上為高度相關,之間為中度相關,0-0.3為低相關。本文檔共65頁;當前第39頁;編輯于星期六\12點46分應當注意,相關系數r只表明x與y之間的線性關系的密切程度和方向。當r很小甚至為0時,只表明x與y之間的線性關系不密切,或不存在線性關系,并不表示x與y之間就沒有關系,可能二者之間有非線性關系。如上圖(4)所示,x與y之間就存在著曲線關系。本文檔共65頁;當前第40頁;編輯于星期六\12點46分(2)相關系數的計算我們已經知道,相關系數的公式為:第二節(jié)中我們介紹了離差乘積的和式:本文檔共65頁;當前第41頁;編輯于星期六\12點46分于是有:本文檔共65頁;當前第42頁;編輯于星期六\12點46分如果將分子分母同乘以n,又可得:根據前例中煉鋼廠鋼液含碳量與精煉時間資料,可計算相關系數。那里,我們已經求得:本文檔共65頁;當前第43頁;編輯于星期六\12點46分于是其相關系數為:計算得出r=0.9892,表明精煉時間和含碳量之間為正相關關系。而且r值接近于1,表示兩者關系很密切。本文檔共65頁;當前第44頁;編輯于星期六\12點46分三、定類變量間的相關關系判定及檢驗在各個研究領域中,有些研究問題只能劃分為不同性質的類別,各類別沒有量的聯系。例如,性別分男女,職業(yè)分為公務員、教師、工人、……,教師職稱又分為教授、副教授、……。有時雖有量的關系,因研究需要將其按一定的標準分為不同的類別,例如,學習成績、能力水平、態(tài)度等都是連續(xù)數據,只是研究者依一定標準將其劃分為優(yōu)良中差,喜歡與不喜歡等少數幾個等級。要判別這些分類間是否有相關關系就得用到相應的方法。本文檔共65頁;當前第45頁;編輯于星期六\12點46分(一)交互分類表交互分類表又叫列聯表和條件次數表。它是按兩個變量的值將所研究的個案進行分類,亦即將兩個變量的次數交互分配在一張統(tǒng)計表中成為一個矩陣,這種表就叫交互分類表。例如:某單位對職工的閑暇時間進行了調查,根據不同年齡檔和喜愛的電視節(jié)目進行了如下的統(tǒng)計分類:收視傾向年齡層老年中年青年戲曲20102電視劇52035體育比賽21020合計274057本文檔共65頁;當前第46頁;編輯于星期六\12點46分從交互分類表中可以清楚地看到在各個年齡層下收視傾向的不同的次數分布狀況,因此這種表又叫條件次數表。表的最下端是每個年齡層的總次數,稱為邊緣次數,它們的分布叫邊緣分布。表中的其他次數叫條件次數,表示在自變量的每一個值下因變量各個值出現的次數,其次數分布叫條件分布。交互分類表有大小之分,我們一般用橫行數目(r)乘上縱列數目(c)即rΧc表示表的大小。交互分類表還可做成相對頻次分布表,如前表就可轉化為下表:(這樣的表更便于比較)通過交互分類表我們可以初步的觀察兩個變量間是否相關。當然這種觀察是粗略的,如果要較準確地檢驗就需進行卡方檢驗并計算相關系數。本文檔共65頁;當前第47頁;編輯于星期六\12點46分年齡層與收視傾向(%)收視傾向年齡層老年中年青年戲曲74254電視劇185061體育比賽82535合計(27)(40)(57)本文檔共65頁;當前第48頁;編輯于星期六\12點46分(二)X2
(卡方)檢驗X2是對樣本的頻數分布所來自的總體分布是否服從某種理論分布或某種假設分布所作的假設檢驗。它與前面所講的抽樣數據的假設檢驗的不同在于:第一,前者數據屬于定距或定比變量(如果是定類變量它也是是非標志);第二,測量數據所來自的總體要求呈正態(tài)分布,而X2檢驗的數據來自的分布是未知的;第三,測量數據的假設檢驗是對總體參數的假設檢驗,X2檢驗是對總體分布的假設檢驗。因此,它是屬于自由分布的非參數檢驗。X2的基本公式是:
X2=∑(f0-fe)/fe(表示f0實際頻數,fe表示理論頻數)本文檔共65頁;當前第49頁;編輯于星期六\12點46分對兩變量進行X2檢驗的步驟是:第一步:建立兩變量不存在相關關系的虛無假設和與之對立的備擇假設。第二步:按照X2公式計算X2
。第三步:根據公式df=(r-1)(c-1)計算出來的自由度和選定的顯著性水平,查出X2的臨界值。第四步:作出統(tǒng)計決策。本文檔共65頁;當前第50頁;編輯于星期六\12點46分卡方檢驗是由統(tǒng)計學家皮爾遜推導的。理論證明,實際觀察次數(fo)與理論次數(fe)(又稱期望次數)之差的平方再除以理論次數所得的統(tǒng)計量,近似服從卡方分布,當fe越大(fe≥5),近似得越好。顯然fo與fe相差越大,卡方值就越大;fo與fe相差越小,卡方值就越小;因此它能夠用來表示fo與fe相差的程度。下面舉例說明幾種常用的卡方檢驗:
本文檔共65頁;當前第51頁;編輯于星期六\12點46分檢驗無差假設所謂無差假設,是指各項分類的實際數之間沒有差異,也就是說各項分類之間的概率相等,因此理論次數完全按概率相等的條件來計算。即任一項的理論次數都等于總數/分類項數。因此自由度也就等于分類項數減1。例1隨機地將麻將色子拋擲300次,檢驗該色子的六個面是否均勻。結果1-6點向上的次數依次是,43,49,56,45,66,41。解:每個類的理論次數是300/6=50,代入公式:X2=(43-50)2/50+(49-50)2/50+……=8.96在0.05的顯著性水平下自由度為5情況下X2的臨界值是11.1。因此,在0.05的顯著性水平下,可以說這個色子的六面是均勻的。本文檔共65頁;當前第52頁;編輯于星期六\12點46分檢驗假設分布的概率這里的假設分布可以是經驗性的,也可以是某理論分布。公式中所需的理論次數則按照這里假設的分布進行計算。例2國際色覺障礙討論會宣布,每12個男子中,有一個是先天性色盲。從某校抽取的132名男生中有4人是色盲,問該校男子色盲比率與上述比例是否有顯著差異?解:按國際色覺障礙討論會的統(tǒng)計結果,132人應該有132/12=11人是色盲,剩下的121人非色盲,代入公式有:X2=(4-11)2/11+(128-121)2/121=4.86此時X2的臨界值為3.84。因此,在0.05和顯著性水平下,該校男子色盲比率與國際色覺障礙討論會的統(tǒng)計結果有顯著差異,顯然根據比例可知該校的色盲率小于國際色覺障礙討論會的統(tǒng)計結果。本文檔共65頁;當前第53頁;編輯于星期六\12點46分例3在英語四級考試中,某學生做對了80個四擇一選擇題中的28題,現在要判斷該生是否是完全憑猜測做題。解:假如該生完全憑猜測做題,那么平均而言每道題做對的可能性是1/4,因此80個題中平均而能做對80/4=20題,代入公式有:X2=(28-20)2/20+(52-60)2/60=4.27大于X2臨界值3.84因此,該生可能會做一些題。本文檔共65頁;當前第54頁;編輯于星期六\12點46分獨立性檢驗卡方獨立性檢驗用于檢驗兩個或兩個以上因素(各有兩項或以上的分類)之間是否相互影響的問題。所謂獨立,即無關聯,互不影響,就意味著一個因素各個分類之間的比例關系,在另一個因素的各項分類下都是相同的,比如在血型與性格關系中,如果A型性格人群中各血型的比例關系,與B型性格人群中各血型的比例關系相同,就可能說血型與性格相互獨立,當然這里的“兩例比例相同”在統(tǒng)計的意義下,應表述為“兩比例差異不超過誤差范圍”,因為就算總體之間相互獨立,收集到兩個比例完全相同的樣本的可能是很小很小的,甚至是不可能的。相反,若一個因素各個分類之間的比例關系,在另一個因素的各項分類下是不同的,則它們之間相關。假如A型性格中A型血的比例高于B型性格中A型血的比例,而且達到顯著水平,那么就可以說血型與性格之間相關,不相互獨立。本文檔共65頁;當前第55頁;編輯于星期六\12點46分卡方獨立性檢驗的虛無假設是各因素之間相互獨立。因此理論次數的計算也是基于這一假設,具體計算時,采用列聯表的方式,后面將舉例說明。
例:某校對學生課外活動內容進行調查,結果整理成下表,表中彩色格子里的數是原始數據的匯總數,括號內的數是理論次數(是按下面將要介紹的原理計算得來的),此外的是原始數據。
本文檔共65頁;當前第56頁;編輯于星期六\12點46分性別(因素2)課外活動內容(因素1)小計和(fx)體育文娛閱讀男生21(15.3)11(10.2)23(29.5)55女生6(11.7)7(7.8)29(22.5)42小計和(fy)27185297本文檔共65頁;當前第57頁;編輯于星期六\12點46分由于所有學生參加三項活動的比例是27:18:52,因此如果課外活動的選擇與性別沒有關系的話,男女生參加這三項活動的比例也應是這同一比例,而男女各自的人數可以計算,所以每格內的理論次數的計算方法如下:男生中參加體育活動的理論人數:55×27/97=15.3參加文娛活動的理論人數:55×18/97=10.2參加閱讀活動的理論人數:55×52/97=29.5女生中參加體育活動的理論人數:42×27/97=11.7參加文娛活動的理論人數:42×18/97=7.8參加閱讀活動的理論人數:42×52/97=22.5我們將行列的小計和分別用fx和fy來表示,總人數用N來表示時,上述計算理論次數的方法可以表示為:feij=fxi×fyj/N本文檔共65頁;當前第58頁;編輯于星期六\12點46分df=(3-1)(2-1)=2,而χ20.05(2)=5.99,所以在0.05的顯著性水平下,拒絕虛無假設,即可以認為性別與課外活動內容有關聯,或者說男女生在選擇課外活動上存在顯著的差異。
X2=(21-15.3)2/15.3+(11-10.2)2/10.2+……=8.3552本文檔共65頁;當前第59頁;編輯于星期六\12點46分(三)削減誤差比例(PRE)卡方檢驗只能檢驗兩變量間是否有相關關系,要測量相關關系的強度還需要計算相關系數。但具體介紹相關測量法之前,我們先要了解PRE。何謂PRE?社會調查研究的主要目標是解釋或預測社會現象的變化。如,一社會現象Y,我們要解釋或預測它的變化。預測或解釋時,難免會有一些誤差。假定另一社會現象X是與Y有關系的,如果我們根據X值來預測Y值時,理應可以減少一些誤差。而且X與Y的關系越強,所能減少的誤差就越多,反過來說,所削減的誤差的多少,可以反映X與Y相關程度的強弱。我們假定我們在不知道X變量而預測Y變量時所產生的誤差為全部誤差(E1);當知道X變量去預測Y時所產生的誤差叫相關誤差(E2);E1-E2我們稱為剩余誤差。剩余誤差占全部誤差的比例就是PRE,即PRE=(E1-E2)/E1。本文檔共65頁;當前第60頁;編輯于星期六\12點46分我們以前面年齡層與收視傾向這個例子來理解PRE。在我們不知道全部124人中哪些是老年人、青年人、中年人時(即不知道X變量),124人中總共有60人喜歡看電視劇,即電視劇是眾數,應用這個眾數來概括所有124人都喜歡電視劇,其估計誤差是:64,64即為E1。當我們認為年齡對收視傾向可能有影響時,并
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 買賣合同第三方保證擔保合同(2024版)
- 二零二五年度旅行社旅游培訓合作合同4篇
- 2025年度女方婚內出軌離婚財產分割及贍養(yǎng)費協議
- 2025年度個人商鋪租賃合同能源消耗監(jiān)測與管理合同4篇
- 2025年度個人與企業(yè)間特殊用途車輛租賃合同3篇
- 二零二五年度農民工勞動保護補貼發(fā)放合同標準
- 2024苗木運輸合同范本全面規(guī)范運輸過程中的風險防控3篇
- 二零二五年度加油站LED廣告屏安裝裝修合同3篇
- 二零二五年度農業(yè)科技園區(qū)運營管理服務合同-@-1
- 二零二五年度企業(yè)內部講師培訓班報名協議4篇
- 2024年全國體育專業(yè)單獨招生考試數學試卷試題真題(含答案)
- 北師大版小學三年級上冊數學第五單元《周長》測試卷(含答案)
- DB45T 1950-2019 對葉百部生產技術規(guī)程
- 2025屆河北省衡水市衡水中學高考仿真模擬英語試卷含解析
- 新修訂《保密法》知識考試題及答案
- 電工基礎知識培訓課程
- 住宅樓安全性檢測鑒定方案
- 廣東省潮州市潮安區(qū)2023-2024學年五年級上學期期末考試數學試題
- 市政道路及設施零星養(yǎng)護服務技術方案(技術標)
- 選擇性必修一 期末綜合測試(二)(解析版)2021-2022學年人教版(2019)高二數學選修一
- 《論語》學而篇-第一課件
評論
0/150
提交評論