第七講 相關(guān)分析_第1頁
第七講 相關(guān)分析_第2頁
第七講 相關(guān)分析_第3頁
第七講 相關(guān)分析_第4頁
第七講 相關(guān)分析_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第七講相關(guān)分析——雙變量關(guān)系之描述一、基本概念與原理變量之間的關(guān)系:函數(shù)關(guān)系和統(tǒng)計關(guān)系

比如,家庭收入和支出、一個人所受教育程度與其收入、子女身高和父母身高等,…一、基本概念與原理相關(guān)分析:衡量事物之間或稱變量之間線性相關(guān)程度的強弱,并用適當(dāng)?shù)慕y(tǒng)計指標(biāo)表示出來的過程。相關(guān)系數(shù):衡量變量之間相關(guān)程度的一個量值。相關(guān)關(guān)系正相關(guān)、負(fù)相關(guān)與零相關(guān)強相關(guān)、中度相關(guān)與弱相關(guān)線性相關(guān)與非線性相關(guān)相關(guān)系數(shù)相關(guān)系數(shù)r的數(shù)值范圍是在一1到十1之間。相關(guān)系數(shù)r的正負(fù)號表示變化方向?!?”號表示變化方向一致,即正相關(guān);“-”號表示變化方向相反,即負(fù)相關(guān)。r的絕對值表示變量之間的密切程度(即強度)。絕對值越接近1,表示兩個變量之間關(guān)系越密切;越接近0,表示兩個變量之間關(guān)系越不密切。相關(guān)系數(shù)相關(guān)系數(shù)的值,僅僅是一個比值。它不是由相等單位度量而來(即不等距),也不是百分比,因此,不能直接作加、減、乘、除運算。相關(guān)系數(shù)只能描述兩個變量之間的變化方向及密切程度,并不能揭示兩者之間的內(nèi)在本質(zhì)聯(lián)系,即存在相關(guān)的兩個變量,不一定存在因果關(guān)系。散點圖基本原理(以積差相關(guān)為例)若>0,則x與y之間為正相關(guān);若<0,則x與y之間為負(fù)相關(guān);若→0,則x與y之間無相關(guān)關(guān)系。

二、相關(guān)分析方法連續(xù)變量的相關(guān)分析等級變量的相關(guān)分析質(zhì)量相關(guān)分析品質(zhì)相關(guān)分析偏相關(guān)分析距離相關(guān)分析連續(xù)變量的相關(guān)分析連續(xù)變量即數(shù)據(jù)變量,它的取值之間可以比較大小,可以用加減法計算出差異的大小。如“年齡”、“收入”、“成績”等變量。當(dāng)兩個變量都是正態(tài)連續(xù)變量,而且兩者之間呈線性關(guān)系時,表示這兩個變量之間的相關(guān)稱為積差相關(guān)。通常用Pearson相關(guān)系數(shù)來衡量。連續(xù)變量的相關(guān)分析Pearson相關(guān)系數(shù)的計算公式積差相關(guān)的使用條件兩個變量都是由測量獲得的連續(xù)性數(shù)據(jù);兩個變量的總體都是呈正態(tài)分布,或接近正態(tài)分布,至少是單峰的對稱分布。必須是成對數(shù)據(jù),而且每對數(shù)據(jù)之間必須是相互獨立。兩個變量之間呈線性關(guān)系。要排除共變因素的影響。樣本容量要大于等于30,計算出的積差相關(guān)系數(shù)才具有有效意義。積差相關(guān)系數(shù)的顯著性檢驗ρ=0統(tǒng)計假設(shè)H0:ρ=0;H1:ρ≠0統(tǒng)計量T統(tǒng)計量服從n-2個自由度的t分布。積差相關(guān)系數(shù)的顯著性檢驗ρ≠0ρ≠0時r的樣本分布不是正態(tài),這時需要將r與ρ都轉(zhuǎn)換成費舍。的分布可以認(rèn)為是正態(tài),其平均數(shù),標(biāo)準(zhǔn)誤這樣就可以進(jìn)行Z檢驗了。統(tǒng)計量如表所示,10個學(xué)生初一數(shù)學(xué)分?jǐn)?shù)與初二數(shù)學(xué)分?jǐn)?shù)的相關(guān)系數(shù)為0.87,問從總體上來說,初一與初二數(shù)學(xué)分?jǐn)?shù)是否存在相關(guān)?序號12345678910總和X74717268767367706574710Y76757170767965776272723檢驗的步驟提出假設(shè)計算檢驗統(tǒng)計量統(tǒng)計決斷所以,從總體上說,初一數(shù)學(xué)分?jǐn)?shù)與初二數(shù)學(xué)分?jǐn)?shù)存在正相關(guān)。例如:29個學(xué)生幾何期中與期末考試成績的相關(guān)系數(shù)r=0.30,問全年級幾何期中與期末考試成績的相關(guān)系數(shù)是否為0.64?提出假設(shè)等距轉(zhuǎn)換選擇檢驗統(tǒng)計量并計算其值統(tǒng)計決斷即全年級幾何期中與期末考試成績之間的相關(guān)系數(shù)極少可能是0.64。等級變量的相關(guān)分析是指以等級次序排列或以等級次序表示的變量之間的相關(guān)。當(dāng)測量得到的數(shù)據(jù)不是等距或等比數(shù)據(jù),而是具有等級順序的數(shù)據(jù);或者得到的數(shù)據(jù)是等距或等比數(shù)據(jù),但其所來自的總體分布不是正態(tài)的,不滿足求積差相關(guān)的要求。這時就要運用等級相關(guān)系數(shù)。它主要包括斯皮爾曼(spearman)二列等級相關(guān)及肯德爾和諧系數(shù)多列等級相關(guān).斯皮爾曼二列等級相關(guān)當(dāng)兩個變量值以等級次序排列或以等級次序表示時,兩個相應(yīng)總體并不一定呈正態(tài)分布,樣本容量也不一定大于30,表示這兩變量之間的相關(guān),稱為Spearman等級相關(guān)。例:10名高三學(xué)生學(xué)習(xí)潛在能力測驗與自學(xué)能力測驗成績?nèi)缦卤硭?,問兩者相關(guān)情況如何?學(xué)生序號學(xué)習(xí)潛在能力自學(xué)能力等級差數(shù)差數(shù)平方X等級Y等級123456789109084767171716968666412355578910325786871092135.57.547.55.5109-110-0.5-2.51-0.52.5-111100.256.2510.256.2511總和18等級相關(guān)系數(shù)的顯著性檢驗與積差相關(guān)系數(shù)檢驗的方法相同10個學(xué)生學(xué)習(xí)潛在能力與自學(xué)能力測驗成績相關(guān)系數(shù)為0.891,問從總體上說,兩者是否存在相關(guān)?檢驗的步驟提出假設(shè)計算檢驗統(tǒng)計量的值統(tǒng)計決斷所以學(xué)生的學(xué)習(xí)潛在能力與自學(xué)能力之間存在著較高的正相關(guān)。肯德爾和諧系數(shù)(Kendall’stau-b)當(dāng)多個(兩個以上)變量值以等級次序排列或以等級次序表示,描述這幾個變量之間的一致性程度的量,稱為肯德爾和諧系數(shù)。它常用來表示幾個評定者對同一組學(xué)生成績用等級先后評定多次之間的一致性程度。無相同等級的情況當(dāng)同一位評定者對所有被評事物的評定無相同等級時,其肯德爾和諧系數(shù)的計算公式為:例:4位教師對6個學(xué)生作文競賽的名次排列次序如表第(2)列所示,問評定的一致性程度如何?

有相同等級的情況當(dāng)同一位評定者對所有被評事物的評定有相同等級時,其肯德爾和諧系數(shù)的計算公式為:同一位教師對5份研究生入學(xué)考試政治試卷根據(jù)標(biāo)準(zhǔn)先后3次等級評定結(jié)果如下表所示,問3次評定結(jié)果的相關(guān)程度如何?質(zhì)量相關(guān)分析質(zhì)量相關(guān)是指一個變量為質(zhì),另一個變量為量,這兩個變量之間的相關(guān)。如智商、學(xué)科分?jǐn)?shù)、身高、體重等是表現(xiàn)為量的變量,男與女、優(yōu)與劣、及格與不及格等是表現(xiàn)為質(zhì)的變量。質(zhì)與量的相關(guān)主要包括二列相關(guān)、點二列相關(guān)、多系列相關(guān)。二列相關(guān)當(dāng)兩個變量都是正態(tài)連續(xù)變量.其中一個變量被人為地劃分成二分變量(如按一定標(biāo)推將屬于正態(tài)連續(xù)變量的學(xué)科考試分?jǐn)?shù)劃分成及格與不及格,錄取與未錄取,把某一體育項目測驗結(jié)果劃分成通過與未通過,達(dá)標(biāo)與末達(dá)標(biāo),把健康狀況劃分成好與差,等等),表示這兩個變量之間的相關(guān),稱為二列相關(guān)。

二列相關(guān)的使用條件

①兩個變量都是連續(xù)變量,且總體呈正態(tài)分布,或總體接近正態(tài)分布,至少是單峰對稱分布。②兩個變量之間是線性關(guān)系。③二分變量是人為劃分的,其分界點應(yīng)盡量靠近中值。④樣本容量應(yīng)當(dāng)大于80。二列相關(guān)系數(shù)的計算公式

點二列相關(guān)

當(dāng)兩個變量其中一個是正態(tài)連續(xù)性變量,另一個是真正的二分名義變量(例如,男與女,已婚和未婚,色盲與非色盲,生與死,等等),這時,表示這兩個變量之間的相關(guān),稱為點二列相關(guān)。

多系列相關(guān)

當(dāng)兩個變量都是正態(tài)連續(xù)變量,其中一個變量按不同質(zhì)被人為地分成多種類別(兩類以上)的正態(tài)名義變量。表示正態(tài)連續(xù)變量與多類正態(tài)名義變量之間的相關(guān),稱為多系列相關(guān)。例如,學(xué)生的智商與學(xué)習(xí)努力程度之間的關(guān)系,智商和學(xué)習(xí)努力程度都是正態(tài)連續(xù)變量,但學(xué)習(xí)努力程度被人為地分成“努力”、“中等”、“不努力”三種類別,二者的相關(guān)稱為三系列相關(guān)。又如,不同學(xué)習(xí)成績的學(xué)生對某種教學(xué)改革的態(tài)度分為“極其不贊成”、“不贊成。、“不置可否”、“贊成”、“極其贊成”。學(xué)習(xí)成績與態(tài)度之間的相關(guān)稱五系列相關(guān)。多系列相關(guān)系數(shù)的計算公式

品質(zhì)相關(guān)分析兩個變量都是按質(zhì)劃分成幾種類別,表示這兩個變量之間的相關(guān)稱為品質(zhì)相關(guān)。如,一個變量按性別分成男與女,另一個變量按學(xué)科成績分成及格與不及格;又如,一個變量按學(xué)校類別分成重點及非重點,另一個變量按學(xué)科成績分成優(yōu)、良、中、差,等等。根據(jù)兩個變量的性質(zhì)及所分類別的多少,分為四分相關(guān)、φ相關(guān)及列聯(lián)相關(guān)。四分相關(guān)

當(dāng)兩個變量都是正態(tài)連續(xù)變量,且兩者呈直線關(guān)系,但兩者都被人為地劃分成二分變量,表示這兩個變量的相關(guān),稱為四分相關(guān)。例如,將學(xué)科成績劃分成及格與不及格,達(dá)標(biāo)與未達(dá)標(biāo),通過與未通過,將對事物的態(tài)度劃分成贊同與反對:將對問題的回答劃分成對與錯,等等。四分相關(guān)四分相關(guān)有多種計算方法,最常用的是皮爾遜的余弦π法,其計算公式為:

例如,45名學(xué)生跳高與跳遠(yuǎn)成績(達(dá)標(biāo)及未達(dá)標(biāo))如表所示,問跳高與跳遠(yuǎn)成績的相關(guān)情況如何?

φ相關(guān)

當(dāng)兩個變量都是二分變量,無論是真正的二分變量還是人為的二分變量,這兩個變量之間的關(guān)系,可以用由φ相關(guān)來表示。其計算公式為:

例如,從研究生入學(xué)考試的學(xué)生中,隨機抽取60人.其大學(xué)應(yīng)屆與往屆畢業(yè)生錄取情況如表11.14,問應(yīng)屆和往屆大學(xué)畢業(yè)生同研究生錄取與否的相關(guān)情況如何?列聯(lián)相關(guān)

當(dāng)兩個變量均被分成兩個以上類別,或其中一個變量被分成兩個以上類別,表示這兩個變量之間的相關(guān),稱為列聯(lián)相關(guān)。列聯(lián)相關(guān)系數(shù)的計算公式為:

數(shù)據(jù)類型與相關(guān)系數(shù)類型第一個變量數(shù)據(jù)類型第二個變量數(shù)據(jù)類型二分?jǐn)?shù)據(jù)等級數(shù)據(jù)等距數(shù)據(jù)人為二分型真正二分型二分?jǐn)?shù)據(jù)人為二分型四格相關(guān)Φ相關(guān)二列相關(guān)列聯(lián)系數(shù)二列相關(guān)真正二分型Φ相關(guān)Φ相關(guān)二列相關(guān)列聯(lián)系數(shù)點二列相關(guān)等級數(shù)據(jù)二列相關(guān)列聯(lián)系數(shù)二列相關(guān)列聯(lián)系數(shù)等級相關(guān)等級相關(guān)多列相關(guān)等距數(shù)據(jù)二列相關(guān)點二列相關(guān)等級相關(guān)多列相關(guān)積差相關(guān)偏相關(guān)分析所謂偏相關(guān),是指在諸多相關(guān)的變量中,剔除其中的一個或若干個變量的影響后,兩個變量之間的相關(guān)關(guān)系。對應(yīng)的相關(guān)分析即為偏相關(guān)分析。偏相關(guān)系數(shù)的計算公式假定有3個變量:x1、x2、x3,求剔除變量的影響后,變量和之間的偏相關(guān)系數(shù)r123:偏相關(guān)系數(shù)的顯著性檢驗公式距離相關(guān)分析距離相關(guān)分析是對觀測量之間或變量之間相似或不相似的程度的一種測量。距離相關(guān)分析可用于同一變量內(nèi)部各個取值間,以考察其相互接近程度;也可用于變量間,以考察預(yù)測值對實際值的擬合優(yōu)度。它有助于分析復(fù)雜的數(shù)據(jù)集合。距離相關(guān)分析根據(jù)統(tǒng)計量不同,分為兩種:(1)不相似性測量,通過計算樣本之間或變量之間的距離來表示。(2)相似性測量,通過計算Pearson相關(guān)系數(shù)或Cosine相關(guān)系數(shù)來表示。根據(jù)分析對象不同,分為兩種:

樣本間分析和變量間分析。三、相關(guān)分析中的可能錯誤

相關(guān)系數(shù)r是對兩個變量之間線性關(guān)系的簡單度量,因此當(dāng)r=0時,只表示兩個變量之間不存在線性相關(guān)關(guān)系,并不說明變量之間沒有任何關(guān)系,比如,它們之間可能存在非線性關(guān)系,如圖8.1(e)就屬于這種情況。三、相關(guān)分析中的可能錯誤

r的計算涉及到變量的標(biāo)準(zhǔn)差和協(xié)方差,其數(shù)值大小易受極端值的影響,特別是與自變量x的變化范圍有很大關(guān)系。這時會產(chǎn)生兩種情況:—是多數(shù)觀察值不相關(guān)時,個別極瑞值引起中度相關(guān),如圖8.4(a);二是大多數(shù)觀察值存在線性相關(guān),個別極端值使觀察數(shù)據(jù)呈非線性相關(guān).如圖8.4(b)。

三、相關(guān)分析中的可能錯誤

在對兩個時間數(shù)列的相關(guān)分析中,r所表現(xiàn)的相關(guān)程度同樣本數(shù)據(jù)的時間范圍有很大關(guān)系。比如.兩個現(xiàn)象在某段時期內(nèi)的相關(guān)關(guān)系為線性的.而整個發(fā)展過程可能是非線性的,如圖(a);或者在某段時期內(nèi)無線性關(guān)系,而整個發(fā)展過程可能存在線性關(guān)系,如圖(b)三、相關(guān)分析中的可能錯誤根據(jù)樣本數(shù)據(jù)計算的r帶有—定的隨機性,樣本數(shù)據(jù)越少,隨機性則越大。對于不相關(guān)的兩個變量計算出的r不—定為0,有時甚至?xí)芨?。但較大的r值不一定就意味著兩個變量之間確實存在著較高的相關(guān);反之,較小的r也不一定就意味著變量之間無相關(guān)關(guān)系,這就是所謂的虛假相關(guān)。為避免出現(xiàn)分析上的錯誤,在實際應(yīng)用r時,必須對r的顯著性進(jìn)行檢驗,r在統(tǒng)計上是否顯著,才是它能否作為變量之間線性關(guān)系度量的依據(jù)。四、應(yīng)用(測驗分析)信度系數(shù)衡量一次測驗可靠性、穩(wěn)定性的統(tǒng)計指標(biāo)叫做信度。通常用不同次測驗結(jié)果的相關(guān)系數(shù)來衡量,即信度系數(shù)α。信度的高低反映了測驗中隨機因素影響的大小,一次測驗中隨機因素影響小則信度大,隨機因素影響大則信度小。信度的種類(1)再測信度系數(shù)——用同一套問卷在兩個不同時間內(nèi)來測試同一批對象,計算兩次測驗分?jǐn)?shù)的相關(guān)系數(shù),又稱穩(wěn)定系數(shù)。(2)等值系數(shù)——用兩份等值的問卷對同一批對象進(jìn)行測驗,計算兩次測驗分?jǐn)?shù)的相關(guān)系數(shù),又稱復(fù)本信度。(3)內(nèi)在一致性系數(shù)——一個測驗中所包含的各個項目上所的成績的一致性,又稱同質(zhì)信度。估計信度的方法用于衡量再測信度、復(fù)本信度——積差相關(guān)法。用于計算內(nèi)部一致性系數(shù)——折半相關(guān)分析法——克倫巴赫α系數(shù)法——庫德-理查遜(K-R)公式

四、應(yīng)用(測驗分析)效度所謂效度,就是衡量測驗有效性、準(zhǔn)確性的統(tǒng)計指標(biāo)。實質(zhì)上是指所測量到的東西與要測量的東西之間的相符合的程度。它與信度的區(qū)別在于:信度反映了測驗中隨機誤差的大小,而效度反映了測驗中系統(tǒng)誤差的大小。四、應(yīng)用(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論