語言統(tǒng)計第八章 線性關系的測量——相關ppt課件_第1頁
語言統(tǒng)計第八章 線性關系的測量——相關ppt課件_第2頁
語言統(tǒng)計第八章 線性關系的測量——相關ppt課件_第3頁
語言統(tǒng)計第八章 線性關系的測量——相關ppt課件_第4頁
語言統(tǒng)計第八章 線性關系的測量——相關ppt課件_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第八章 線性關系的丈量相關n第一節(jié) 什么是相關n第二節(jié) 相關的直觀表示法n第三節(jié) 線性相關的量化n 一、皮爾遜積距相關系數(shù)n 二、皮爾遜積距相關系數(shù)的計算n 三、皮爾遜積距相關系數(shù)的假設檢驗n第四節(jié) 斯皮爾曼等級相關系數(shù)n 一、斯皮爾曼等級相關系數(shù)的運用與計n 二、斯皮爾曼等級相關系數(shù)的假設檢驗第一節(jié) 什么是相關 變量之間往往存在一定程度的聯(lián)絡或關聯(lián),比如變量X的值能夠隨變量Y的值的增大而增大,或隨變量的值能夠隨值的增大而減小等。相關本質(zhì)上就是變量之間的協(xié)變或共變,即一個變量隨另一個變量的變化而變化。既然相關的變量之間存在規(guī)律性的關系,那么有了一個變量的值就可以在一定程度上預測另一個變量的值,

2、預測的準碗性顯然取決于變量之間相關程度的強弱,假設兩變量完全相關這種情況非常少見,那么預測的準碗性就可以到達百分之百。第二節(jié) 相關的直觀表示法 變量之間相關的強弱可以量化,也可以用直觀的方法表示出來。在對相關量化之前,最好先用直觀的方法,看看變量之間的大體關系如何,比如相關的程度能否強,是正相關還是負相關,是線性關系還是非線性關系 由于對相關的量化往往要求變量之間呈線性關系 , 等等。 此外, 我們還能很容易、很直觀地發(fā)現(xiàn)能否有反常的數(shù)據(jù)值,這些反常值會對相關的量化 相關系數(shù)產(chǎn)生很大的影響。 對相關的直觀表示普通是利用分布圖。分布圖就是一個直角坐標,橫坐標代表一個變量,縱坐標代表另一個變量。在

3、坐標內(nèi)用一個個的點來表示相關變量的一對對的觀測值,這些點所構(gòu)成的圖形的外形就可以表達變量之間的相關情況。 圖8.1和圖8.2 表示完全線性相關,即變量X和變量Y之間的關系完全可以用一條直線來表達,這時給出一個變量的值就可以完全預測另一個變量的值。正相關表示變量Y的值隨變量X的值的增大而增大,負相關表示變量Y的值隨變量X的值的增大而減小。圖8.3表示線性強正相關,即隨變量X的值增大,變量Y的值也傾向于增大,兩者之間存在很強的線性關系,即各點相聚很緊,經(jīng)過各點的中間根本上可以劃一條直線。 圖8.4表示線性強負相關,即隨變量X的值的增大,變量Y的值傾向于減小,各點之間相聚同樣很緊,經(jīng)過各點的中間也根

4、本上可以劃一條直線。 圖8.5表示弱正相關,變量Y的值大休上隨變量X的值的增大而增大,但有很多例外,因此各點不是緊聚在一條直線兩側(cè)。 圖8.6表示弱負相關,變量Y的值大體上隨變量X 的值的增大而減小,但有很多例外,因此各點不是緊聚在一條直線兩側(cè)。 圖8.7中看不出明顯的規(guī)律性,這闡明兩變量不相關或相關很低。 圖8.8闡明兩變量之間雖有規(guī)律性的關系U型,變量X的小值和變量Y的大值相聯(lián)絡,但該關系是非線性關系。 第三節(jié)線性 相關的量化 一、 皮爾遜積矩相關系數(shù) 最常用的一種指數(shù)是皮爾遜積矩相關系數(shù)或積差相關系數(shù),用符號r表示。 該相關系數(shù)有以下幾個特點: 1就像比例或百分比那樣,相關系數(shù)沒有單位,

5、變量的丈量單位的改動不影響相關系數(shù)的值。 2與其值在 -1與+1之間, 即-1r +1。 -1和+1分別表示完全的負相關和完全的正相關; 3適用于兩變量都是等距變量或比率變量,且每一變量的數(shù)據(jù)都是呈正態(tài)分布的情況。二、皮爾遜積矩相關系數(shù)的計算皮爾遜積矩相關系數(shù)的計算公式為8.1其中 代表變量X的任一個觀測值的規(guī)范分; 代表變量Y的任一個觀測值的規(guī)范分; ,即每對規(guī)范分之積的和,就表示了兩變量之間的關系;N表示兩變量觀測值的對子數(shù),N-1就是相關系數(shù)的自在度。在上式中又因所以上述公式可以改寫為(8.1) 三、皮爾遜積矩相關系數(shù)的假設檢驗 對皮爾遜積矩相關系數(shù)的假設檢驗為參數(shù)檢驗。 檢驗步驟如下:

6、 第一步:陳說零假設和備擇假設: 為希臘字母, 表示總體的相關系數(shù),表示樣本所來自的總體之間不存在任何相關 雙尾檢驗 或 單尾檢驗 或 單尾檢驗 第二步: 設定顯著程度 第三步: 計算檢驗統(tǒng)計值 如兩變量呈正態(tài)分布, 即用r作為檢驗計值。 第四步: 查表:附表3給出了對應于各顯著程度和數(shù)據(jù)對子數(shù) N 的 臨界值。 第五步: 假設r值大于或等于臨界值,就可以在所設定的顯著程度上回絕零假設。 對于上例,假設設 為 0.05,雙尾檢驗,那么臨界值為 0.444。由于r值0.672 大于臨界值, 所以該檢驗有顯著意義, 即兩組分數(shù)之間確實存在相關。假設設 ,該檢驗即為單尾檢驗值,如 仍為0.05 ,那

7、么臨界值為0.378 ,檢驗依然有顯著意義。第四節(jié)斯皮爾曼等級相關系數(shù) 一、 斯皮爾曼等級相關系數(shù)的運用與計算 另一個常用的相關系數(shù)是斯皮爾曼等級相關系數(shù),符號為 。該相關系數(shù)用來比較兩組等級數(shù)據(jù),來決議兩者之間的相關程度,因此,它適用于兩變量都是順 序變量的情況。斯皮爾曼等級相關系數(shù)的計算公式為8.3 上述計算方法僅適用于兩變量都是順序變量即變量的值為等級的情況。假設一個是順序變量,而另一個是等距變量,或者兩個變量都是等距變量因種種緣由不能運用皮爾遜積矩相關系數(shù),就要先把等距變量轉(zhuǎn)換為順序變量當然隨著轉(zhuǎn)換,將會失去一定量的信息。轉(zhuǎn)換的方法是:先把第一個變量的觀測值按從小到大的順序一一轉(zhuǎn)換成等

8、級,即最小的觀測值的等級為如遇并列的觀測值,那么把它們的平均等級即假設它們不并列而本應占的等級除以并列的觀測值個數(shù)用作它們的等級。轉(zhuǎn)換以后,其他計算方法同 上。 計算斯皮爾曼等級相關系數(shù)時有一點需求留意,那就是并列等級有能夠?qū)?值帶來偏向。假設并列等級過多,就會大大影響值的準確性傾向于過高估計相關強度在上例中,有一部分觀測值的等級是并 性列的, 所以計算出的 值略高于r值。在這種情況下, 一個更精碗的方法是把等級作為觀測值,計算皮爾遜相關系數(shù)。二、皮爾曼等級相關系數(shù)的假設檢驗檢驗的步驟與方法如下:第一步:零假設與備擇假設為: 即樣本所來自的總體之間不存在相關; 單尾檢驗,即總體之間的相關為正相關。第二步: 設顯著程度為0.05第三步: 檢驗統(tǒng)計值第四步:查表得臨界值為第五步:由于 值大于臨界值,所以零假設被推翻,證明兩變量之間確實存在顯著的正相關。小 結(jié) 在研討相關時有兩點需求留意。一是,相關并不意味著因果關系,兩變量相關并不闡明兩者之間存在因果關系。舉一個很極端的例子,某年的降雨量與出生率之間有很高的正相關,但是不能因此說高降雨量導致了

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論