列聯(lián)表及其spss實(shí)現(xiàn)過程PPT課件.ppt_第1頁
列聯(lián)表及其spss實(shí)現(xiàn)過程PPT課件.ppt_第2頁
列聯(lián)表及其spss實(shí)現(xiàn)過程PPT課件.ppt_第3頁
列聯(lián)表及其spss實(shí)現(xiàn)過程PPT課件.ppt_第4頁
列聯(lián)表及其spss實(shí)現(xiàn)過程PPT課件.ppt_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

列聯(lián)表 定類變量 定類變量 1 一 兩個(gè)定類變量的一般情況例1 某單位對閑暇時(shí)間進(jìn)行了全面調(diào)查 根據(jù)不同年齡檔和喜愛收看電視節(jié)目的類型進(jìn)行類如下的統(tǒng)計(jì)分析 表1 列聯(lián)表 通過各間格的頻次或相對頻次 研究變量之間是否存在關(guān)系 也就是說 變量x的分類是否與變量y的分類有關(guān) 第十章列聯(lián)表第一節(jié)什么是列聯(lián)表 2 二 列聯(lián)表分布列聯(lián)表 聯(lián)合分布 邊緣分布 3 例1 試就下列頻次的聯(lián)合分布表 求概率分布的聯(lián)合分布 邊緣分布和條件分布 4 條件分布y的條件分布 控制x值 X的條件分布 控制y值 5 例1 試就下列頻次的聯(lián)合分布表 求概率分布的聯(lián)合分布 邊緣分布和條件分布 1 y的條件分布x 老年 x 中年 x 青年 6 1 x的條件分布y 戲曲 y 歌舞 y 球賽 7 三 列聯(lián)表中變量的相互獨(dú)立 我們把關(guān)于y的條件分布和邊緣分布合寫在一個(gè)表格中 8 我們把關(guān)于y的條件分布和邊緣分布合寫在一個(gè)表格中 如果統(tǒng)計(jì)結(jié)果如下 稱作變量之間是相互獨(dú)立的 9 如果變量間是相互獨(dú)立的 則變量的條件分布與它的邊緣分布相同 10 一 列聯(lián)表檢驗(yàn)的原假設(shè) 總體中的變量之間無關(guān)系 或相互獨(dú)立 二 列聯(lián)表檢驗(yàn)的統(tǒng)計(jì)量根據(jù)列聯(lián)表的原假設(shè)求出列聯(lián)表中各格的期望頻次 第二節(jié)列聯(lián)表的檢驗(yàn) 用樣本的邊緣頻率分布作為總體邊緣分布的點(diǎn)估計(jì)值 11 在原假設(shè)成立條件下的期望頻次列聯(lián)表抽樣調(diào)查獲得的實(shí)測的頻次列聯(lián)表 如果總體中為真的話 實(shí)測頻次列聯(lián)表的格值和期望頻次列聯(lián)表中的格值相差不多的可能性較大 反之 如果兩格值差距很大 則原假設(shè)很可能不反映真實(shí)情況 列聯(lián)表檢驗(yàn)的統(tǒng)計(jì)量 12 統(tǒng)計(jì)量 當(dāng)為大樣本時(shí) 近似地服從分布 B 值的計(jì)算與意義 殘差大小是相對概念 相對于期望頻數(shù)為10時(shí) 20的殘差非常大 可相對于期望頻數(shù)為1000是20的殘差就很小 所以將殘差平方除以期望頻數(shù)再求和 以估計(jì)觀察頻數(shù)與期望頻數(shù)的差別 殘差 一個(gè)類別觀察值和理論值的偏離程度 統(tǒng)計(jì)量 使有英國統(tǒng)計(jì)學(xué)家KarlPearson在1900年提出的 因此也稱為Pearson 13 當(dāng)觀察頻數(shù)與期望頻數(shù)完全一致時(shí) 值為0 觀察頻數(shù)與期望頻數(shù)越接近 兩者之間的差異越小 值越小 表明觀察頻數(shù)接近期望頻數(shù) 接近假設(shè) 反之 觀察頻數(shù)與期望頻數(shù)差別越大 兩者之間的差異越大 值越大 表明觀察頻數(shù)遠(yuǎn)離期望頻數(shù) 即表明遠(yuǎn)離假設(shè) 是觀察頻數(shù)與期望頻數(shù)之間距離的一種度量指標(biāo) 也是假設(shè)成立與否的度量指標(biāo) 但在每個(gè)具體研究中究竟要大到什么程度才能拒絕原假設(shè)呢 這要借助于分布求出所對應(yīng)的p值來確定 B 值的計(jì)算與意義 14 列聯(lián)表檢驗(yàn)就其檢驗(yàn)的內(nèi)容來看是雙邊檢驗(yàn) 但它所判斷的內(nèi)容僅是變量間是否存在關(guān)系 至于關(guān)系的方向 由于列聯(lián)表屬定類變量 因此是不存在的 但從列聯(lián)表統(tǒng)計(jì)量的公式來看 只有期望頻次和實(shí)測頻次間的絕對值愈大 才能越否定變量間無關(guān)系的原假設(shè) 因此 列聯(lián)檢驗(yàn)從形式上看 又很像右側(cè)單邊檢驗(yàn) 列聯(lián)表的檢驗(yàn)是通過頻次而不是相對頻次的比較進(jìn)行的 15 例2 某鄉(xiāng)鎮(zhèn)職業(yè)代際流動(dòng) 調(diào)查140人 結(jié)果如下 16 一 對于列聯(lián)表 由于格數(shù)過少 為減少作為離散觀測值與作為連續(xù)型變量x值之間的偏差 可做連續(xù)性修正 列聯(lián)表統(tǒng)計(jì)量的討論 17 二 檢驗(yàn)的討論 也適用于單變量二項(xiàng)總體或多項(xiàng)總體的假設(shè)檢驗(yàn)1 二項(xiàng)總體 大樣本總體成數(shù)檢驗(yàn) Z 檢驗(yàn) 設(shè)對于樣本容量為n的抽樣 理論上的數(shù)學(xué)期望 18 2 多項(xiàng)總體檢驗(yàn) 設(shè)對于樣本容量為n的抽樣 理論上的數(shù)學(xué)期望 三 使用統(tǒng)計(jì)量對列聯(lián)表進(jìn)行檢驗(yàn) 每一格值的要保持在一定數(shù)目之上 如果其中有的格值過小 那么在計(jì)算值時(shí) 值的波動(dòng)就會(huì)擴(kuò)大 如果有兩個(gè)格值 要求對于列聯(lián)表 要求或者小于5的格數(shù)不應(yīng)超過總個(gè)數(shù)的20 當(dāng)出現(xiàn)不符合上述要求時(shí) 可將期望值偏小的格值合并 19 第三節(jié)列聯(lián)強(qiáng)度一 變量間的相關(guān) Association 通過統(tǒng)計(jì)量值檢驗(yàn)列聯(lián)表間是否存在關(guān)系 在確定了存在關(guān)系之后 進(jìn)一步要問的問題將是關(guān)系的程度如何 相關(guān)程度的度量方法根據(jù)變量層次的不同而有所不同 由于列聯(lián)表研究的是定類變量 因此列聯(lián)表中的頻次分布情況 不僅是檢驗(yàn)是否存在關(guān)系的依據(jù) 同時(shí)也是度量變量間關(guān)系強(qiáng)弱的依據(jù) 相關(guān)程度越高 變量間的關(guān)系越密切 20 二 以值為基礎(chǔ)的相關(guān)性測量 列聯(lián)表檢驗(yàn)的統(tǒng)計(jì)量除了可作為顯著性檢驗(yàn)外 它的表達(dá)式還反映了實(shí)際頻次與期望頻次間差值的累計(jì) 而期望頻次是基于無相關(guān)的前提下計(jì)算的 因此 的大小反映了變量間關(guān)系的程度 而單位頻次的值就構(gòu)成了系數(shù) 21 變量間的完全相關(guān) 22 變量間的完全相關(guān) 值除了對于列聯(lián)表 可以控制在 1 1 之間外 當(dāng)表的格數(shù)增多后 值將增加 因此值是沒有上限的 這樣系數(shù)間就缺乏了比較性 而C系數(shù)對此進(jìn)行了改進(jìn) 23 C系數(shù) 這樣C值將永遠(yuǎn)保持在 0 1 之間 且永遠(yuǎn)小于1 C系數(shù)雖然克服了系數(shù)無上限的缺點(diǎn) 但在兩變量全相關(guān)時(shí) 卻永遠(yuǎn)不能達(dá)到1 為此又出現(xiàn)了V系數(shù) V系數(shù) V的取值范圍是 24 四 以減少誤差比例為基礎(chǔ)的相關(guān)性測量 具有更普遍意義 適用于所有層次的變量 研究現(xiàn)象之間的關(guān)系 可以幫助我們從一個(gè)現(xiàn)象預(yù)測另一個(gè)現(xiàn)象 其中關(guān)系密切者 在預(yù)測中通過某一現(xiàn)象預(yù)測另一現(xiàn)象時(shí) 其盲目性比較關(guān)系不密切者為少 變量間的相關(guān)程度 可以通過不知y與x有關(guān)系時(shí) 預(yù)測y的全部誤差與知道y與x有關(guān)系時(shí) 用x去預(yù)測y的誤差的相對差值大小度量之 又稱減少誤差比例法 PRE 不知y與x有關(guān)系時(shí) 預(yù)測y的全部誤差 知道y與x有關(guān)系后 用x預(yù)測y的全部誤差 知道y與x有關(guān)系后 預(yù)測y所減少的誤差 所減少的相對誤差 其值越大 則表示y和x的關(guān)系越密切 或者說相關(guān)程度越高 25 PRE的取值范圍 當(dāng)兩變量無關(guān)時(shí) 知道X與否 無助于y的預(yù)測 因此誤差不變 兩變量無關(guān) 如果知道y與x完全相關(guān)有 可以全部消滅誤差 這是有 兩變量全相關(guān) 可見 PRE的取值范圍 PRE 0 兩變量無相關(guān) 0 PRE 1 兩變量相關(guān) PRE 1 兩變量全相關(guān) 的具體定義在不同層次的變量以及同一層次變量的不同相關(guān)系數(shù)中的定義是有所不同的 26 2020 1 15 27 一 系數(shù) 的定義 未知y與x有關(guān)系之前 如果預(yù)測y值 唯一可以參考的是y本身的分布 即關(guān)于y的邊緣分布 當(dāng)預(yù)測每一個(gè)觀察者的y值時(shí) 用邊緣分布中的眾值猜測它 猜對的頻次較多 這時(shí)預(yù)測的誤差為 的定義 當(dāng)知道y與x有關(guān)系之前 如果再預(yù)測y值 首先看它屬于x的哪一類 然后根據(jù)這一類中y的眾值猜測它 也就是用條件分布中的眾值去預(yù)測y 這樣猜對的頻次較多 這時(shí)預(yù)測的誤差為 y的邊緣分布 x的邊緣分布 28 的取值范圍 1 x與y無相關(guān) 0 2 x與y相關(guān) 0 1 3 x與y全相關(guān) 1 一 系數(shù) 29 例4 研究飲食習(xí)慣與地區(qū)之間關(guān)系 作了400人的抽樣調(diào)查 30 值的非對稱性以上所談的是以x為自變量 用對y的預(yù)測來定義PRE 所得值稱作 如果y為自變量 用對x的預(yù)測來定義PRE 所得值稱作 如果x和y孰因孰果不明顯 這時(shí)可同時(shí)計(jì)算和 并取其平均值 作為x和y間的相關(guān)程度 31 例4 研究飲食習(xí)慣與地區(qū)之間關(guān)系 作了400人的抽樣調(diào)查用邊緣分布所提供的比例來進(jìn)行預(yù)測 用條件分布所提供的比例來進(jìn)行預(yù)測 32 一 系數(shù) 的定義 未知y與x有關(guān)系之前 如果預(yù)測y值 充分考慮到y(tǒng)值邊緣分布所提供的信息 用邊緣分布所提供的比例來進(jìn)行預(yù)測 的定義 當(dāng)知道y與x有關(guān)系后 如果再預(yù)測y值 首先看它屬于x的哪一類 然后根據(jù)這一類中y的條件分布的比例來猜測它 這樣猜對的頻次較多 這時(shí)預(yù)測的誤差為 33 的取值范圍 1 x與y無相關(guān) 0 2 x與y相關(guān) 0 1 3 x與y全相關(guān) 1 一 系數(shù) 34 值的非對稱性以上所談的是以x為自變量 用對y的預(yù)測來定義PRE 所得值稱作 如果y為自變量 用對x的預(yù)測來定義PRE 所得值稱作 35 四 使用Spss的rosstabs過程輸出列聯(lián)表 根據(jù)原始數(shù)據(jù) 1 1列聯(lián)表數(shù)據(jù) 作出年齡與愛好的交叉列聯(lián)表Analyze DescriptiveStatistics Crosstabs1 行變量Row s 年齡 列變量Column s 愛好2 行變量Row s 愛好 列變量Column s 年齡系統(tǒng)默認(rèn)為升序排列 ascending Layer 用于選入更多的分類變量 層變量 Cells 定義列聯(lián)表單元格中需要顯示的指標(biāo) Percentages Row Column Total Displayclusteredbarchart 顯示統(tǒng)計(jì)圖ContinueOK 36 Crosstabs 37 38 行百分比 y 戲曲 x 年齡 的條件分布 列百分比 x 老年 y 愛好 的條件分布 x 年齡 的邊緣分布 y 愛好 的邊緣分布 合計(jì)百分比 聯(lián)合分布 39 年齡與愛好獨(dú)立 年齡與愛好不獨(dú)立檢驗(yàn)的具體操作 Analyze DescriptiveStatistics CrosstabsRows框 年齡 Columns 愛好Cells Counts框組 Expected ContinueStatistics Chi square ContinueOK 運(yùn)用spss進(jìn)行列聯(lián)表的檢驗(yàn) 40 檢驗(yàn)的分析結(jié)果 41 檢驗(yàn)的分析結(jié)果 47 817 統(tǒng)計(jì)量與自由度為4的理論分布比較 近似概率和精確概率均為0 000 四舍五入 精確值 進(jìn)入編輯狀態(tài)后 雙擊精確概率單元格 遠(yuǎn)遠(yuǎn)小于0 05或0 01的顯著性水平 所以拒絕原假設(shè) 接受備擇假設(shè) 可以非常有把握地說 年齡與愛好不獨(dú)立 42 運(yùn)用spss進(jìn)行列聯(lián)表的檢驗(yàn) 如果考慮其它定類因素的影響 多因素分析 如果考慮其它定距變量的影響 高級篇Logistic回歸 實(shí)際應(yīng)用中 值的大小可以粗略地反映兩變量聯(lián)系的強(qiáng)弱 但是這很難有更貼近實(shí)際的解釋 研究者只能從它的大小上有一個(gè)關(guān)聯(lián)強(qiáng)弱的印象 43 例2 某鄉(xiāng)鎮(zhèn)研究職業(yè)代際流動(dòng) 調(diào)查了工140人 其結(jié)果如下 問父輩職業(yè)與子輩職業(yè)受有關(guān) 0 05 p308 44 例2 p308 45 例2 p308 46 三 如何運(yùn)用spss計(jì)算V系數(shù) C系數(shù) 例3 p318輸入數(shù)據(jù) 1 數(shù)據(jù)加權(quán) Data WeightCaseWeightcasesbyFrequencyVariable 人數(shù)OK2 列聯(lián)強(qiáng)度 Analyze DescriptiveStatistics CrosstabsRows框 滿意度 Columns 婚姻 Suppresstables不顯示具體表格Statistics Chi square Nominal ContingencycoefficientC系數(shù) PhiandCramer sVV系數(shù) UncertaintyCoefficient不確定系數(shù)ContinueOK 47 0 0002343410 48 1 數(shù)據(jù)加權(quán) Data WeightCaseWeightcasesbyFrequencyVariable 人數(shù)OK2 列聯(lián)強(qiáng)度 Analyze Descripti

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論