第四章3基本統(tǒng)計分析課件_第1頁
第四章3基本統(tǒng)計分析課件_第2頁
第四章3基本統(tǒng)計分析課件_第3頁
第四章3基本統(tǒng)計分析課件_第4頁
第四章3基本統(tǒng)計分析課件_第5頁
已閱讀5頁,還剩77頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

探索性數(shù)據(jù)分析調(diào)用此過程可產(chǎn)生所有個案或不同分組個案的綜合統(tǒng)計量及圖形,提供各種不同的統(tǒng)計量與描述作圖,可進(jìn)行數(shù)據(jù)篩查,發(fā)現(xiàn)奇異值,描述性分析,假設(shè)檢驗及不同分組個案的特征描述可幫助用戶決定選擇哪種統(tǒng)計方法進(jìn)行數(shù)據(jù)分析,選擇將數(shù)據(jù)轉(zhuǎn)換成正態(tài)方法及是否使用非參數(shù)目的探索性數(shù)據(jù)分析調(diào)用此過程可產(chǎn)生所有個案或不同分組目的按Analyze--DescriptiveStatistics--Explore順序單擊,打開Explore主對話框?;静僮靼碅nalyze--DescriptiveStatisti選擇一個或多個變量進(jìn)入Dependent框作為因變量此作為分組變量,可以是字符變量,對因變量的分析將按該變量的觀測值進(jìn)行分組分析。可有多個分組變量,這時會按多個變量的交叉組合進(jìn)行分組。該框中的變量作為個案標(biāo)識符可同時輸出基本統(tǒng)計量和圖形只輸出基本統(tǒng)計量只輸出圖形Explore主對話框選擇一個或多個變量進(jìn)入Dependent框作為因變量此作為分輸出基本統(tǒng)計量均值的置信區(qū)間,可鍵入1—99%的任意值,根據(jù)該值算出置信區(qū)間的上下限。給出中心趨勢的的穩(wěn)健最大似然估計量,當(dāng)數(shù)據(jù)分布均勻,且兩尾較長,或當(dāng)數(shù)據(jù)中存在極端值時,可給出比均值或中位數(shù)更合理的估計。輸出最大和最小的5個數(shù),且在輸出窗口中加以標(biāo)明。輸出5%、10%、25%、50%、75%、90%和95%的百分位數(shù)。Statistics對話框輸出基本統(tǒng)計量給出中心趨勢的的穩(wěn)健最大似然估計量,當(dāng)數(shù)據(jù)分布只有指定分組變量才有效,可輸出分布—水平圖,同時輸出回歸直線斜率以及對方差的Levene’s檢驗不輸出分布—水平圖功效估計根據(jù)在Power參數(shù)框中指定的變換對原始數(shù)據(jù)進(jìn)行變換。不對數(shù)據(jù)進(jìn)行轉(zhuǎn)換Explore欄中Plots對話框箱型圖每一個因變量生成一個箱形圖所有因變量生成一個箱形圖不顯示任何箱形圖生成莖葉圖,為默認(rèn)生成直方圖輸出帶檢驗的正態(tài)圖只有指定分組變量才有效,可輸出分布—水平圖,同時輸出回歸直線確定缺失值的處置:因變量或分組變量中帶有缺失值的觀測量都將在分析過程中被剔除。在分析過程中剔除此分析中含缺失值個案。分組變量的缺失值被單獨分為一組,在結(jié)果中產(chǎn)生一個附加分類。Explore欄中Options對話框確定缺失值的處置:Explore欄中Options對話框?qū)嵗齝hild.sav,根據(jù)因子變量性別對身高進(jìn)行探索性數(shù)據(jù)分析EXAMINEVARIABLES=x5BYx2/PLOTBOXPLOTSTEMLEAF/COMPAREGROUP/STATISTICSDESCRIPTIVES/CINTERVAL95/MISSINGLISTWISE/NOTOTAL.實例child.sav,根據(jù)因子變量性別對EXAMINE檢驗列聯(lián)表分析列聯(lián)表相關(guān)性測度檢驗列聯(lián)表分析列聯(lián)表相關(guān)性測度數(shù)據(jù)的類型與列聯(lián)分析數(shù)據(jù)定量數(shù)據(jù)(數(shù)值型數(shù)據(jù))定性數(shù)據(jù)(品質(zhì)數(shù)據(jù))離散數(shù)據(jù)連續(xù)數(shù)據(jù)列聯(lián)分析數(shù)據(jù)的類型與列聯(lián)分析數(shù)據(jù)定量數(shù)據(jù)定性數(shù)據(jù)離散數(shù)據(jù)連續(xù)數(shù)據(jù)列定性數(shù)據(jù)定性變量的結(jié)果表現(xiàn)為類別例如:性別(男,女)各類別用符號或數(shù)字代碼來測度使用定類或定序尺度你吸煙嗎?1.是;2.否你贊成還是反對這一改革方案?1.贊成;2.反對對定性數(shù)據(jù)的描述和分析通常使用列聯(lián)表可使用檢驗定性數(shù)據(jù)定性變量的結(jié)果表現(xiàn)為類別列聯(lián)表

(例題分析)一分公司二分公司三分公司四分公司合計贊成該方案68755779279反對該方案32753331141合計10012090110420【例】一個集團(tuán)公司在四個不同的地區(qū)設(shè)有分公司,現(xiàn)該集團(tuán)公司欲進(jìn)行一項改革,此項改革可能涉及到各分公司的利益,故采用抽樣調(diào)查方式,從四個分公司共抽取420個樣本單位(人),了解職工對此項改革的看法,調(diào)查結(jié)果如下表列聯(lián)表

(例題分析)一分公司二分公司三分公司四分公司合計贊成列聯(lián)表按多個(兩個或兩個以上)變量的不同取值對不同情形進(jìn)行劃分,也即劃分不同的行或列。用以分行的變量稱為行(row)變量,和用以分列的變量則稱為列(column)變量。表格中間各行變量和列變量不同取值的交匯處,就是這種情形出現(xiàn)的頻數(shù)或計數(shù)(count)。列聯(lián)表中行變量和列變量的個數(shù)稱為列聯(lián)表的維數(shù)。二維的列聯(lián)表又稱為交叉表(crosstable)。三維或三維以上的列聯(lián)表叫做高維列聯(lián)表。列聯(lián)表

(contingencytable)列聯(lián)表按多個(兩個或兩個以上)變量的不同取值對不同情形進(jìn)行劃列聯(lián)表中每個行變量或列變量又有兩個或更多的不同取值,這些取值常稱為水平(level)。每一種不同的水平組合就代表一種不同的情形。列聯(lián)表

(contingencytable)列聯(lián)表中每個行變量或列變量又有兩個或更多的不同取值,這些取值列聯(lián)表的結(jié)構(gòu)

(22列聯(lián)表)列(cj)合計j=1j=2i=1f11f12f11+f12i=2f21f22f21+f22合計f11+f21f12+f22n列(cj)行(ri)列聯(lián)表的結(jié)構(gòu)

(22列聯(lián)表)列(cj)合計j=列聯(lián)表的結(jié)構(gòu)

(r

c列聯(lián)表的一般表示)列(cj)合計j=1j=2…i=1f11f12…r1i=2f21f22…r2:::::合計c1c2…n列(cj)行(ri)fij表示第i行第j列的觀察頻數(shù)列聯(lián)表的結(jié)構(gòu)

(rc列聯(lián)表的一般表示)列(cj)合計關(guān)于某項政策調(diào)查的結(jié)果觀點:贊成觀點:反對低收入中等收入高收入低收入中等收入高收入男201055810女25157279高維列聯(lián)表關(guān)于某項政策調(diào)查的結(jié)果觀點:贊成觀點:反對低收入中等收入高收觀察值的分布邊緣分布行邊緣分布行觀察值的合計數(shù)的分布例如,贊成改革方案的共有279人,反對改革方案的141人列邊緣分布列觀察值的合計數(shù)的分布例如,四個分公司接受調(diào)查的人數(shù)分別為100人,120人,90人,110人條件分布與條件頻數(shù)變量X條件下變量Y的分布,或在變量Y條件下變量X的分布每個具體的觀察值稱為條件頻數(shù)觀察值的分布邊緣分布觀察值的分布

(圖示)一分公司二分公司三分公司四分公司合計贊成該方案68755779279反對該方案32753331141合計10012090110420行邊緣分布列邊緣分布條件頻數(shù)觀察值的分布

(圖示)一分公司二分公司三分公司四分公司合計贊百分比分布

(概念要點)條件頻數(shù)反映了數(shù)據(jù)的分布,但不適合對比為在相同的基數(shù)上進(jìn)行比較,可以計算相應(yīng)的百分比,稱為百分比分布行百分比:行的每一個觀察頻數(shù)除以相應(yīng)的行合計數(shù)(fij

/ri)列百分比:列的每一個觀察頻數(shù)除以相應(yīng)的列合計數(shù)(fij

/cj)總百分比:每一個觀察值除以觀察值的總個數(shù)(fij

/n)百分比分布

(概念要點)條件頻數(shù)反映了數(shù)據(jù)的分布,但不適合對期望頻數(shù)的分布假定行變量和列變量是獨立的一個實際頻數(shù)fij

的期望頻數(shù)eij

,是總頻數(shù)的個數(shù)n乘以該實際頻數(shù)fij

落入第i行和第j列的概率,即期望頻數(shù)的分布假定行變量和列變量是獨立的

統(tǒng)計量用于檢驗列聯(lián)表中變量間擬合優(yōu)度和獨立性用于測定兩個分類變量之間的相關(guān)程度

計算公式為統(tǒng)計量用于檢驗列聯(lián)表中變量間擬合優(yōu)度和獨立性列聯(lián)表中的相關(guān)測量一.

相關(guān)系數(shù)列聯(lián)相關(guān)系數(shù)

V相關(guān)系數(shù)列聯(lián)表中的相關(guān)測量一.相關(guān)系數(shù)

相關(guān)系數(shù)

(correlationcoefficient)測度22列聯(lián)表中數(shù)據(jù)相關(guān)程度對于22列聯(lián)表,

系數(shù)的值在0~1之間

相關(guān)系數(shù)計算公式為相關(guān)系數(shù)

(correlationcoefficie列聯(lián)相關(guān)系數(shù)

(coefficientofcontingency)用于測度大于22列聯(lián)表中數(shù)據(jù)的相關(guān)程度計算公式為C的取值范圍是0C<1C=0表明列聯(lián)表中的兩個變量獨立C的數(shù)值大小取決于列聯(lián)表的行數(shù)和列數(shù),并隨行數(shù)和列數(shù)的增大而增大根據(jù)不同行和列的列聯(lián)表計算的列聯(lián)系數(shù)不便于比較列聯(lián)相關(guān)系數(shù)

(coefficientofcontingV相關(guān)系數(shù)

(Vcorrelationcoefficient)計算公式為

V的取值范圍是0V1

V=0表明列聯(lián)表中的兩個變量獨立

V=1表明列聯(lián)表中的兩個變量完全相關(guān)不同行和列的列聯(lián)表計算的列聯(lián)系數(shù)不便于比較當(dāng)列聯(lián)表中有一維為2,min[(r-1),(c-1)]=1,此時V=V相關(guān)系數(shù)

(Vcorrelationcoeffici、C、V的比較同一個列聯(lián)表,、C、V的結(jié)果會不同不同的列聯(lián)表,、C、V的結(jié)果也不同在對不同列聯(lián)表變量之間的相關(guān)程度進(jìn)行比較時,不同列聯(lián)表中的行與行、列與列的個數(shù)要相同,并且采用同一種系數(shù)、C、V的比較同一個列聯(lián)表,、C、V的結(jié)果會不同操作步驟按Analyze--DescriptiveStatistics--Crosstabs順序打開Crosstabs主對話框。操作步驟按Analyze--DescriptiveSt該框中的變量作為分布表中的行變量,該框中的變量作為控制變量,決定頻數(shù)分布表中的層,可有多個控制變量顯示每一組中各變量的分類條形圖。只輸出統(tǒng)計量,不輸出多維列聯(lián)表。Crosstabs對話框該框中的變量作為分布表中的列變量,exact精確檢驗該框中的變量作為分布表中的行變量,該框中的變量作為控制變量,卡方檢驗計算相關(guān)系數(shù):Pearson相關(guān)系數(shù)和Spearman相關(guān)系數(shù)適用于定類變量的統(tǒng)計量:相關(guān)性檢驗適用于連兩定序變量,相關(guān)性檢驗適用于一定類一定距變量:用于檢驗相關(guān)性Statistics對話框內(nèi)部一致性系數(shù),用于檢驗兩個評估人對同一對象的評估是否具有一致系。相對危險度,檢驗?zāi)呈录l(fā)生和某因子之間的關(guān)系進(jìn)行兩個相關(guān)的二值變量的非參數(shù)檢驗進(jìn)行一個二值因素變量和一個二值響應(yīng)變量的獨立性檢驗??ǚ綑z驗計算相關(guān)系數(shù):適用于定類變量的統(tǒng)計量:相關(guān)性檢驗適用Crosstabs的CellDisplay對話框選擇在列聯(lián)表中輸出的統(tǒng)計量,包括觀測量數(shù)、百分比、殘差輸出觀測量的實際數(shù)量如果行和列變量在統(tǒng)計上是獨立的或不相關(guān)的,那么會在單元格中輸出期望的觀測值的數(shù)量。輸出單元格中觀測量的數(shù)目占整行全部觀測量數(shù)目的百分比輸出單元格中觀測值的數(shù)目占整列全部觀測量數(shù)目的百分比輸出單元格中觀測量的數(shù)目占全部觀測量數(shù)目的百分比計算非標(biāo)準(zhǔn)化殘差計算標(biāo)準(zhǔn)化殘差計算調(diào)整后殘差Crosstabs的CellDisplay對話框選擇在列TableFormat對話框決定各行的排列順序:各行的排列按升序各行的排列按降序TableFormat對話框決定各行的排列順序:實例分析CROSSTABS/TABLES=a13BYa14/FORMAT=AVALUETABLES/CELLS=COUNT/COUNTROUNDCELL.對居民儲蓄調(diào)查數(shù)據(jù).sav建立列聯(lián)表,分析戶口和職業(yè)的關(guān)系

實例分析CROSSTABS對居民儲蓄調(diào)查數(shù)據(jù).sav建立列聯(lián)為了探討吸煙與慢性支氣管炎有無關(guān)系,調(diào)查了339人,情況如下:(數(shù)據(jù)為:吸煙與支氣管炎.sav)患慢性支氣管炎未患慢性支氣管炎吸煙43162不吸煙13121實例分析為了探討吸煙與慢性支氣管炎有無關(guān)患慢性支氣管炎未患慢在Data菜單中選WeightCases…項,打開WeightCases對話框。WeightCasesby,再將變量x3選入FrequenceVariable框,單擊OK完成加權(quán)。按Analyze--DescriptiveStatistics--Crootabs順序打開Crootabs主對話框。將x1變量選入Row框作為行變量,將x2變量選入Column框作為列變量。打開Statistics對話框,選中Chi-square、Contingencycoefficient和PhiandCramer’sV復(fù)選框,單擊Continue返回。單擊Cell按鈕,打開Celldisplay對話框,選中observed和Expected復(fù)選框,單擊Continue返回;單擊OK。1操作步驟:實例分析在Data菜單中選WeightCases…項,打開Weig

統(tǒng)計摘要表,列出觀測量有效值個數(shù)、缺失值個數(shù)和總的個數(shù)。從列聯(lián)表中可看出,吸煙人中患病者有43人,比期望值33.9大,不吸煙人中患病者只有13人,比期望值22.1小。

輸出結(jié)果如下表:表吸煙與患病統(tǒng)計摘要表2輸出結(jié)果及分析統(tǒng)計摘要表,列出觀測量有效值個數(shù)、缺失值個數(shù)和表吸煙與患病列聯(lián)表表卡方檢驗表吸煙與患病列聯(lián)表表卡方檢驗

卡方檢驗表中可看出,Chi-Square值為7.469,顯著值為0.006<0.05,應(yīng)否定零假設(shè),即認(rèn)為吸煙與患慢性支氣管炎是不獨立的。由于使用卡方檢驗要求每個單元格頻數(shù)不少于5,當(dāng)條件不滿足時,還可用Fisher精確檢驗。其雙側(cè)檢驗顯著值為0.007。對稱性測量表表明,變量間相關(guān)關(guān)系弱,不應(yīng)拒絕原假設(shè)表對稱性檢驗表卡方檢驗表中可看出,Chi-Square值為練習(xí)2為了解住房條件對婆媳關(guān)系的影響,對600戶家庭進(jìn)行調(diào)查,見婆媳關(guān)系與住房條件.sav問住房條件與婆媳有無關(guān)系?婆媳關(guān)系住房條件差一般好緊張577860一般458763和睦4845117練習(xí)2為了解住房條件對婆媳關(guān)系的影響,婆媳關(guān)系練習(xí)2為了解住房條件對婆媳關(guān)系的影響,對600戶家庭進(jìn)行調(diào)查,見婆媳關(guān)系與住房條件.sav問住房條件與婆媳有無關(guān)系?WEIGHTBY頻數(shù).CROSSTABS/TABLES=婆媳關(guān)系BY住房條件/FORMAT=AVALUETABLES/STATISTIC=CHISQCCPHICORR/CELLS=COUNTEXPECTEDROWCOLUMNTOTAL/COUNTROUNDCELL.練習(xí)2為了解住房條件對婆媳關(guān)系的影響,WEIGHT1:居民儲蓄調(diào)查數(shù)據(jù)分析儲戶存(取)款金額的基本描述統(tǒng)計量,并對城市儲戶和農(nóng)村儲戶進(jìn)行比較.作業(yè)11:居民儲蓄調(diào)查數(shù)據(jù)作業(yè)1作業(yè)2某班42名男女同學(xué)全部參加大學(xué)英語4級水平考試,男生合格2人,不合格26人,女生合格6人,不合格8人,問男女生在英語學(xué)習(xí)水平上有無顯著差別?將以上結(jié)果保存為word文件,并對結(jié)果作出統(tǒng)計分析,要寫明第幾次作業(yè).作業(yè)2某班42名男女同學(xué)全部參加大學(xué)英語將以上結(jié)果保存為探索性數(shù)據(jù)分析調(diào)用此過程可產(chǎn)生所有個案或不同分組個案的綜合統(tǒng)計量及圖形,提供各種不同的統(tǒng)計量與描述作圖,可進(jìn)行數(shù)據(jù)篩查,發(fā)現(xiàn)奇異值,描述性分析,假設(shè)檢驗及不同分組個案的特征描述可幫助用戶決定選擇哪種統(tǒng)計方法進(jìn)行數(shù)據(jù)分析,選擇將數(shù)據(jù)轉(zhuǎn)換成正態(tài)方法及是否使用非參數(shù)目的探索性數(shù)據(jù)分析調(diào)用此過程可產(chǎn)生所有個案或不同分組目的按Analyze--DescriptiveStatistics--Explore順序單擊,打開Explore主對話框。基本操作按Analyze--DescriptiveStatisti選擇一個或多個變量進(jìn)入Dependent框作為因變量此作為分組變量,可以是字符變量,對因變量的分析將按該變量的觀測值進(jìn)行分組分析??捎卸鄠€分組變量,這時會按多個變量的交叉組合進(jìn)行分組。該框中的變量作為個案標(biāo)識符可同時輸出基本統(tǒng)計量和圖形只輸出基本統(tǒng)計量只輸出圖形Explore主對話框選擇一個或多個變量進(jìn)入Dependent框作為因變量此作為分輸出基本統(tǒng)計量均值的置信區(qū)間,可鍵入1—99%的任意值,根據(jù)該值算出置信區(qū)間的上下限。給出中心趨勢的的穩(wěn)健最大似然估計量,當(dāng)數(shù)據(jù)分布均勻,且兩尾較長,或當(dāng)數(shù)據(jù)中存在極端值時,可給出比均值或中位數(shù)更合理的估計。輸出最大和最小的5個數(shù),且在輸出窗口中加以標(biāo)明。輸出5%、10%、25%、50%、75%、90%和95%的百分位數(shù)。Statistics對話框輸出基本統(tǒng)計量給出中心趨勢的的穩(wěn)健最大似然估計量,當(dāng)數(shù)據(jù)分布只有指定分組變量才有效,可輸出分布—水平圖,同時輸出回歸直線斜率以及對方差的Levene’s檢驗不輸出分布—水平圖功效估計根據(jù)在Power參數(shù)框中指定的變換對原始數(shù)據(jù)進(jìn)行變換。不對數(shù)據(jù)進(jìn)行轉(zhuǎn)換Explore欄中Plots對話框箱型圖每一個因變量生成一個箱形圖所有因變量生成一個箱形圖不顯示任何箱形圖生成莖葉圖,為默認(rèn)生成直方圖輸出帶檢驗的正態(tài)圖只有指定分組變量才有效,可輸出分布—水平圖,同時輸出回歸直線確定缺失值的處置:因變量或分組變量中帶有缺失值的觀測量都將在分析過程中被剔除。在分析過程中剔除此分析中含缺失值個案。分組變量的缺失值被單獨分為一組,在結(jié)果中產(chǎn)生一個附加分類。Explore欄中Options對話框確定缺失值的處置:Explore欄中Options對話框?qū)嵗齝hild.sav,根據(jù)因子變量性別對身高進(jìn)行探索性數(shù)據(jù)分析EXAMINEVARIABLES=x5BYx2/PLOTBOXPLOTSTEMLEAF/COMPAREGROUP/STATISTICSDESCRIPTIVES/CINTERVAL95/MISSINGLISTWISE/NOTOTAL.實例child.sav,根據(jù)因子變量性別對EXAMINE檢驗列聯(lián)表分析列聯(lián)表相關(guān)性測度檢驗列聯(lián)表分析列聯(lián)表相關(guān)性測度數(shù)據(jù)的類型與列聯(lián)分析數(shù)據(jù)定量數(shù)據(jù)(數(shù)值型數(shù)據(jù))定性數(shù)據(jù)(品質(zhì)數(shù)據(jù))離散數(shù)據(jù)連續(xù)數(shù)據(jù)列聯(lián)分析數(shù)據(jù)的類型與列聯(lián)分析數(shù)據(jù)定量數(shù)據(jù)定性數(shù)據(jù)離散數(shù)據(jù)連續(xù)數(shù)據(jù)列定性數(shù)據(jù)定性變量的結(jié)果表現(xiàn)為類別例如:性別(男,女)各類別用符號或數(shù)字代碼來測度使用定類或定序尺度你吸煙嗎?1.是;2.否你贊成還是反對這一改革方案?1.贊成;2.反對對定性數(shù)據(jù)的描述和分析通常使用列聯(lián)表可使用檢驗定性數(shù)據(jù)定性變量的結(jié)果表現(xiàn)為類別列聯(lián)表

(例題分析)一分公司二分公司三分公司四分公司合計贊成該方案68755779279反對該方案32753331141合計10012090110420【例】一個集團(tuán)公司在四個不同的地區(qū)設(shè)有分公司,現(xiàn)該集團(tuán)公司欲進(jìn)行一項改革,此項改革可能涉及到各分公司的利益,故采用抽樣調(diào)查方式,從四個分公司共抽取420個樣本單位(人),了解職工對此項改革的看法,調(diào)查結(jié)果如下表列聯(lián)表

(例題分析)一分公司二分公司三分公司四分公司合計贊成列聯(lián)表按多個(兩個或兩個以上)變量的不同取值對不同情形進(jìn)行劃分,也即劃分不同的行或列。用以分行的變量稱為行(row)變量,和用以分列的變量則稱為列(column)變量。表格中間各行變量和列變量不同取值的交匯處,就是這種情形出現(xiàn)的頻數(shù)或計數(shù)(count)。列聯(lián)表中行變量和列變量的個數(shù)稱為列聯(lián)表的維數(shù)。二維的列聯(lián)表又稱為交叉表(crosstable)。三維或三維以上的列聯(lián)表叫做高維列聯(lián)表。列聯(lián)表

(contingencytable)列聯(lián)表按多個(兩個或兩個以上)變量的不同取值對不同情形進(jìn)行劃列聯(lián)表中每個行變量或列變量又有兩個或更多的不同取值,這些取值常稱為水平(level)。每一種不同的水平組合就代表一種不同的情形。列聯(lián)表

(contingencytable)列聯(lián)表中每個行變量或列變量又有兩個或更多的不同取值,這些取值列聯(lián)表的結(jié)構(gòu)

(22列聯(lián)表)列(cj)合計j=1j=2i=1f11f12f11+f12i=2f21f22f21+f22合計f11+f21f12+f22n列(cj)行(ri)列聯(lián)表的結(jié)構(gòu)

(22列聯(lián)表)列(cj)合計j=列聯(lián)表的結(jié)構(gòu)

(r

c列聯(lián)表的一般表示)列(cj)合計j=1j=2…i=1f11f12…r1i=2f21f22…r2:::::合計c1c2…n列(cj)行(ri)fij表示第i行第j列的觀察頻數(shù)列聯(lián)表的結(jié)構(gòu)

(rc列聯(lián)表的一般表示)列(cj)合計關(guān)于某項政策調(diào)查的結(jié)果觀點:贊成觀點:反對低收入中等收入高收入低收入中等收入高收入男201055810女25157279高維列聯(lián)表關(guān)于某項政策調(diào)查的結(jié)果觀點:贊成觀點:反對低收入中等收入高收觀察值的分布邊緣分布行邊緣分布行觀察值的合計數(shù)的分布例如,贊成改革方案的共有279人,反對改革方案的141人列邊緣分布列觀察值的合計數(shù)的分布例如,四個分公司接受調(diào)查的人數(shù)分別為100人,120人,90人,110人條件分布與條件頻數(shù)變量X條件下變量Y的分布,或在變量Y條件下變量X的分布每個具體的觀察值稱為條件頻數(shù)觀察值的分布邊緣分布觀察值的分布

(圖示)一分公司二分公司三分公司四分公司合計贊成該方案68755779279反對該方案32753331141合計10012090110420行邊緣分布列邊緣分布條件頻數(shù)觀察值的分布

(圖示)一分公司二分公司三分公司四分公司合計贊百分比分布

(概念要點)條件頻數(shù)反映了數(shù)據(jù)的分布,但不適合對比為在相同的基數(shù)上進(jìn)行比較,可以計算相應(yīng)的百分比,稱為百分比分布行百分比:行的每一個觀察頻數(shù)除以相應(yīng)的行合計數(shù)(fij

/ri)列百分比:列的每一個觀察頻數(shù)除以相應(yīng)的列合計數(shù)(fij

/cj)總百分比:每一個觀察值除以觀察值的總個數(shù)(fij

/n)百分比分布

(概念要點)條件頻數(shù)反映了數(shù)據(jù)的分布,但不適合對期望頻數(shù)的分布假定行變量和列變量是獨立的一個實際頻數(shù)fij

的期望頻數(shù)eij

,是總頻數(shù)的個數(shù)n乘以該實際頻數(shù)fij

落入第i行和第j列的概率,即期望頻數(shù)的分布假定行變量和列變量是獨立的

統(tǒng)計量用于檢驗列聯(lián)表中變量間擬合優(yōu)度和獨立性用于測定兩個分類變量之間的相關(guān)程度

計算公式為統(tǒng)計量用于檢驗列聯(lián)表中變量間擬合優(yōu)度和獨立性列聯(lián)表中的相關(guān)測量一.

相關(guān)系數(shù)列聯(lián)相關(guān)系數(shù)

V相關(guān)系數(shù)列聯(lián)表中的相關(guān)測量一.相關(guān)系數(shù)

相關(guān)系數(shù)

(correlationcoefficient)測度22列聯(lián)表中數(shù)據(jù)相關(guān)程度對于22列聯(lián)表,

系數(shù)的值在0~1之間

相關(guān)系數(shù)計算公式為相關(guān)系數(shù)

(correlationcoefficie列聯(lián)相關(guān)系數(shù)

(coefficientofcontingency)用于測度大于22列聯(lián)表中數(shù)據(jù)的相關(guān)程度計算公式為C的取值范圍是0C<1C=0表明列聯(lián)表中的兩個變量獨立C的數(shù)值大小取決于列聯(lián)表的行數(shù)和列數(shù),并隨行數(shù)和列數(shù)的增大而增大根據(jù)不同行和列的列聯(lián)表計算的列聯(lián)系數(shù)不便于比較列聯(lián)相關(guān)系數(shù)

(coefficientofcontingV相關(guān)系數(shù)

(Vcorrelationcoefficient)計算公式為

V的取值范圍是0V1

V=0表明列聯(lián)表中的兩個變量獨立

V=1表明列聯(lián)表中的兩個變量完全相關(guān)不同行和列的列聯(lián)表計算的列聯(lián)系數(shù)不便于比較當(dāng)列聯(lián)表中有一維為2,min[(r-1),(c-1)]=1,此時V=V相關(guān)系數(shù)

(Vcorrelationcoeffici、C、V的比較同一個列聯(lián)表,、C、V的結(jié)果會不同不同的列聯(lián)表,、C、V的結(jié)果也不同在對不同列聯(lián)表變量之間的相關(guān)程度進(jìn)行比較時,不同列聯(lián)表中的行與行、列與列的個數(shù)要相同,并且采用同一種系數(shù)、C、V的比較同一個列聯(lián)表,、C、V的結(jié)果會不同操作步驟按Analyze--DescriptiveStatistics--Crosstabs順序打開Crosstabs主對話框。操作步驟按Analyze--DescriptiveSt該框中的變量作為分布表中的行變量,該框中的變量作為控制變量,決定頻數(shù)分布表中的層,可有多個控制變量顯示每一組中各變量的分類條形圖。只輸出統(tǒng)計量,不輸出多維列聯(lián)表。Crosstabs對話框該框中的變量作為分布表中的列變量,exact精確檢驗該框中的變量作為分布表中的行變量,該框中的變量作為控制變量,卡方檢驗計算相關(guān)系數(shù):Pearson相關(guān)系數(shù)和Spearman相關(guān)系數(shù)適用于定類變量的統(tǒng)計量:相關(guān)性檢驗適用于連兩定序變量,相關(guān)性檢驗適用于一定類一定距變量:用于檢驗相關(guān)性Statistics對話框內(nèi)部一致性系數(shù),用于檢驗兩個評估人對同一對象的評估是否具有一致系。相對危險度,檢驗?zāi)呈录l(fā)生和某因子之間的關(guān)系進(jìn)行兩個相關(guān)的二值變量的非參數(shù)檢驗進(jìn)行一個二值因素變量和一個二值響應(yīng)變量的獨立性檢驗??ǚ綑z驗計算相關(guān)系數(shù):適用于定類變量的統(tǒng)計量:相關(guān)性檢驗適用Crosstabs的CellDisplay對話框選擇在列聯(lián)表中輸出的統(tǒng)計量,包括觀測量數(shù)、百分比、殘差輸出觀測量的實際數(shù)量如果行和列變量在統(tǒng)計上是獨立的或不相關(guān)的,那么會在單元格中輸出期望的觀測值的數(shù)量。輸出單元格中觀測量的數(shù)目占整行全部觀測量數(shù)目的百分比輸出單元格中觀測值的數(shù)目占整列全部觀測量數(shù)目的百分比輸出單元格中觀測量的數(shù)目占全部觀測量數(shù)目的百分比計算非標(biāo)準(zhǔn)化殘差計算標(biāo)準(zhǔn)化殘差計算調(diào)整后殘差Crosstabs的CellDisplay對話框選擇在列TableFormat對話框決定各行的排列順序:各行的排列按升序各行的排列按降序TableFormat對話框決定各行的排列順序:實例分析CROSSTABS/TABLES=a13BYa14/FORMAT=AVALUETABLES/CELLS=COUNT/COUNTROUNDCELL.對居民儲蓄調(diào)查數(shù)據(jù).sav建立列聯(lián)表,分析戶口和職業(yè)的關(guān)系

實例分析CROSSTABS對居民儲蓄調(diào)查數(shù)據(jù).sav建立列聯(lián)為了探討吸煙與慢性支氣管炎有無關(guān)系,調(diào)查了339人,情況如下:(數(shù)據(jù)為:吸煙與支氣管炎.sav)患慢性支氣管炎未患慢性支氣管炎吸煙43162不吸煙13121實例分析為了探討吸煙與慢性支氣管炎有無關(guān)患慢性支氣管炎未患慢在Data菜單中選WeightCases…項,打開WeightCases對話框。WeightCasesby,再將變量x3選入FrequenceVariable框,單擊OK完成加權(quán)。按Analyze--DescriptiveStatistics--

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論