SPSS統(tǒng)計(jì)分析實(shí)用教程(第2版)_第1頁
SPSS統(tǒng)計(jì)分析實(shí)用教程(第2版)_第2頁
SPSS統(tǒng)計(jì)分析實(shí)用教程(第2版)_第3頁
SPSS統(tǒng)計(jì)分析實(shí)用教程(第2版)_第4頁
SPSS統(tǒng)計(jì)分析實(shí)用教程(第2版)_第5頁
已閱讀5頁,還剩98頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

SPSS統(tǒng)計(jì)分析實(shí)用教程(第2版)第一章SPSS簡介社會科學(xué)統(tǒng)計(jì)軟件包(StatisticalPackagefortheSocialScience,SPSS)是世界著名的統(tǒng)計(jì)分析軟件之一。經(jīng)過近40年的發(fā)展,SPSS在全球已擁有大量的用戶。目前,SPSS使用Windows的窗口方式展示各種管理和分析數(shù)據(jù)的方法,可方便地用于特定的科研統(tǒng)計(jì)。第一章SPSS簡介SPSS運(yùn)行方式1.批處理方式2.完全窗口菜單運(yùn)行方式3.程序運(yùn)行方式第一章SPSS簡介SPSS的啟動SPSS的數(shù)據(jù)編輯窗口SPSS的結(jié)果輸出窗口SPSS的退出SPSS的幫助系統(tǒng)第二章變量、數(shù)據(jù)文件、參數(shù)2.1定義變量1.定義變量名(Name)2.定義變量類型(Type):Numeric、Comma、Dot、Scientificnotation、Date、Dollar、String3.變量長度(Width)4.變量小數(shù)點(diǎn)位數(shù)(Decimal)5.變量標(biāo)簽(Label)第二章變量、數(shù)據(jù)文件、參數(shù)6.變量值標(biāo)簽(Values):對變量的每一個(gè)可能取值的進(jìn)一步描述7.缺失值的定義方式(Missing):系統(tǒng)缺失值和用戶缺失值8.變量的顯示寬度(Columns)9.變量顯示的對齊方式(Align):Left(左對齊)、Right(右對齊)、Center(居中對齊)10.變量的測量精度(Measure):定性變量(Nominal)、定序變量(Ordinal)、定距變量(Interval)、定比變量(Interval)第二章變量、數(shù)據(jù)文件、參數(shù)2.2數(shù)據(jù)的輸入與保存1、輸入數(shù)據(jù)的一般方法2、輸入帶有變量值標(biāo)簽的數(shù)據(jù)3、SPSS數(shù)據(jù)文件的保存第二章變量、數(shù)據(jù)文件、參數(shù)2.3數(shù)據(jù)的編輯1、單元值的修改:“Edit”-“GotoCase”2、增加和刪除一個(gè)個(gè)案:“Data”-“InsertCase”;“Delete”或“Edit”-“Clear”3、數(shù)據(jù)的排序:“Data”-“SortCases”4、數(shù)據(jù)的行列互換:“Data”-“Transpose”第二章變量、數(shù)據(jù)文件、5、選取個(gè)案子集:“Data”-“SelectCases”6、數(shù)據(jù)分類匯總:“Data”-“Aggregate”7、缺失值的替代:“Transform”-“ReplaceMissingValues”8、數(shù)據(jù)次序確定:“Transform”-“RankCases”第二章變量、數(shù)據(jù)文件、參數(shù)2.4變量的操作1、增加和刪除一個(gè)變量:“Data”-“InsertVariable”;“Delete”鍵或“Edit”-“Clear”2、指定加權(quán)變量:“Data”-“WeightCases”3、根據(jù)已存在的變量建立新變量:“Transform”-“ComputeVariable”4、產(chǎn)生計(jì)數(shù)變量:“Transform”-“CountValuewithinCases”第二章變量、數(shù)據(jù)文件、5、變量的重新賦值:

為同一個(gè)變量賦值是“Transform”-“IntoSameVariables”

為不同的變量賦值是“Transform”-“IntoDifferentVariables”6、變量的自動賦值:“Transform”-“AutomaticRecode”7、變量定義信息的查詢:“Utilities”8、變量集的定義和使用:

變量集的定義“Utilities”-“DefineVariableSets”

變量集的使用“Utilities”-“UseVariableSets”第二章變量、數(shù)據(jù)文件、參數(shù)2.5數(shù)據(jù)文件的合并和分組1、數(shù)據(jù)文件的縱向合并:選擇“Data”菜單中“MergeFiles”的“Addcases”命令2、數(shù)據(jù)文件的橫向合并:選擇“Data”菜單“MergeFiles”子菜單中的“AddVariables”命令3、數(shù)據(jù)文件的分組:選擇“Data”菜單中的“SplitFile”命令第二章變量、數(shù)據(jù)文件、參數(shù)2.6讀入其他格式的數(shù)據(jù)文件1、讀取固定格式的文本文件2、讀取自由格式的文本文件3、讀取dBASE軟件文件(.dbf)4、讀取Excel軟件文件5、讀取數(shù)據(jù)庫文件第二章變量、數(shù)據(jù)文件、參數(shù)2.7SPSS運(yùn)行環(huán)境設(shè)置1、SPSS狀態(tài)欄的顯示和隱藏2、SPSS網(wǎng)格線的顯示和隱藏3、SPSS菜單的增加和刪除4、SPSS字體的設(shè)置第三章描述統(tǒng)計(jì)3.1基本描述統(tǒng)計(jì)分析1、均值和均值標(biāo)準(zhǔn)誤差2、中位數(shù)

3、眾數(shù)4、全距5、方差和標(biāo)準(zhǔn)差6、四分位數(shù)、十分位數(shù)和百分位7、峰度和偏度第三章描述統(tǒng)計(jì)3.2頻數(shù)統(tǒng)計(jì)頻數(shù)(Frequency)就是一個(gè)變量在各個(gè)變量值上取值的個(gè)案數(shù)。如要了解學(xué)生某次考試的成績情況,需要計(jì)算出學(xué)生所有分?jǐn)?shù)取值,以及每個(gè)分?jǐn)?shù)取值有多少個(gè)人,這就需要用到頻數(shù)分析。變量的頻數(shù)分析正是實(shí)現(xiàn)上述分析的最好手段,它可以使人們非常清楚地了解變量取值的分布情況。第三章描述統(tǒng)計(jì)3.3標(biāo)準(zhǔn)化Z分?jǐn)?shù)及線性轉(zhuǎn)換Z分?jǐn)?shù)定義:從總體中抽出一個(gè)變量值

,Z分?jǐn)?shù)表示的是此變量大于或小于平均數(shù)幾個(gè)標(biāo)準(zhǔn)差。由于Z分?jǐn)?shù)分母的單位與分子相同,故Z分?jǐn)?shù)沒有單位,因此能夠用來比較兩個(gè)從不同單位總體中抽出的變量值。將原始數(shù)據(jù)直接轉(zhuǎn)換為Z分?jǐn)?shù)時(shí),常會出現(xiàn)負(fù)數(shù)和帶小數(shù)點(diǎn)的值,實(shí)際使用起來很不方便。因此,在有些情況下,可以對Z分?jǐn)?shù)進(jìn)一步加以線性轉(zhuǎn)換,使之成為正的數(shù)值。第三章描述統(tǒng)計(jì)3.4探索分析1.探索分析的內(nèi)容包括下面幾個(gè)方面⑴檢查數(shù)據(jù)是否有錯(cuò)誤⑵獲得數(shù)據(jù)分布特征⑶對數(shù)據(jù)規(guī)律的初步觀察2、探索分析的考察方法3、正態(tài)分布檢驗(yàn)4、方差齊次性檢驗(yàn)第三章描述統(tǒng)計(jì)3.5交叉列聯(lián)表分析交叉列聯(lián)表分析是指多個(gè)變量在不同取值情況下的數(shù)據(jù)分布情況,從而進(jìn)一步深入分析變量之間的相互影響和關(guān)系。交叉列聯(lián)表分析除了列出交叉分組下的頻數(shù)分布外,還需要分析兩個(gè)變量之間是否具有獨(dú)立性或一定的相關(guān)性。第三章描述統(tǒng)計(jì)SPSS提供了多種適用于不同相關(guān)系數(shù)的相關(guān)關(guān)系,這些檢驗(yàn)的零假設(shè)是:行和列變量之間彼此獨(dú)立,不存在顯著的相關(guān)關(guān)系。SPSS將自動給出檢驗(yàn)的相伴概率,如果相伴概率小于顯著性水平0.05,那么應(yīng)拒絕零假設(shè),認(rèn)為行列變量之間彼此相關(guān)。第三章描述統(tǒng)計(jì)3.6多選項(xiàng)分析多選項(xiàng)分析是對多選項(xiàng)問題的分析方法。所謂多選項(xiàng)問題,就是一個(gè)問題的答案都是順序變量或名義變量,并且允許選擇的答案可以有多種組合。對于多選項(xiàng)問題,編碼的方法有兩種。1.多選項(xiàng)二分法2.多選項(xiàng)分類法第三章描述統(tǒng)計(jì)3.7基本統(tǒng)計(jì)分析的報(bào)表制作報(bào)表分類:個(gè)案簡明統(tǒng)計(jì)報(bào)表行形式報(bào)表列形式報(bào)表第四章統(tǒng)計(jì)圖形統(tǒng)計(jì)圖形是用點(diǎn)的位置、線段的升降、直條的長短或面積的大小等方法來表達(dá)統(tǒng)計(jì)資料的內(nèi)容。它可以把統(tǒng)計(jì)資料所反映的變化趨勢、數(shù)量多少、分布狀態(tài)和相互關(guān)系等情況形象直觀地表現(xiàn)出來,以便于讀者閱讀、比較和分析。SPSS制圖功能很強(qiáng),能繪制許多統(tǒng)計(jì)圖形,這些圖形既可以在統(tǒng)計(jì)分析過程中產(chǎn)生,也可以直接由Graphs圖形菜單中所包含的一系列選項(xiàng)來實(shí)現(xiàn)。第四章統(tǒng)計(jì)圖形4.1條形圖條形圖(BarCharts)是利用寬度相同的條形的長短或高低來表現(xiàn)統(tǒng)計(jì)數(shù)據(jù)大小或變動情況的統(tǒng)計(jì)圖形。橫排的條形圖稱為帶形圖,縱排的條形圖稱為柱形圖。1、個(gè)案分組的簡單條形圖2、單個(gè)變量的簡單條形圖

3、個(gè)案取值的簡單條形圖第四章統(tǒng)計(jì)圖形4.2線圖線圖(LineCharts)又稱曲線圖,是用線段的升降來說明現(xiàn)象變動情況的一種統(tǒng)計(jì)圖,主要用于表示現(xiàn)象在時(shí)間上的變化趨勢、現(xiàn)象的分配情況和現(xiàn)象間的依存關(guān)系等。1、個(gè)案分組的單線圖2、單個(gè)變量的多線圖第四章統(tǒng)計(jì)圖形4.3餅圖餅圖(PieCharts),是以整個(gè)圓的面積代表被研究現(xiàn)象的總體,按各組成部分占總體比重的大小把圓面積分割成若干扇形,用以表示現(xiàn)象的部分對總體的比例關(guān)系的統(tǒng)計(jì)圖。根據(jù)實(shí)際問題所要反映的數(shù)據(jù),用戶可以在餅圖的主對話框中確定不同的餅圖類型。第五章均值比較和T檢驗(yàn)在正態(tài)或近似正態(tài)分布的計(jì)量資料中,經(jīng)常在使用統(tǒng)計(jì)描述過程分析后,還要進(jìn)行組與組之間平均水平的比較。本章介紹的T檢驗(yàn)方法,主要應(yīng)用在兩個(gè)樣本間比較。第五章均值比較和T檢驗(yàn)5.1MEANS過程Means過程是SPSS計(jì)算各種基本描述統(tǒng)計(jì)量的過程。與描述統(tǒng)計(jì)分析里計(jì)算某一樣本總體均值相比,Means過程其實(shí)就是按照用戶指定條件,對樣本進(jìn)行分組計(jì)算均數(shù)和標(biāo)準(zhǔn)差,如按性別計(jì)算各組的均數(shù)和標(biāo)準(zhǔn)差。第五章均值比較和T檢驗(yàn)5.2單一樣本T檢驗(yàn)SPSS單樣本T檢驗(yàn)是檢驗(yàn)?zāi)硞€(gè)變量的總體均值和某指定值之間是否存在顯著差異。統(tǒng)計(jì)的前提樣本總體服從正態(tài)分布。也就是說單樣本本身無法比較,進(jìn)行的是其均數(shù)與已知總體均數(shù)間的比較。第五章均值比較和T檢驗(yàn)采用T檢驗(yàn)方法,計(jì)算T統(tǒng)計(jì)量的公式為SPSS將自動計(jì)算t值,由于該統(tǒng)計(jì)量服從n?1個(gè)自由度的T分布,SPSS將根據(jù)T分布表給出t值對應(yīng)的相伴概率值。如果相伴概率值小于或等于用戶設(shè)想的顯著性水平a,則拒絕H0,認(rèn)為總體均值和檢驗(yàn)值之間存在顯著差異。相反,相伴概率大于顯著性水平a,則不拒絕H0,可以認(rèn)為總體均值和檢驗(yàn)值之間不存在顯著差異。第五章均值比較和T檢驗(yàn)5.3兩獨(dú)立樣本T檢驗(yàn)所謂獨(dú)立樣本是指兩個(gè)樣本之間彼此獨(dú)立沒有任何關(guān)聯(lián),兩個(gè)獨(dú)立樣本各自接受相同的測量,研究者的主要目的是了解兩個(gè)樣本之間是否有顯著差異存在。這個(gè)檢驗(yàn)的前提如下:

兩個(gè)樣本應(yīng)是互相獨(dú)立的,即從一總體中抽取一批樣本對從另一總體中抽取一批樣本沒有任何影響,兩組樣本個(gè)案數(shù)目可以不同,個(gè)案順序可以隨意調(diào)整。

樣本來自的兩個(gè)總體應(yīng)該服從正態(tài)分布。第五章均值比較和T檢驗(yàn)兩總體方差未知且相同情況下,T統(tǒng)計(jì)量為兩總體方差未知且不同情況下,T統(tǒng)計(jì)量為在SPSS中,將會給出相伴概率值。如果相伴概率值小于或等于顯著性水平

,則拒絕H0,認(rèn)為兩總體均值之間存在顯著差異。第五章均值比較和T檢驗(yàn)5.4兩配對樣本T檢驗(yàn)兩配對樣本T檢驗(yàn)是根據(jù)樣本數(shù)據(jù)對樣本來自的兩配對總體的均值是否有顯著性差異進(jìn)行推斷。一般用于同一研究對象(或兩配對對象)分別給予兩種不同處理的效果比較,以及同一研究對象(或兩配對對象)處理前后的效果比較。兩配對樣本T檢驗(yàn)的前提要求如下:兩個(gè)樣本應(yīng)是配對的樣本出處的兩個(gè)總體應(yīng)服從正態(tài)分布第五章均值比較和T檢驗(yàn)T檢驗(yàn)值得公式為:SPSS將自動計(jì)算T值,由于該統(tǒng)計(jì)量服從n?1個(gè)自由度的T分布,SPSS將根據(jù)T分布表給出t值對應(yīng)的相伴概率值。如果相伴概率值小于或等于用戶設(shè)想的顯著性水平

,則拒絕H0,認(rèn)為兩總體均值之間存在顯著差異。相反,相伴概率大于顯著性水平

,則不拒絕H0,可以認(rèn)為兩總體均值之間不存在顯著差異。第六章方差分析方差分析是R.A.Fister發(fā)明的,用于兩個(gè)及兩個(gè)以上樣本均數(shù)差別的顯著性檢驗(yàn)。方差分析的基本思想是:通過分析研究不同變量的變異對總變異的貢獻(xiàn)大小,確定控制變量對研究結(jié)果影響力的大小。通過方差分析,分析不同水平的控制變量是否對結(jié)果產(chǎn)生了顯著影響。如果控制變量的不同水平對結(jié)果產(chǎn)生了顯著影響,那么它和隨機(jī)變量共同作用,必然使結(jié)果有顯著的變化;如果控制變量的不同水平對結(jié)果沒有顯著的影響,那么結(jié)果的變化主要由隨機(jī)變量起作用,和控制變量關(guān)系不大。第六章方差分析6.1單因素方差分析單因素方差分析測試某一個(gè)控制變量的不同水平是否給觀察變量造成了顯著差異和變動。單因素方差分析實(shí)質(zhì)上采用了統(tǒng)計(jì)推斷的方法。計(jì)算F統(tǒng)計(jì)量,進(jìn)行F檢驗(yàn)。總的變異平方和記為SST,分解為兩個(gè)部分:一部分是由控制變量引起的離差,記為SSA(組間BetweenGroups離差平方和);另一部分隨機(jī)變量引起的SSE(組內(nèi)WithinGroups離差平方和)。第六章方差分析采用F檢驗(yàn):SPSS依據(jù)F分布表給出相應(yīng)的相伴概率值。如果相伴概率值小于顯著性水平

,則拒絕零假設(shè),認(rèn)為控制變量不同水平下各總體均值有顯著差異;反之,則認(rèn)為控制變量不同水平下各總體均值沒有顯著差異。第六章方差分析6.2多因素方差分析多因素方差分析中的控制變量在兩個(gè)或兩個(gè)以上。它的研究目的是要分析多個(gè)控制變量的作用、多個(gè)控制變量的交互作用以及其他隨機(jī)變量是否對結(jié)果產(chǎn)生了顯著影響。多因素方差分析不僅需要分析多個(gè)控制變量獨(dú)立作用對觀察變量的影響,還要分析多個(gè)控制變量交互作用對觀察變量的影響,及其他隨機(jī)變量對結(jié)果的影響。第六章方差分析方差分解結(jié)果為:第六章方差分析采用F檢驗(yàn):檢驗(yàn)結(jié)果判斷方法與單因素方差分析相同。第六章方差分析6.3協(xié)方差分析協(xié)方差分析是將那些很難控制的因素作為協(xié)變量,在排除協(xié)變量影響的條件下,分析控制變量對觀察變量的影響,從而更加準(zhǔn)確地對控制因素進(jìn)行評價(jià)。協(xié)方差分析要求協(xié)變量應(yīng)是連續(xù)數(shù)值型,多個(gè)協(xié)變量間互相獨(dú)立,且與控制變量之間也沒有交互影響。第六章方差分析應(yīng)用F檢驗(yàn)結(jié)果解釋和判斷如單因素方差分析。第七章相關(guān)分析衡量事物之間,或稱變量之間線性相關(guān)程度的強(qiáng)弱并用適當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)表示出來,這個(gè)過程就是相關(guān)分析。為了能夠更加準(zhǔn)確地描述變量之間的線性相關(guān)程度,可以通過計(jì)算相關(guān)系數(shù)來進(jìn)行相關(guān)分析。相關(guān)系數(shù)是衡量變量之間相關(guān)程度的一個(gè)量值。在統(tǒng)計(jì)學(xué)中,一般用樣本相關(guān)系數(shù)r來推斷總體相關(guān)系數(shù)第七章相關(guān)分析7.1二元定距變量相關(guān)分析二元定距變量的相關(guān)分析是指通過計(jì)算定距變量間兩兩相關(guān)的相關(guān)系數(shù),對兩個(gè)或兩個(gè)以上定距變量之間兩兩相關(guān)的程度進(jìn)行分析。Pearson簡單相關(guān)系數(shù)用來衡量定距變量間的線性關(guān)系:第七章相關(guān)分析7.2二元定序變量的相關(guān)分析定序變量又稱為有序(ordinal)變量、順序變量,它取值的大小能夠表示觀測對象的某種順序關(guān)系(等級、方位或大小等),也是基于“質(zhì)”因素的變量。Spearman和Kendall'stua-b等級相關(guān)系數(shù)用以衡量定序變量間的線性相關(guān)關(guān)系,它們利用的是非參數(shù)檢驗(yàn)的方法第七章相關(guān)分析相應(yīng)統(tǒng)計(jì)量為:第七章相關(guān)分析7.3偏相關(guān)分析偏相關(guān)分析是指當(dāng)兩個(gè)變量同時(shí)與第三個(gè)變量相關(guān)時(shí),將第三個(gè)變量的影響剔除,只分析另外兩個(gè)變量之間相關(guān)程度的過程。偏相關(guān)分析的工具是計(jì)算偏相關(guān)系數(shù)r12,3:第七章相關(guān)分析7.4距離相關(guān)分析距離相關(guān)分析是對觀測量之間或變量之間相似或不相似的程度的一種測量。距離相關(guān)分析可用于同一變量內(nèi)部各個(gè)取值間,以考察其相互接近程度;也可用于變量間,以考察預(yù)測值對實(shí)際值的擬合優(yōu)度。距離相關(guān)分析的結(jié)果可以用于其他分析過程。例如,因子分析、聚類分析等,有助于分析復(fù)雜的數(shù)據(jù)集合。第七章相關(guān)分析距離相關(guān)分析根據(jù)統(tǒng)計(jì)量不同,分為以下兩種。

不相似性測量:通過計(jì)算樣本之間或變量之間的距離來表示。

相似性測量:通過計(jì)算Pearson相關(guān)系數(shù)或Cosine相關(guān)來表示。距離相關(guān)分析根據(jù)分析對象不同,分為以下兩種。

樣本間分析:樣本和樣本之間的距離相關(guān)分析。

變量間分析:變量和變量之間的距離相關(guān)分析。第七章相關(guān)分析在不相似性測量的距離分析中,根據(jù)不同類型的變量,采用不同的統(tǒng)計(jì)量進(jìn)行計(jì)算。對連續(xù)變量的樣本(x,y)進(jìn)行距離相關(guān)分析時(shí),常用的統(tǒng)計(jì)量有:歐氏距離歐氏距離平方Chebychev距離Minkowski距離馬氏距離用戶自定義距離。第八章回歸分析回歸分析主要解決以下幾方面的問題:

通過分析大量的樣本數(shù)據(jù),確定變量之間的數(shù)學(xué)關(guān)系式。

對所確定的數(shù)學(xué)關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并區(qū)分出對某一特定變量影響較為顯著的變量和影響不顯著的變量。

利用所確定的數(shù)學(xué)關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的值來預(yù)測或控制另一個(gè)特定變量的取值,并給出這種預(yù)測或控制的精確度。第八章回歸分析8.1一元線性回歸分析一元線性回歸分析是在排除其他影響因素或假定其他影響因素確定的條件下,分析某一個(gè)因素(自變量)是如何影響另一事物(因變量)的過程,所進(jìn)行的分析是比較理想化的。第八章回歸分析一般來說,對于具有線性相關(guān)關(guān)系的兩個(gè)變量,可以用直線方程來表示它們之間的關(guān)系。一元線性總體回歸模型:一元線性回歸模型的樣本回歸方程:第八章回歸分析式中,

?是樣本回歸直線上與x相對應(yīng)的y值,可視為E(y)

的估計(jì);

是未知常數(shù),作為總體回歸參數(shù)

的估計(jì)值,

為直線在y軸上的截距,

為直線的斜率,也稱為回歸系數(shù),它表示自變量x每變動一個(gè)單位時(shí)因變量y的平均變動量。從幾何意義上講,一元線性回歸方程是二維平面上的一條直線。通過數(shù)據(jù)估計(jì)模型中各個(gè)參數(shù),完成模型。第八章回歸分析通過樣本數(shù)據(jù)建立一個(gè)回歸方程后,不能立即就用于對某個(gè)實(shí)際問題的預(yù)測。因?yàn)?,?yīng)用最小二乘法求得的樣本回歸直線作為對總體回歸直線的近似,這種近似是否合理,必須對其作各種統(tǒng)計(jì)檢驗(yàn)以確定。通常作以下的統(tǒng)計(jì)檢驗(yàn):1.?dāng)M合優(yōu)度檢驗(yàn)2.回歸方程的顯著性檢驗(yàn)(F檢驗(yàn))3.回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn))第八章回歸分析8.2多元線性回歸分析多元線性回歸模型是一元線性回歸模型的擴(kuò)展,其基本原理與一元線性回歸模型類似。多元線性總體回歸方程為多元線性樣本回歸方程為第八章回歸分析實(shí)際求解回歸系數(shù)的估計(jì)值,當(dāng)自變量個(gè)數(shù)較多時(shí),計(jì)算十分復(fù)雜,必須依靠計(jì)算機(jī)完成?,F(xiàn)在,利用SPSS,只要將有關(guān)數(shù)據(jù)輸入,并指定因變量和相應(yīng)的自變量,立刻就能得到計(jì)算結(jié)果。對多元線性回歸,也需要測定方程的擬合程度、檢驗(yàn)回歸方程和回歸系數(shù)的顯著性。第八章回歸分析8.3非線性回歸分析非線性回歸問題大多數(shù)可以轉(zhuǎn)化為線性回歸問題來求解,也就是對非線性回歸模型進(jìn)行適當(dāng)?shù)淖兞孔儞Q,使其轉(zhuǎn)化為線性模型。一般步驟如下:

根據(jù)經(jīng)驗(yàn)或者繪制散點(diǎn)圖,選擇適當(dāng)?shù)姆蔷€性回歸方程;

通過變量置換,把非線性回歸方程化為線性回歸;

用線性回歸分析中采用的方法來確定各回歸系數(shù)的值;

對各系數(shù)進(jìn)行顯著性檢驗(yàn)。第八章回歸分析幾種常見的非線性回歸模型:1.雙曲線模型2.冪函數(shù)模型3.指數(shù)函數(shù)模型4.對數(shù)函數(shù)模型5.多項(xiàng)式模型第八章回歸分析相對應(yīng)的函數(shù)形式為:第八章回歸分析8.4曲線回歸分析在實(shí)際問題中,往往不能確定究竟該選擇何種函數(shù)模型更接近樣本數(shù)據(jù),這時(shí)可選擇曲線估計(jì)方法,其步驟如下:

首先,根據(jù)實(shí)際問題本身特點(diǎn),同時(shí)選擇幾種模型。

然后,SPSS自動完成模型的參數(shù)估計(jì),并顯示R2、F檢驗(yàn)值、相伴概率值等統(tǒng)計(jì)量。

最后,選擇具有R2統(tǒng)計(jì)量值最大的模型作為此問題的回歸模型,并作一些預(yù)測。第八章回歸分析第八章回歸分析8.5時(shí)間序列的曲線估計(jì)時(shí)間序列的曲線估計(jì)是分析社會和經(jīng)濟(jì)現(xiàn)象中經(jīng)常用到的一種曲線估計(jì)。通常把時(shí)間設(shè)為自變量x,代表具體的經(jīng)濟(jì)或社會現(xiàn)象的變量設(shè)為因變量y,研究變量x與y之間關(guān)系的方法就是時(shí)間序列曲線估計(jì)。其具體步驟與一般的曲線估計(jì)基本類似。第八章回歸分析8.6含虛擬自變量的回歸分析在回歸分析中,對一些自變量是定性變量的先作數(shù)量化處理,處理的方法是引進(jìn)只取“0”和“1”兩個(gè)值的0?1型虛擬自變量。當(dāng)某一屬性出現(xiàn)時(shí),虛擬變量取值為“1”,否則取值為“0”。如果在回歸模型中需要引入多個(gè)0?1型虛擬變量D時(shí),虛擬變量的個(gè)數(shù)應(yīng)按下列原則來確定:對于包含一個(gè)具有k種特征或狀態(tài)的質(zhì)因素的回歸模型,如果回歸模型不帶常數(shù)項(xiàng),則需引入k個(gè)0?1型虛擬變量D;如果有常數(shù)項(xiàng),則只需引入k?1個(gè)0?1型虛擬變量D。當(dāng)k=2時(shí),只需要引入一個(gè)0?1型虛擬變量D。第八章回歸分析8.7邏輯回歸分析Logistic回歸分析是處理定性因變量的最主要的統(tǒng)計(jì)分析方法。Logistic回歸分析根據(jù)因變量取值類別不同,又可以分為BinaryLogistic回歸分析和Multinomi-nalLogistic回歸分析。BinaryLogistic回歸模型中因變量只能取兩個(gè)值1、0(虛擬因變量),而MultinomialLogistic回歸模型中因變量可以取多個(gè)值。第八章回歸分析其Logistic回歸方程為可以采用最大似然估計(jì)法(Maximumlikelihoodestimation,MLE)對其回歸參數(shù)進(jìn)行估計(jì)。最大似然估計(jì)法是一種迭代算法,它以一個(gè)預(yù)測估計(jì)值作為參數(shù)的初始值,根據(jù)算法確定能增大對數(shù)似然值的參數(shù)的方向和變動。估計(jì)了該初始函數(shù)后,對殘差進(jìn)行檢驗(yàn)并用改進(jìn)的函數(shù)進(jìn)行重新估計(jì),直到收斂為止(即對數(shù)似然不再顯著變化)。第八章回歸分析參數(shù)估計(jì)后必須進(jìn)行檢驗(yàn),常用的檢驗(yàn)統(tǒng)計(jì)量有:1.-2對數(shù)似然值(-2loglikelihood,-2LL)2.?dāng)M合優(yōu)度(GoodnessofFit)統(tǒng)計(jì)量3.Cox和Snell的R2(Cox&Snell’sR-Square)4.Nagelkerke的R2(Nagelkerke’sR-Square)5.偽R2(Psedo-R-square)6.Hosmer和Lemeshow的擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量(HosmerandLemeshow'sGoodnessofFitTestStatistic)7.Wald統(tǒng)計(jì)量第九章聚類分析和判別分析聚類分析是統(tǒng)計(jì)學(xué)中研究這種“物以類聚”問題的一種有效方法,它屬于統(tǒng)計(jì)分析的范疇。聚類分析的實(shí)質(zhì)是建立一種分類方法,它能夠?qū)⒁慌鷺颖緮?shù)據(jù)按照他們在性質(zhì)上的親密程度在沒有先驗(yàn)知識的情況下自動進(jìn)行分類。這里所說的類就是一個(gè)具有相似性的個(gè)體的集合,不同類之間具有明顯的區(qū)別。聚類分析的方法主要有兩種,一種是“快速聚類分析方法”(K-MeansClusterAnaly-sis),另一種是“層次聚類分析方法”(HierarchicalClusterAnalysis)。第九章聚類分析和判別分析9.1層次聚類分析中Q型聚類層次聚類分析有兩種形式,一種是對樣本(個(gè)案)進(jìn)行分類,稱為Q型聚類,它使具有共同特點(diǎn)的樣本聚齊在一起,以便對不同類的樣本進(jìn)行分析;另一種是對研究對象的觀察變量進(jìn)行分類,稱為R型聚類。它使具有共同特征的變量聚在一起,以便從不同類中分別選出具有代表性的變量作分析,從而減少分析變量的個(gè)數(shù)。第九章聚類分析和判別分析聚類的時(shí)候會涉及兩種類型親疏程度的計(jì)算:一種是樣本數(shù)據(jù)之間的親疏程度,一種是樣本數(shù)據(jù)與小類、小類與小類之間的親疏程度。樣本數(shù)據(jù)之間的親疏程度測量方法:歐氏距離(EuclideanDistance)歐氏距離平方(SquaredEuclideanDistance)Chebychev距離Block距離Minkowski距離Customized距離第九章聚類分析和判別分析樣本數(shù)據(jù)與小類、小類與小類之間的親疏程度測量方法:最短距離法(NearestNeighbor)最長距離法(FurthestNeighbor)、類間平均鏈鎖法(Between-groupsLinkage)類內(nèi)平均鏈鎖法(Within-groupsLinkage)重心法(CentroidClustering)離差平方和法(Ward’sMethod)。第九章聚類分析和判別分析9.2層次聚類分析中R型聚類層次聚類分析中的R型聚類是對研究對象的觀察變量進(jìn)行分類,它使具有共同特征的變量聚在一起。R型聚類的計(jì)算公式和Q型聚類的計(jì)算公式是類似的,不同的是R型聚類是對變量間進(jìn)行距離的計(jì)算,Q型聚類則是對樣本間進(jìn)行距離的計(jì)算。第九章聚類分析和判別分析9.3快速聚類快速聚類分析是由用戶指定類別數(shù)的大樣本資料的逐步聚類分析??焖倬垲惙治鲇?jì)算過程如下。(1)首先需要用戶指定聚類成多少類(比如k類)。(2)然后SPSS確定k個(gè)類的初始類中心點(diǎn)(3)計(jì)算所有樣本數(shù)據(jù)點(diǎn)到k個(gè)類中心點(diǎn)的歐氏距離。(4)SPSS重新確定k個(gè)類的中心點(diǎn)。(5)重復(fù)上面的兩步計(jì)算過程,直到達(dá)到指定的迭代次數(shù)或終止迭代的判斷要求為止。第九章聚類分析和判別分析9.4判別分析判別分析先根據(jù)已知類別的事物的性質(zhì)(自變量),建立函數(shù)式(自變量的線性組合,即判別函數(shù)),然后對未知類別的新事物進(jìn)行判斷以將之歸入已知的類別。第九章聚類分析和判別分析判別分析有如下的假定:

預(yù)測變量服從正態(tài)分布。

預(yù)測變量之間沒有顯著的相關(guān)。

預(yù)測變量的平均值和方差不相關(guān)。

預(yù)測變量應(yīng)是連續(xù)變量,因變量(類別或組別)是間斷變量。

兩個(gè)預(yù)測變量之間的相關(guān)性在不同類中是一樣的。第九章聚類分析和判別分析在分析的各個(gè)階段應(yīng)把握如下的原則。

事前組別(類)的分類標(biāo)準(zhǔn)(作為判別分析的因變量)要盡可能準(zhǔn)確和可靠,否則會影響判別函數(shù)的準(zhǔn)確性,從而影響判別分析的效果。

所分析的自變量應(yīng)是因變量的重要影響因素,應(yīng)該挑選既有重要特性又有區(qū)別能力的變量,達(dá)到以最少變量而有高辨別能力的目標(biāo)。

初始分析的數(shù)目不能太少。第十章因子分析10.1因子分析定義和數(shù)學(xué)模型在大多數(shù)情況下,許多變量之間存在一定的相關(guān)關(guān)系。因此,有可能用較少的綜合指標(biāo)分析存在于各變量中的各類信息,而各綜合指標(biāo)之間彼此是不相關(guān)的,代表各類信息的綜合指標(biāo)稱為因子。因子分析就是用少數(shù)幾個(gè)因子來描述許多指標(biāo)或因素之間的聯(lián)系,以較少幾個(gè)因子反映原資料的大部分信息的統(tǒng)計(jì)學(xué)方法。第十章因子分析因子分析有如下特點(diǎn)。(1)因子變量的數(shù)量遠(yuǎn)少于原有的指標(biāo)變量的數(shù)量,對因子變量的分析能夠減少分析中的計(jì)算工作量。(2)因子變量不是對原有變量的取舍,而是根據(jù)原始變量的信息進(jìn)行重新組構(gòu),它能夠反映原有變量大部分的信息。(3)因子變量之間不存在線性相關(guān)關(guān)系,對變量的分析比較方便。(4)因子變量具有命名解釋性,即該變量是對某些原始變量信息的綜合和反映。第十章因子分析因子分析的出發(fā)點(diǎn)是用較少的相互獨(dú)立的因子變量來代替原來變量的大部分信息,可以通過下面的數(shù)學(xué)模型來表示其中為p個(gè)原有變量,是均值為零、標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)化變量,為m個(gè)因子變量,m小于p,表示成矩陣形式為第十章因子分析其中F為因子變量或公共因子,可以將它們理解為在高維空間中互相垂直的m個(gè)坐標(biāo)軸。A為因子載荷矩陣,aij為因子載荷,是第i個(gè)原有變量在第j個(gè)因子變量上的負(fù)荷。如果把變量xi看成是m維因子空間中的一個(gè)向量,則aij為xi在坐標(biāo)軸Fj上的投影,相當(dāng)于多元回歸中的標(biāo)準(zhǔn)回歸系數(shù)。ε為特殊因子,表示了原有變量不能被因子變量所解釋的部分,相當(dāng)于多元回歸分析中的殘差部分。第十章因子分析因子分析有兩個(gè)核心問題:一是如何構(gòu)造因子變量;二是如何對因子變量進(jìn)行命名解釋。因子分析有下面4個(gè)基本步驟:(1)確定待分析的原有若干變量是否適合于因子分析。(2)構(gòu)造因子變量。(3)利用旋轉(zhuǎn)使得因子變量更具有可解釋性。(4)計(jì)算因子變量的得分。第十章因子分析確定待分析的原有若干變量是否適合于因子分析:相關(guān)系數(shù)矩陣:如果相關(guān)系數(shù)矩陣在進(jìn)行統(tǒng)計(jì)檢驗(yàn)中,大部分相關(guān)系數(shù)都小于0.3,并且未通過統(tǒng)計(jì)檢驗(yàn),那么這些變量就不適合進(jìn)行因子分析。SPSS在因子分析過程中還提供了幾種檢驗(yàn)方法來判斷變量是否適于作因子分析:1.巴特利特球形檢驗(yàn)(BartlettTestofSphericity)2.反映像相關(guān)矩陣檢驗(yàn)(Anti-imagecorrelationmatrix)3.KMO(Kaiser-Meyer-Olkin)檢驗(yàn)第十章因子分析構(gòu)造因子變量因子分析中有多種確定因子變量的方法,如基于主成分模型的主成分分析法和基于因子分析模型的主軸因子法、極大似然法、最小二乘法等。其中,基于主成分模型的主成分分析法是使用最多的因子分析方法之一。第十章因子分析因子變量的命名解釋在實(shí)際分析工作中,主要是通過對載荷矩陣A的值進(jìn)行分析,得到因子變量和原變量的關(guān)系,從而對新的因子變量進(jìn)行命名??梢酝ㄟ^因子矩陣的旋轉(zhuǎn)來確定。旋轉(zhuǎn)的方法有正交旋轉(zhuǎn)、斜交旋轉(zhuǎn)、方差極大法,其中最常用的是方差極大法。第十章因子分析計(jì)算因子得分因子變量確定以后,對每一樣本數(shù)據(jù),希望得到它們在不同因子上的具體數(shù)據(jù)值,這些數(shù)值就是因子得分,它和原變量的得分相對應(yīng)。有了因子得分,在以后的研究中,就可以針對維數(shù)少的因子得分來進(jìn)行。估計(jì)因子得分的方法有回歸法、Bartlette法、Anderson-Rubin法等。第十一章非參數(shù)檢驗(yàn)許多調(diào)查或?qū)嶒?yàn)所得的科研數(shù)據(jù),其總體分布未知或無法確定。因?yàn)橛械臄?shù)據(jù)不是來自所假定分布的總體,或者數(shù)據(jù)根本不是來自一個(gè)總體,還有可能數(shù)據(jù)因?yàn)槟撤N原因被嚴(yán)重污染,這樣在假定分布的情況下進(jìn)行推斷的做法就有可能產(chǎn)生錯(cuò)誤的結(jié)論。此時(shí)人們希望檢驗(yàn)對一個(gè)總體分布形狀不必作限制。這種不是針對總體參數(shù),而是針對總體的某些一般性假設(shè)(如總體分布)的統(tǒng)計(jì)分析方法稱為非參數(shù)檢驗(yàn)(NonparametricTests)。第十一章非參數(shù)檢驗(yàn)11.1總體分布的卡方檢驗(yàn)總體分布的卡方檢驗(yàn)適用于配合度檢驗(yàn),是根據(jù)樣本數(shù)據(jù)的實(shí)際頻數(shù)推斷總體分布與期望分布或理論分布是否有顯著差異。它的零假設(shè)H0:樣本來自的總體分布形態(tài)和期望分布或某一理論分布沒有顯著差異。第十一章非參數(shù)檢驗(yàn)總體分布的卡方檢驗(yàn)的原理是:如果從一個(gè)隨機(jī)變量中隨機(jī)抽取若干個(gè)觀察樣本,這些觀察樣本落在X的k個(gè)互不相交的子集中的觀察頻數(shù)服從一個(gè)多項(xiàng)分布,這個(gè)多項(xiàng)分布當(dāng)k趨于無窮時(shí),就近似服從X的總體分布。因此,假設(shè)樣本來自的總體服從某個(gè)期望分布或理論分布,同時(shí)獲得樣本數(shù)據(jù)各子集的實(shí)際觀察頻數(shù),并依據(jù)統(tǒng)計(jì)量Q第十一章非參數(shù)檢驗(yàn)Q值越大,表示觀察頻數(shù)和理論頻數(shù)越不接近;Q值越小,說明觀察頻數(shù)和理論頻數(shù)越接近。SPSS將自動計(jì)算Q統(tǒng)計(jì)量,由于Q統(tǒng)計(jì)量服從k-1個(gè)自由度的χ2分布,因此SPSS將根據(jù)χ2分布表給出Q統(tǒng)計(jì)量所對應(yīng)的相伴概率值。如果相伴概率小于或等于用戶的顯著性水平

,則應(yīng)拒絕零假設(shè)H0,認(rèn)為樣本來自的總體分布形態(tài)與期望分布或理論分布存在顯著差異;如果相伴概率值大于顯著性水平,則不能拒絕零假設(shè)H0,認(rèn)為樣本來自的總體分布形態(tài)與期望分布或理論分布不存在顯著差異。第十一章非參數(shù)檢驗(yàn)11.2二項(xiàng)分布檢驗(yàn)SPSS二項(xiàng)分布檢驗(yàn)就是根據(jù)收集到的樣本數(shù)據(jù),推斷總體分布是否服從某個(gè)指定的二項(xiàng)分布。其零假設(shè)是H0:樣本來自的總體與所指定的某個(gè)二項(xiàng)分布不存在顯著的差異。SPSS中的二項(xiàng)分布檢驗(yàn),在樣本小于或等于30時(shí),按照計(jì)算二項(xiàng)分布概率的公式進(jìn)行計(jì)算;樣本數(shù)大于30時(shí),計(jì)算的是Z統(tǒng)計(jì)量,認(rèn)為在零假設(shè)下,Z統(tǒng)計(jì)量服從正態(tài)分布。第十一章非參數(shù)檢驗(yàn)Z統(tǒng)計(jì)量為SPSS將自動計(jì)算Z統(tǒng)計(jì)量,并給出相應(yīng)的相伴概率值。如果相伴概率小于或等于用戶的顯著性水平α,則應(yīng)拒絕零假設(shè)H0,認(rèn)為樣本來自的總體分布形態(tài)與指定的二項(xiàng)分布存在顯著差異;如果相伴概率值大于顯著性水平,則不能拒絕零假設(shè)H0,認(rèn)為樣本來自的總體分布形態(tài)與指定的二項(xiàng)分布不存在顯著差異。第十一章非參數(shù)檢驗(yàn)11.3SPSS單樣本變量值隨機(jī)性檢驗(yàn)單樣本變量值的隨機(jī)性檢驗(yàn)是對某變量的取值出現(xiàn)是否隨機(jī)進(jìn)行檢驗(yàn),也稱為游程檢驗(yàn)(Run過程)。單樣本變量值的隨機(jī)性檢驗(yàn)是由Wald提出的,它的零假設(shè)為H0:總體某變量的變量值出現(xiàn)是隨機(jī)的。第十一章非參數(shù)檢驗(yàn)在SPSS單樣本變量值的隨機(jī)性檢驗(yàn)中,SPSS將利用游程構(gòu)造Z

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論