SPSS培訓(xùn)課程講義0522_第1頁
SPSS培訓(xùn)課程講義0522_第2頁
SPSS培訓(xùn)課程講義0522_第3頁
SPSS培訓(xùn)課程講義0522_第4頁
SPSS培訓(xùn)課程講義0522_第5頁
已閱讀5頁,還剩84頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、SPSS 培訓(xùn)課程大綱SPSS數(shù)據(jù)分析高級應(yīng)用培訓(xùn)班培訓(xùn)資料(僅供培訓(xùn)使用)目 錄第1講 統(tǒng)計工具與SPSS軟件11.1 統(tǒng)計工具含義11.2 統(tǒng)計工具作用11.3運用統(tǒng)計工具注意事項11.4 統(tǒng)計工具與SPSS軟件關(guān)系1第2講 SPSS入門22.1 SPSS歷史沿革22.2 SPSS基本界面22.3 常規(guī)功能設(shè)置32.3 數(shù)據(jù)變量(詳細介紹在課堂上演示)32.3.1 計量尺度32.3.2 常量與變量32.3.3 變量標(biāo)簽32.3.4 變量缺失值4第3講 數(shù)據(jù)采集與整理53.1數(shù)據(jù)編輯器簡介53.2 數(shù)據(jù)文件的建立53.3 數(shù)據(jù)的編輯53.3.1 查看數(shù)據(jù)信息53.3.2 數(shù)據(jù)定位53.3.3

2、 插入與刪除變量和觀測量53.3.4 實用數(shù)據(jù)文件操作63.4 單選題、多選題與開放題的數(shù)據(jù)錄入,檢查異常值83.5 SPSS函數(shù)10第4講 描述性統(tǒng)計分析134.1 常用統(tǒng)計量134.1.1 描述集中趨勢的統(tǒng)計量(將融合在后續(xù)演示中)134.1.2 描述離散程度的統(tǒng)計量(將融合在后續(xù)演示中)134.1.3 描述分布形態(tài)的統(tǒng)計量(將融合在后續(xù)演示中)134.2 常用統(tǒng)計表134.2.1 在線處理分析報告(OLPA)134.2.2 個案摘要報告144.2.3 行形式摘要報告和列形式摘要報告(略,學(xué)員可獨立學(xué)習(xí))144.3 頻數(shù)分析144.4 描述性分析154.5 探索性分析164.6 常用統(tǒng)計圖

3、(課堂現(xiàn)場演示)16第5講 一般推斷性統(tǒng)計分析175.1 統(tǒng)計推斷理論(課堂現(xiàn)場講授)175.2 均值比較175.2.1 均值過程175.2.2 單樣本t檢驗185.2.3獨立樣本t檢驗195.2.4配對樣本t檢驗205.3 相關(guān)分析225.3.1 簡單相關(guān)分析225.3.2 偏相關(guān)分析235.3.3 距離分析255.4 回歸分析275.4.1 線性回歸分析285.4.2 曲線回歸分析295.4.3 非線性回歸分析315.5 方差分析325.5.1 單因素方差分析325.5.2 多因素方差分析355.5.3重復(fù)測量方差分析375.5.4 協(xié)方差分析39第6講 多元統(tǒng)計分析426.1 聚類分析4

4、26.1.1 理論背景426.1.2距離和相似系數(shù)426.1.4 K-Means聚類466.1.5 分層聚類476.3 判別分析486.3 因子分析546.3.1 基本概念546.3.2 基本步驟546.3.3 實例演示556.4 主成分分析576.4.1 基本概念576.4.2 基本步驟576.4.3 實例演示59第7講 定性數(shù)據(jù)分析607.1 列聯(lián)表607.1.1 基本概念607.1.2 實例演示617.2 Logistic回歸627.2.1 基本概念627.2.2 實例演示63第8講 時間序列分析658.1 組成要素658.2 ARMA模型658.2.1 ARMA模型及基本原理658.2

5、.2 ARMA模型的基本形式658.3 實例演示66第9講 其他統(tǒng)計分析679.1信度分析679.1.1 基本分類679.1.2 實例演示679.2生存分析689.2.1 生存分析的目的689.2.2 生存數(shù)據(jù)699.2.3 生存時間函數(shù)699.2.4 生存分析的基本方法709.2.5 實例演示71第10講 綜合案例分析7610.1 案例背景7610.2 RFM模型簡介7610.3 實例演示(課堂演示)77第11講 SPSS編程簡介7811.1 程序編輯窗口操作入門7811.1.1 Syntax 與 UI7811.1.2 生成和運行syntax7911.2 syntax 基本規(guī)則7911.2.

6、1 syntax簡介7911.2.2 命令分類8211.3 結(jié)構(gòu)化語句8411.3.1 分支語句(條件語句)8411.3.2 循環(huán)語句8411.4 實例演示8585第1講 統(tǒng)計工具與SPSS軟件1.1 統(tǒng)計工具含義統(tǒng)計學(xué)是通過搜索、整理、分析數(shù)據(jù)等手段,以達到推斷所測對象的本質(zhì),甚至預(yù)測對象未來的一門綜合性科學(xué)。其中用到了大量的數(shù)學(xué)及其它學(xué)科的專業(yè)知識,它的使用范圍幾乎覆蓋了社會科學(xué)和自然科學(xué)的各個領(lǐng)域。統(tǒng)計工具是實現(xiàn)上述過程的手段與方法,包括理論方法與計算軟件。1.2 統(tǒng)計工具作用在古代,治國安天下多數(shù)通過邏輯分析和簡單計算就能滿足,在現(xiàn)今社會,單純靠邏輯分析和推斷無法滿足實際需要,人們往往

7、需求的是隱藏在表面之后的規(guī)律,需要借助統(tǒng)計工具加以實現(xiàn),比如:利用C-D生產(chǎn)函數(shù)來判斷國家的GDP中,多大程度受固定資產(chǎn)影響,多大程度受人力資本影響,科技進步有多大。諸如此類問題都需要通過統(tǒng)計工具實現(xiàn),由此,可以得出統(tǒng)計工具的主要作用就是實現(xiàn)人們想了解到的、可以了解到的那些潛在的關(guān)系和規(guī)律。1.3運用統(tǒng)計工具注意事項在說明統(tǒng)計工具在使用中需注意問題之前,舉個實際例子?!纠?.1】有人說:“統(tǒng)計方法沒什么用,我想知道明天幾點幾分下雨,統(tǒng)計方法根本無法實現(xiàn)”。這樣的說法正確嗎?分析與解答:該種說法錯誤,從供給和需求角度進行分析。需求方面:實際生活中,人們期望獲取一具體點值,屬于微觀問題供給方面:利

8、用統(tǒng)計方法得到的點估計屬于宏觀問題,只有在大量重復(fù)情況下才能實現(xiàn),舉點估計的評價標(biāo)準(zhǔn)為例說明(課堂講授)。從供給和需求方面可以看出,統(tǒng)計工具是在滿足某些約束條件下得出的結(jié)果,具體在統(tǒng)計工具運用中需注意如下事項:1、注意統(tǒng)計工具滿足的基本假定;2、統(tǒng)計工具計算的結(jié)果一定存在誤差;3、只要不影響實際決策的誤差可以認為是統(tǒng)計上允許的誤差;4、統(tǒng)計結(jié)果往往具有實際意義,不要為了面子而濫用統(tǒng)計工具。1.4 統(tǒng)計工具與SPSS軟件關(guān)系SPSS軟件是一種實現(xiàn)理論計算方法,幫助統(tǒng)計研究者簡化計劃,提高工作效率的電腦軟件,通過該軟件可迅速實現(xiàn)描述性統(tǒng)計分析、確定性統(tǒng)計分析、隨機統(tǒng)計分析等。第2講 SPSS入門2

9、.1 SPSS歷史沿革SPSS是世界上最早的統(tǒng)計分析軟件,全稱為Statistical Package for Social Science,也稱社會科學(xué)統(tǒng)計軟件。由美國斯坦福大學(xué)的三位研究生Norman H. Nie、C. Hadlai (Tex) Hull 和 Dale H. Bent于1968年研究開發(fā)成功,同時成立了SPSS公司,并于1975年成立法人組織、在芝加哥組建了SPSS總部。1984年SPSS總部首先推出了世界上第一個統(tǒng)計分析軟件微機版本SPSS/PC+,開創(chuàng)了SPSS微機系列產(chǎn)品的開發(fā)方向,極大地擴充了它的應(yīng)用范圍,并使其能很快地應(yīng)用于自然科學(xué)、技術(shù)科學(xué)、社會科學(xué)的各個領(lǐng)域

10、。世界上許多有影響的報刊雜志紛紛就SPSS的自動統(tǒng)計繪圖、數(shù)據(jù)的深入分析、使用方便、功能齊全等方面給予了高度的評價。隨著應(yīng)用領(lǐng)域的不斷擴大,SPSS已經(jīng)有原來的名字改為Statistics Product and Service Solution,即統(tǒng)計產(chǎn)品與服務(wù)解決方案。SPSS 15.0.1 - 2006年11月SPSS 16.0.2 - 2008年4月SPSS Statistics 17.0.1 - 2008年12月PASW Statistics 17.0.2 - 2009年3月PASW Statistics 17.0.3 - 2009年11月PASW Statistics 18.0.0

11、 - 2009年8月PASW Statistics 18.0.1 - 2009年12月PASW Statistics 18.0.2 - 2010年4月PASW Statistics 18.0.3 - 2010年9月IBM SPSS Statistics 19.0 - 2010年8月IBM SPSS Statistics 20.0 - 2011年8月IBM SPSS Statistics 21.0 - 2012年8月IBM SPSS Statistics 22.0 - 2013年8月2.2 SPSS基本界面安裝SPSS22.0之后,第一次啟動將出現(xiàn)如下界面。在點擊“取消”可出現(xiàn)以下常規(guī)界面。2.

12、3 常規(guī)功能設(shè)置通過“編輯”“選項”,獲取如下對話框?qū)Φ谝恍忻钪鹨稽c開,會出現(xiàn)關(guān)于SPSS如阿年常規(guī)功能設(shè)置的所有界面(課堂演示)2.3 數(shù)據(jù)變量(詳細介紹在課堂上演示)2.3.1 計量尺度無論是觀測數(shù)據(jù)還是試驗數(shù)據(jù),都需要度量。統(tǒng)計數(shù)據(jù)是對客觀現(xiàn)象進行計量的結(jié)果,按照對事物的精確程度,可將所采用的計量尺度有低級到高級分為:名義尺度、定序尺度和間隔尺度(又分為定距尺度和定比尺度)2.3.2 常量與變量常量分為數(shù)值型常量、字符型常量、日期型常量變量分為數(shù)值型變量、字符型變量、日期型變量。數(shù)值型變量包括:標(biāo)準(zhǔn)型、逗號型、圓點型、科學(xué)計數(shù)法型、美元型和自定義貨幣型。2.3.3 變量標(biāo)簽變量標(biāo)簽是對

13、變量名進一步解釋和說明,包括變量名標(biāo)簽和變量值標(biāo)簽。變量名標(biāo)簽是對變量名含義的進一步解釋和說明,在SPSS界面中表現(xiàn)為“標(biāo)簽”列。變量值標(biāo)簽是對數(shù)值型變量各個取值的含義進行解釋和說明,尤其是定型數(shù)據(jù),在SPSS界面中表現(xiàn)為“值”列。2.3.4 變量缺失值在調(diào)查問卷中,被調(diào)查者沒有填寫調(diào)查表要求填寫的某些數(shù)據(jù)或填寫的數(shù)據(jù)失真,造成缺失值。這些情況稱為數(shù)據(jù)缺失或數(shù)據(jù)不全,缺失或不完全的數(shù)據(jù)在統(tǒng)計分析中不能使用,需標(biāo)出,在在SPSS界面中表現(xiàn)為“缺失”列。第3講 數(shù)據(jù)采集與整理3.1數(shù)據(jù)編輯器簡介數(shù)據(jù)編輯器主要由標(biāo)題欄、當(dāng)前數(shù)據(jù)欄、輸入數(shù)據(jù)欄和數(shù)據(jù)顯示區(qū)組成。3.2 數(shù)據(jù)文件的建立建立數(shù)據(jù)文件可通過

14、如下兩種方式實現(xiàn):1、“文件”“新建”命令2、在啟動SPSS時選擇“輸入數(shù)據(jù)”選項數(shù)據(jù)錄入方法包括:按單元格輸入數(shù)據(jù)、按變量錄入數(shù)據(jù)、按觀測量錄入數(shù)據(jù)和輸入帶有變量標(biāo)簽的數(shù)據(jù)。3.3 數(shù)據(jù)的編輯3.3.1 查看數(shù)據(jù)信息1、查看變量信息在數(shù)據(jù)編輯器窗口中切換到“變量視圖”區(qū)域查看變量信息或者執(zhí)行菜單“應(yīng)用程序”“變量”命令2、查看文件信息執(zhí)行菜單“文件”“顯示數(shù)據(jù)文件信息”命令3.3.2 數(shù)據(jù)定位1、按個案序號自動定位執(zhí)行菜單“編輯”“轉(zhuǎn)至個案”命令2、按變量值自動定位執(zhí)行菜單“編輯”“查找”命令3.3.3 插入與刪除變量和觀測量插入變量可通過以下三種方式實現(xiàn):1、通過數(shù)據(jù)編輯器窗口中相關(guān)快捷命

15、令2、利用鼠標(biāo)右鍵完成3、執(zhí)行菜單“編輯”“插入變量”命令刪除變量可通過以下兩種方式實現(xiàn):1、利用鼠標(biāo)右鍵完成2、執(zhí)行菜單“編輯”“清除”命令觀測量(個案)的插入和刪除方法同變量類似,課堂演示。3.3.4 實用數(shù)據(jù)文件操作1、數(shù)據(jù)的打開和保存(略)2、數(shù)據(jù)排序(1)執(zhí)行菜單“數(shù)據(jù)”“排序個案”命令(2)需要根據(jù)哪個變量排序,則單擊該變量“排序依據(jù)”(3)選擇“升序”還是“降序”(4)點擊“確定”3、數(shù)據(jù)文件的分解(1)執(zhí)行菜單“數(shù)據(jù)”“拆分文件”命令(2)選擇不同的拆分方式:分析所有個案,不創(chuàng)建組(默認方式)、比較組或按組組織輸出(3)選擇不創(chuàng)建組(默認方式)、比較組或按組組織輸出需選取“分組

16、方式”(4)點擊“確定”4、數(shù)據(jù)文件的合并1、增加變量(1)執(zhí)行菜單“數(shù)據(jù)”“合并文件”“添加變量”命令(2)選中所添加的變量后點擊“繼續(xù)”命令(3)點擊“確定”2、增加觀測值(1)執(zhí)行菜單“數(shù)據(jù)”“合并文件”“添加個案”命令(2)選中所添加的變量后點擊“繼續(xù)”命令(3)點擊“確定”5、數(shù)據(jù)文件的轉(zhuǎn)置執(zhí)行菜單“數(shù)據(jù)”“變換”命令3.4 單選題、多選題與開放題的數(shù)據(jù)錄入,檢查異常值1、單選題的數(shù)據(jù)錄入通過具體例子說明【例3.1】對馬航失聯(lián)客機的結(jié)果有如下幾種,選擇最可能的一種?( )A 墜入海洋 B 恐怖分子劫機 C 被海盜劫機 D 政府行為具體實現(xiàn)方法有兩種:(1)二分法。對每個選項賦值“0”

17、或者“1”(2)對每個選項分別賦值“1,2,3,4”2、多選題的數(shù)據(jù)錄入(1)多重二分法處理方法同單選題數(shù)據(jù)錄入的(1),此處略。(2)多重分類法若假定最多選2個,先對對每個選項分別賦值“1,2,3,4”,后給出2個備選變量即可。若沒有限制選項個數(shù),則將所有的備選變量給出。3、開放題的錄入開放型問題的處理一般不需要編碼的操作,當(dāng)然也不需要輸入到SPSS中進行分析處理,只能通過調(diào)查者的匯總歸納概括,因此開放型問題在問卷中應(yīng)該盡可能的減少;原因在于一是不便于分析處理,二是開放型問題的回答率一般較低。4、異常值的查找離群值:(箱圖)值與框的上下邊界的距離在1.5倍框的長度到3倍框的長度之間的個案???/p>

18、的長度是內(nèi)距。極端值:(箱圖)值距離框的上下邊界超過3倍框的長度的個案??虻拈L度是內(nèi)距在回歸模型診斷里面,一般稱預(yù)測值與實際值的偏差為殘差,按照需要取一殘差,再按照某種標(biāo)準(zhǔn)取一個閥值來限定異常點,只要那個點的殘差大于閥值,就可以認為它是異常點。在時間序列分析中,異常值的統(tǒng)計檢驗方法可以通過殘差的正態(tài)性檢驗實現(xiàn)。3.5 SPSS函數(shù)SPSS函數(shù)是一個常用程序(rountine),并且利用一個或多個自變量(參數(shù))來執(zhí)行。每個SPSS函數(shù)均有一個關(guān)鍵名稱(keywordname),且絕不能寫錯。通常,函數(shù)的格式為:函數(shù)名稱(自變量,自變量,),某些函數(shù)可能只含有一個自變量,而有些函數(shù)則可能含有多個自

19、變量,當(dāng)一個函數(shù)含有多個自變量時,各自變量間用逗號(,)隔開,而函數(shù)的自變量通常又可分為以下三種:1)常數(shù),如SQRT(100):2)變量名稱,如MEAN(VAR1,VAR2,VAR3);3)表達式,如MIN(30,SQRT(100)。總之,SPSS函數(shù)和我們平時EXCEL里面函數(shù)格式規(guī)則并無差別。SPSS提供了180多種函數(shù),共可分為十多類。和EXCEL一樣,我們也不可能記住所有函數(shù),只要知道一些常用函數(shù),至于其他函數(shù)要用的時候再去查找也不遲,下面本人將列舉一些常用函數(shù):1 算術(shù)函數(shù)函數(shù)說明范例(x=2.6,y=3)ABS(numbexpr)絕對值函數(shù)ABS(y-x)=0.4RND(numb

20、expr)四舍五入函數(shù)RND(x)=3TRUNC(numbexpr)取整函數(shù)TRUNC(x)=2SORT(numbexpr)平方根函數(shù)SQRT(y)=1.71MOD(numbexpr,modulus)求算兩數(shù)相除后的余數(shù)MOD(y,x)=0.4EXP(numbexpr)以e為底的指數(shù)函數(shù)EXP(y)=20.09LG10(numbexpr)以10底的對數(shù)函數(shù)LG10(x*10)=1.41LN(numbexpr)自然對數(shù)函數(shù)LN(y)=1.12 統(tǒng)計函數(shù)函數(shù)說明范例(X1=2X2=5X3=8)MEAN(numexpr,numexpr,)自變量的平均值MEAN(X1,X2,X3)=5MIN(valu

21、e, value,)自變量的最小值MIN(X1,X2,X3)=1MAX(value, value,)自變量的最大值MAX(X1,X2,X3)=8SUM(numexpr,numexpr,)求和SUM(X1,X2,X3)=15SD(numexpr,numexpr,)求標(biāo)準(zhǔn)差SD(X1,X2,X3)=3VARIANCE(numexpr,numexpr,)求方差VAR(X1,X2,X3)=9CFVAR(numexpr,numexpr,)求變異系數(shù)CFVAR(X1,X2,X3)=0.6 3 缺失值函數(shù)函數(shù)說明范例MISSING(variable)若變量缺失,則為T或1,否則為F或0MISSING(X1)

22、=1MISSING(X2)=1MISSING(X3)=0SYSMIS(numvar)若變量是系統(tǒng)缺失值則為T或1,如為自定缺失或非缺失則為F或0SYSMIS(X1)=0SYSMIS(X2)=1SYSMIS(X3)=0NMISS(variable,)缺失值個數(shù)NMISS(X1,X2,X3)=2NVALID(variable,)有效值個數(shù)NVALID(X1,X2,X3)=1VALUE(variable,)忽略自定義缺失值,當(dāng)作非缺失VALUE(X1)=X1注:X1為使用者界定缺失值,X2為系統(tǒng)缺失值,X3為非缺失值4 字符串型函數(shù)函數(shù)說明范例ANY(test,value,value)若自變量1和后

23、面自變量竄相同則為真,記為1ANY(is, this)=0ANY(is,this,is)=1CONCAT(strexpr,strexpr)將自變量連成一個新自變量CONCAT(th,is)=thisINDEX(haystack,needle,divisor)Divisor在needle最左側(cè)開始出現(xiàn)的位置INDEX(this is,is)=3LENGTH(strexpr)自變量所含文字的個數(shù)(包括特殊字符和空格)LENGTH(th is)=5LOWER(strexpr)自變量中的大寫字母改為小寫字母LOWER(This)=thisUPCASE(strexpr)將自變量中的小寫字母改為大寫字母U

24、PCASE(this)=THISLTRIM(strexpr,char)在strexpr開始處去除char所形成的常量,如無char則去除strexpr左側(cè)的空格LTRIM(this,t)=hisLTRIM(this,is)=thLTRIM( this)=thisNUMBER (strexpr,format)當(dāng)自變量為數(shù)字的文字變量時,按文字變量指定格式轉(zhuǎn)換為數(shù)字變量NUMBER(23,F8.1)=2.3NUMBER(23,F8.0)=23RANGE(test,lo,hi,lo,hi)如果自變量1的值包含在自變量集lo至hi的范圍內(nèi),則為T或1RANGE(c,a,k)=TSTRING(strex

25、pr,format)按指定格式將自變量轉(zhuǎn)換為文字型變量STRING(3+4,F8.2)=7.00SUBSTR(sterxpr,pos,length)從strexpr子竄的第pos位置開始取length的字符串長度SUBSTR(this is,6,2)=is5 時間日期函數(shù)函數(shù)說明范例DATA.DMY(d,m,y)與指定日月年對應(yīng)的日期DATA.DMY(3,5,99)=05/03/99DATA.MDY(m,d,y)與指定月日年對應(yīng)的日期DATA.MDY(5,3,99)=05/03/99DATA.YRDA(y,d)與指定年日對應(yīng)的日期DATA.YRDA(99,35)=02/04/99DATA.QY

26、R(q,y)指定的季節(jié)年份對應(yīng)的日期DATA.QYR(2,99)=04/01/99DATA.MOYR(m,y)與指定的月年度對應(yīng)的日期DATA.MOYR(5,99)=05/01/99DATA.WKYR(w,y)與指定的周年度對應(yīng)的日期DATA.WKYR(38,98)=9/17/98注:1. 要正確顯示以上函數(shù)值,必須先賦予其SPSS得日期型變量(DATA)格式,假設(shè)以上日期用mm/dd/yy格式顯示,時間則用hh:mm:ss格式表示 2. 1=d=31、1=m=12、1=w=52、1=q=4(六)其他函數(shù)SPSS除了上述函數(shù)外,尚有日期和時間轉(zhuǎn)換函數(shù)(YOMODACTMIESDAYSCTIME

27、HOURSMDAYS等)、連續(xù)幾率密度函數(shù)(CDFBINOMCHISQCDFEXPLOGISTIC等),此外還有NORMAL(stddev)可產(chǎn)生平均數(shù)為0,標(biāo)準(zhǔn)差為stddev的正態(tài)分布隨機數(shù)字。UNIFORM(max)可產(chǎn)生平均數(shù)為0與max間呈均等分布的隨機數(shù)字。第4講 描述性統(tǒng)計分析4.1 常用統(tǒng)計量4.1.1 描述集中趨勢的統(tǒng)計量(將融合在后續(xù)演示中)1、均值2、中位數(shù)3、眾數(shù)4、百分位數(shù)4.1.2 描述離散程度的統(tǒng)計量(將融合在后續(xù)演示中)1、樣本方差2、樣本標(biāo)準(zhǔn)差3、均值標(biāo)準(zhǔn)差4、極差5、離散系數(shù)4.1.3 描述分布形態(tài)的統(tǒng)計量(將融合在后續(xù)演示中)1、偏度系數(shù)(以眾數(shù)為衡量指標(biāo)

28、)2、峰度系數(shù)(高矮) 全方位的刻畫和定義一組數(shù)據(jù),均數(shù)、方差、風(fēng)度系數(shù)偏度系數(shù)4.2 常用統(tǒng)計表4.2.1 在線處理分析報告(OLPA)該過程對于按一個或多個分組變量所分的組,計算所考察變量的總值、均值及其他統(tǒng)計量,并且以分層的方式輸出結(jié)果,表中每一層是依據(jù)一個分組變量的結(jié)果輸出。執(zhí)行菜單“分析”“報告”“OLPA多維數(shù)據(jù)集”命令4.2.2 個案摘要報告?zhèn)€案摘要報告又成觀測量摘要報告,主要用于按指定分組統(tǒng)計不同水平的交叉匯編,對變量進行記錄列表,并計算相應(yīng)統(tǒng)計量。可通過“個案匯總”命令來預(yù)覽和打印數(shù)據(jù)。執(zhí)行菜單“分析”“報告”“個案匯總”命令4.2.3 行形式摘要報告和列形式摘要報告(略,學(xué)

29、員可獨立學(xué)習(xí))專門用于生成復(fù)雜報表,他們均可以對輸出表格進行精密定義,以滿足客戶的各種嚴(yán)格要求,且輸出格式為文本格式4.3 頻數(shù)分析頻數(shù)分析是描述性統(tǒng)計分析中最常用的方法之一,可以通過對數(shù)據(jù)的分布趨勢進行初步的分析,以便掌握數(shù)據(jù)分布的特征,對數(shù)據(jù)作進一步分析。執(zhí)行菜單“分析”“描述統(tǒng)計”“頻率”命令(1) 在菜單欄中選擇“分析描述統(tǒng)計頻率”命令,打開如下所示的對話框。 (2) 選擇“分組后的人均面積”作為需要分析的變量,單擊按鈕進入“變量”文本框。由于本案例中不要求計算其他統(tǒng)計量,所以不用在“統(tǒng)計量”中進行相關(guān)設(shè)置,只需在“圖表”中選擇圖形類型即可。(3) 選擇“直方圖”項,激活“在直方圖上方

30、顯示正態(tài)曲線”復(fù)選框。(4) 單擊“確定”按鈕,系統(tǒng)開始分析。4.4 描述性分析通過此過程可對變量進行描述性統(tǒng)計量的分析,計算并列出一系列相應(yīng)的指標(biāo),包括平均值、算數(shù)和、標(biāo)準(zhǔn)差、最大值、最小值、方差、全距、和均值標(biāo)準(zhǔn)誤差等,并可以將原始數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)Z分布存入數(shù)據(jù)庫,在數(shù)據(jù)集中生成一個新的變量,該變量自動命名為“Z+原變量名稱”。執(zhí)行菜單“分析”“描述統(tǒng)計”“描述”命令,在執(zhí)行該命令前,執(zhí)行菜單“數(shù)據(jù)”“拆分文件”“比較組”命令(1) 打開數(shù)據(jù)文件,按“班級”數(shù)量對數(shù)據(jù)進行分組。從菜單欄中選擇“數(shù)據(jù)拆分文件”命令,打開“拆分文件”對話框。選擇“比較組”按鈕,然后將“班級”變量選入“分組方式”列

31、表框。單擊“確定”按鈕,完成分組。(2) 打開下圖的“描述性”對話框,從變量列表框中選擇變量年齡、體重和身高。單擊按鈕將選中的變量移動到“變量”文本框,并且選擇“將標(biāo)準(zhǔn)化得分另存為變量”復(fù)選框,即要求以變量形式保存Z分值。(3) 選擇完變量后,單擊“選項”選項,進行統(tǒng)計量的選擇。在本例中,選擇范圍、最大值、最小值、均值、標(biāo)準(zhǔn)差和方差。單擊“繼續(xù)”按鈕確認并返回主對話框。(4) 設(shè)置完畢后,單擊“確定”按鈕,系統(tǒng)將執(zhí)行描述性分析。4.5 探索性分析探索性分析可以對變量進行更為深入詳盡的統(tǒng)計分析,主要用于當(dāng)對數(shù)據(jù)的性質(zhì)、分布特點等完全不知道的時候,檢查數(shù)據(jù)是否有錯誤,獲得數(shù)據(jù)基本特征,以及對數(shù)據(jù)規(guī)

32、律作初步觀察。在常用描述性統(tǒng)計指標(biāo)的基礎(chǔ)上,探索性分析增加了有關(guān)數(shù)據(jù)詳細分布特征的文字與圖形描述,還可以為方差齊性為目的的變量變換提供線索。執(zhí)行菜單“分析”“描述統(tǒng)計”“探索”命令(1) 選擇“分析統(tǒng)計描述探索”命令,打開如下所示的“探索”對話框。 (2) 選擇height變量進入“因變量列表”框作為待摘要變量;選擇area變量進入“因子列表”框作為分組變量。(3) 在輸出欄中,選擇“兩者都”項。(4) 單擊“統(tǒng)計量”按鈕,打開統(tǒng)計量對話框。選中描述性、M-估計量、界外值和百分位數(shù)復(fù)選框,然后單擊“繼續(xù)”按鈕,確認選擇并返回“探索”對話框。(5) 單擊“繪制”按鈕, “探索:圖”對話框。選擇“

33、箱圖”欄中的“按因子水平分組”項,選擇獎分組結(jié)果顯示在同一張圖上;選擇“描述性”欄內(nèi)的“莖葉圖”復(fù)選框,輸出莖葉圖,同時選中“帶檢驗的正態(tài)圖”復(fù)選框,要求進行正態(tài)性檢驗;選擇“伸展與級別Levene檢驗”中的“冪估計”項估計冪次使組間方差齊次。單擊“繼續(xù)”按鈕,確認并選擇返回“探索”對話框。(6) 在“探索”對話框中單擊“確定”按鈕,完成設(shè)置并執(zhí)行探索性分析。4.6 常用統(tǒng)計圖(課堂現(xiàn)場演示)常用的統(tǒng)計圖形包括條形圖、3-D條形圖、面積圖、線圖、餅圖、高低圖、箱圖、誤差條形圖、人口金子塔圖、散點/點狀圖、直方圖等。第5講 一般推斷性統(tǒng)計分析5.1 統(tǒng)計推斷理論(課堂現(xiàn)場講授)5.2 均值比較5

34、.2.1 均值過程均值過程傾向于對樣本進行描述,他可以對需要比較的各組計算描述指標(biāo)進行檢驗前的預(yù)分析。執(zhí)行菜單“分析”“比較平均值”“平均值”命令(1) 在數(shù)據(jù)管理窗口中打開house. Sav數(shù)據(jù)文件。(2) 從菜單欄中選擇“分析比較均值均值”命令,打開如下所示的“均值”對話框。(3) 在“均值”對話框左側(cè)變量列表中選中price和sale變量,單擊按鈕將其移入“因變量列表”列表框中,并將district變量移入“自變量列表”列表框。單擊“選項”按鈕,打開“均值:選項”對話框,如下圖所示。(4) 在“選項”對話框中選擇需要分析的統(tǒng)計量,本例中選擇統(tǒng)計項目。從“單元格統(tǒng)計量”列表中,選中均值、

35、標(biāo)準(zhǔn)差、最小值、最大值和個案數(shù)5個統(tǒng)計量,然后單擊“繼續(xù)”按鈕確認,返回“均值”對話框。(5) 在“均值”對話框中,單擊“確定”按鈕,完成設(shè)置并執(zhí)行操作。5.2.2 單樣本t檢驗用樣本均數(shù)代表的未知總體均數(shù)和已知總體均數(shù)進行比較,來觀察此組樣本與總體的差異性。既是單樣本本身無法比較,進行的是均數(shù)與已知總體均數(shù)間的比較。1基本假定(1) 樣本來自正態(tài)或近似正態(tài)總體;(2) 已知總體均值,可得到樣本均值和標(biāo)準(zhǔn)差2 t檢驗統(tǒng)計量 其中 為樣本平均數(shù);為總體平均數(shù);為樣本標(biāo)準(zhǔn)差;n為樣本容量;t為樣本平均數(shù)與總體平均數(shù)的離差統(tǒng)計量;3 計算原理(1) 建立假設(shè),確定檢驗水平 H0: = 0 H1: 0

36、; (2) 計算統(tǒng)計量;(3) 查相應(yīng)的界值表,確定p值,下結(jié)論;4 SPSS實例演示執(zhí)行菜單“分析”“比較平均值”“單樣本t檢驗”命令(1) 打開數(shù)據(jù)文件pulse.sav之后,從菜單欄選擇“分析比較均值單樣本T檢驗”命令,打開如下所示的“單樣本T檢驗”對話框。(2) 將變量pulse選入“檢驗變量”列表框。(3) 在“檢驗值”框中輸入已知母體平均數(shù)72。(4) 單擊“確定”按鈕,完成設(shè)置并執(zhí)行上述操作。5.2.3獨立樣本t檢驗 “獨立樣本 T 檢驗”過程比較兩組個案的均值。理想的情況下,對于此檢驗,主體應(yīng)隨機地分配到兩個組中,以便響應(yīng)的任何差別是由于處理(或缺少處理)而非其他因素造成的。例

37、如而比較男性和女性的平均收入則不屬于此情況人不是隨機指定為男性或女性的。在這些情況下,應(yīng)確保其他因素中的差別沒有掩飾或夸大均值中的顯著性差異。平均收入的差值還可能受諸如教育之類的因素影響(而非僅僅受性別影響)。1 基本假定(1) 兩個樣本獨立; (2) 樣本來自的正態(tài)總體服從正態(tài)分布;2 獨立樣本t檢驗統(tǒng)計量t分兩種情況:(1) 兩總體方差未知且相等 (2) 兩總體方差未知且不等 , 3 計算原理設(shè)總X1服從正態(tài)分布N(1,12),總體X2服從正態(tài)分布N(2,22),分別從這兩個總體中抽取樣本(x11,x12,x13,x1n)和(x21,x22,x23,x2n),且兩樣本相互獨立,要求檢驗1和2是否有顯著性差異。(1) 建立假設(shè),確定檢驗水平;H0:1 = 2 H1:1 2; (2) 判斷兩總體方差是否相等,F(xiàn)檢驗法(spss會自動檢驗方差是否相

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論