SPSS在統(tǒng)計分析中的運用(上機).docx_第1頁
SPSS在統(tǒng)計分析中的運用(上機).docx_第2頁
SPSS在統(tǒng)計分析中的運用(上機).docx_第3頁
SPSS在統(tǒng)計分析中的運用(上機).docx_第4頁
SPSS在統(tǒng)計分析中的運用(上機).docx_第5頁
已閱讀5頁,還剩68頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

SPSS在統(tǒng)計分析中的運用第一章 數(shù)據(jù)文件的建立及基本統(tǒng)計描述21.1 SPSS的啟動及數(shù)據(jù)庫的建立21.1.2 SPSS簡介21.1.2 啟動SPSS軟件包31.1.3 數(shù)據(jù)文件的建立41.2 數(shù)據(jù)的編輯與整理61.2.1 數(shù)據(jù)窗口菜單欄功能操作61.2.2 Date數(shù)據(jù)功能61.2.3 Transform 變換及轉換功能81.2.4 數(shù)據(jù)的編輯91.2.5 SPSS對變量的編輯141.3 基本統(tǒng)計描述171.3.1 描述統(tǒng)計分析過程171.3.2 頻數(shù)分析191.4 交叉列聯(lián)表分析301.4.1 交叉列聯(lián)表的形成311.4.2 兩變量關聯(lián)性檢驗(Chi-square Test卡方檢驗)33第二章 均值比較檢驗與方差分析2.1 單個總體的 t 檢驗(One-Sample T Test)分析362.2.1 兩個獨立樣本的t檢驗(Independent-samples T Test)382.2.2 兩個有聯(lián)系總體間的均值比較(Paired-Sample T Test)412.3 單因素方差分析432.4 雙因素方差(Univariate)分析過程47第三章 相關分析3.1 簡單相關分析543.2 偏相關分析60附錄 SPSS函數(shù)61第一章 數(shù)據(jù)文件的建立及基本統(tǒng)計描述1.1 SPSS的啟動及數(shù)據(jù)庫的建立1.1.2 SPSS簡介SPSS(Statistics Package for Social Science )for Windows是一種運行在Windows系統(tǒng)下的社會科學統(tǒng)計軟件軟件包。SPSS軟件包集數(shù)據(jù)整理、分析過程、結果輸出等功能為一體,采用窗口操作界面,統(tǒng)計分析方法涵蓋面廣,用戶操作使用方便,輸出數(shù)據(jù)表格圖文并貌,并且隨著它的功能不斷完善,統(tǒng)計分析方法不斷充實,大大提高了統(tǒng)計分析工作的效率。從1968年由美國斯坦福大學開發(fā)使用至今,已經擁有全球數(shù)以萬計的用戶,分布在通信、醫(yī)療、銀行、證券、保險、制造、商業(yè)、市場研究、科學教育等眾多的行業(yè)領域,成為世界上應用最廣泛的專業(yè)統(tǒng)計軟件之一。SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等,具體內容包括描述統(tǒng)計、列聯(lián)分析,總體的均值比較、相關分析、回歸模型分析、聚類分析、主成份分析、時間序列分析、非參數(shù)檢驗等多個大類,每個類中還有多個專項統(tǒng)計方法。SPSS設有專門的繪圖系統(tǒng),可以根據(jù)使用者的需要將給出的數(shù)據(jù)繪制各種圖形,能夠滿足用戶的不同需求。一 SPSS的運行方式SPSS提供了3種基本運行方式:完全窗口菜單方式,程序運行方式、混合運行方式。程序運行方式和混合運行方式是使用者從特殊的分析需要出發(fā),編寫自己的SPSS命令程序,通過語句直接運行。這里只介紹完全窗口菜單管理方式,這種操作方式簡單明了,除數(shù)據(jù)輸入工作需要鍵盤外,大部分的操作命令、統(tǒng)計分析方法的實現(xiàn)是通過菜單、圖標按鈕、對話框來完成的,非常適用于一般的統(tǒng)計分析人員和一般統(tǒng)計方法的應用者。 SPSS中使用的對話框主要有兩類,一類是文件操作對話框,文件操作對話窗口操作與Windows應用軟件操作風格一致。另一類是統(tǒng)計分析對話框,統(tǒng)計分析對話框可以分為主窗口和下級窗口,在該類對話框中,選擇參與分析的各類變量及統(tǒng)計方法是對話框的主要任務。有關對話框的詳細操作將在后面的統(tǒng)計方法的實驗中解釋。二 SPSS的實驗環(huán)境要求1、系統(tǒng)運行環(huán)境SPSS10.0以上版本軟件包可以工作在兩種模式下,單機模式和作為網絡系統(tǒng)的用戶界面模式。SPSS for Windows軟件包可以運行在微軟公司的Windows98、Windows NT 4.0、Windows ME、Windows2000和Windows XP操作系統(tǒng)之下。由于統(tǒng)計分析軟件的數(shù)據(jù)量比較大,所以系統(tǒng)運行需要大于16M以上空間。2、輔助軟件環(huán)境SPSS可以直接將SPSS數(shù)據(jù)文件保存為Excel工作表,也可以直接打開一個Excel工作表,因此,為了方便數(shù)據(jù)錄入(許多人對Excel工作表編輯比較熟習),應在操作系統(tǒng)下安裝一個Excel軟件。另外,許多數(shù)據(jù)在處理之前可能保存在某個數(shù)據(jù)庫中,例如FoxBase、Sybase、SQL_Server、Oracle等等,如有需要從數(shù)據(jù)庫中獲取數(shù)據(jù)的分析,應在操作系統(tǒng)下安裝相應的數(shù)據(jù)庫管理系統(tǒng)。三 SPSS的主要界面SPSS的主要界面有數(shù)據(jù)編輯窗口和結果輸出窗口。數(shù)據(jù)編輯窗口與微軟的Exdel類似,但SPSS的統(tǒng)計功能更多。SPSS的結果輸出窗口是顯示統(tǒng)計分析的結果,此窗口的內容可以以結果文件.spo的形式保存。數(shù)據(jù)編輯窗口和結果輸出窗口的詳細描述將在有關SPSS的數(shù)據(jù)文件建立的內容中查到。四 SPSS的幫助系統(tǒng)SPSS對一些基本模塊中的統(tǒng)計提供了幫助,可以通過單擊Help菜單中的Statistics Coach命令,選擇所需要的統(tǒng)計指導。 1.1.2 啟動SPSS軟件包當用戶在操作系統(tǒng)下運行SPSS軟件后,計算機屏幕上出現(xiàn)一個對話框,如圖1.1所示: 圖1.1 SPSS啟動后操作對話框對話框包括一個六選一單選對話框和一個復選對話框,其內容為:l Run the tutorial 運行操作指南;l Type in data 輸入數(shù)據(jù)選項,建立新的數(shù)據(jù)集時可選擇此項;l Run an existing query 運行一個已經存在的數(shù)據(jù)文件選項;l Create new query using Database Wizard 用數(shù)據(jù)庫處理工具建立新文件;l Open an existing date source 打開一個已經存在的數(shù)據(jù)文件;l Open another type of file 打開其他類型的文件。l Dont show this dialog in the future 是一復選對話框,選中該復選項后,下次啟動SPSS時將不會顯示對話框,直接顯示數(shù)據(jù)編輯窗口。1.1.3 數(shù)據(jù)文件的建立當對話框選擇Type in data后,點擊OK,系統(tǒng)將顯示出SPSS軟件包數(shù)據(jù)編輯主窗口,數(shù)據(jù)文件的建立就是在數(shù)據(jù)編輯窗口中完成的。數(shù)據(jù)編輯窗口可以顯示兩張表,分別是Data View(見圖1.2)和Variable View(見圖1.3),通過點擊下端的2個同名窗口標簽按鈕實現(xiàn)相互切換。標尺欄菜單欄工具欄數(shù)據(jù)輸入區(qū)數(shù)據(jù)編輯區(qū)窗口標簽標題欄圖1.2 SPSS for Windows 主窗口示意圖狀態(tài)欄當前數(shù)據(jù)欄顯示區(qū)滾動條數(shù)據(jù)編輯區(qū)是SPSS的主要操作窗口,是一個二維平面表格,用于對數(shù)據(jù)進行各種編輯;標尺欄由縱向標尺欄和橫向標尺欄,橫向標尺欄顯示數(shù)據(jù)變量,縱向標尺欄顯示數(shù)據(jù)順序(如時間順序)。Data View表可以直接輸入觀測數(shù)據(jù)值或存放數(shù)據(jù),表的左端列邊框顯示觀測個體的序號,最上端行邊框顯示變量名。Variable View表用來定義和修改變量的名稱、類型及其他屬性,如圖1.3所示。圖1.3 Variable View 表在Variable View表中,每一行描述一個變量,依次是:Name:變量名。變量名必須以字母、漢字及開頭,總長度不超過8個字符,共容納4個漢字或8個英文字母,英文字母不區(qū)別大小寫,最后一個字符不能是句號。Type:變量類型。變量類型有8 種,最常用的是Numeric數(shù)值型變量。其它常用的類型有:String字符型,Date日期型,Comma逗號型(隔3位數(shù)加一個逗號)等。Width:變量所占的寬度。Decimals:小數(shù)點后位數(shù)。Label:變量標簽。關于變量涵義的詳細說明。Values:變量值標簽。關于變量各個取值的涵義說明。Missing:缺失值的處理方式。Columns:變量在Date View 中所顯示的列寬(默認列寬為8)。Align:數(shù)據(jù)對齊格式(默認為右對齊)。Measure:數(shù)據(jù)的測度方式。系統(tǒng)給出名義尺度、定序尺度和等間距尺度三種(默認為等間距尺度)。如果輸入變量名后回車,將給出變量的默認屬性。如果不定義變量的屬性,直接輸入數(shù)據(jù),系統(tǒng)將默認變量Var00001,Var00002等。定義了變量的各種屬性后,回到Data View表中,就可以直接在表中錄入數(shù)據(jù)。輸入數(shù)據(jù)后可以點擊Save或Save as作為數(shù)據(jù)文件保存。另外對于統(tǒng)計分析的結果也可以作為文件保存起來。為了在統(tǒng)計分析過程中能有效的利用其它軟件產生的數(shù)據(jù),SPSS軟件編輯窗口除可以使用*.sav擴展名數(shù)據(jù)文件,還可以直接打開和保存下述類型的文件。SPSS DOS版本產生的數(shù)據(jù)文件*.sys;Excel 報表程序產生的數(shù)據(jù)文件*.xls;DBASE 數(shù)據(jù)庫格式文件*.dbf;SAS統(tǒng)計軟件產生的數(shù)據(jù)文件。1.2 數(shù)據(jù)的編輯與整理當錄入數(shù)據(jù)之后,就可以對原始數(shù)據(jù)進行整理和分析,關于數(shù)據(jù)的整理和分析都是在數(shù)據(jù)窗口完成的。下面將介紹SPSS統(tǒng)計分析軟件在數(shù)據(jù)窗口的主要操作方式和菜單相應的功能。1.2.1 數(shù)據(jù)窗口菜單欄功能操作數(shù)據(jù)編輯窗口的主菜單如圖1.4所示,主菜單中的具體功能包括:圖1.4 SPSS主菜單1.File:文件操作。2.Edit:文件編輯。3.View:視圖編輯。4.Data:數(shù)據(jù)操作。5.Transform:數(shù)據(jù)轉換。6.Analyze:統(tǒng)計分析方法。 7.Graphs: 圖形編輯。8.Utilities:實用程序。 9.Windows:窗口控制。10.Help:幫助。 在統(tǒng)計分析過程中常用的功能主要集中在數(shù)據(jù)操作、數(shù)據(jù)轉換、數(shù)據(jù)分析、統(tǒng)計圖形的建立與編輯等操作。1.2.2 Date數(shù)據(jù)功能數(shù)據(jù)編輯窗口的Data菜單為用戶創(chuàng)建和定義數(shù)據(jù)提供了方便的功能,如圖1.5所示。這個菜單是SPSS統(tǒng)計軟件數(shù)據(jù)整理的特有功能菜單。它的功能包括:對變量、觀測量的編輯處理;對變量數(shù)據(jù)的變換;對觀察量數(shù)據(jù)整理。這些功能為各種統(tǒng)計分析要求提供極其靈活了數(shù)據(jù)整理功能,用戶可以根據(jù)不同統(tǒng)計分析對數(shù)據(jù)的要求對數(shù)據(jù)進行整理。圖1.5 Data菜單項示意圖拷貝數(shù)據(jù)屬性定義變量屬性插入一個變量定義日期變量定位觀測量插入觀測量重構數(shù)據(jù)結構數(shù)據(jù)文件轉置觀測量排序標識重復觀測量分類或不分類匯總合并數(shù)據(jù)文件觀測量加權選擇觀測量拆分數(shù)據(jù)文件正交設計一、定義和編輯變量、觀測量的命令Define Variable Properties 用于定義變量屬性;Copy Data Properties 由外部文件和工作文件拷貝數(shù)據(jù)變量和屬性;Define Dates 定義或編輯日期變量格式;Insert Variable 在數(shù)據(jù)編輯窗口插入一個變量;Insert Case 在數(shù)據(jù)編輯窗口插入一個觀測量;Goto Case 光標跳轉到某一指定觀測量。二、變量數(shù)據(jù)變換的命令Sort Cases 對觀測量進行排序;Transpose 對觀測量進行轉置;Restructure 對現(xiàn)有的觀測量進行重新構造,形成新格式的數(shù)據(jù)文件;Merge File 把外部文件數(shù)據(jù)合并到工作文件中;Aggregate 對數(shù)據(jù)進行分類或不分類匯總,產生新文件或代替工作文件。Identify Duplicate Cases 標識重復觀測量;Orthogonal Design 進行正交設計。三、觀察量數(shù)據(jù)整理的命令Split File 拆分數(shù)據(jù)文件的觀測量,觀測量進行條件分組;Select Cases 選擇觀測量;Weight Cases 對觀測量進行加權處理。通過選擇上述命令,可以實現(xiàn)對數(shù)據(jù)的整理編輯。1.2.3 Transform 變換及轉換功能數(shù)據(jù)編輯窗口的Transform菜單為用戶創(chuàng)建和定義復雜的數(shù)據(jù)提供了方便的功能,如圖2.3所示。它與Data菜單共同使用,可對基本的數(shù)據(jù)進行重新編輯,形成新的變量和觀測量。這個菜單主要對變量進行操作,分為三部分的功能。這些功能也為各種統(tǒng)計分析要求提供極其靈活了數(shù)據(jù)處理功能。產生新的分組變量創(chuàng)建時間序列變量創(chuàng)建計數(shù)變量變量值重新編碼計算產生新變量運行其它轉換程序設定隨機數(shù)種子觀測量排秩變量值自動編碼創(chuàng)建代替缺失值變量圖1.6 Transform菜單項示意圖一. 通過基本變量創(chuàng)建各種新變量; Compute 計算產生新變量,SPSS提供了10類100多個函數(shù),通過該菜單可以用表達式產生一個新變量;Random Number Seed 創(chuàng)建隨機數(shù)種子;Create Times Series 創(chuàng)建時間序列變量;二. 創(chuàng)建各種參數(shù)變量;Count 創(chuàng)建一個計數(shù)變量,用于統(tǒng)計計數(shù);Recode 對變量值重新編碼;Rank Cases 為觀測量排秩,求得的秩在數(shù)據(jù)窗口作為一個新變量保存;Categorize Variables 建立新的分組變量,使數(shù)據(jù)分成若干個組;Automatic Recode 對變量值自動編碼,產生一個連續(xù)的變量值編碼;Replace Missing Values 創(chuàng)建替代缺失值變量;三.運行其它自定義的轉輸程序。Run Pending Transform 運行其它轉換程序。在一般的情況下,通過Date菜單和Transform菜單的操作就可以實現(xiàn)對原始數(shù)據(jù)的整理和變換。1.2.4 數(shù)據(jù)的編輯在Data View中,用鼠標左鍵單擊數(shù)據(jù)表左邊框的觀測個體序號,這一行值就會被選中,用鼠標左鍵單擊上邊框的變量名,這個列就被選中,和其它Windows中的操作類似,也可以用鼠標對選中一部分單元格,選中的行、列、單元格后,單擊鼠標右鍵,可以對它們進行復制、刪除、剪切等操作。如果需要對已經輸入的數(shù)據(jù)進行修改,就要對已經存在的數(shù)據(jù)進行編輯,SPSS有許多數(shù)據(jù)編輯功能。下面介紹幾種常用的數(shù)據(jù)編輯功能。一、插入一個新觀測量(Case)插入一個新觀測量(數(shù)據(jù))的命令是Insert Cases。在數(shù)據(jù)窗口主菜單上單擊DateInsert Cases命令,可以在光標所在位置的前上一行插入一行新的觀測個體,可以輸入新的觀測數(shù)據(jù)。二、查找指定的觀測量(數(shù)據(jù))查找指定的觀測數(shù)據(jù)的命令是Go to Case。在數(shù)據(jù)窗口單擊DateGo to Case,彈出一個對話框,如圖1.7所示:輸入要找的觀測量的序號后,點OK按鈕,數(shù)據(jù)表中光標就會指到選定的觀測量個體。圖1.7 Go To Case對話框三、 觀測數(shù)據(jù)排序建立數(shù)據(jù)文件sys-1:基本結構如下,數(shù)據(jù)上機時自行錄入性別受教育年限年薪剛工作年薪年齡給觀測量數(shù)據(jù)排序的命令是Sort Cases。在數(shù)據(jù)窗口單擊DateSort Cases,打開Sort Cases對話框(見圖1.8 )。 圖1.8 Sort Case對話框從對話框左側的變量列表中選擇排序變量,點擊右箭頭按鈕加入Sort by框中,然后在Sort Order欄中選擇排序順序:Ascending 觀測個體按照選定的排序變量值由小到大的升序排列;Descending 觀測個體按照選定的排序變量值降序排列。注意:觀測個體.排序變量可以是一個或多個,當選擇多個排序變量時,首先按第一個變量值排序,然后在第一個變量取值相同的那些個體中再按第二個變量值排序,依次類推。注意在排序的時候,觀測個體整行的值一同變到新位置,而不是只有排序變量那一列變動。但數(shù)據(jù)表中左邊框上的序號并不隨著變動,因此,為了保留原始數(shù)據(jù)的信息,最好自己定義一個變量來記錄觀測個體的序號。四、在數(shù)據(jù)中選取子集如果需要從數(shù)據(jù)文件中選取一部分數(shù)據(jù),可以在數(shù)據(jù)編輯窗口單擊Data Select Case,打開Select Case對話框,如圖1.9所示: 圖1.9 Select Case對話框在該對話框的Select欄中選擇挑選數(shù)據(jù)子集的方式(單選):l All case:選擇所有數(shù)據(jù);l If condition is satisfied: 按指定條件選擇數(shù)據(jù)。單擊If按紐,打開Select Case:If對話框,如圖1.10所示,先選擇變量,然后定義條件。l Random Sample of cases:對觀察值進行隨機抽樣。單擊Sample 按紐,打開Select Case:Random sample對話框。如圖1.11所示。 圖1.10 Select Case:If對話框在Sample Size欄中有兩種選擇方式,一種是大概抽樣(Approximately),即鍵入抽樣比例后由系統(tǒng)隨機抽樣;另一種是精確抽樣((Exactly),要求輸入從第幾個觀察值起抽取多少數(shù)據(jù)。 圖1.11 Select Case:Random Sample對話框l Based on time or case range:順序抽樣。單擊Range按紐,打開Select Case: Range對話框,用戶自行定義從第幾個觀察值開始抽到第幾個觀察值結束。l Use filter variable:用指定變量作過濾。先選擇一個變量,系統(tǒng)自動在數(shù)據(jù)管理器中將該變量值為0的觀測單位標上刪除記號,系統(tǒng)對標有刪除記號的觀測單位不作分析。選擇了挑選數(shù)據(jù)子集的方式后,單擊OK,在數(shù)據(jù)窗口可看到新的變量filter_s。五、數(shù)據(jù)分類匯總(數(shù)據(jù)分組匯總)建立數(shù)據(jù)庫文件sys-2:基本結構如下,數(shù)據(jù)上機時自行錄入姓名性別班級數(shù)學物理用戶可以根據(jù)需要對數(shù)據(jù)按指定的變量的數(shù)值進行歸類分組匯總。以上述建立的數(shù)據(jù)庫的學生成績?yōu)槔?,如果按照性別對數(shù)學成績進行匯總,可以使用分類匯總命令實現(xiàn)。具體操作如下。1.指定分類變量和匯總變量。打開建立的數(shù)據(jù)庫,在數(shù)據(jù)窗口單擊DateAggregate命令,打開Aggregate Date對話框。如圖1.12所示: 圖1.12 Aggregate Date對話框2. 在變量名列表框中選擇分類變量”性別”進入Break Variable(s)。3. 在變量名列表框中選擇匯總變量”Math”進入Aggregate Variable(s)。4. 單擊Function按紐,打開Aggregate Date:Function對話框,如圖1.13所示。在此對話框中可以選擇平均值、數(shù)據(jù)和、標準差的形式,特別值形式,百分數(shù)形式、頻數(shù)形式等其中之一的方法進行分類匯總。選擇分類匯總的函數(shù)形式后返回Aggregate Date對話框中。 圖1.13 Aggregate Date:Aggregate Function對話框5. 在Aggregate Date對話框中指定匯總文件的保存路徑。有兩種選擇:一種是選中創(chuàng)建新數(shù)據(jù)文件,通過File按紐,重新指定結果文件名。一種是替代原來數(shù)據(jù)文件,用分類匯總結果覆蓋當前編輯窗口的數(shù)據(jù)。6. 單擊Name&Label按紐,可以重新指定結果文件中的變量名并加入變量標簽。SPSS默認的結果文件中的變量名為原變量名最后加上_1.7. 如果希望在結果文件中保存各分類組的數(shù)據(jù)個數(shù),可以選擇Save number of case in break group as variable項。最后單擊OK,可得相應的數(shù)據(jù)文件。 六、缺失值的替代方式如果用戶希望對缺失值進行定義,可以采用以下的操作:在數(shù)據(jù)窗口點擊TransformReplace Missing Values,打開Replace Missing Values,對話框,如圖.1.14.所示: 圖1.14 Replace Missing Values對話框在變量中選擇具有缺失值的變量進入New Variable框內,系統(tǒng)可以自動產生替代缺失值的新變量,也可處定義新變量。然后在Method的下拉菜單中選擇缺失值的替代方式。五種方式依次是:Series mean 用該變量所有非缺失值的平均值替代缺失值;Mean of nearly point 用缺失值相鄰點的的非缺失值的平均數(shù)據(jù)替代缺失值;Median of nearly point 用缺失值相鄰點的的非缺失值的中位數(shù)替代缺失值;Linear interpolation 用缺失值相鄰點的的非缺失值的中點值替代缺失值;Linear trend at point 用線性擬合方式替代缺失值。七、數(shù)據(jù)秩(序)的確定如果用戶需要對已有的數(shù)據(jù)變量排秩(序),如對數(shù)據(jù)SYS-2中的數(shù)學成績分別排出名次,可以在數(shù)據(jù)窗口采用以下操作。 1. 單擊TransformRand Cases,打開Rand Cases對話框。2. 從左邊變量名列表框中選擇變量”數(shù)學”(也可選擇多個變量)進入Variable(s)框中,選擇變量”班級”進入By框中,則系統(tǒng)排序時將按照進入By的變量值“班級”進行分別排序。如圖1.15所示:圖1.15 Rand Cases對話框3. 單擊Ties按紐,選擇Ties(Ties是指兩個或兩個以上的數(shù)據(jù)相等的情況)的處理方式。由于秩與數(shù)據(jù)個數(shù)是一一對應的,當數(shù)據(jù)有相同的時,確定它們相應的秩有三種處理方式:對應秩的Mean平均值、Low最小值和high最大值。如本例選擇最大值。選擇后返回在主對話框。點擊OK,就可以在數(shù)據(jù)窗口看到排序結果。Rank Types按紐提供排秩方式。單擊Rank Types按紐,打開types對話框,從中選擇排秩類型,排秩類型從左到右依次是:Rank普通排序(系統(tǒng)默認),新變量的值就是秩;Fractional rank as% 累計百分數(shù)排序;Savage score以指數(shù)分布為基礎的原始分排序;Sum of Case weights 以分組例數(shù)之和的權重排序;Fractional rank以秩變量除以分組例數(shù)之和排序;Ntile先給定一個大于1 的整數(shù),系統(tǒng)按照此數(shù)的范圍確定秩。1.2.5 SPSS對變量的編輯一、插入一個新變量插入一個新變量的命令是Insert Variable。在數(shù)據(jù)窗口單擊DataInsert Variable,會在光標所在位置的前一列插入一個新的變量,變量名字和屬性可以在Variable View窗口中定義。二、已存在的變量生成新變量對于已存在的數(shù)據(jù)變量,根據(jù)需要進行計算生成新變量的命令是Compute。在數(shù)據(jù)窗口單擊Transform Compute,打開Compute Variable對話框,如圖1.16所示。在對話框左上方Target Variable欄中,鍵入即將生成的新變量的名稱,并單擊Type & Lable按紐確定變量標簽及數(shù)據(jù)類型。對話框的左下欄中給出了數(shù)據(jù)文件中所有可用的變量列表,我們可以用右箭頭按鈕從中選取所需的變量進入右上方的Numeric Expression欄中,該欄存放運算表達式,運算表達式中所需要的常用函數(shù)可以從下的Functions列表中直接選取。這些常用函數(shù)(見附錄)和其它語言中的函數(shù)名稱類似,在框中按字母順序排列,用鼠標選中某個函數(shù),用Functions右面的上箭頭按鈕加入數(shù)值表達式中,對話框中間是一個小鍵盤,可以用來輸入數(shù)字、運算符號等。Compute Variable對話框的下面還有一個if按鈕,可以選一部分滿足某種條件的觀測個體來做運算,不滿足條件觀測,其新變量值缺失。 圖1.16 Compute Variable對話框如圖1.16表示的是數(shù)據(jù)SYS-2中每個學生的數(shù)學和物理總成績。在Compute Variable對話框中填好新變量名稱和運算表達式后,點擊OK按鈕,就可以在數(shù)據(jù)文件中看到,已經生成了一個新變量Total。三、產生計數(shù)變量如果用戶需要對滿足某項條件的數(shù)據(jù)進行計數(shù),可以使用Count命令。以學生成績數(shù)據(jù)SYS-2為例,說明具體操作步驟:在數(shù)據(jù)窗口單擊TransformCount,打開Count Occurrence of Value within Cases對話框,如圖1.17所示: 圖1.17 Count Occurrence of Value within Cases對話框先在Target Variable中指定一個變量(可以是已經存在的變量或新變量),并定義變量標簽,然后指定要統(tǒng)計的變量加到Numeric Variables框中,再單擊Define Values按紐,打開Value to Count對話框。如圖1.18所示: 圖1.18 Count Values within Cases:Value to Count對話框在上面的對話框中,確定需要計數(shù)的數(shù)值,其Value值的設置項依次是:Value:輸入某個值為清點對象;System-missing:以系統(tǒng)的缺失值為清點對象;System-or user missing:以系統(tǒng)或用戶指定的缺失值為清點對象;Range:指定數(shù)值的計數(shù)區(qū)域:其中包括: ( )through( )在框內指定下限和上限lowest through( ): 在框內只指定上限;( )highest through: 在框內只指定下限。圖中給出的是計算達到優(yōu)良標準,即學生達到80分以上課程數(shù)。確定了計數(shù)數(shù)值后,單擊Add,使選擇結果進入Values to count 框內。單擊Continue按紐,返回主對話框中。如果需要,可以單擊If按紐確定計數(shù)條件。最后點OK可在數(shù)據(jù)窗口得到計數(shù)變量。四、變量分組(編碼)與自動分組(編碼)Transform菜單下還有以上兩條分組(編碼)命令。對變量數(shù)據(jù)的重新分組(編碼),是指給每個變量值重新賦予一個碼來描述他們的某些屬性。碼數(shù)相同的即為一組。比如,可以對年齡重新分組,19歲及以下年齡賦予一個編碼1,20-29歲的年齡碼賦予2,30-39歲年齡碼賦予3,依此類推,這些碼只能取正整數(shù)值。從某種程度上來講,編碼也可以看做分組:一個組對應一個組號,這樣就把這些人按年齡分為幾個組,一目了然。變量重新編碼命令為Recode,自動重新編碼命令為Automatic Recode。Automatic 兩者的區(qū)別是:Automatic Recode命令是SPSS系統(tǒng)自動設定碼為正整數(shù),而Recode可以根據(jù)用戶的需要指定特別的碼值。自動編碼的具體操作為:在數(shù)據(jù)窗口單擊Transform Automatic Recode打開Automatic Recode。對話框,從左側的變量列表中選出被將重新編碼的原變量,在New Name按鈕右邊空白欄中輸入新的碼值的變量名,點New Name按鈕放到上面的欄中。對話框底下有兩個選項,以確定編碼是從最小的開始,還是從最大的開始,點OK執(zhí)行這條命令。需要注意的是,碼與秩是不同的,請讀者在學習時注意它們的區(qū)別。如果用戶需要自定義分組的條件,可選擇Recode命令。Recode命令有兩個選項,分別是:Into Same Variables:數(shù)據(jù)編碼后新的碼值直接放到原來的變量中;Into Different Variables:數(shù)據(jù)編碼后新的碼值存到一個新變量中。為了避免數(shù)據(jù)丟失,盡量不要輕易選擇前者。 選擇后者的Recode命令對話框如圖1.19所示, 圖1.19 Recode Into Different Variables對話框選擇需要重新分組(編碼)的變量進入Numeric VariableOutput框中,并在右邊的Output Variable框中定義新的變量名及變量標簽,單擊Old and New Values按紐,打開對話框,Old and New Values對話框最左側有六個選項,用來確定原變量的取值區(qū)間(或單個變量值),它們將被賦予一個相同的新碼值,新的碼值在右上方的New Value欄中填入。填好后Add按鈕就被激活了,單擊此按鈕,就把這個舊的變量區(qū)間(值)以及新的碼值到Old-News欄中。重復以上步驟,把所有的區(qū)間一個一個都輸入后,點Continue按鈕回到Recode Into Different Variables菜單,點OK按鈕執(zhí)行命令,即在數(shù)據(jù)窗口可得到需要的分組賦值變量。1.3 基本統(tǒng)計描述在建立了數(shù)據(jù)文件之后,需要對數(shù)據(jù)作進一步的考察,如了解數(shù)據(jù)的基本特征,如數(shù)據(jù)的均值、標準差、四分位點,數(shù)據(jù)的分布形態(tài)等,這個過程稱為對數(shù)據(jù)進行基本統(tǒng)計描述。所以說,數(shù)據(jù)的基本統(tǒng)計描述的目的是:了解數(shù)據(jù)的基本特征和基本分布形狀,為進一步分析做好充分準備。u 本節(jié)主要內容:數(shù)據(jù)的基本統(tǒng)計描述方法:頻數(shù)分析、探索分析及交叉列聯(lián)表分析等。1.3.1 描述統(tǒng)計分析過程描述統(tǒng)計分析是對數(shù)據(jù)進行基礎性描述??梢缘贸鰯?shù)據(jù)的平均值(Mean)、和(sum)、標準差(Std deviation)、最大值(Max)、最小值(Min)、方差(Variance)、極差(range)、平均值標準誤(S.E.Mean),峰度(Kurtosis)、偏度(Skewness)等統(tǒng)計量。以數(shù)據(jù)庫SYS-2為例,介紹描述統(tǒng)計分析的具體操作步驟如下:1、首先打開數(shù)據(jù)表SYS-2,按照AnalyzeDescriptives Statistics Descriptives打開Descriptives對話框,如圖1.20所示圖1.20 Descriptives 主對話框2、 從左邊源變量中選擇一個或者幾個變量進入右框中,單擊Options按鈕,打開Options對話框,如圖1.21所示(本例選兩個) 圖1.21 Descriptives Options對話框在對話框中最上面一行是Mean:均值,sum:算術和l Dispersion離差欄Std.Deviation 標準差 Minimum 最小值Variance 方差 Maximum 最大值Range 極差 S.E.mean 均值的標準誤l Distribution分布狀態(tài)欄Skewness 偏度 Kurtosis 峰度l Display Order欄,選擇輸出方式:Variable List 按變量表次序;Alphabetic 按字母順序;Ascending Meas 按平均值升序;Descending Means 按平均值降序。如在此例中選擇按平均值升序項,返回主對話框,單擊OK,在輸出窗口得描述統(tǒng)計分析輸出表。表1.1 Descriptive Statistics基本描述統(tǒng)計表1.3.2 頻數(shù)分析對于一組數(shù)據(jù),考察不同的數(shù)據(jù)出現(xiàn)的頻數(shù),或者是數(shù)據(jù)所落入指定的區(qū)域內的頻數(shù),可以了解數(shù)據(jù)的分布狀況。數(shù)據(jù)文件SYS-1是一個公司職員表,其中有性別、年齡,受教育年限等五個變量,具體操作如下:1、打開數(shù)據(jù)文件SYS-1后,單擊AnalyzeDescriptive Statistics Frequencies 打開頻數(shù)分析對話框如圖1.22所示。 圖1.22 頻數(shù)分布主對話框2、在左邊的變量框中選中一個或多個變量送入Variable(s)。3、選中Display frequency tables要求輸出分布表。4、單擊Statistics按鈕,得到對話框圖1.23。在Frequencies: Statistics對話框中選擇要求輸出的統(tǒng)計量。圖1.23 Frequencies: Statistics對話框l Percentile Values百分數(shù)選擇項欄(復選項)Quartile四分位數(shù),Cut points equal groups等分位點百分位數(shù)(取值范圍在2100之間)。Percentile(s)自定義百分數(shù)。l Dispersion 離差欄(見1.3.1基本統(tǒng)計描述過程)l Central Tendency 中心趨勢欄Mean 算術平均值(均值), Median 中位數(shù), Mode 眾數(shù), Sum 算術和.l Distribution分布狀態(tài)欄在本例中選擇四分位點、10等分的百分位點;標準差、方差、最大、最小值;全距、均值、均值的標準誤,中位數(shù)、偏度、峰度等復選項。5、單擊Chart按鈕,得到Frequencies: Chart對話框圖1.24. 在對話框中有l(wèi) Chart Type圖形欄(單選),選擇輸出的圖形類型。None 不輸出圖形(系統(tǒng)默許) Bar charts 條形圖Pie charts 餅圖 Histograms 直方圖With normal curve直方圖中顯示正態(tài)曲線(只有選擇直方圖時才能選擇)。l Chart Values欄,選擇圖形中分類值的表現(xiàn)形式。Frequencies直方圖縱軸為頻數(shù),餅圖中每塊表示屬于該組觀測值頻數(shù);Percentage直方圖縱軸為百分比,餅圖中每塊表示該組的觀測量數(shù)占總數(shù)的百分比。 圖1.24 Frequencies: Chart對話框6、單擊Format按鈕,得到對話框圖1.25。 圖1.25 Frequencies: Format 對話框在Frequencies: Format 對話框中:l Order by 排序欄,表示頻數(shù)分布表的排列順序。(單選)Ascending values 按變量值升序排列(系統(tǒng)默許)。Descending values 按變量值降序排列。Ascending counts 按變量各種取值發(fā)生的頻數(shù)升序排列。Descending counts按變量各種取值發(fā)生的頻數(shù)降序排列。如果設置了直方圖,頻數(shù)表將按照變量值順序排列。l Multiple Variables多變量輸出表格設置(單選)。Compare variables 將所有變量的結果輸出在一個表中。Organize output by variables 為每一個變量輸出一個表。l Suppress tables with more than _ categories控制頻數(shù)表輸出的分類數(shù)復選項。Maximum number of categories 分類數(shù)最大參數(shù)值,默許值是10.本例中均選擇系統(tǒng)默認項。點擊OK,得到輸出表1.2.表 1-2(a) Statistics統(tǒng)計分析表年齡 NValid70Missing0Mean 均值42.66Std. Error of Mean 均值的標準誤1.223Std. Deviation 標準差10.232Skewness 偏度.775Std. Error of Skewness 偏度的標準誤.287Kurtosis 峰度-.010Std. Error of Kurtosis 峰度的標準誤.566Minimum 最小值24Maximum 最大值70Percentiles百分數(shù)1033.002035.002536.003036.004038.005039.006042.607046.707550.008052.009059.00表1-2(b) 頻數(shù)表年齡 Frequency頻數(shù)Percent%Valid PercentCumulative PercentValid243033345.75.714.33422.92.917.13545.75.722.936710.010.032.93745.75.738.63868.68.647.1394134.34.358.64211.41.460.04322.92.962.94411.41.464.34534.34.368.64611.41.470.04722.92.972.94911.41.474.35022.92.977.15111.41.478.65222.92.981.45322.92.984.35511.41.485.75711.41.487.15811.41.488.65934.34.392.96122.92.995.76622.92.998.67011.41.4100.0Total70100.0100.0 表1.2(c)直方圖 從上面的表和直方圖中可以觀察到該公司32歲至47歲之間的人數(shù)最多,占到總人數(shù)的60%以上。1.3.3 探索分析過程探索分析是對數(shù)據(jù)進行初步的觀察分析,主要的分析項目有:u 觀察數(shù)據(jù)的分布特征:可通過繪制箱圖和莖葉圖等圖形直觀地反映數(shù)據(jù)的分布形式和數(shù)據(jù)的一些規(guī)律性,包括考察數(shù)據(jù)中是否存在異常值等。 u 正態(tài)分布檢驗:檢驗數(shù)據(jù)是否服從正態(tài)分布。u 方差齊性的檢驗:用Levene檢驗比較各組的方差是否相等。以數(shù)據(jù)庫SYS-2提供的學習成績數(shù)據(jù)為例,對各班的數(shù)學成績按照性別進行數(shù)據(jù)的分布、按照性別檢驗其數(shù)學成績的方差是否相等。打開數(shù)據(jù)庫SYS-2,具體操作步驟:1、單擊Analyze-Descriptive statistics-Explore,打開Explore主對話框:如圖1.26所示: 圖1.26 探索分析主對話框(1) 從左側的變量列表中選出變量”數(shù)學”,送入Dependent List欄;(2) 選擇”性別”作為因子變量,送入Factor List欄。有了因子變量,SPSS會把所有的觀測個體按照因子變量的取值分成若干各組,再分組考察Dependent List中的各個變量,如果不選擇因子變量,SPSS會對全部觀測來做探索分析。(3) 選擇”班級”標識變量送入Label Case欄,當輸出涉及到觀測量時,使用該變量值標識各觀測量。(4) 在Display欄中選擇輸出項,依次是Both選擇項,輸出圖形與描述統(tǒng)計量(系統(tǒng)默認),只輸出描述統(tǒng)計量和只輸出圖形。本例中選擇默認項。2、單擊Statistics統(tǒng)計量按鈕,打開Statistics對話框,選擇統(tǒng)計輸出量。有四個選擇項,分別是:Descriptives基本統(tǒng)計描述。同時指定均值的置信區(qū)間的置信度,系統(tǒng)默認為95。M-估計(M估計在計算時對所有觀測量賦予權重,隨觀測量距分布中心的遠近而變化);Outliers輸出分析數(shù)據(jù)中五個最大值和五個最小值;Percentiles輸出百分數(shù)。本例中選擇Descriptives和Outliers后,返回主對話框。如圖1.27所示。圖1.27 探索分析 Statistics對話框3、 單擊Plots 圖形按鈕,打開Plots對話框,如圖1.28所示。圖1.28 探索分析 Plots對話框對話框中有四個選擇欄:l Boxplot 箱圖選擇欄。Factor levels together因變量按因素水平分組(系統(tǒng)默認);Dependents together 所有因變量生成一個并列箱圖(本例中選擇項);None不顯示箱圖。箱圖中,最底部的水平線段是數(shù)據(jù)的最小值(奇異點除外),頂部的水平線段是數(shù)據(jù)的最大值(奇異點除外),中間矩形箱子的底所在位置是數(shù)據(jù)的第一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論