




免費預覽已結束,剩余21頁可下載查看
下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
北京大學社會學系 數(shù)據(jù)分析課程講義 劉愛玉 2004年SPSS數(shù)據(jù)分析技術課程提綱教材:自編講義 阮桂海主編, 2000,SPSS實用教程電子工業(yè)出版社課程內容第一講 SPSS基本知識及數(shù)據(jù)錄入一概述二SPSS的基本模塊三SPSS的基本窗口四SPSS文件類型五問卷及編碼六什么是數(shù)據(jù)七數(shù)據(jù)錄入問卷資料轉變?yōu)樵紨?shù)據(jù)文件(一)WORD中錄入(二)在 EXCEL中錄入數(shù)據(jù)(三)在SPSS中錄入(四)Epidat錄入(六)數(shù)據(jù)文件的編輯與管理第二講 SPSS命令文件的編寫 一 SPSS的命令文件(一)Data list(二)Variable label的命令格式(三)value label的命令格式 (四)程序中的缺少值(Missing Value命令) 第三講 用Frequencies做數(shù)據(jù)匯總一. 數(shù)據(jù)匯總使用的數(shù)據(jù)類型二頻次統(tǒng)計及統(tǒng)計量的計算(一)Statistics統(tǒng)計量(二)畫圖第四講 描述性統(tǒng)計(Descriptives與Explore的應用)一Descriptives(一)應用實例(二)統(tǒng)計量分析二Explore分析第五講 數(shù)據(jù)變換一Recode 命令對數(shù)據(jù)重新編碼二用Compute命令創(chuàng)建新變量三COUNT命令四用If命令做條件變換和邏輯校第六講 交叉匯總與關聯(lián)分析(Crosstabs的應用)一 交叉匯總表的一般形式及其特點二 交互表的檢驗兩個變量之間是否相關三 兩個變量之間相關的強度(一)定類定類(二)定序定序(三)定類定距(四)定距定距四運用CRPSSTABS做交互表及對變量之間的關系進行測量第七講 引進其他變量后的交互分析一 因果分析explanation model二 闡明分析Interpretation analysis三 條件分析 conditional analysis 第八講 描述子總體均值的差異(Means過程的應用)一Means過程運行二One Sample T-Test第九講 均值比較分析(TTest過程)一獨立樣本T檢驗二成對樣本T-TEST三注意事項 第十講 方差分析ANOVA一 實例二 解釋第十一講 相關分析(Correlate過程分析)一Bivariate Correlate二Partial correlation偏相關(也叫凈相關)三距離分析(Distance)第十二講 簡單線性相關(一元線性回歸分析)一回歸分析對變量的要求(假設條件)二一元線性回歸模型及其含義三在對話框中做一元線性回歸模型第十三講 SPSS統(tǒng)計圖形一Bar條形圖二Line線圖年齡與收入三Area面積圖四 Pie餅圖五 High-LOW 高低圖六Pareto 帕雷托圖七Control 控制圖八Boxplot 箱圖九Error Bar 誤差條圖十Scatter 散點圖十一.Histogram 直方圖十二P-P:P-P 概率圖十三Q-Q:Q-Q 概率圖十四Sequence 序列圖十五Time Series 時間序列圖第十四講 非參數(shù)檢驗SPSS數(shù)據(jù)分析技術第一講 SPSS基本知識及數(shù)據(jù)錄入一概述SPSS(statistical package for the social science)是美國SPSS公司開發(fā)的社會科學統(tǒng)計軟件,SPSS最初的幾個版本都是在DOS系統(tǒng)下運行,雖然功能比較強,但在用戶界面、輸入、輸出環(huán)境等方面并不十分理想。80年代末,Microsoft推出Windows后,SPSS迅速向Windows移植。90年代以來,由于MS Windows的普及,SPSS公司于1992、1993、1994年相繼推出了在Windows操作系統(tǒng)下的5.0, 6.0 6.1版本,隨著Windows95與WindowsNT3.5以上版本的32位操作系統(tǒng)的出現(xiàn),1997年以來又相繼推出了8.0,9.0,10.0及11.5版本。11.5版本的界面與10.0版本相比沒有什么變化,只是增加了一些統(tǒng)計功能和方法。與其他版本相比,11.5版本的用戶界面更為友好,使用更加方便,統(tǒng)計功能更為強大。它的基本特點有四個:1大多數(shù)操作是通過菜單、圖表按鈕、對話框完成,操作簡單方便;2命令語句、子命令、選擇項大部分通過對話框來進行,無需記憶大量的命令、過程與選擇項;3可以與其他數(shù)據(jù)轉換接口,其他軟件生成的數(shù)據(jù),可以轉化為SPSS數(shù)據(jù)4與其他Windows兼容,輸出結果可以復制到WORD,以便進一步編輯。二SPSS的啟動及基本模塊 BSPSS 11.0版一共由十個模塊組成 SPSS BaseAdvanced Models Regression Models Tables Trends Categories Conjoint Exact Tests Missing Value Analysis Maps三 SPSS的基本窗口(一)打開SPSS(二)基本窗口Data EditorFile 文件管理菜單,完成對數(shù)據(jù)文件的建立、讀取、存儲、打印等操作。Edit 文件編輯菜單,完成對數(shù)據(jù)文件的重新編輯、檢索、拷貝、剪貼與替換等操作。View 瀏覽編輯,完成文本或數(shù)據(jù)內容的狀態(tài)欄、工具欄、字體、網(wǎng)格線以及數(shù)值標簽等功能的操作。Data 數(shù)據(jù)管理,數(shù)據(jù)的選擇、排序菜單,包括對數(shù)據(jù)行的增加、合并、變量值的選擇等Transform 數(shù)據(jù)變換菜單,創(chuàng)建新變量、重新編碼、計算同值的次數(shù)等。Analyze 統(tǒng)計過程菜單,完成各種統(tǒng)計分析。Graphs 統(tǒng)計圖表,完成統(tǒng)計圖表的建立與編輯Utilities 實用程序,有關命令解釋、字體選擇、文件信息、定義輸出標題和窗口設計等。Windows 窗口控制,可進行窗口的排列、選擇和顯示操作Help 幫助文件, 幫助文件的調用、選擇和顯示等操作。(三)SPSS的其他窗口在SPSS的主窗口中還有兩個窗口,一個是數(shù)據(jù)管理窗口,其標題名稱是“Newdata”,且默認為激活狀態(tài)。數(shù)據(jù)管理器是一種典型的電子表格形式,用戶可通過定義變量名、格式化數(shù)據(jù)類型后輸入原始數(shù)值,并可根據(jù)需要對數(shù)據(jù)進行增刪、剪貼、修改、存儲等操作。另一個是結果輸出窗口,標題名稱是“!Output1”,啟動時為非活動窗口,只有當完成一項處理后,才在該窗口顯示處理過程提示和計算結果。當進行某項具體的統(tǒng)計方法操作時,可點擊對話框的“Paste”鈕激活命令編輯窗口,其標題名稱是“!Syntax1”,或選Window菜單的!Syntax1項也可激活命令編輯窗口。用戶可利用該窗口進行SPSS命令的輸入、編輯和運行,這對熟悉DOS版本的SPSS用戶是十分方便的。上述三個窗口在實際操作時,經(jīng)常因為內容很多,一個窗口中無法看到全部內容。有兩種方法可幫助用戶看到全部內容:1、使用窗口的滾動條 每個窗口的右側有一個垂直滾動條,用鼠標點擊滾動條上下兩頭的箭號鈕或用鼠標按住滾動條中的方塊上下拖動,可使窗口中的內容前后翻滾;底邊有一個水平滾動條,用鼠標點擊滾動條左右兩頭的箭號鈕或用鼠標按住滾動條中的方塊左右拖動,可使窗口中的內容左右移動。如此,用戶便可看清所有內容。2、改變窗口的大小 一般情況下,鼠標指針是一個朝左上方的箭頭,當把鼠標指針指向窗口邊界時,鼠標指針變成雙向箭頭形。這時,若按住鼠標左鍵移動,可改變窗口的大小,同樣可看清窗口內容。SPSS的退出完成SPSS的統(tǒng)計分析后,退出該系統(tǒng)的方法是:選File菜單的Exit項,回答系統(tǒng)提出的有關是否需要存儲原始數(shù)據(jù)、計算結果和SPSS命令之后,即退到Windows的程序管理器中。SPSS的求助系統(tǒng)SPSS提供了豐富且詳盡的在線幫助。主要有下列幾種方式:1、主窗口的Help菜單:在軟件運行的任何時候,點擊Help菜單選相關的子菜單,可得到所需的各種幫助。2、主窗口的Utilities菜單:在Utilities菜單中,有Command index.子菜單,它提供有關SPSS各項統(tǒng)計分析技術能解決什么問題的信息。3、各種對話框中的Help鈕:在具體操作過程中,當彈出某一對話框時,一般總有Help鈕,點擊該鈕,用戶可得到這一對話框選項內容的詳細幫助。4、結果輸出窗口中的Grossary鈕:當用戶在瀏覽計算結果時,可點擊結果輸出窗的Grossary鈕,它顯示各種專用統(tǒng)計術語的解釋信息以便用戶理解。5、命令編輯窗口中的Syntax鈕:激活命令編輯窗,可見一Syntax鈕,點擊該鈕,可得到與用戶正在編輯的命令相關的命令語法提示。四SPSS文件類型1原始數(shù)據(jù)文件及其類型*. Dat(原來還有ASCII碼)生成方法DOS中的EDITWORD中的TXTEXCEL中的XLSDBASE中的DBF以上形式的數(shù)據(jù)文件在SPSS中可以直接調用打開一個已有的數(shù)據(jù)文件的方式如下:2數(shù)據(jù)文件*SAV *SAS(原來)數(shù)據(jù)文件可以根據(jù)原始數(shù)據(jù)的轉換獲得3圖形文件 *CHT4命令文件 *SPS5結果文件 *SPO(OUTPUT, 原來是LST)五問卷及編碼1 多選擇題的處理(0,1編碼)2 多位題(要補位)3 缺失值,以9結尾,如年齡,編碼為99,如答案正好是9,以0替補4 不適用,以8結尾,8,98,998,如答案正好是8,以0替補。如有四個可選項的多選題而不適用,則為8888。六什么是數(shù)據(jù)數(shù)據(jù)是一個矩陣,行是一個case在多維空間下的位置,列是不同空間的維度用來分析用行收集到的資料。數(shù)據(jù)分析:用微觀的方法分析宏觀的資料,分析平均人、平均的體系;這個分析都是在平均的基礎上,這種推斷是不能還原到個案的,分析的過程是不斷拋棄個人影響的過程。數(shù)據(jù)的計算機表示法:變量-問卷中的每一個問題, 在dBASE中稱為字段(Field) 變量名-變量名以字母為首,后面跟A-Z, 0-9字符(字符8個字符), 變量名不能帶擴展名,如 A11。 變量值-變量的答案七數(shù)據(jù)錄入問卷資料轉變?yōu)樵紨?shù)據(jù)文件(一) WORD中錄入,存成TXT1方法:打開WORD文檔,錄入數(shù)據(jù)固定格式:這種數(shù)據(jù)要根據(jù)已經(jīng)確定的欄目位置對號入座地錄入數(shù)據(jù),在對問卷進行編碼時,指定了各個項目的數(shù)值與欄位(書P10),給數(shù)據(jù)指定欄目位置時,前后數(shù)據(jù)一般不留空格,這樣可以提高數(shù)據(jù)錄入的速度,缺點是前后的數(shù)據(jù)不太容易區(qū)分。如:欄位(列號)1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 0 0 0 0 1 2 2 6 1 5 0 00 0 0 0 2 2 3 1 4 0 0 自由格式P22:按照問卷編碼方案將某個個案數(shù)據(jù)直接錄入,中間可以沒有任何空格和其他符號,也可以在輸入時在不同的變量之間以空擋、逗號、分號等把變量分開,不同個案之間的數(shù)據(jù)要對齊,數(shù)據(jù)錄入完成以后,存成*TXT文件2把 TXT文件轉變?yōu)?SAV文件SPSSFile-Read Text Data-點選*TXT-對話框(六步),即Text Import Wizard-Fixed wide-No-下一步-The first case begins on which line-劃線即可-下一步完成SPSSFile-Read Text Data-點選*TXT-對話框(六步),即Text Import Wizard-Delimite-下一步-SPACE-下一步-完成如果特殊數(shù)據(jù)、負數(shù)、小數(shù)點多時,則不用這種方法,可以用EXCEL錄入。(二) 在 EXCEL中錄入數(shù)據(jù)打開EXCEL表不用補0,可以錄入漢字,速度較慢,一般在小樣本時用比較好。第一行錄入變量,第二行開始錄入數(shù)據(jù)文件保存類型:*XLS(工作簿BOOK)轉變?yōu)闉?SAV文件:SPSS-File-Open-Data-點選文件類型*XLS-點選BOOK-OK-存成SPSS的*SAV文件即可用EXCEL錄入的優(yōu)點:1可以進行各種計算,如數(shù)學與三角函數(shù)2可以進行位置計算,還可以直接COPY3可以用EXCEL做輔助分析,進行數(shù)據(jù)變換4可以作表,非常方便(三)在SPSS中錄入 直接在SPSS WIN中錄入數(shù)據(jù)方法:SPSSFILENEW DATA點選Data View(數(shù)據(jù)瀏覽界面)錄入數(shù)據(jù)存成*SAV,適合于較小的樣本在Data View(數(shù)據(jù)瀏覽界面)中錄入的數(shù)據(jù)還沒有在各個數(shù)據(jù)之間區(qū)分意義,可以在Variable View(變量瀏覽界面)中對錄入數(shù)據(jù)的意義進行界定,這個工作也可以在問卷數(shù)據(jù)錄入前做,也可以在數(shù)據(jù)錄入后做。點擊Variable View(變量瀏覽界面),對變量進行定義。定義變量有10種功能選項,1Name: 變量欄名,在這個欄目中輸入變量名,如 V1、V2、 age sex 或其他名稱。定義變量名注意:A變量名以字母為首,后面跟A-Z, 0-9字符(字符8個字符), ? ! / 等不能作為變量名, 變量名也不能帶擴展名,如 A11。B有些關鍵詞不能作為變量的名字,如 AND OR NOT EQ LT LE GT GE NE NE TO BYcrosstabs WITH ALL THRU P-Percentage SPSS中不區(qū)別大小寫字符 可以用中文做變量名,但最好不用,因為涉及一個兼容性問題。2Type:變量類型, 有8種類型可供選擇Numeric:數(shù)值型變量,系統(tǒng)默認值為數(shù)值型,系統(tǒng)默認長度為8,小數(shù)位數(shù)為2Comma:帶逗號的數(shù)值型變量,即整數(shù)部分每3位數(shù)加一逗號,其余定義方式同數(shù)值型。輸入:1,287,300,顯示:1,287,300Dot:帶圓點的數(shù)值型變量,3位加點數(shù)值型,無論數(shù)值大小,均以整數(shù)形式顯示,每3位加一小點(但不是小數(shù)點),可定義小數(shù)位置,但都顯示0,且小數(shù)點用逗號表示。如1.2345顯示為 12.345,00(實際是12345E-4). Scientific notion:科學記數(shù)法 輸入:253.7E2,輸出:253.7E2Date:日期型變量,有27種表示方法。點date即可以看到Dollar:貨幣型變量,有12種表示方法Custom currency: 自定義型變量,是一種用戶利用Edit 菜單的Options功能定義的。String:字符型變量一般最常用的是數(shù)字型變量與字符型變量。日期型變量格式:ddmmmyyyy 日日-月月月-年年年年mm/dd/yyyy 月月/日日/年年年年qQyyyy 季度Q年年年年mMmyy 月份年年 wWWKyy 周數(shù)WK年年hh:mm:ss 時時分分秒秒SPSS中存儲的實際上是該時間與1582年10月14日零點相差的秒數(shù),如1582年10月15日存儲的就是60602486400,在我們把變量類型變換為數(shù)值型時可以看到這種數(shù)字。如定date的類型為mm/dd/yyyy,輸入10/15/1582, 當我們把日期型數(shù)據(jù)轉變?yōu)閿?shù)值型數(shù)據(jù)時,看到數(shù)據(jù)變?yōu)?6400。貨幣型變量格式格式總長度小數(shù)位數(shù)$# 20$# #30$# # #40$# # # #72$# ,# # #60$# , # # # # #90$# # #,# # #,# # #,# # #160$# # #,# # #,# # #,# # # # #192要求:能夠辨別數(shù)值型、字符型與日期型變量就可以。3width:寬度,指的是運算寬度,默認值為8,運算寬度實際上只會改變輸出結果的顯示寬度,數(shù)據(jù)的存儲結果與運算的精度不受寬度的影響。4Decimals:小數(shù)位數(shù),根據(jù)每個變量數(shù)據(jù)的大小,定義小數(shù)的位數(shù)5Label :變量標簽, 給相應的變量以文字說明6values:數(shù)值標簽, value 1value 男add最后點OK7missing values缺失值,有三種選項No missing values 沒有缺失值Discrete missing values 定義13個單一數(shù)為缺失值Range plus optional discrete values 定義指定范圍為缺失值,同時指定另外一個不在這一范圍內的單一數(shù)為缺失值缺失值的意義是指某一項值數(shù)值缺失,軟件在進行統(tǒng)計時不將其考慮進去。用戶自己把特定的數(shù)據(jù)界定為缺失值,則為用戶缺失值user-missing. 如可以把把被調查者拒絕回答或者問題不合適而沒有回答的情況界定為用戶缺失值9 系統(tǒng)缺失值 system missing主要是指計算機默認的缺失方式,如果在錄入數(shù)據(jù)時空缺了某些數(shù)據(jù),計算機就把其界定為缺失值,這是的數(shù)據(jù)標記為 ,而用戶界定的缺失值則不會在數(shù)據(jù)顯示時出現(xiàn) 。8columns:定義數(shù)據(jù)管理器縱列的長度9字符排列方向:有三種選擇left左對齊right 右對齊center 居中10 measure:數(shù)據(jù)量度選擇,有三種:scale 連續(xù)型變量,是測量的最高層次。ordinal 定序型變量Nominal 定類型變量將變量定義完畢,點擊數(shù)據(jù)編輯窗口,定義的變量會自動地出現(xiàn)在窗口中。如何定義,進行操作演示數(shù)據(jù)錄入和變量定義完畢,可以將其存成*sav文件,然后就可以用這些數(shù)據(jù)進行統(tǒng)計分析(四)Epidat錄入http:/101/php/index.phphttp:/www.epidata.dk下載軟件Epidat建立數(shù)據(jù)描述文件建立數(shù)據(jù)文件數(shù)據(jù)錄入數(shù)據(jù)輸出*qes *rec dbase; excel;txt;data屏幕設計 邏輯校驗*chk 1 打開Epidat1Define data點選new qes file建立一個空的untitled1文件,qes是qustionaire的縮寫2把空文件untitled1文件存成一個你想要的文件名(如存成first.qes)方法:file菜單 save as 出來一個對話框把untitled1改成 first.qes3在空白的EpiEditor中錄入相當于變量名、變量標簽、變量值的界定錄入原則:A 必須有一個變量的名字,如V1, Sex, occupation等B 對變量進行描述,如V1 “個案號” “出生年月”等C 對變量錄入的定義說明:Shift +#號鍵變量有幾個碼,就打幾個#鍵V1 sex# 1:M 2:F V2 Income #4錄入完成以后存盤。File-save as -first.qes或Ctrl+S5看一下錄入變量的格式找preview the dataform(左邊工具欄第三個), 或按一下Ctral + T鍵。在屏幕上你可以看到變量的格式,這相當于預覽,在里面的空白處錄入東西沒有用。2 Make datafileMake datafileMake datafile默認 Enter name of qes Enter name of datafile(當然也可以改成自己喜歡的路徑,但qes 與rec不能改)點OK生成firstrec文件firstqes是數(shù)據(jù)描述文件,firstrec為建立了數(shù)據(jù)文件rec為record 的縮寫3Add Checks經(jīng)常出現(xiàn)Checks無法進入,碰到這種情況,點FileClose all, 把所有打開的文檔關閉即可)對錄入數(shù)據(jù)的方式進行某種專門的規(guī)定,如果沒有可修改的,則直接錄入數(shù)據(jù)修改檢查A Value label賦值(sex income等)B Range/legal規(guī)定變量值的范圍(10-80,99)C Jumps跳答1write 如果是回答1的 ,跳到職業(yè)(S2):錄入1S2D Must enter一定要錄入某個值(yes )E RepeatNo 一般選擇NO,把以前錄入的某個值在出現(xiàn)類似情況時進行復制。修改完成以后或邏輯校驗完成以后的數(shù)據(jù)存成fiestchk4Enter Data對話框找firstrec錄入完畢點File-close form5 Document6 Export data存成SPSS等7 打開SPSS- File-open-syntax-first.sps-select all-點黑-RUN(運行)點數(shù)據(jù)窗口-可以看到已經(jīng)轉換好的數(shù)據(jù)FILE-SAVE AS 存成SPSS的SAV文件。(五)數(shù)據(jù)文件的編輯與管理數(shù)據(jù)錄入完成以后,對數(shù)據(jù)進行編輯與管理非常重要,這可以為分析打下基礎。編輯與管理主要的操作有:1.增加新的變量(Insert Variable)激活待增加新變量區(qū)的那個變量, Data-Insert Variable,系統(tǒng)會自動為用戶插入一個新的變量var00001,用戶可以根據(jù)需要對其進行定義并錄入數(shù)據(jù)。2.增加新的個案(Insert case)如果要在第29個個案之前增加一個新的個案,可先激活第29個個案的任一單元格,然后點擊Data菜單中的Insert case, 系統(tǒng)會自動為用戶增加一個新的觀察行,默認為第29個個案,原來的第29個個案觀察值變?yōu)榈?0個觀察值,然后可以錄入數(shù)據(jù)。2.刪除一個變量列(Delete Variable)點選要刪除的列,點Edit菜單中的CUT或按Delete鍵3.刪除一個個案(delete case)點選要刪除的那個個案,點Edit菜單中的CUT或按Delete鍵4.查找個案(Go To Case)如果數(shù)據(jù)量很答,查找某一個觀察值就很有必要,如果想查找第10個觀察值,則點擊Data中的Go To Case, 出現(xiàn)對話框 case number 10-OK即可5.數(shù)據(jù)的排序(Sort Case)Ascending 升排序Descending 降排序可以對某一個變量為基準進行排序5. 數(shù)據(jù)的行列對換(Transpose) 點擊Data菜單中Transpose,出現(xiàn)對話框 對話框左側是需要轉換的變量,全部點擊進入對話框右側OK 轉換后的數(shù)據(jù)行列的位置發(fā)生了改變6.數(shù)據(jù)文件的拆分(Split File)在進行數(shù)據(jù)處理時經(jīng)常要對文件中的觀察值進行分組分析,如要求求出不同性別人員的平均收入,但是男女的收入數(shù)據(jù)是在一個數(shù)據(jù)文件中,在進行分析以前,可以對數(shù)據(jù)進行拆分,這里的拆分不是將一個數(shù)據(jù)分成兩個文件,而是進行按性別變量為基礎的排序,創(chuàng)造對男女收入數(shù)據(jù)進行分別分析的條件。 點擊Data菜單中的Split File,打開Split File對話框, 為了獲得對不同組別觀察值的各自分析,選擇Compare Groups選項,系統(tǒng)默認的是對數(shù)據(jù)文件中所有的觀察值進行分析,選擇性別進入Groups Based On對話框,指以性別作為分組的依據(jù)。在Groups Based On對話框下有兩個選項: File is already sorted指數(shù)據(jù)文件已經(jīng)按照選擇的變量排序;Sort the file by grouping variables是指要求按照所選擇的變量對數(shù)據(jù)文件進行排序,在本例選擇這一項。 然后點擊OK,即可完成對數(shù)據(jù)文件的拆分。7.數(shù)據(jù)文件的合并(Merge Files)合并數(shù)據(jù)文件包括兩種方式:一種是從外部數(shù)據(jù)文件中增加觀察量到當前數(shù)據(jù)文件中add cases; 另一種是從外部數(shù)據(jù)文件中增加變量到當前數(shù)據(jù)文件add variables. 將liu1sav的個案添加到liusavadd cases: 點擊Data-Merge File-add cases-彈出Add Cases: Read File對話框打開liu1sav彈出對話框Add Cases From D:liu1.sav對話框左側為不能匹配的變量,右側是可以匹配的變量,如果在合并時出現(xiàn)兩個數(shù)據(jù)文件的變量不能匹配的情況,就一定要對變量進行處理,使其能夠完全匹配,然后再進行合并。add variables:要將liu2sav中的變量橫向合并到liusav中去,以某個變量為基點將同源的兩部分數(shù)據(jù)連接在一起,一般是用ID或身份記號, * 原文件中的變量; +新文件中的變量。8 數(shù)據(jù)文件的分類匯總(Aggregate)9 對數(shù)據(jù)進行分類匯總就是按照指定的分類變量值對觀察值進行分組,對每組觀察量的各個變量求描述統(tǒng)計,生成新的數(shù)據(jù)文件,在新數(shù)據(jù)文件中對應分類變量的每一個值產(chǎn)生一個觀察量。如在liusav中要對30個人的身高、體重按照年齡、性別進行分類匯總,求平均值。具體操作為:Data-Aggregate-彈出Aggregate對話框將性別、年齡變量選入Break Variables框中,表示要以年齡、性別作為分組變量在Aggregate Variables框選入身高、體重,表示要將身高、體重進行匯總。系統(tǒng)會默認新的變量名,但是我們可以根據(jù)自己的需要對變量名進行變換。用Aggregate換可以進行其他很多計算,如 means of values:求平均值Standard deviation 標準差First value 只保留該組的第一個數(shù)值Minimum value 只保留該組的最小值Last Value 只保留該組的最后一個數(shù)值Maximum value 只保留該組的最大值Number of cases 合計該組的觀察數(shù)值Sum of values 求和Percentage above 先確定一個數(shù)值,求大于該數(shù)值的所有個案占總個案的百分比(%)Percentage below 先確定一個數(shù)值,求小于該數(shù)值的所有個案占總個案的百分比Fraction above 先確定一個數(shù)值,求大于該數(shù)值的所有個案占總個案的比例(0-1)Fraction below 先確定一個數(shù)值,求小于該數(shù)值的所有個案占總個案的比例(0-1)Percentage inside 先確定一個下限,再確定一個上限,求在該區(qū)間內個案占總個案的百分比(0-100%)Percentage outside先確定一個下限,再確定一個上限,求在該區(qū)間之外個案占總個案的百分比(0-100%)Fraction inside 先確定一個下限,再確定一個上限,求在該區(qū)間內個案占總個案的比例(0-1)Fraction outside 先確定一個下限,再確定一個上限,求在該區(qū)間內個案占總個案的比例(0-1)Aggregate命令非常有用,如我們入戶調查得到了一家人所有的資料,包括編號、年齡、收入。根據(jù)這些資料,我們可以計算家庭負擔系數(shù),即大于60歲和小于18歲的人口占家庭總人口的比例。DATA-Aggregate-age-per-outside Low 18 High 59-continue-新生成的變量即為家庭負擔系數(shù)還可以算年齡均值、人均月收入。選擇-percentage, value-1家庭人口數(shù)-INC-number of cases家庭總收入-INC- number of cases然后把這些新得到的變量存成默認值或者是你希望的文件,然后你可以看一下生成的到底是什么變量。 File -open-找文件-新生成的變量與一般調查得到的變量是一致的,因此可以進行匹配,這個時候可以用Merge命令9數(shù)據(jù)的選擇( S
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 某童裝品牌戰(zhàn)略咨詢計劃書
- 地理(山東青島卷)(A4考試版)
- 大班音樂歌唱春天幼兒讀物幼兒教育教育專區(qū)
- 上海虹口區(qū)2024-2025學年下學期七年級期末考試英語試題(含答案無聽力原文及音頻)
- 試劑分析性能評估模板資料講解
- 自動控制系統(tǒng)設計曲面印刷機
- 2025年遼寧省中考英語模擬試題(二)
- 【高中語文】《登岳陽樓》課件+統(tǒng)編版高一語文必修下冊
- 建筑施工特種作業(yè)-橋(門)式起重機司機真題庫-4
- 山東美術英文題目及答案
- 信息隱藏與數(shù)字水印課件(全)全書教學教程完整版電子教案最全幻燈片
- 304不銹鋼管材質證明書
- 預拌混凝土及原材料檢測理論考試題庫(含答案)
- 公開招聘社區(qū)居委專職工作人員考試筆試、面試題集及相關知識(11套試題含答案)
- 《植物生理學》課件第三章+植物的光合作用
- 游泳館網(wǎng)架翻新施工組織方案設計
- 有機化學所有的命名--超全.
- 引水罐的設計計算
- 三年級譯林版英語下學期按要求寫句子專項強化練習題
- 電纜接線工藝設計規(guī)范流程
- 中醫(yī)經(jīng)絡減肥課件
評論
0/150
提交評論