統(tǒng)計(jì)分析方法及應(yīng)用二章數(shù)據(jù)錄入與_第1頁(yè)
統(tǒng)計(jì)分析方法及應(yīng)用二章數(shù)據(jù)錄入與_第2頁(yè)
統(tǒng)計(jì)分析方法及應(yīng)用二章數(shù)據(jù)錄入與_第3頁(yè)
統(tǒng)計(jì)分析方法及應(yīng)用二章數(shù)據(jù)錄入與_第4頁(yè)
統(tǒng)計(jì)分析方法及應(yīng)用二章數(shù)據(jù)錄入與_第5頁(yè)
已閱讀5頁(yè),還剩61頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章

SPSS數(shù)據(jù)文件的建立與管理本章內(nèi)容SPSS數(shù)據(jù)文件

SPSS數(shù)據(jù)的結(jié)構(gòu)和定義方法

SPSS數(shù)據(jù)的錄入和編輯

SPSS數(shù)據(jù)的保存讀取其他格式的數(shù)據(jù)文件

SPSS數(shù)據(jù)文件的合并2.1SPSS數(shù)據(jù)文件2.1.1SPSS數(shù)據(jù)文件的特點(diǎn):SPSS是一個(gè)有別于其他文件的特殊格式的文件,SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件,它由數(shù)據(jù)結(jié)構(gòu)和內(nèi)容兩部分組成,其中的數(shù)據(jù)結(jié)構(gòu)記錄數(shù)據(jù)變量的名稱、類型、變量寬度、小數(shù)位數(shù)、變量名標(biāo)簽、變量值標(biāo)簽、缺失值、顯示寬度、對(duì)齊方式和度量尺度等必要信息,數(shù)據(jù)的內(nèi)容才是那些待分析的具體數(shù)據(jù)。基于上述特點(diǎn),建立SPSS數(shù)據(jù)文件時(shí)應(yīng)完成兩項(xiàng)任務(wù),即描述數(shù)據(jù)的結(jié)構(gòu)和錄入編輯數(shù)據(jù)。SPSS數(shù)據(jù)文件的特點(diǎn)SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件年級(jí)性別 問(wèn)題1…… 問(wèn)題n1 1 ………. 42 2 ……… 2 …………………...3 1 ………… 1文件結(jié)構(gòu)數(shù)據(jù)個(gè)案case變量名變量42.1.2SPSS數(shù)據(jù)的組織方式(1)原始數(shù)據(jù)的組織方式數(shù)據(jù)編輯窗口中的一行稱為一個(gè)個(gè)案或記錄(Case),所有個(gè)案組成SPSS數(shù)據(jù)文件的內(nèi)容。數(shù)據(jù)編輯窗口的一列稱為一個(gè)變量(Variable),每個(gè)變量都有一個(gè)名字,稱為變量名,它是訪問(wèn)和分析SPSS每個(gè)變量的唯一標(biāo)志。SPSS數(shù)據(jù)文件的結(jié)構(gòu)就是對(duì)每個(gè)變量及相關(guān)特征的描述。案例:住房狀況調(diào)查.sav(DataView)(2)計(jì)數(shù)數(shù)據(jù)的組織方式

如果所采集的數(shù)據(jù)不是原始的問(wèn)卷調(diào)查數(shù)據(jù),而是進(jìn)過(guò)分組匯總后的計(jì)數(shù)數(shù)據(jù),就采用計(jì)數(shù)數(shù)據(jù)的組織方式。

在計(jì)數(shù)數(shù)據(jù)的組織方式中,數(shù)據(jù)編輯窗口中的一行為變量的一個(gè)分組(或多變量交叉分組下的一個(gè)分組)。所有行囊括了該變量的多有分組情況(或多變量交叉下的所有分組情況)。數(shù)據(jù)編輯窗口中的一列依然是一個(gè)變量,代表某個(gè)問(wèn)題(或某個(gè)方面特征)以及相應(yīng)的計(jì)數(shù)結(jié)果。職稱:1、2、3、4分別表示教授、副教授、講師和助教年齡段:1、2、3分別表示35歲以下、36~49歲和50歲以上2.2SPSS數(shù)據(jù)的結(jié)構(gòu)和定義方法

SPSS數(shù)據(jù)的結(jié)構(gòu)是對(duì)SPSS每列變量及其相關(guān)屬性的描述,主要包括變量名、數(shù)據(jù)類型、變量寬度、變量名標(biāo)簽、變量值標(biāo)簽、顯示寬度、缺失值、對(duì)齊方式、度量尺度等信息。變量名(Variablename)變量名是變量訪問(wèn)和分析的唯一標(biāo)志。在定義SPSS數(shù)據(jù)結(jié)構(gòu)時(shí)應(yīng)首先給出每列變量的變量名。變量的命名規(guī)則如下:1.首字符應(yīng)以英文字母開頭,后面可以跟除了!、?、*之外的字母或數(shù)字。下劃線、圓點(diǎn)不能為變量名的最后一個(gè)字符。SPSS允許用漢字作為變量名。2.變量名的字符個(gè)數(shù)最好不多于8個(gè);變量名不區(qū)分大小寫字母。3.SPSS有默認(rèn)的變量名,以字母“VAR”開頭,后面補(bǔ)足5位數(shù)字,如VAR00001,VAR00012等。變量名不能與SPSS內(nèi)部特有的具有特定含義的保留字同名,如ALL,BY,AND,NOT,OR等。4.變量名最好與其代表的數(shù)據(jù)含義相對(duì)應(yīng),每個(gè)變量名必須具有唯一性。設(shè)計(jì)變量變量設(shè)計(jì)的基本原則不同觀察對(duì)象的數(shù)據(jù)不能在同一條記錄中出現(xiàn)每一個(gè)測(cè)量指標(biāo)/影響因素只能占據(jù)一列的位置,即同一個(gè)指標(biāo)的測(cè)量數(shù)值都應(yīng)當(dāng)錄入到同一個(gè)變量中去最終的數(shù)據(jù)集應(yīng)當(dāng)能夠包含原始數(shù)據(jù)的所有信息可以出現(xiàn)違反這些原則的例外情況,如重復(fù)測(cè)量數(shù)據(jù)具體的設(shè)計(jì)思路非調(diào)查問(wèn)卷數(shù)據(jù),需要根據(jù)具體的情況設(shè)計(jì)變量結(jié)構(gòu)對(duì)于調(diào)查表數(shù)據(jù)的錄入,問(wèn)題就要簡(jiǎn)單得多,往往一張調(diào)查表對(duì)應(yīng)了一個(gè)受訪者,大多數(shù)情況下也就對(duì)應(yīng)了一條記錄但是存在例外情況,特別是當(dāng)進(jìn)行重復(fù)測(cè)量時(shí)12數(shù)據(jù)類型(Type)數(shù)據(jù)類型是指每個(gè)變量取值的類型。SPSS中有三種基本數(shù)據(jù)類型:數(shù)值型、字符型和日期型。數(shù)值型(1)標(biāo)準(zhǔn)型(Numeric)(2)科學(xué)記數(shù)法型(ScientificNotation)(3)逗號(hào)型(Comma)(4)圓點(diǎn)型(Dot)(5)美元符號(hào)型(Dollar)(6)用戶自定義型(CustomCurrency)字符型(String)日期型(Date)標(biāo)準(zhǔn)數(shù)值型逗號(hào)數(shù)值型圓點(diǎn)數(shù)值型科學(xué)技術(shù)法數(shù)值型美元數(shù)值型用戶自定義型日期型圖示數(shù)值型數(shù)值型是SPSS最常用的數(shù)據(jù)類型,通常由阿拉伯?dāng)?shù)字和其它特殊符號(hào)等組成。其中的標(biāo)準(zhǔn)型(numeric)是SPSS默認(rèn)的數(shù)據(jù)類型,默認(rèn)的顯示寬度為8位,包括正負(fù)符號(hào)位、小數(shù)點(diǎn)和小數(shù)位在內(nèi),小數(shù)位默認(rèn)為2位。如果數(shù)據(jù)的實(shí)際寬度大于8位,spss將自動(dòng)按照科學(xué)計(jì)數(shù)法顯示,數(shù)據(jù)的顯示并不影響數(shù)據(jù)的存儲(chǔ),也不影響數(shù)據(jù)的計(jì)算。字符型(String)字符型也是SPSS較常用的數(shù)據(jù)類型,由一個(gè)字符串組成。如職工號(hào)碼、姓名、地址等變量都可以定義為字符型數(shù)據(jù)。字符型數(shù)據(jù)的默認(rèn)顯示寬度為8個(gè)字符,不能夠進(jìn)行算術(shù)運(yùn)算,并區(qū)分大小寫字母。字符型數(shù)據(jù)在SPSS命令處理過(guò)程中應(yīng)用一對(duì)雙引號(hào)括起來(lái),但在輸入數(shù)據(jù)時(shí)不應(yīng)輸入雙引號(hào),否則雙引號(hào)將會(huì)作為字符型數(shù)據(jù)的一部分。日期型(Data)日期型數(shù)據(jù)用來(lái)表示日期或者時(shí)間,如生日、成立日期等變量可以定義為日期型數(shù)據(jù)。顯示格式:dd-mmm-yyyy;mm/dd/yyyy。變量寬度(Width)、顯示寬度(Columns)

每種類型的變量都有自己的變量寬度、小數(shù)位和顯示寬度,其中變量寬度是變量允許的最大字符位數(shù),列寬度是數(shù)據(jù)編輯窗口中顯示每列的字符位數(shù)。通常這兩個(gè)寬度是一致的。變量名標(biāo)簽(Variablelabel)變量名標(biāo)簽是對(duì)變量名含義的進(jìn)一步解釋說(shuō)明,它可以增強(qiáng)變量名的可視性和統(tǒng)計(jì)分析結(jié)果的可讀性。變量名標(biāo)簽可用中文,總長(zhǎng)度可達(dá)120個(gè)字符,但在統(tǒng)計(jì)分析結(jié)果的顯示中一般不能顯示如此長(zhǎng)的變量名標(biāo)簽信息。變量值標(biāo)簽(Valuelabel)

變量值標(biāo)簽是對(duì)變量取值含義的解釋說(shuō)明信息,對(duì)于品質(zhì)型數(shù)據(jù)尤為重要,比如1代表男性,2代表女性,它不但明確了數(shù)據(jù)的含義,也增強(qiáng)了最后統(tǒng)計(jì)分析結(jié)果的可讀性,變量值標(biāo)簽可以用中文。缺失數(shù)據(jù)(Missingvalues)數(shù)據(jù)中存在明顯錯(cuò)誤或明顯不合理的數(shù)據(jù)或漏填數(shù)據(jù)項(xiàng)時(shí)統(tǒng)計(jì)學(xué)上稱為不完全數(shù)據(jù)或缺失數(shù)據(jù)。數(shù)據(jù)中如果存在缺失數(shù)據(jù),分析時(shí)通常不能直接采用,要進(jìn)行說(shuō)明。SPSS中說(shuō)明缺失數(shù)據(jù)的方法是指定用戶缺失值。這樣,SPSS在分析時(shí),就能夠?qū)⑦@些缺失值與正常的數(shù)據(jù)區(qū)分開來(lái),并依據(jù)用戶指定的缺失值處理策略對(duì)其進(jìn)行處理或分析。SPSS還有一類默認(rèn)的缺失值,稱為系統(tǒng)缺失值,數(shù)值型變量用圓點(diǎn)表示,字符型用空格表示。SPSS中說(shuō)明缺失數(shù)據(jù)的基本方法是指定用戶缺失值。用戶缺失值可以是:對(duì)字符型或數(shù)值型變量,用戶缺失值可以是1至3個(gè)特定的離散值(Discretemissingvalues);對(duì)一個(gè)數(shù)值型變量,用戶缺失值可以在一個(gè)連續(xù)的閉區(qū)間內(nèi)并同時(shí)再附加一個(gè)區(qū)間以外的離散值(Rangeplusoneoptionaldiscrete)。

變量對(duì)齊格式(Align)

定義顯示對(duì)齊方式,對(duì)齊方式分為右對(duì)齊、左對(duì)齊和中間對(duì)齊,系統(tǒng)中,數(shù)值型變量默認(rèn)為右對(duì)齊,字符型變量默認(rèn)為左對(duì)齊度量尺度(Measure)統(tǒng)計(jì)學(xué)依據(jù)數(shù)據(jù)的度量尺度將數(shù)據(jù)劃分為:定距數(shù)據(jù)(Scale),如身高、體重;定序數(shù)據(jù)(Ordinal),如職稱、職務(wù)、對(duì)某事物的贊同程度;定類數(shù)據(jù)(Nominal),如民族、宗教信仰、性別、黨派。(1)定距尺度(IntervalMeasurement):定矩尺度是對(duì)事物類別或次序之間間距的測(cè)度。如溫度。特點(diǎn):不僅能將事物區(qū)分為不同類型并進(jìn)行排序,而且可能準(zhǔn)確指出類別之間的差距是多少;定距變量通常以自然或物理單位為計(jì)量尺度,因此測(cè)量結(jié)果往往表現(xiàn)為數(shù)值,所以計(jì)量結(jié)果可以進(jìn)行加減運(yùn)算。(2)定序尺度(OrdinalMeasurement):定序尺度是對(duì)事物之間的等級(jí)或順序差別的一種測(cè)度,可比較優(yōu)劣或排序。用:序號(hào)(O)表示。如:1.教授2.副教授3.講師4.助教。特點(diǎn):由于定序變量只能側(cè)度類別之間的順序,無(wú)法測(cè)出類別之間的準(zhǔn)確差值,即測(cè)量數(shù)值不代表絕對(duì)的數(shù)量大小,所以其測(cè)量結(jié)果只能排序,不能進(jìn)行運(yùn)算。(3)定類尺度(NominalMeasurement):定類尺度是對(duì)事物的類別或?qū)傩缘囊环N測(cè)度,按照事物的某種屬性對(duì)其進(jìn)行分類或分組。用:名義(N)表示。如,1.男2.女特點(diǎn):其值僅代表了事物的類別和屬性,即能測(cè)度類別差異,不能比較各類之間的大小,所以各類之間沒有順序和等級(jí)。對(duì)定類尺度的變量只能計(jì)算頻數(shù)和頻率。在spss中,能適用定類尺度的數(shù)據(jù)可以是數(shù)值型,也可以是字符型變量。使用定類變量對(duì)事物進(jìn)行分類時(shí),必須符合窮盡原則和互斥原則。通常建立SPSS數(shù)據(jù)文件時(shí)應(yīng)首先定義數(shù)據(jù)的結(jié)構(gòu)部分,然后再輸入數(shù)據(jù),但實(shí)際應(yīng)用中,邊錄入、邊分析、邊修改數(shù)據(jù)結(jié)構(gòu)的情況也是常見的。數(shù)據(jù)的結(jié)構(gòu)定義完成之后,可以在VariableView卡片中瀏覽,也可以通過(guò)菜單選項(xiàng)Utilities/Variable來(lái)實(shí)現(xiàn)。2.3SPSS數(shù)據(jù)的錄入與編輯2.3.1錄入

定義好SPSS數(shù)據(jù)結(jié)構(gòu)后,可將具體的數(shù)據(jù)輸入到SPSS中,最終形成SPSS數(shù)據(jù)文件。SPSS數(shù)據(jù)的錄入操作在數(shù)據(jù)編輯窗口中的數(shù)據(jù)視圖(DataView中實(shí)現(xiàn)。其操作方法與EXCEL基本類似,也是以電子表格的方式進(jìn)行錄入。錄入帶有變量值標(biāo)簽的數(shù)據(jù)時(shí),可以在下拉按鈕中的值標(biāo)簽列表中選擇一個(gè)作為輸入?!緮?shù)據(jù)視圖】表可以直接輸入觀測(cè)數(shù)據(jù)值或存放數(shù)據(jù),表的左端列邊框顯示觀測(cè)個(gè)體的序號(hào),最上端行邊框顯示變量名?!咀兞恳晥D】表用來(lái)定義和修改變量的名稱、類型及其他屬性,如圖所示。如果輸入變量名后回車,將給出變量的默認(rèn)屬性。如果不定義變量的屬性,直接輸入數(shù)據(jù),系統(tǒng)將默認(rèn)變量Var00001,Var00002等。2.3.2SPSS數(shù)據(jù)的編輯數(shù)據(jù)必須輸入正確才能保證正確的分析結(jié)果。但很難一次輸入正確,所以就需要進(jìn)行修改,一般包括數(shù)據(jù)的定位、插入、刪除、修改、復(fù)制等。2.3.2.1SPSS數(shù)據(jù)的定位數(shù)據(jù)的定位目的是將當(dāng)前數(shù)據(jù)單元定位到某個(gè)特定的單元中。有兩種定位方式:

1、按個(gè)案號(hào)碼定位(1)將當(dāng)前單元定位在任何單元中。(2)【編輯】->【轉(zhuǎn)到個(gè)案】2、按變量值定位:(1)將當(dāng)前單元格定位在某變量列的任意一條個(gè)案上,如年齡變量(2)【編輯】-【查找】

于是,SPSS自動(dòng)對(duì)指定的變量進(jìn)行搜索,并將當(dāng)前單元定位于定位變量值相等的第一個(gè)個(gè)案上。2.3.2.2插入和刪除一個(gè)個(gè)案

1、插入一條個(gè)案

(1)將當(dāng)前數(shù)據(jù)單元定位在一條個(gè)案上。

(2)【編輯】-【插入個(gè)案】2、刪除一條個(gè)案

(1)在欲刪除的個(gè)案號(hào)碼上點(diǎn)擊左鍵

(2)點(diǎn)擊【清除】按變量值自動(dòng)定位按個(gè)案號(hào)碼自動(dòng)定位2.3.2.3插入和刪除一個(gè)變量

1、插入一個(gè)新變量

(1)將當(dāng)前數(shù)據(jù)單元定位在一個(gè)變量上。

(2)【編輯】-【插入變量】2、刪除一個(gè)變量

(1)在欲刪除的變量名上點(diǎn)擊左鍵

(2)點(diǎn)擊【清除】2.3.2.4數(shù)據(jù)的移動(dòng)、復(fù)制和刪除數(shù)據(jù)的移動(dòng)、復(fù)制和刪除:與一般的應(yīng)用程序相同選擇操作對(duì)象(變量、個(gè)案、若干連續(xù)單元等)剪切:【編輯】-【剪切】(Ctrl+X)復(fù)制:【編輯】-【復(fù)制】((Ctrl+C)粘貼:【編輯】-【粘貼】((Ctrl+V)2.4SPSS數(shù)據(jù)的保存2.4.1SPSS支持的數(shù)據(jù)格式

1、SPSS文件格式,擴(kuò)展名為.sav2、Excel格式文件,擴(kuò)展名為.xls3、dbf格式文件,擴(kuò)展名為.dbf4、文本格式文件,擴(kuò)展名為.dat將數(shù)據(jù)保存為SPSS數(shù)據(jù)文件或其他格式的數(shù)據(jù)文件的基本操作是:【文件】-【保存】,對(duì)于新的:提示文件名和類型;對(duì)于舊的,覆蓋原來(lái)的,不再提問(wèn);【文件】-【另存為】,另存一個(gè)數(shù)據(jù)文件,也有格式(類型)問(wèn)題;Variable按鈕允許用戶指定保存哪些變量,不保存哪些變量,變量名前畫叉的變量將被保存到磁盤中。將數(shù)據(jù)保存為Excel文件格式時(shí),Writevariablesnamestospreadsheet選項(xiàng)呈可用狀態(tài),它的作用是指定是否將SPSS變量名寫入Excel工作表的第一行上。2.5讀取其他格式的數(shù)據(jù)文件(Excel文件)SPSS能夠直接讀取其他格式的數(shù)據(jù)文件,并將其保存為SPSS格式的數(shù)據(jù)。1.直接讀取其他格式的數(shù)據(jù)文件:(1)選擇菜單【文件】-【打開】-【數(shù)據(jù)】;(2)選擇數(shù)據(jù)文件的類型,并輸入數(shù)據(jù)文件名。文件類型選擇Excel讀取Excel2.6SPSS數(shù)據(jù)文件的合并

SPSS中合并數(shù)據(jù)文件是指將一個(gè)(或多個(gè))已存儲(chǔ)在磁盤上的SPSS數(shù)據(jù)文件分別依次與SPSS數(shù)據(jù)編輯窗口中的數(shù)據(jù)合并。因此,實(shí)現(xiàn)兩個(gè)或多個(gè)SPSS數(shù)據(jù)文件的合并,應(yīng)首先將其中的某個(gè)數(shù)據(jù)文件讀入(打開)到數(shù)據(jù)編輯窗口中,然后依次與其他數(shù)據(jù)文件合并。SPSS提供了兩種合并數(shù)據(jù)文件的方式:

縱向合并和橫向合并縱向合并數(shù)據(jù)文件

案例:職工數(shù)據(jù).sav和追加職工.sav

(1)打開文件“職工數(shù)據(jù).sav”和“追加職工.sav”(2)對(duì)于文件“職工數(shù)據(jù).sav” 【數(shù)據(jù)】->【合并文件】->【添加個(gè)案】

選擇“追加職工.sav”,繼續(xù)。(3)【新的活動(dòng)數(shù)據(jù)集中的變量】中顯示的變量名是兩個(gè)數(shù)據(jù)文件中的同名變量名。(4)【非成對(duì)變量】中顯示的變量名是兩個(gè)數(shù)據(jù)文件中的不同名變量名。將sr(*)和e(+)配對(duì),將zc(*)和zc1(+)配對(duì),確定??v向合并后:由于兩份數(shù)據(jù)文件都有015號(hào)職工,SPSS將其合并時(shí)一并保留。由于數(shù)據(jù)“追加職工.sav”中沒有年齡、學(xué)歷和失業(yè)保險(xiǎn),因此合并后的數(shù)據(jù)為系統(tǒng)缺失值。添加的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論