




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、數(shù)據(jù)分析技術(shù)&SPSS16.01第二章數(shù)據(jù)的組織數(shù)據(jù)分析技術(shù)&SPSS16.02主要內(nèi)容主要內(nèi)容2.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.3 從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)2.4 SPSS數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并2.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 數(shù)據(jù)分析技術(shù)&SPSS16.032.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.1.1幾個基本概念幾個基本概念 表表2-1人員編號性別部門體檢日期體重健康狀況1女通信學(xué)院08/10/200455好2女計算機學(xué)院08/10/200446好3女外語學(xué)院08/10/200450一般4男通信學(xué)
2、院08/10/200456差5男管理學(xué)院08/11/200451差6男光電學(xué)院08/11/200453好7女光電學(xué)院08/11/200450一般8男通信學(xué)院08/12/200450好9女計算機學(xué)院08/12/200445一般10男管理學(xué)院08/13/200456好變量個案樣本 變量值數(shù)據(jù)分析技術(shù)&SPSS16.042.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.1.2統(tǒng)計數(shù)據(jù)的度量尺度統(tǒng)計數(shù)據(jù)的度量尺度觀測數(shù)據(jù):觀測數(shù)據(jù):是在自然的未被控制的條件下觀測到的數(shù)據(jù)。是在自然的未被控制的條件下觀測到的數(shù)據(jù)。如社會商品零售額、消費價格指數(shù)、汽車銷售額、如社會商品零售額、消費價格指數(shù)、汽車銷售額、降雨量等。
3、降雨量等。實驗數(shù)據(jù):實驗數(shù)據(jù):是通過抽樣調(diào)查,從研究對象全體中選取一部分是通過抽樣調(diào)查,從研究對象全體中選取一部分個體組成樣本,對樣本的觀測所得到的數(shù)據(jù)。個體組成樣本,對樣本的觀測所得到的數(shù)據(jù)。數(shù)量的度量:數(shù)量的度量:度量尺度(由低級向高級劃分):度量尺度(由低級向高級劃分):名義尺度名義尺度定序尺度定序尺度間隔尺度間隔尺度數(shù)據(jù)分析技術(shù)&SPSS16.052.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.1.2統(tǒng)計數(shù)據(jù)的度量尺度統(tǒng)計數(shù)據(jù)的度量尺度1、名義尺度(、名義尺度(Norminal)即定類尺度,它僅僅是一種標志,用于區(qū)分變量即定類尺度,它僅僅是一種標志,用于區(qū)分變量的不同值,類別數(shù)據(jù)之間沒有次
4、序關(guān)系。的不同值,類別數(shù)據(jù)之間沒有次序關(guān)系。如:人口的性別、商品的名稱、身份證、商店類如:人口的性別、商品的名稱、身份證、商店類型等。型等。特點:特點:僅測度了事物之間的類別差僅測度了事物之間的類別差所有類的地位相等,可以隨意排序所有類的地位相等,可以隨意排序計量結(jié)果可以且只能計算每一類各元素出現(xiàn)計量結(jié)果可以且只能計算每一類各元素出現(xiàn)的頻率的頻率符合窮盡和互斥原則符合窮盡和互斥原則變量取值可以是數(shù)值型,也可以是字符型變量取值可以是數(shù)值型,也可以是字符型數(shù)據(jù)分析技術(shù)&SPSS16.062.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.1.2統(tǒng)計數(shù)據(jù)的度量尺度統(tǒng)計數(shù)據(jù)的度量尺度2、定序尺度(、定序尺度(
5、Ordinal)是對事物之間等級或順序差別的一種測度。是對事物之間等級或順序差別的一種測度。如:考試成績(優(yōu)、良、中、差)、人的身高等級如:考試成績(優(yōu)、良、中、差)、人的身高等級(高、中、矮)、學(xué)歷等級(博士、碩士、學(xué)士)(高、中、矮)、學(xué)歷等級(博士、碩士、學(xué)士)等。等。特點:特點:可以測度類別差,還可以測度次序差可以測度類別差,還可以測度次序差但無法測出數(shù)據(jù)之間的準確差值但無法測出數(shù)據(jù)之間的準確差值計量結(jié)果只能排序,不能進行算術(shù)四則運算計量結(jié)果只能排序,不能進行算術(shù)四則運算變量取值可以是數(shù)值型、也可以是字符型變量取值可以是數(shù)值型、也可以是字符型數(shù)據(jù)分析技術(shù)&SPSS16.072.1 SP
6、SS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.1.2統(tǒng)計數(shù)據(jù)的度量尺度統(tǒng)計數(shù)據(jù)的度量尺度3、間隔尺度(、間隔尺度(Scale) 間隔尺度是指變量的取值是連續(xù)的區(qū)間。分為兩類。間隔尺度是指變量的取值是連續(xù)的區(qū)間。分為兩類。1)定距尺度()定距尺度(Interval),是對事物類別或次序之間),是對事物類別或次序之間間距的測度。間距的測度。如:如:100分制考試的成績、重量、溫度等。分制考試的成績、重量、溫度等。特點:可區(qū)分不同類型并排序,且可準確指出類別之間的特點:可區(qū)分不同類型并排序,且可準確指出類別之間的差距,并可以進行加減運算。差距,并可以進行加減運算。數(shù)據(jù)分析技術(shù)&SPSS16.082.1 SPSS數(shù)
7、據(jù)文件概述數(shù)據(jù)文件概述2.1.2統(tǒng)計數(shù)據(jù)的度量尺度統(tǒng)計數(shù)據(jù)的度量尺度3、間隔尺度(、間隔尺度(Scale) 間隔尺度是指變量的取值是連續(xù)的區(qū)間。分為兩類。間隔尺度是指變量的取值是連續(xù)的區(qū)間。分為兩類。2)定比尺度()定比尺度(Ratio),是指能夠測度值之間比值的),是指能夠測度值之間比值的一種計量尺度。一種計量尺度。如:員工的月收入、企業(yè)產(chǎn)值等。如:員工的月收入、企業(yè)產(chǎn)值等。特點:特點:其區(qū)間屬于同一階層;其區(qū)間屬于同一階層;計量結(jié)果也表現(xiàn)為數(shù)值;計量結(jié)果也表現(xiàn)為數(shù)值;具有其它三類測量尺度的所有優(yōu)秀,同時要計算兩個測量具有其它三類測量尺度的所有優(yōu)秀,同時要計算兩個測量值之間比值的特點。值之間
8、比值的特點??梢赃M行可以進行+、-、*、/等延伸運算。等延伸運算。數(shù)據(jù)分析技術(shù)&SPSS16.092.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.1.2統(tǒng)計數(shù)據(jù)的度量尺度統(tǒng)計數(shù)據(jù)的度量尺度 不同的度量尺度的統(tǒng)計數(shù)據(jù)在SPSS的數(shù)據(jù)文件中,對應(yīng)不同的變量數(shù)據(jù)類型。 名義尺度名義尺度-數(shù)值型、字符型數(shù)值型、字符型 定序尺度定序尺度-數(shù)值型、字符型數(shù)值型、字符型 間隔尺度間隔尺度-數(shù)值型數(shù)值型數(shù)據(jù)分析技術(shù)&SPSS16.010主要內(nèi)容主要內(nèi)容2.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.3 從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)2.4 SPSS數(shù)據(jù)文件的合
9、并數(shù)據(jù)文件的合并2.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 數(shù)據(jù)分析技術(shù)&SPSS16.0112.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立 SPSS數(shù)據(jù)文件的建立包括兩個方面,首先進行數(shù)據(jù)的結(jié)構(gòu)定義,其次錄入數(shù)據(jù)。2.2.1)數(shù)據(jù)的結(jié)構(gòu)定義)數(shù)據(jù)的結(jié)構(gòu)定義結(jié)構(gòu)定義包括:變量名(Name)、變量類型(Type)、變量寬度(Width)、小數(shù)位數(shù)(Decimals)、變量名標簽(Label)、變量值標簽(Values)、缺失值(Missing)、列寬(Columns)、對齊方式(Align)、變量的度量尺度(Measure)圖2.1數(shù)據(jù)分析技術(shù)&SPSS16.0122.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)
10、文件的建立2.2.1數(shù)據(jù)的結(jié)構(gòu)定義數(shù)據(jù)的結(jié)構(gòu)定義變量名(Name) 命名規(guī)則:變量名長度可多達64位建議控制在8位之內(nèi)且盡量避免中文中文說明可以放在Label欄中加以說明首字符應(yīng)以英文字母開頭,后面可以跟除了!、?、* 之外的字母或數(shù)字下劃線、圓點不能為變量名的最后一個字符變量名必須唯一且不區(qū)分大小寫字母允許漢字作為變量名,漢字總數(shù)一般不超過4個變量名不能與SPSS的保留字相同:all、by、eq、ge、gt、leIt、ne、not、or、to、with系統(tǒng)不區(qū)分變量名的大小寫數(shù)據(jù)分析技術(shù)&SPSS16.0132.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.1數(shù)據(jù)的結(jié)構(gòu)定義數(shù)據(jù)的結(jié)構(gòu)定義
11、變量類型(Type) 表2-2英文名英文名中文名中文名說明說明Numeric標準數(shù)值型變量標準數(shù)值型變量默認總長度默認總長度8位,小數(shù)位位,小數(shù)位2位。位。Comma帶逗號的數(shù)值型變帶逗號的數(shù)值型變量量默認總長度默認總長度8位,小數(shù)位位,小數(shù)位2位,其值在顯示時位,其值在顯示時整數(shù)部分從右至左每三位用一個逗號做分隔整數(shù)部分從右至左每三位用一個逗號做分隔符。符。Dot帶圓點的數(shù)值型變帶圓點的數(shù)值型變量量默認總長度默認總長度8位,小數(shù)位位,小數(shù)位2位,其值在顯示時位,其值在顯示時整數(shù)部分從右至左每三位用一個圓點做分隔整數(shù)部分從右至左每三位用一個圓點做分隔符。符。Scientific notatio
12、n科學(xué)記數(shù)法數(shù)值型科學(xué)記數(shù)法數(shù)值型變量變量默認總長度默認總長度8位,小數(shù)位位,小數(shù)位2位,變量值可以有位,變量值可以有指數(shù)部分也可以沒有。指數(shù)部分用指數(shù)部分也可以沒有。指數(shù)部分用E或或D表示表示且可帶正負號。且可帶正負號。Date日期型變量日期型變量既可表示日期又可表示時間,用戶可根據(jù)實既可表示日期又可表示時間,用戶可根據(jù)實際情況自行選擇。際情況自行選擇。Dollar美元符號型數(shù)值變美元符號型數(shù)值變量量主要用來表示貨幣數(shù)據(jù),在數(shù)據(jù)前附加美元主要用來表示貨幣數(shù)據(jù),在數(shù)據(jù)前附加美元符號符號$。Custom currency自定義數(shù)值型變量自定義數(shù)值型變量用戶可以自定義變量類型,但是此項一般不用戶可
13、以自定義變量類型,但是此項一般不用。用。String字符型變量字符型變量默認總長度為默認總長度為8位。位。數(shù)據(jù)分析技術(shù)&SPSS16.0142.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.1數(shù)據(jù)的結(jié)構(gòu)定義數(shù)據(jù)的結(jié)構(gòu)定義變量寬度(Width)設(shè)置變量寬度。一般無需調(diào)整,直接采取默認值。它的大小可通過Width欄后邊的微調(diào)按鈕調(diào)整小數(shù)位數(shù)(Decimals) 若變量類型為數(shù)值型,則可設(shè)置變量的小數(shù)位數(shù),其他類型的變量則不能設(shè)置。小數(shù)位數(shù)默認為兩位變量名標簽(Label)考慮到與老版本的兼容問題,變量名最好限制為8位以內(nèi),并且盡量避免中文,這就有可能不能完全描述清楚變量的信息,此時就可在標簽中對
14、變量名做進一步的說明。利用Label欄,不僅可以對變量詳細說明,而且還可以采用中文,大大方便了用戶對變量的理解。數(shù)據(jù)分析技術(shù)&SPSS16.0152.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.1數(shù)據(jù)的結(jié)構(gòu)定義數(shù)據(jù)的結(jié)構(gòu)定義 變量值標簽(Values)變量值標簽是對變量的可能取值附加的進一步說明,標簽內(nèi)容最多可以有120個字符,通常僅對類型或分類變量的取值指定值標簽例如,將變量Departmt定義為數(shù)值型變量時,可以按照表2-3中所規(guī)定它的值和值標簽,具體定義方法見圖2.2。變量值變量值標簽1通信學(xué)院2計算機學(xué)院3管理學(xué)院4光電學(xué)院5外語學(xué)院表2-3圖2.2數(shù)據(jù)分析技術(shù)&SPSS16.01
15、62.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.1數(shù)據(jù)的結(jié)構(gòu)定義數(shù)據(jù)的結(jié)構(gòu)定義缺失值(Missing)SPSS統(tǒng)計軟件的另一特點就是可以通過制定缺失值的方式來定義缺失數(shù)據(jù),這樣就可以更好地利用其他的有效數(shù)據(jù)。例:調(diào)查表中某欄沒填寫數(shù)據(jù)(缺失)學(xué)生年齡為60歲(數(shù)據(jù)不完整)數(shù)據(jù)分析技術(shù)&SPSS16.0172.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.1數(shù)據(jù)的結(jié)構(gòu)定義數(shù)據(jù)的結(jié)構(gòu)定義缺失值(Missing)處理方法(3種):No Missing Values:不指定缺失值Discrete missing values:離散型缺失值,對數(shù)值型或字符型變量,用指定1-3個特定的離散值Ran
16、ge plus one optional discrete missing value,對數(shù)值型變量,缺失值定義為一個連續(xù)的閉區(qū)間以內(nèi),外加一個離散值。數(shù)據(jù)分析技術(shù)&SPSS16.0182.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.1數(shù)據(jù)的結(jié)構(gòu)定義數(shù)據(jù)的結(jié)構(gòu)定義列寬(Columns) 定義變量在數(shù)據(jù)窗口中顯示的寬度。對齊方式(Align)定義變量值顯示的對齊方式,默認為左對齊。變量的度量尺度(Measure)(見2.1.2)根據(jù)統(tǒng)計數(shù)據(jù)的類型定義度量尺度,度量尺度在數(shù)據(jù)分析中的作用不是很明顯,但是如果用戶要進行交互式繪圖就必須定義好度量尺度。數(shù)據(jù)分析技術(shù)&SPSS16.0192.2 SP
17、SS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.2數(shù)據(jù)的錄入數(shù)據(jù)的錄入錄入數(shù)據(jù)的一般方法 逐行錄入(TAB鍵)逐列錄入(回車鍵)從Word或Excel中直接復(fù)制粘貼到數(shù)據(jù)文件中連續(xù)粘貼相同值數(shù)據(jù)分析技術(shù)&SPSS16.0202.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.2數(shù)據(jù)的錄入數(shù)據(jù)的錄入錄入帶有變量值標簽的數(shù)據(jù)輸入定義了變量值標簽的數(shù)據(jù)時,可以直接輸入變量值,也可以通過下拉列框的形式輸入,如圖2.3所示。圖2.3數(shù)據(jù)分析技術(shù)&SPSS16.0212.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.2數(shù)據(jù)的錄入數(shù)據(jù)的錄入實例P26-27數(shù)據(jù)分析技術(shù)&SPSS16.0222.2 SPSS數(shù)據(jù)文件
18、的建立數(shù)據(jù)文件的建立2.2.3數(shù)據(jù)的編輯數(shù)據(jù)的編輯數(shù)據(jù)定位按編號行或變量列定位按變量值查找定位變量、觀測量的插入與刪除插入、刪除一行(個案)插入、刪除一個列(變量)數(shù)據(jù)的剪切、復(fù)制和刪除數(shù)據(jù)分析技術(shù)&SPSS16.0232.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.4數(shù)據(jù)的保存數(shù)據(jù)的保存 SPSS支持的數(shù)據(jù)格式 保存操作數(shù)據(jù)分析技術(shù)&SPSS16.024主要內(nèi)容主要內(nèi)容2.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.3 從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)2.4 SPSS數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并2.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理
19、數(shù)據(jù)分析技術(shù)&SPSS16.0252.3 從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)(1)直接打開)直接打開 SPSS可直接打開很多類型的數(shù)據(jù)文件,選擇菜單FileOpenData,彈出Open File對話框,左鍵單擊“文件類型”,即可看到SPSS所能打開的數(shù)據(jù)文件類型,如表2-4所示。 表2-4文件擴展名具體描述SPSS(*.sav)當前版本SPSS16.0數(shù)據(jù)文件SPSS/PC+(*.sys)老版本SPSS數(shù)據(jù)文件Systat(*.syd *.sys)Systat格式數(shù)據(jù)文件SPSS Portable(*.por)SPSS的ASCII數(shù)據(jù)文件Excel(*.xls ,*.xlsx, *
20、.xlsm)各種版本的Excel數(shù)據(jù)文件,此種數(shù)據(jù)格式常用。Lotus(*.w*)Lotus數(shù)據(jù)文件Sylk(*.slk)Sylk數(shù)據(jù)文件dBase(*.dbf)dBase數(shù)據(jù)文件,F(xiàn)oxpro下的dbf文件需轉(zhuǎn)換為dBase文件才能打開SAS(*.sas7bat,*.sd7,*sd2,*.ssd01,*.xpt )各種版本和類型的SAS數(shù)據(jù)文件,一種統(tǒng)計學(xué)軟件的數(shù)據(jù)文件格式Stata(*.dta)Stata數(shù)據(jù)文件,一種統(tǒng)計軟件的數(shù)據(jù)文件格式Text(*.txt,*.dat)文本數(shù)據(jù)文件數(shù)據(jù)分析技術(shù)&SPSS16.0262.3 從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)(1)直接打開)直接
21、打開其中用的最多的是直接打開Excel的數(shù)據(jù)文件。在打開Excel格式的文件時,SPSS默認將Excel工作表中的全部數(shù)據(jù)讀到SPSS數(shù)據(jù)編輯窗口中,但也可指定僅讀取工作表某個區(qū)域內(nèi)的數(shù)據(jù)。如果Excel工作表文件第一行或指定讀取區(qū)域內(nèi)的第一行上存儲了變量名信息,則應(yīng)選擇打開對話框上的復(fù)選框“Read variable names form the first row of data”,即以工作表第一行或指定讀取區(qū)域內(nèi)的第一行上的文字信息作為SPSS的變量名;如果不選此項,SPSS的變量名將自動取名為V1、V2等。數(shù)據(jù)分析技術(shù)&SPSS16.0272.3 從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)從其他數(shù)據(jù)文件導(dǎo)
22、入數(shù)據(jù)(2)數(shù)據(jù)庫查詢方式)數(shù)據(jù)庫查詢方式 如果數(shù)據(jù)為數(shù)據(jù)庫格式的文件,可以同用數(shù)據(jù)庫查詢的方式導(dǎo)入數(shù)據(jù)到SPSS中。其操作步驟如下:第1步 選擇菜單FileOpen DatabaseNew Query,彈出Database Wizard窗口。這里顯示了所有可以打開的數(shù)據(jù)源類型。第2步 用戶根據(jù)打開文件的向?qū)нx擇要打開的文件類型并逐步打開文件。數(shù)據(jù)分析技術(shù)&SPSS16.0282.3 從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)(3)從文本文件導(dǎo)入)從文本文件導(dǎo)入 文本格式的數(shù)據(jù)文件是一種最通用格式的數(shù)據(jù)文件,SPSS提供了專門讀取文本文件的功能。選擇菜單FileRead Text Data,
23、彈出Open File對話框,選擇要導(dǎo)入的文本文件名后會出現(xiàn)文本數(shù)據(jù)的向?qū)?,該向?qū)且粋€分為6步的打開向?qū)В鶕?jù)文本文件的格式和導(dǎo)入數(shù)據(jù)的需求進行每一步的設(shè)置即可。數(shù)據(jù)分析技術(shù)&SPSS16.029主要內(nèi)容主要內(nèi)容2.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.3 從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)2.4 SPSS數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并2.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 數(shù)據(jù)分析技術(shù)&SPSS16.0302.4 SPSS數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并SPSS提供兩種形式的合并:一是橫向合并,從外部文件中增加變量到當前數(shù)據(jù)文件中;二是縱
24、向合并,指從外部數(shù)據(jù)文件中增加觀測量到當前數(shù)據(jù)文件中。V1V2V3V4+V1V2V3V4V1V2V1V2+V1V2橫向合并橫向合并縱向合并縱向合并數(shù)據(jù)分析技術(shù)&SPSS16.0312.4 SPSS數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并(1)橫向合并)橫向合并單擊單擊Browse按鈕按鈕選擇要合并的選擇要合并的SPSS數(shù)據(jù)文件的數(shù)據(jù)文件的文件名文件名從左邊文本框中選擇從左邊文本框中選擇需合并的變量到此框需合并的變量到此框中中圖2.4圖2.5數(shù)據(jù)分析技術(shù)&SPSS16.0322.4 SPSS數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并(2)縱向合并)縱向合并 縱向合并數(shù)據(jù)文件的操作方法同橫向合并的方縱向合并數(shù)據(jù)文件的操作方
25、法同橫向合并的方法類似,操作不再贅述,但需注意以下幾點:法類似,操作不再贅述,但需注意以下幾點:兩個待合并的兩個待合并的SPSS數(shù)據(jù)文件的內(nèi)容合并起來應(yīng)具有實數(shù)據(jù)文件的內(nèi)容合并起來應(yīng)具有實際意義;際意義;兩個數(shù)據(jù)文件的結(jié)構(gòu)最好一致;兩個數(shù)據(jù)文件的結(jié)構(gòu)最好一致;不同數(shù)據(jù)文件中含義相同的變量最好用相同的變量名,不同數(shù)據(jù)文件中含義相同的變量最好用相同的變量名,數(shù)據(jù)類型要相同數(shù)據(jù)類型要相同數(shù)據(jù)分析技術(shù)&SPSS16.033主要內(nèi)容主要內(nèi)容2.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.3 從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)2.4 SPSS數(shù)據(jù)文件的合并
26、數(shù)據(jù)文件的合并2.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 數(shù)據(jù)分析技術(shù)&SPSS16.0342.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 2.5.1觀測量排序觀測量排序2.5.2數(shù)據(jù)分類匯總數(shù)據(jù)分類匯總2.5.3數(shù)據(jù)文件的拆分數(shù)據(jù)文件的拆分2.5.4選擇觀測量選擇觀測量2.5.5觀測量加權(quán)觀測量加權(quán)2.5.6變量的變換和計算變量的變換和計算 圖2.6數(shù)據(jù)分析技術(shù)&SPSS16.0352.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 (1)觀測量排序)觀測量排序 圖2.6列出數(shù)據(jù)文件中的所有變量,從中選擇排序的關(guān)鍵變量先按“部門”升序排序,再按“體檢日期”升序排序數(shù)據(jù)分析技術(shù)&SPSS16.0362.5 SP
27、SS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 (2)分類匯總)分類匯總 選擇“產(chǎn)品”作為分類變量,匯總時按產(chǎn)品的類別進行匯總選擇“銷售量”作為匯總變量,將按產(chǎn)品分類計算銷售量的總和單擊該按鈕選擇匯總函數(shù),常用的有求和、平均值等。匯總函數(shù)設(shè)置匯總結(jié)果的存儲方式設(shè)置數(shù)據(jù)文件是否已排序,以提高匯總效率圖2.7數(shù)據(jù)分析技術(shù)&SPSS16.0372.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 匯總函數(shù)提供了大量統(tǒng)計學(xué)中專業(yè)的匯提供了大量統(tǒng)計學(xué)中專業(yè)的匯總函數(shù),是總函數(shù),是Excel中的分類匯中的分類匯總所不能完成的。總所不能完成的。數(shù)據(jù)分析技術(shù)&SPSS16.0382.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 (3)數(shù)據(jù)文件的拆
28、分)數(shù)據(jù)文件的拆分 數(shù)據(jù)拆分的目的 所謂的拆分并不是要把數(shù)據(jù)文件分成幾個,而是根據(jù)實際情況,根據(jù)變量對數(shù)據(jù)進行分組,為以后的分組統(tǒng)計分析提供便利數(shù)據(jù)分析技術(shù)&SPSS16.0392.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 (3)數(shù)據(jù)文件的拆分)數(shù)據(jù)文件的拆分 選項1:不拆分,也用于取消原來的拆分;選項2、3:對數(shù)據(jù)拆分,并選擇拆分的變量到“Groups Base on”框中。數(shù)據(jù)拆分后排序的方式圖2.8數(shù)據(jù)分析技術(shù)&SPSS16.0402.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 ( 3)數(shù)據(jù)文件的拆分)數(shù)據(jù)文件的拆分 Compare groups與Organize output by groups
29、的區(qū)別在于:前者將分組統(tǒng)計結(jié)果輸出在同一張表格中,以便于不同組之間的比較;后者將分組統(tǒng)計結(jié)果分別輸出在不同的表格中。通常選擇第一種輸出方式;若要取消數(shù)據(jù)拆分,只需選擇Analyze all cases, do not create groups;對數(shù)據(jù)可以進行多重拆分,類似于數(shù)據(jù)的多重排序,多重拆分的次序決定于選擇拆分變量的前后次序。數(shù)據(jù)分析技術(shù)&SPSS16.0412.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 (4)選擇觀測量)選擇觀測量選擇觀測量的目的 有時為了進行特定的分析,需要從所有的數(shù)據(jù)資料中選擇一些數(shù)據(jù)進行統(tǒng)計分析。例如:有學(xué)生的成績數(shù)據(jù),如果只分析男同學(xué)的成績,則要進行選擇觀測量為男
30、性的數(shù)據(jù)。數(shù)據(jù)分析技術(shù)&SPSS16.0422.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 (4)選擇觀測量)選擇觀測量1)All cases:所有的觀測量都被選擇,該:所有的觀測量都被選擇,該選項可用于解除原來的觀測量選擇。選項可用于解除原來的觀測量選擇。2)If condition is satisfied:表示按指定條:表示按指定條件選擇觀測量件選擇觀測量3)Random sample of cases:對觀測量進:對觀測量進行隨機抽樣,即對數(shù)據(jù)編輯窗口中的所有個行隨機抽樣,即對數(shù)據(jù)編輯窗口中的所有個案進行隨機篩選,包括兩種方式的隨機篩選,案進行隨機篩選,包括兩種方式的隨機篩選,一是近似抽樣(
31、一是近似抽樣(Approximately)即鍵入抽)即鍵入抽樣比例后由系統(tǒng)隨機抽取;二是精確抽樣樣比例后由系統(tǒng)隨機抽取;二是精確抽樣(Exactly)即要求從第幾個觀測量起抽取多)即要求從第幾個觀測量起抽取多少個。少個。4)Based on time or case range:順序抽:順序抽樣,單擊樣,單擊Range按鈕可以定義從第幾個觀按鈕可以定義從第幾個觀測量到第幾個觀測量測量到第幾個觀測量。5)Use filter variable:用指定的變量:用指定的變量(只能只能為數(shù)字型變量為數(shù)字型變量)作過濾,即依據(jù)過濾變量的取作過濾,即依據(jù)過濾變量的取值進行樣本選取,變量值為非值進行樣本選取
32、,變量值為非0或非系統(tǒng)缺失或非系統(tǒng)缺失值的個案將被選中。這種方法通常用于排除值的個案將被選中。這種方法通常用于排除包含系統(tǒng)缺失值的個案。包含系統(tǒng)缺失值的個案。設(shè)置被選擇個案的輸出形式:設(shè)置被選擇個案的輸出形式:1)生成一個名為)生成一個名為filter_$的的新變量,取值為新變量,取值為0或或1;2)選中的個案輸出到新的數(shù))選中的個案輸出到新的數(shù)據(jù)文件中據(jù)文件中圖2.9數(shù)據(jù)分析技術(shù)&SPSS16.0432.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 (5)觀測量加權(quán))觀測量加權(quán) 所謂權(quán)重是指同一個觀測量值在所有的觀測量里出現(xiàn)的次數(shù)或頻率。SPSS的觀測量加權(quán)功能是在數(shù)據(jù)文件中選擇一個變量,這個變量里
33、的值是相應(yīng)的觀測量出現(xiàn)的次數(shù),這個變量叫做權(quán)變量。 SPSS中指定加權(quán)變量的本質(zhì)是數(shù)據(jù)復(fù)制,例如表2-5是工人每天生產(chǎn)產(chǎn)品的數(shù)量,第一行數(shù)據(jù)表示當天生產(chǎn)產(chǎn)品 數(shù)量為20各的工人有3個,將“工人數(shù)”作為加權(quán)變量后,實際是將數(shù)據(jù)轉(zhuǎn)換成表2-6所示的數(shù)據(jù)進行分析。產(chǎn)品數(shù)量工人數(shù)203表2-5產(chǎn)品數(shù)量202020表2-6數(shù)據(jù)分析技術(shù)&SPSS16.0442.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 (5)觀測量加權(quán))觀測量加權(quán) 一旦指定了加權(quán)變量,在以后的分析處理中加權(quán)是一直有效的,直到取消加權(quán)為止;只有數(shù)值型的變量才能作為加權(quán)變量。數(shù)據(jù)分析技術(shù)&SPSS16.0452.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處
34、理 (6)變量的變換和計算)變量的變換和計算 在統(tǒng)計分析中,數(shù)據(jù)文件中的數(shù)據(jù)可能需要從原始數(shù)據(jù)計算得來的結(jié)果,有時需要統(tǒng)計一個觀測量滿足特定要求的那些變量值出現(xiàn)的次數(shù)等。在SPSS中,提供了強大的變量的變換及計算功能,針對這些變量值的變換整理的功能在菜單Transform中實現(xiàn),比較常用的數(shù)據(jù)轉(zhuǎn)換方法有:Compute:通過變量間的運算來轉(zhuǎn)換數(shù)據(jù),利用原始數(shù):通過變量間的運算來轉(zhuǎn)換數(shù)據(jù),利用原始數(shù)據(jù)計算一些特定的數(shù)值,組成一個新的變量;據(jù)計算一些特定的數(shù)值,組成一個新的變量;Visual Binning:對數(shù)據(jù)進行離散化處理,將數(shù)據(jù)文件:對數(shù)據(jù)進行離散化處理,將數(shù)據(jù)文件中一個或多個變量的取值按
35、照某種方式分成一定數(shù)目的組中一個或多個變量的取值按照某種方式分成一定數(shù)目的組段,并建立一個新的變量來記錄每個觀測值屬于那個組;段,并建立一個新的變量來記錄每個觀測值屬于那個組;Recode:變量重新賦值功能,通過修改變量值來轉(zhuǎn)換:變量重新賦值功能,通過修改變量值來轉(zhuǎn)換數(shù)據(jù),可以將原有變量的舊值更換為新值。數(shù)據(jù),可以將原有變量的舊值更換為新值。數(shù)據(jù)分析技術(shù)&SPSS16.0462.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 Compute 輸入新生成的變量的變量名輸入計算的式子SPSS中提供的用于計算的函數(shù),利用這些函數(shù)可以生成指定分布的隨機數(shù)、生成給定參數(shù)的概率密度函數(shù)等。 圖 2.10數(shù)據(jù)分析技術(shù)
36、&SPSS16.0472.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 Visual Binning 變量組的劃分實際上就是將連續(xù)變量離散化 ,例如:將百分制的分數(shù)轉(zhuǎn)換為用優(yōu)、良等表示的等級分數(shù)。利用SPSS16.0中提供的Visual Binning功能可方便地實現(xiàn)該種轉(zhuǎn)換。數(shù)據(jù)分析技術(shù)&SPSS16.0482.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 Visual Binning 見書見書Page 50例例2-6 將需要劃分組段的變量“評價結(jié)果”選擇到此框中。選擇TransformVisual Binning ,出現(xiàn)如圖2.11的界面圖2.11數(shù)據(jù)分析技術(shù)&SPSS16.0492.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 Visual Binn
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- JG/T 129-2007建筑門窗五金件滑輪
- JG/T 118-2000建筑隔震橡膠支座
- JG 135-2000雜物電梯
- DZ/T 0276.16-2015巖石物理力學(xué)性質(zhì)試驗規(guī)程第16部分:巖石體積電阻率和表面電阻率試驗
- DZ/T 0128-1994地下水資源數(shù)據(jù)文件格式
- CJ/T 238-2006耐熱聚乙烯(PE-RT)塑鋁穩(wěn)態(tài)復(fù)合管
- CJ/T 152-2016薄壁不銹鋼卡壓式和溝槽式管件
- 系統(tǒng)集成項目的創(chuàng)新思考試題及答案
- 初級社會工作者考試有效復(fù)習(xí)的試題及答案
- 終身學(xué)習(xí)的重要性與中級社會工作者考試的試題及答案
- 2024年徐州市小學(xué)六年級畢業(yè)抽測語文模擬試卷
- 《電力建設(shè)安全工作規(guī)程 第2部分:電力線路》
- 模板工程風(fēng)險辨識及防范措施
- 臨床輪轉(zhuǎn)出科個人小結(jié)
- 房建工程監(jiān)理大綱范本(內(nèi)容全面)
- 300立方米柴油儲罐設(shè)計
- 2024年湖北新華書店有限公司招聘筆試參考題庫含答案解析
- 社區(qū)警務(wù)培訓(xùn)課件
- 水平二障礙跑課程設(shè)計
- 退伍軍人登記表
- 電氣英文文獻+翻譯
評論
0/150
提交評論