版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)分析技術(shù)&SPSS16.01第二章數(shù)據(jù)的組織數(shù)據(jù)分析技術(shù)&SPSS16.02主要內(nèi)容主要內(nèi)容2.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.3 從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)2.4 SPSS數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并2.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 數(shù)據(jù)分析技術(shù)&SPSS16.032.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.1.1幾個(gè)基本概念幾個(gè)基本概念 表表2-1人員編號(hào)性別部門體檢日期體重健康狀況1女通信學(xué)院08/10/200455好2女計(jì)算機(jī)學(xué)院08/10/200446好3女外語(yǔ)學(xué)院08/10/200450一般4男通信學(xué)
2、院08/10/200456差5男管理學(xué)院08/11/200451差6男光電學(xué)院08/11/200453好7女光電學(xué)院08/11/200450一般8男通信學(xué)院08/12/200450好9女計(jì)算機(jī)學(xué)院08/12/200445一般10男管理學(xué)院08/13/200456好變量個(gè)案樣本 變量值數(shù)據(jù)分析技術(shù)&SPSS16.042.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.1.2統(tǒng)計(jì)數(shù)據(jù)的度量尺度統(tǒng)計(jì)數(shù)據(jù)的度量尺度觀測(cè)數(shù)據(jù):觀測(cè)數(shù)據(jù):是在自然的未被控制的條件下觀測(cè)到的數(shù)據(jù)。是在自然的未被控制的條件下觀測(cè)到的數(shù)據(jù)。如社會(huì)商品零售額、消費(fèi)價(jià)格指數(shù)、汽車銷售額、如社會(huì)商品零售額、消費(fèi)價(jià)格指數(shù)、汽車銷售額、降雨量等。
3、降雨量等。實(shí)驗(yàn)數(shù)據(jù):實(shí)驗(yàn)數(shù)據(jù):是通過(guò)抽樣調(diào)查,從研究對(duì)象全體中選取一部分是通過(guò)抽樣調(diào)查,從研究對(duì)象全體中選取一部分個(gè)體組成樣本,對(duì)樣本的觀測(cè)所得到的數(shù)據(jù)。個(gè)體組成樣本,對(duì)樣本的觀測(cè)所得到的數(shù)據(jù)。數(shù)量的度量:數(shù)量的度量:度量尺度(由低級(jí)向高級(jí)劃分):度量尺度(由低級(jí)向高級(jí)劃分):名義尺度名義尺度定序尺度定序尺度間隔尺度間隔尺度數(shù)據(jù)分析技術(shù)&SPSS16.052.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.1.2統(tǒng)計(jì)數(shù)據(jù)的度量尺度統(tǒng)計(jì)數(shù)據(jù)的度量尺度1、名義尺度(、名義尺度(Norminal)即定類尺度,它僅僅是一種標(biāo)志,用于區(qū)分變量即定類尺度,它僅僅是一種標(biāo)志,用于區(qū)分變量的不同值,類別數(shù)據(jù)之間沒(méi)有次
4、序關(guān)系。的不同值,類別數(shù)據(jù)之間沒(méi)有次序關(guān)系。如:人口的性別、商品的名稱、身份證、商店類如:人口的性別、商品的名稱、身份證、商店類型等。型等。特點(diǎn):特點(diǎn):僅測(cè)度了事物之間的類別差僅測(cè)度了事物之間的類別差所有類的地位相等,可以隨意排序所有類的地位相等,可以隨意排序計(jì)量結(jié)果可以且只能計(jì)算每一類各元素出現(xiàn)計(jì)量結(jié)果可以且只能計(jì)算每一類各元素出現(xiàn)的頻率的頻率符合窮盡和互斥原則符合窮盡和互斥原則變量取值可以是數(shù)值型,也可以是字符型變量取值可以是數(shù)值型,也可以是字符型數(shù)據(jù)分析技術(shù)&SPSS16.062.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.1.2統(tǒng)計(jì)數(shù)據(jù)的度量尺度統(tǒng)計(jì)數(shù)據(jù)的度量尺度2、定序尺度(、定序尺度(
5、Ordinal)是對(duì)事物之間等級(jí)或順序差別的一種測(cè)度。是對(duì)事物之間等級(jí)或順序差別的一種測(cè)度。如:考試成績(jī)(優(yōu)、良、中、差)、人的身高等級(jí)如:考試成績(jī)(優(yōu)、良、中、差)、人的身高等級(jí)(高、中、矮)、學(xué)歷等級(jí)(博士、碩士、學(xué)士)(高、中、矮)、學(xué)歷等級(jí)(博士、碩士、學(xué)士)等。等。特點(diǎn):特點(diǎn):可以測(cè)度類別差,還可以測(cè)度次序差可以測(cè)度類別差,還可以測(cè)度次序差但無(wú)法測(cè)出數(shù)據(jù)之間的準(zhǔn)確差值但無(wú)法測(cè)出數(shù)據(jù)之間的準(zhǔn)確差值計(jì)量結(jié)果只能排序,不能進(jìn)行算術(shù)四則運(yùn)算計(jì)量結(jié)果只能排序,不能進(jìn)行算術(shù)四則運(yùn)算變量取值可以是數(shù)值型、也可以是字符型變量取值可以是數(shù)值型、也可以是字符型數(shù)據(jù)分析技術(shù)&SPSS16.072.1 SP
6、SS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.1.2統(tǒng)計(jì)數(shù)據(jù)的度量尺度統(tǒng)計(jì)數(shù)據(jù)的度量尺度3、間隔尺度(、間隔尺度(Scale) 間隔尺度是指變量的取值是連續(xù)的區(qū)間。分為兩類。間隔尺度是指變量的取值是連續(xù)的區(qū)間。分為兩類。1)定距尺度()定距尺度(Interval),是對(duì)事物類別或次序之間),是對(duì)事物類別或次序之間間距的測(cè)度。間距的測(cè)度。如:如:100分制考試的成績(jī)、重量、溫度等。分制考試的成績(jī)、重量、溫度等。特點(diǎn):可區(qū)分不同類型并排序,且可準(zhǔn)確指出類別之間的特點(diǎn):可區(qū)分不同類型并排序,且可準(zhǔn)確指出類別之間的差距,并可以進(jìn)行加減運(yùn)算。差距,并可以進(jìn)行加減運(yùn)算。數(shù)據(jù)分析技術(shù)&SPSS16.082.1 SPSS數(shù)
7、據(jù)文件概述數(shù)據(jù)文件概述2.1.2統(tǒng)計(jì)數(shù)據(jù)的度量尺度統(tǒng)計(jì)數(shù)據(jù)的度量尺度3、間隔尺度(、間隔尺度(Scale) 間隔尺度是指變量的取值是連續(xù)的區(qū)間。分為兩類。間隔尺度是指變量的取值是連續(xù)的區(qū)間。分為兩類。2)定比尺度()定比尺度(Ratio),是指能夠測(cè)度值之間比值的),是指能夠測(cè)度值之間比值的一種計(jì)量尺度。一種計(jì)量尺度。如:?jiǎn)T工的月收入、企業(yè)產(chǎn)值等。如:?jiǎn)T工的月收入、企業(yè)產(chǎn)值等。特點(diǎn):特點(diǎn):其區(qū)間屬于同一階層;其區(qū)間屬于同一階層;計(jì)量結(jié)果也表現(xiàn)為數(shù)值;計(jì)量結(jié)果也表現(xiàn)為數(shù)值;具有其它三類測(cè)量尺度的所有優(yōu)秀,同時(shí)要計(jì)算兩個(gè)測(cè)量具有其它三類測(cè)量尺度的所有優(yōu)秀,同時(shí)要計(jì)算兩個(gè)測(cè)量值之間比值的特點(diǎn)。值之間
8、比值的特點(diǎn)。可以進(jìn)行可以進(jìn)行+、-、*、/等延伸運(yùn)算。等延伸運(yùn)算。數(shù)據(jù)分析技術(shù)&SPSS16.092.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.1.2統(tǒng)計(jì)數(shù)據(jù)的度量尺度統(tǒng)計(jì)數(shù)據(jù)的度量尺度 不同的度量尺度的統(tǒng)計(jì)數(shù)據(jù)在SPSS的數(shù)據(jù)文件中,對(duì)應(yīng)不同的變量數(shù)據(jù)類型。 名義尺度名義尺度-數(shù)值型、字符型數(shù)值型、字符型 定序尺度定序尺度-數(shù)值型、字符型數(shù)值型、字符型 間隔尺度間隔尺度-數(shù)值型數(shù)值型數(shù)據(jù)分析技術(shù)&SPSS16.010主要內(nèi)容主要內(nèi)容2.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.3 從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)2.4 SPSS數(shù)據(jù)文件的合
9、并數(shù)據(jù)文件的合并2.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 數(shù)據(jù)分析技術(shù)&SPSS16.0112.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立 SPSS數(shù)據(jù)文件的建立包括兩個(gè)方面,首先進(jìn)行數(shù)據(jù)的結(jié)構(gòu)定義,其次錄入數(shù)據(jù)。2.2.1)數(shù)據(jù)的結(jié)構(gòu)定義)數(shù)據(jù)的結(jié)構(gòu)定義結(jié)構(gòu)定義包括:變量名(Name)、變量類型(Type)、變量寬度(Width)、小數(shù)位數(shù)(Decimals)、變量名標(biāo)簽(Label)、變量值標(biāo)簽(Values)、缺失值(Missing)、列寬(Columns)、對(duì)齊方式(Align)、變量的度量尺度(Measure)圖2.1數(shù)據(jù)分析技術(shù)&SPSS16.0122.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)
10、文件的建立2.2.1數(shù)據(jù)的結(jié)構(gòu)定義數(shù)據(jù)的結(jié)構(gòu)定義變量名(Name) 命名規(guī)則:變量名長(zhǎng)度可多達(dá)64位建議控制在8位之內(nèi)且盡量避免中文中文說(shuō)明可以放在Label欄中加以說(shuō)明首字符應(yīng)以英文字母開頭,后面可以跟除了!、?、* 之外的字母或數(shù)字下劃線、圓點(diǎn)不能為變量名的最后一個(gè)字符變量名必須唯一且不區(qū)分大小寫字母允許漢字作為變量名,漢字總數(shù)一般不超過(guò)4個(gè)變量名不能與SPSS的保留字相同:all、by、eq、ge、gt、leIt、ne、not、or、to、with系統(tǒng)不區(qū)分變量名的大小寫數(shù)據(jù)分析技術(shù)&SPSS16.0132.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.1數(shù)據(jù)的結(jié)構(gòu)定義數(shù)據(jù)的結(jié)構(gòu)定義
11、變量類型(Type) 表2-2英文名英文名中文名中文名說(shuō)明說(shuō)明Numeric標(biāo)準(zhǔn)數(shù)值型變量標(biāo)準(zhǔn)數(shù)值型變量默認(rèn)總長(zhǎng)度默認(rèn)總長(zhǎng)度8位,小數(shù)位位,小數(shù)位2位。位。Comma帶逗號(hào)的數(shù)值型變帶逗號(hào)的數(shù)值型變量量默認(rèn)總長(zhǎng)度默認(rèn)總長(zhǎng)度8位,小數(shù)位位,小數(shù)位2位,其值在顯示時(shí)位,其值在顯示時(shí)整數(shù)部分從右至左每三位用一個(gè)逗號(hào)做分隔整數(shù)部分從右至左每三位用一個(gè)逗號(hào)做分隔符。符。Dot帶圓點(diǎn)的數(shù)值型變帶圓點(diǎn)的數(shù)值型變量量默認(rèn)總長(zhǎng)度默認(rèn)總長(zhǎng)度8位,小數(shù)位位,小數(shù)位2位,其值在顯示時(shí)位,其值在顯示時(shí)整數(shù)部分從右至左每三位用一個(gè)圓點(diǎn)做分隔整數(shù)部分從右至左每三位用一個(gè)圓點(diǎn)做分隔符。符。Scientific notatio
12、n科學(xué)記數(shù)法數(shù)值型科學(xué)記數(shù)法數(shù)值型變量變量默認(rèn)總長(zhǎng)度默認(rèn)總長(zhǎng)度8位,小數(shù)位位,小數(shù)位2位,變量值可以有位,變量值可以有指數(shù)部分也可以沒(méi)有。指數(shù)部分用指數(shù)部分也可以沒(méi)有。指數(shù)部分用E或或D表示表示且可帶正負(fù)號(hào)。且可帶正負(fù)號(hào)。Date日期型變量日期型變量既可表示日期又可表示時(shí)間,用戶可根據(jù)實(shí)既可表示日期又可表示時(shí)間,用戶可根據(jù)實(shí)際情況自行選擇。際情況自行選擇。Dollar美元符號(hào)型數(shù)值變美元符號(hào)型數(shù)值變量量主要用來(lái)表示貨幣數(shù)據(jù),在數(shù)據(jù)前附加美元主要用來(lái)表示貨幣數(shù)據(jù),在數(shù)據(jù)前附加美元符號(hào)符號(hào)$。Custom currency自定義數(shù)值型變量自定義數(shù)值型變量用戶可以自定義變量類型,但是此項(xiàng)一般不用戶可
13、以自定義變量類型,但是此項(xiàng)一般不用。用。String字符型變量字符型變量默認(rèn)總長(zhǎng)度為默認(rèn)總長(zhǎng)度為8位。位。數(shù)據(jù)分析技術(shù)&SPSS16.0142.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.1數(shù)據(jù)的結(jié)構(gòu)定義數(shù)據(jù)的結(jié)構(gòu)定義變量寬度(Width)設(shè)置變量寬度。一般無(wú)需調(diào)整,直接采取默認(rèn)值。它的大小可通過(guò)Width欄后邊的微調(diào)按鈕調(diào)整小數(shù)位數(shù)(Decimals) 若變量類型為數(shù)值型,則可設(shè)置變量的小數(shù)位數(shù),其他類型的變量則不能設(shè)置。小數(shù)位數(shù)默認(rèn)為兩位變量名標(biāo)簽(Label)考慮到與老版本的兼容問(wèn)題,變量名最好限制為8位以內(nèi),并且盡量避免中文,這就有可能不能完全描述清楚變量的信息,此時(shí)就可在標(biāo)簽中對(duì)
14、變量名做進(jìn)一步的說(shuō)明。利用Label欄,不僅可以對(duì)變量詳細(xì)說(shuō)明,而且還可以采用中文,大大方便了用戶對(duì)變量的理解。數(shù)據(jù)分析技術(shù)&SPSS16.0152.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.1數(shù)據(jù)的結(jié)構(gòu)定義數(shù)據(jù)的結(jié)構(gòu)定義 變量值標(biāo)簽(Values)變量值標(biāo)簽是對(duì)變量的可能取值附加的進(jìn)一步說(shuō)明,標(biāo)簽內(nèi)容最多可以有120個(gè)字符,通常僅對(duì)類型或分類變量的取值指定值標(biāo)簽例如,將變量Departmt定義為數(shù)值型變量時(shí),可以按照表2-3中所規(guī)定它的值和值標(biāo)簽,具體定義方法見(jiàn)圖2.2。變量值變量值標(biāo)簽1通信學(xué)院2計(jì)算機(jī)學(xué)院3管理學(xué)院4光電學(xué)院5外語(yǔ)學(xué)院表2-3圖2.2數(shù)據(jù)分析技術(shù)&SPSS16.01
15、62.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.1數(shù)據(jù)的結(jié)構(gòu)定義數(shù)據(jù)的結(jié)構(gòu)定義缺失值(Missing)SPSS統(tǒng)計(jì)軟件的另一特點(diǎn)就是可以通過(guò)制定缺失值的方式來(lái)定義缺失數(shù)據(jù),這樣就可以更好地利用其他的有效數(shù)據(jù)。例:調(diào)查表中某欄沒(méi)填寫數(shù)據(jù)(缺失)學(xué)生年齡為60歲(數(shù)據(jù)不完整)數(shù)據(jù)分析技術(shù)&SPSS16.0172.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.1數(shù)據(jù)的結(jié)構(gòu)定義數(shù)據(jù)的結(jié)構(gòu)定義缺失值(Missing)處理方法(3種):No Missing Values:不指定缺失值Discrete missing values:離散型缺失值,對(duì)數(shù)值型或字符型變量,用指定1-3個(gè)特定的離散值Ran
16、ge plus one optional discrete missing value,對(duì)數(shù)值型變量,缺失值定義為一個(gè)連續(xù)的閉區(qū)間以內(nèi),外加一個(gè)離散值。數(shù)據(jù)分析技術(shù)&SPSS16.0182.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.1數(shù)據(jù)的結(jié)構(gòu)定義數(shù)據(jù)的結(jié)構(gòu)定義列寬(Columns) 定義變量在數(shù)據(jù)窗口中顯示的寬度。對(duì)齊方式(Align)定義變量值顯示的對(duì)齊方式,默認(rèn)為左對(duì)齊。變量的度量尺度(Measure)(見(jiàn)2.1.2)根據(jù)統(tǒng)計(jì)數(shù)據(jù)的類型定義度量尺度,度量尺度在數(shù)據(jù)分析中的作用不是很明顯,但是如果用戶要進(jìn)行交互式繪圖就必須定義好度量尺度。數(shù)據(jù)分析技術(shù)&SPSS16.0192.2 SP
17、SS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.2數(shù)據(jù)的錄入數(shù)據(jù)的錄入錄入數(shù)據(jù)的一般方法 逐行錄入(TAB鍵)逐列錄入(回車鍵)從Word或Excel中直接復(fù)制粘貼到數(shù)據(jù)文件中連續(xù)粘貼相同值數(shù)據(jù)分析技術(shù)&SPSS16.0202.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.2數(shù)據(jù)的錄入數(shù)據(jù)的錄入錄入帶有變量值標(biāo)簽的數(shù)據(jù)輸入定義了變量值標(biāo)簽的數(shù)據(jù)時(shí),可以直接輸入變量值,也可以通過(guò)下拉列框的形式輸入,如圖2.3所示。圖2.3數(shù)據(jù)分析技術(shù)&SPSS16.0212.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.2數(shù)據(jù)的錄入數(shù)據(jù)的錄入實(shí)例P26-27數(shù)據(jù)分析技術(shù)&SPSS16.0222.2 SPSS數(shù)據(jù)文件
18、的建立數(shù)據(jù)文件的建立2.2.3數(shù)據(jù)的編輯數(shù)據(jù)的編輯數(shù)據(jù)定位按編號(hào)行或變量列定位按變量值查找定位變量、觀測(cè)量的插入與刪除插入、刪除一行(個(gè)案)插入、刪除一個(gè)列(變量)數(shù)據(jù)的剪切、復(fù)制和刪除數(shù)據(jù)分析技術(shù)&SPSS16.0232.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.2.4數(shù)據(jù)的保存數(shù)據(jù)的保存 SPSS支持的數(shù)據(jù)格式 保存操作數(shù)據(jù)分析技術(shù)&SPSS16.024主要內(nèi)容主要內(nèi)容2.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.3 從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)2.4 SPSS數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并2.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理
19、數(shù)據(jù)分析技術(shù)&SPSS16.0252.3 從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)(1)直接打開)直接打開 SPSS可直接打開很多類型的數(shù)據(jù)文件,選擇菜單FileOpenData,彈出Open File對(duì)話框,左鍵單擊“文件類型”,即可看到SPSS所能打開的數(shù)據(jù)文件類型,如表2-4所示。 表2-4文件擴(kuò)展名具體描述SPSS(*.sav)當(dāng)前版本SPSS16.0數(shù)據(jù)文件SPSS/PC+(*.sys)老版本SPSS數(shù)據(jù)文件Systat(*.syd *.sys)Systat格式數(shù)據(jù)文件SPSS Portable(*.por)SPSS的ASCII數(shù)據(jù)文件Excel(*.xls ,*.xlsx, *
20、.xlsm)各種版本的Excel數(shù)據(jù)文件,此種數(shù)據(jù)格式常用。Lotus(*.w*)Lotus數(shù)據(jù)文件Sylk(*.slk)Sylk數(shù)據(jù)文件dBase(*.dbf)dBase數(shù)據(jù)文件,F(xiàn)oxpro下的dbf文件需轉(zhuǎn)換為dBase文件才能打開SAS(*.sas7bat,*.sd7,*sd2,*.ssd01,*.xpt )各種版本和類型的SAS數(shù)據(jù)文件,一種統(tǒng)計(jì)學(xué)軟件的數(shù)據(jù)文件格式Stata(*.dta)Stata數(shù)據(jù)文件,一種統(tǒng)計(jì)軟件的數(shù)據(jù)文件格式Text(*.txt,*.dat)文本數(shù)據(jù)文件數(shù)據(jù)分析技術(shù)&SPSS16.0262.3 從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)(1)直接打開)直接
21、打開其中用的最多的是直接打開Excel的數(shù)據(jù)文件。在打開Excel格式的文件時(shí),SPSS默認(rèn)將Excel工作表中的全部數(shù)據(jù)讀到SPSS數(shù)據(jù)編輯窗口中,但也可指定僅讀取工作表某個(gè)區(qū)域內(nèi)的數(shù)據(jù)。如果Excel工作表文件第一行或指定讀取區(qū)域內(nèi)的第一行上存儲(chǔ)了變量名信息,則應(yīng)選擇打開對(duì)話框上的復(fù)選框“Read variable names form the first row of data”,即以工作表第一行或指定讀取區(qū)域內(nèi)的第一行上的文字信息作為SPSS的變量名;如果不選此項(xiàng),SPSS的變量名將自動(dòng)取名為V1、V2等。數(shù)據(jù)分析技術(shù)&SPSS16.0272.3 從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)從其他數(shù)據(jù)文件導(dǎo)
22、入數(shù)據(jù)(2)數(shù)據(jù)庫(kù)查詢方式)數(shù)據(jù)庫(kù)查詢方式 如果數(shù)據(jù)為數(shù)據(jù)庫(kù)格式的文件,可以同用數(shù)據(jù)庫(kù)查詢的方式導(dǎo)入數(shù)據(jù)到SPSS中。其操作步驟如下:第1步 選擇菜單FileOpen DatabaseNew Query,彈出Database Wizard窗口。這里顯示了所有可以打開的數(shù)據(jù)源類型。第2步 用戶根據(jù)打開文件的向?qū)нx擇要打開的文件類型并逐步打開文件。數(shù)據(jù)分析技術(shù)&SPSS16.0282.3 從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)(3)從文本文件導(dǎo)入)從文本文件導(dǎo)入 文本格式的數(shù)據(jù)文件是一種最通用格式的數(shù)據(jù)文件,SPSS提供了專門讀取文本文件的功能。選擇菜單FileRead Text Data,
23、彈出Open File對(duì)話框,選擇要導(dǎo)入的文本文件名后會(huì)出現(xiàn)文本數(shù)據(jù)的向?qū)?,該向?qū)且粋€(gè)分為6步的打開向?qū)?,根?jù)文本文件的格式和導(dǎo)入數(shù)據(jù)的需求進(jìn)行每一步的設(shè)置即可。數(shù)據(jù)分析技術(shù)&SPSS16.029主要內(nèi)容主要內(nèi)容2.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.3 從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)2.4 SPSS數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并2.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 數(shù)據(jù)分析技術(shù)&SPSS16.0302.4 SPSS數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并SPSS提供兩種形式的合并:一是橫向合并,從外部文件中增加變量到當(dāng)前數(shù)據(jù)文件中;二是縱
24、向合并,指從外部數(shù)據(jù)文件中增加觀測(cè)量到當(dāng)前數(shù)據(jù)文件中。V1V2V3V4+V1V2V3V4V1V2V1V2+V1V2橫向合并橫向合并縱向合并縱向合并數(shù)據(jù)分析技術(shù)&SPSS16.0312.4 SPSS數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并(1)橫向合并)橫向合并單擊單擊Browse按鈕按鈕選擇要合并的選擇要合并的SPSS數(shù)據(jù)文件的數(shù)據(jù)文件的文件名文件名從左邊文本框中選擇從左邊文本框中選擇需合并的變量到此框需合并的變量到此框中中圖2.4圖2.5數(shù)據(jù)分析技術(shù)&SPSS16.0322.4 SPSS數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并(2)縱向合并)縱向合并 縱向合并數(shù)據(jù)文件的操作方法同橫向合并的方縱向合并數(shù)據(jù)文件的操作方
25、法同橫向合并的方法類似,操作不再贅述,但需注意以下幾點(diǎn):法類似,操作不再贅述,但需注意以下幾點(diǎn):兩個(gè)待合并的兩個(gè)待合并的SPSS數(shù)據(jù)文件的內(nèi)容合并起來(lái)應(yīng)具有實(shí)數(shù)據(jù)文件的內(nèi)容合并起來(lái)應(yīng)具有實(shí)際意義;際意義;兩個(gè)數(shù)據(jù)文件的結(jié)構(gòu)最好一致;兩個(gè)數(shù)據(jù)文件的結(jié)構(gòu)最好一致;不同數(shù)據(jù)文件中含義相同的變量最好用相同的變量名,不同數(shù)據(jù)文件中含義相同的變量最好用相同的變量名,數(shù)據(jù)類型要相同數(shù)據(jù)類型要相同數(shù)據(jù)分析技術(shù)&SPSS16.033主要內(nèi)容主要內(nèi)容2.1 SPSS數(shù)據(jù)文件概述數(shù)據(jù)文件概述2.2 SPSS數(shù)據(jù)文件的建立數(shù)據(jù)文件的建立2.3 從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)2.4 SPSS數(shù)據(jù)文件的合并
26、數(shù)據(jù)文件的合并2.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 數(shù)據(jù)分析技術(shù)&SPSS16.0342.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 2.5.1觀測(cè)量排序觀測(cè)量排序2.5.2數(shù)據(jù)分類匯總數(shù)據(jù)分類匯總2.5.3數(shù)據(jù)文件的拆分?jǐn)?shù)據(jù)文件的拆分2.5.4選擇觀測(cè)量選擇觀測(cè)量2.5.5觀測(cè)量加權(quán)觀測(cè)量加權(quán)2.5.6變量的變換和計(jì)算變量的變換和計(jì)算 圖2.6數(shù)據(jù)分析技術(shù)&SPSS16.0352.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 (1)觀測(cè)量排序)觀測(cè)量排序 圖2.6列出數(shù)據(jù)文件中的所有變量,從中選擇排序的關(guān)鍵變量先按“部門”升序排序,再按“體檢日期”升序排序數(shù)據(jù)分析技術(shù)&SPSS16.0362.5 SP
27、SS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 (2)分類匯總)分類匯總 選擇“產(chǎn)品”作為分類變量,匯總時(shí)按產(chǎn)品的類別進(jìn)行匯總選擇“銷售量”作為匯總變量,將按產(chǎn)品分類計(jì)算銷售量的總和單擊該按鈕選擇匯總函數(shù),常用的有求和、平均值等。匯總函數(shù)設(shè)置匯總結(jié)果的存儲(chǔ)方式設(shè)置數(shù)據(jù)文件是否已排序,以提高匯總效率圖2.7數(shù)據(jù)分析技術(shù)&SPSS16.0372.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 匯總函數(shù)提供了大量統(tǒng)計(jì)學(xué)中專業(yè)的匯提供了大量統(tǒng)計(jì)學(xué)中專業(yè)的匯總函數(shù),是總函數(shù),是Excel中的分類匯中的分類匯總所不能完成的。總所不能完成的。數(shù)據(jù)分析技術(shù)&SPSS16.0382.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 (3)數(shù)據(jù)文件的拆
28、分)數(shù)據(jù)文件的拆分 數(shù)據(jù)拆分的目的 所謂的拆分并不是要把數(shù)據(jù)文件分成幾個(gè),而是根據(jù)實(shí)際情況,根據(jù)變量對(duì)數(shù)據(jù)進(jìn)行分組,為以后的分組統(tǒng)計(jì)分析提供便利數(shù)據(jù)分析技術(shù)&SPSS16.0392.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 (3)數(shù)據(jù)文件的拆分)數(shù)據(jù)文件的拆分 選項(xiàng)1:不拆分,也用于取消原來(lái)的拆分;選項(xiàng)2、3:對(duì)數(shù)據(jù)拆分,并選擇拆分的變量到“Groups Base on”框中。數(shù)據(jù)拆分后排序的方式圖2.8數(shù)據(jù)分析技術(shù)&SPSS16.0402.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 ( 3)數(shù)據(jù)文件的拆分)數(shù)據(jù)文件的拆分 Compare groups與Organize output by groups
29、的區(qū)別在于:前者將分組統(tǒng)計(jì)結(jié)果輸出在同一張表格中,以便于不同組之間的比較;后者將分組統(tǒng)計(jì)結(jié)果分別輸出在不同的表格中。通常選擇第一種輸出方式;若要取消數(shù)據(jù)拆分,只需選擇Analyze all cases, do not create groups;對(duì)數(shù)據(jù)可以進(jìn)行多重拆分,類似于數(shù)據(jù)的多重排序,多重拆分的次序決定于選擇拆分變量的前后次序。數(shù)據(jù)分析技術(shù)&SPSS16.0412.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 (4)選擇觀測(cè)量)選擇觀測(cè)量選擇觀測(cè)量的目的 有時(shí)為了進(jìn)行特定的分析,需要從所有的數(shù)據(jù)資料中選擇一些數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。例如:有學(xué)生的成績(jī)數(shù)據(jù),如果只分析男同學(xué)的成績(jī),則要進(jìn)行選擇觀測(cè)量為男
30、性的數(shù)據(jù)。數(shù)據(jù)分析技術(shù)&SPSS16.0422.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 (4)選擇觀測(cè)量)選擇觀測(cè)量1)All cases:所有的觀測(cè)量都被選擇,該:所有的觀測(cè)量都被選擇,該選項(xiàng)可用于解除原來(lái)的觀測(cè)量選擇。選項(xiàng)可用于解除原來(lái)的觀測(cè)量選擇。2)If condition is satisfied:表示按指定條:表示按指定條件選擇觀測(cè)量件選擇觀測(cè)量3)Random sample of cases:對(duì)觀測(cè)量進(jìn):對(duì)觀測(cè)量進(jìn)行隨機(jī)抽樣,即對(duì)數(shù)據(jù)編輯窗口中的所有個(gè)行隨機(jī)抽樣,即對(duì)數(shù)據(jù)編輯窗口中的所有個(gè)案進(jìn)行隨機(jī)篩選,包括兩種方式的隨機(jī)篩選,案進(jìn)行隨機(jī)篩選,包括兩種方式的隨機(jī)篩選,一是近似抽樣(
31、一是近似抽樣(Approximately)即鍵入抽)即鍵入抽樣比例后由系統(tǒng)隨機(jī)抽??;二是精確抽樣樣比例后由系統(tǒng)隨機(jī)抽?。欢蔷_抽樣(Exactly)即要求從第幾個(gè)觀測(cè)量起抽取多)即要求從第幾個(gè)觀測(cè)量起抽取多少個(gè)。少個(gè)。4)Based on time or case range:順序抽:順序抽樣,單擊樣,單擊Range按鈕可以定義從第幾個(gè)觀按鈕可以定義從第幾個(gè)觀測(cè)量到第幾個(gè)觀測(cè)量測(cè)量到第幾個(gè)觀測(cè)量。5)Use filter variable:用指定的變量:用指定的變量(只能只能為數(shù)字型變量為數(shù)字型變量)作過(guò)濾,即依據(jù)過(guò)濾變量的取作過(guò)濾,即依據(jù)過(guò)濾變量的取值進(jìn)行樣本選取,變量值為非值進(jìn)行樣本選取
32、,變量值為非0或非系統(tǒng)缺失或非系統(tǒng)缺失值的個(gè)案將被選中。這種方法通常用于排除值的個(gè)案將被選中。這種方法通常用于排除包含系統(tǒng)缺失值的個(gè)案。包含系統(tǒng)缺失值的個(gè)案。設(shè)置被選擇個(gè)案的輸出形式:設(shè)置被選擇個(gè)案的輸出形式:1)生成一個(gè)名為)生成一個(gè)名為filter_$的的新變量,取值為新變量,取值為0或或1;2)選中的個(gè)案輸出到新的數(shù))選中的個(gè)案輸出到新的數(shù)據(jù)文件中據(jù)文件中圖2.9數(shù)據(jù)分析技術(shù)&SPSS16.0432.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 (5)觀測(cè)量加權(quán))觀測(cè)量加權(quán) 所謂權(quán)重是指同一個(gè)觀測(cè)量值在所有的觀測(cè)量里出現(xiàn)的次數(shù)或頻率。SPSS的觀測(cè)量加權(quán)功能是在數(shù)據(jù)文件中選擇一個(gè)變量,這個(gè)變量里
33、的值是相應(yīng)的觀測(cè)量出現(xiàn)的次數(shù),這個(gè)變量叫做權(quán)變量。 SPSS中指定加權(quán)變量的本質(zhì)是數(shù)據(jù)復(fù)制,例如表2-5是工人每天生產(chǎn)產(chǎn)品的數(shù)量,第一行數(shù)據(jù)表示當(dāng)天生產(chǎn)產(chǎn)品 數(shù)量為20各的工人有3個(gè),將“工人數(shù)”作為加權(quán)變量后,實(shí)際是將數(shù)據(jù)轉(zhuǎn)換成表2-6所示的數(shù)據(jù)進(jìn)行分析。產(chǎn)品數(shù)量工人數(shù)203表2-5產(chǎn)品數(shù)量202020表2-6數(shù)據(jù)分析技術(shù)&SPSS16.0442.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 (5)觀測(cè)量加權(quán))觀測(cè)量加權(quán) 一旦指定了加權(quán)變量,在以后的分析處理中加權(quán)是一直有效的,直到取消加權(quán)為止;只有數(shù)值型的變量才能作為加權(quán)變量。數(shù)據(jù)分析技術(shù)&SPSS16.0452.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處
34、理 (6)變量的變換和計(jì)算)變量的變換和計(jì)算 在統(tǒng)計(jì)分析中,數(shù)據(jù)文件中的數(shù)據(jù)可能需要從原始數(shù)據(jù)計(jì)算得來(lái)的結(jié)果,有時(shí)需要統(tǒng)計(jì)一個(gè)觀測(cè)量滿足特定要求的那些變量值出現(xiàn)的次數(shù)等。在SPSS中,提供了強(qiáng)大的變量的變換及計(jì)算功能,針對(duì)這些變量值的變換整理的功能在菜單Transform中實(shí)現(xiàn),比較常用的數(shù)據(jù)轉(zhuǎn)換方法有:Compute:通過(guò)變量間的運(yùn)算來(lái)轉(zhuǎn)換數(shù)據(jù),利用原始數(shù):通過(guò)變量間的運(yùn)算來(lái)轉(zhuǎn)換數(shù)據(jù),利用原始數(shù)據(jù)計(jì)算一些特定的數(shù)值,組成一個(gè)新的變量;據(jù)計(jì)算一些特定的數(shù)值,組成一個(gè)新的變量;Visual Binning:對(duì)數(shù)據(jù)進(jìn)行離散化處理,將數(shù)據(jù)文件:對(duì)數(shù)據(jù)進(jìn)行離散化處理,將數(shù)據(jù)文件中一個(gè)或多個(gè)變量的取值按
35、照某種方式分成一定數(shù)目的組中一個(gè)或多個(gè)變量的取值按照某種方式分成一定數(shù)目的組段,并建立一個(gè)新的變量來(lái)記錄每個(gè)觀測(cè)值屬于那個(gè)組;段,并建立一個(gè)新的變量來(lái)記錄每個(gè)觀測(cè)值屬于那個(gè)組;Recode:變量重新賦值功能,通過(guò)修改變量值來(lái)轉(zhuǎn)換:變量重新賦值功能,通過(guò)修改變量值來(lái)轉(zhuǎn)換數(shù)據(jù),可以將原有變量的舊值更換為新值。數(shù)據(jù),可以將原有變量的舊值更換為新值。數(shù)據(jù)分析技術(shù)&SPSS16.0462.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 Compute 輸入新生成的變量的變量名輸入計(jì)算的式子SPSS中提供的用于計(jì)算的函數(shù),利用這些函數(shù)可以生成指定分布的隨機(jī)數(shù)、生成給定參數(shù)的概率密度函數(shù)等。 圖 2.10數(shù)據(jù)分析技術(shù)
36、&SPSS16.0472.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 Visual Binning 變量組的劃分實(shí)際上就是將連續(xù)變量離散化 ,例如:將百分制的分?jǐn)?shù)轉(zhuǎn)換為用優(yōu)、良等表示的等級(jí)分?jǐn)?shù)。利用SPSS16.0中提供的Visual Binning功能可方便地實(shí)現(xiàn)該種轉(zhuǎn)換。數(shù)據(jù)分析技術(shù)&SPSS16.0482.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 Visual Binning 見(jiàn)書見(jiàn)書Page 50例例2-6 將需要?jiǎng)澐纸M段的變量“評(píng)價(jià)結(jié)果”選擇到此框中。選擇TransformVisual Binning ,出現(xiàn)如圖2.11的界面圖2.11數(shù)據(jù)分析技術(shù)&SPSS16.0492.5 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 Visual Binn
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- YY/T 1941-2024采用機(jī)器人技術(shù)的腹腔內(nèi)窺鏡手術(shù)系統(tǒng)
- YY/T 1940-2024用于增材制造的醫(yī)用鎳鈦合金粉末
- 貴陽(yáng)康養(yǎng)職業(yè)大學(xué)《焊接專業(yè)英語(yǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025年上海市安全員B證考試題庫(kù)及答案
- 廣州醫(yī)科大學(xué)《大學(xué)英語(yǔ)自主學(xué)習(xí)(Ⅱ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025河北省安全員C證考試(專職安全員)題庫(kù)附答案
- 2025年河北省建筑安全員《A證》考試題庫(kù)及答案
- 2025云南省建筑安全員知識(shí)題庫(kù)附答案
- 2025江西省建筑安全員《C證》考試題庫(kù)
- 2025建筑安全員-B證考試題庫(kù)附答案
- 2025共團(tuán)永康市委下屬青少年綜合服務(wù)中心駐團(tuán)市委機(jī)關(guān)人員招聘2人(浙江)高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年中國(guó)服裝制造行業(yè)市場(chǎng)深度研究及發(fā)展趨勢(shì)預(yù)測(cè)報(bào)告
- 2025年計(jì)算機(jī)二級(jí)WPS考試題目
- 2024-2030年中國(guó)車載導(dǎo)航儀行業(yè)發(fā)展?fàn)顩r及投資前景規(guī)劃研究報(bào)告
- 雙高建設(shè)的路徑設(shè)計(jì)與實(shí)施方案
- 人工智能:AIGC基礎(chǔ)與應(yīng)用 課件 03模塊三AIGC賦能辦公應(yīng)用
- 醫(yī)院純水系統(tǒng)施工方案
- 各類骨折病人體位護(hù)理
- 肺部感染的護(hù)理查房課件
- 網(wǎng)絡(luò)評(píng)論員培訓(xùn)
- 大型醫(yī)院多院區(qū)一體化基礎(chǔ)信息平臺(tái)建設(shè)方案
評(píng)論
0/150
提交評(píng)論