統(tǒng)計(jì)軟件SPSS教案(全)_第1頁(yè)
統(tǒng)計(jì)軟件SPSS教案(全)_第2頁(yè)
統(tǒng)計(jì)軟件SPSS教案(全)_第3頁(yè)
統(tǒng)計(jì)軟件SPSS教案(全)_第4頁(yè)
統(tǒng)計(jì)軟件SPSS教案(全)_第5頁(yè)
已閱讀5頁(yè),還剩151頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、PAGE PAGE 154第一單元 SPSS基本操作實(shí)驗(yàn)一 SPSS基本操作一、實(shí)驗(yàn)?zāi)康?、掌握SPSS數(shù)據(jù)分析的一般步驟;2、能根據(jù)實(shí)際情況定義變量,建立SPSS數(shù)據(jù)文件;3、能根據(jù)數(shù)據(jù)分析的要求,對(duì)原始數(shù)據(jù)進(jìn)行適當(dāng)?shù)念A(yù)處理;4、能夠?qū)PSS的運(yùn)行結(jié)果進(jìn)行適當(dāng)?shù)木庉嫴?dǎo)入到分析報(bào)告中。二、實(shí)驗(yàn)原理及步驟講解(一)SPSS概述SPSS(Statistical Package for the Social Science,社會(huì)科學(xué)統(tǒng)計(jì)軟件包)是世界著名的統(tǒng)計(jì)軟件之一。1968年美國(guó)斯坦福大學(xué)三位研究生研制了最早的SPSS統(tǒng)計(jì)軟件系統(tǒng),并基于這一系統(tǒng)于1975年在芝加哥成立SPSS公司,推出SP

2、SS 中小型機(jī)版SPSSX。1984年推出世界第一個(gè)統(tǒng)計(jì)分析軟件微機(jī)版SPSS/PC+。迄今為止軟件已有30多年的成長(zhǎng)歷史,應(yīng)用遍布于通信、醫(yī)療、銀行、證券、保險(xiǎn)、制造、商業(yè)、市場(chǎng)研究、科學(xué)教育等領(lǐng)域,是世界上應(yīng)用最廣泛的專(zhuān)業(yè)統(tǒng)計(jì)軟件。隨著SPSS產(chǎn)品服務(wù)領(lǐng)域的擴(kuò)大和服務(wù)深度的加深,2002年公司將軟件更名為Statistical Product and Service Solutions,意為“統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案”。SPSS主界面有兩個(gè),一個(gè)是SPSS數(shù)據(jù)編輯窗口,另一個(gè)是SPSS結(jié)果輸出窗口。數(shù)據(jù)編輯窗口是最重要的,使用也最為頻繁,是SPSS的基本操作平臺(tái)。對(duì)SPSS的數(shù)據(jù)進(jìn)行定義、錄

3、入、修改、管理等基本操作的窗口,各統(tǒng)計(jì)分析功能都是針對(duì)該窗口中的數(shù)據(jù)進(jìn)行的;窗口中的數(shù)據(jù)以.sav存于磁盤(pán)上;SPSS運(yùn)行過(guò)程中自動(dòng)打開(kāi),且只能打開(kāi)一個(gè)窗口;運(yùn)行過(guò)程中無(wú)法關(guān)閉。本節(jié)先介紹數(shù)據(jù)編輯窗口。SPSS屬于電子表格軟件,其數(shù)據(jù)編輯窗口與微軟公司的Excel窗口有些相似,并且有一些功能也相同。不過(guò)SPSS的數(shù)據(jù)統(tǒng)計(jì)功能要比Excel強(qiáng)很多。數(shù)據(jù)編輯窗口由標(biāo)題欄、菜單欄、工具欄、編輯欄、變量名欄、內(nèi)容區(qū)、窗口切換標(biāo)簽頁(yè)和狀態(tài)欄組成。如圖1-1所示。標(biāo)題欄中顯示編輯的數(shù)據(jù)文件名,本圖中所編輯的數(shù)據(jù)文件為Hair&eye.sav。菜單欄中列出了SPSS的命令菜單,每個(gè)菜單對(duì)應(yīng)一組相應(yīng)的功能。其

4、中File是對(duì)SPSS文件的操作;Edit是SPSS文件的編輯菜單;Data是數(shù)據(jù)文件的建立和編輯菜單;View是用戶(hù)界面設(shè)置菜單;Transform是數(shù)據(jù)基本處理菜單;Analyze是統(tǒng)計(jì)分析菜單,主要統(tǒng)計(jì)功能都集中在該菜單中;Graphs是統(tǒng)計(jì)圖形菜單;Utilities是相關(guān)應(yīng)用和設(shè)置菜單;Windows是SPSS各窗口切換菜單;Help是SPSS幫助菜單。標(biāo)題欄編輯欄標(biāo)題欄編輯欄變量名欄菜單欄內(nèi)容區(qū)窗口切換標(biāo)簽狀態(tài)欄工具欄圖1-1 數(shù)據(jù)編輯窗口編輯欄中可以輸入數(shù)據(jù)。變量名欄中列出了該文件中所含有的變量名。SPSS自動(dòng)命名變量名為var001、var002等。本文件中有三個(gè)變量:num、

5、hair、eye。內(nèi)容區(qū)列出了各個(gè)個(gè)案在變量中的取值。SPSS中每一行表示一個(gè)個(gè)案(記錄)。內(nèi)容區(qū)的最左邊是行的標(biāo)號(hào),這和Excel類(lèi)似。該窗口下方有兩個(gè)標(biāo)簽:“Data View”(數(shù)據(jù)視圖)和“Variable View”(變量視圖)。這兩種視圖提供了一種類(lèi)似于電子表格的方法,用以產(chǎn)生和編輯SPSS數(shù)據(jù)文件中的變量和數(shù)據(jù)?!?Data View”對(duì)應(yīng)的表格用于查看、錄入和修改數(shù)據(jù);“ Variable View ”對(duì)應(yīng)的表格用于輸入和修改變量的定義。這樣使用者就可以非常方便地進(jìn)行變量類(lèi)型的定義和數(shù)據(jù)的輸入。相對(duì)于Excel來(lái)講,“Data View ”所對(duì)應(yīng)表格有以下特點(diǎn):(1)一個(gè)列對(duì)應(yīng)

6、一個(gè)變量,即每一列代表一個(gè)變量或一個(gè)被觀測(cè)量的特征。例如問(wèn)卷上的每一項(xiàng)就是一個(gè)變量。(2)行是觀測(cè),即每一行代表一個(gè)個(gè)體、一個(gè)觀測(cè)、一個(gè)樣品,在 SPSS中稱(chēng)為事件(Case)。例如,問(wèn)卷上的每一個(gè)人就是一個(gè)觀測(cè)。(3)單元包含值,即每個(gè)單元包括一個(gè)觀測(cè)中的單個(gè)變量值。單元(Cell)是觀測(cè)和變量的交叉。(4)數(shù)據(jù)文件是一張長(zhǎng)方形的二維表。數(shù)據(jù)文件的范圍是由觀測(cè)和變量的數(shù)目決定的。數(shù)據(jù)編輯窗口最下面的狀態(tài)欄用來(lái)顯示SPSS當(dāng)前的運(yùn)行狀態(tài)。當(dāng)SPSS等待用戶(hù)操作時(shí),會(huì)出現(xiàn)“SPSS Processor is ready”的提示信息。在數(shù)據(jù)編輯窗口中完成變量定義、數(shù)據(jù)輸入后,單擊某個(gè)統(tǒng)計(jì)功能菜單,

7、SPSS會(huì)自動(dòng)完成統(tǒng)計(jì)分析,并將彈出結(jié)果輸出窗口,其中存放了數(shù)據(jù)統(tǒng)計(jì)的結(jié)果。(二)數(shù)據(jù)分析概述1、數(shù)據(jù)分析一般流程任何一個(gè)數(shù)據(jù)分析項(xiàng)目,如果按照整個(gè)分析過(guò)程的流程結(jié)構(gòu)來(lái)看,都可被劃分為大致7個(gè)階段:計(jì)劃階段、數(shù)據(jù)收集、數(shù)據(jù)獲取、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)分析、結(jié)果報(bào)告和模型發(fā)布階段。計(jì)劃階段:在分析項(xiàng)目的初始階段,需要花費(fèi)大量的時(shí)間來(lái)設(shè)計(jì)分析計(jì)劃,以減少盲目分析,避免資源浪費(fèi)。該階段要對(duì)數(shù)據(jù)分析的各個(gè)行動(dòng)步驟做好規(guī)劃確定以下幾個(gè)問(wèn)題:確定研究問(wèn)題。建立項(xiàng)目預(yù)算確定研究范圍即確定研究總體和個(gè)體確定樣本抽取方法分析評(píng)估所需樣本量確定數(shù)據(jù)收集方式確定與研究問(wèn)題相關(guān)的數(shù)據(jù),即確定應(yīng)該收集個(gè)體的哪些數(shù)據(jù)確定研究問(wèn)題

8、的分析方法和分析工具數(shù)據(jù)收集階段:如果手頭已經(jīng)有現(xiàn)成的數(shù)據(jù),就可不必再進(jìn)行數(shù)據(jù)收集。 數(shù)據(jù)收集的方式有很多種,可以是電話式訪問(wèn),可以是面談式收集,也可以是攔截式訪問(wèn)。如果是從頭進(jìn)行數(shù)據(jù)收集,則應(yīng)當(dāng)有標(biāo)準(zhǔn)問(wèn)卷,問(wèn)題的設(shè)計(jì)不僅要相關(guān),還要能夠從中的出有意義的結(jié)論。數(shù)據(jù)獲取階段。該階段的目的是將分散的、原始格式各不相同的數(shù)據(jù)讀入分析工具中,使分析工具可以對(duì)數(shù)據(jù)進(jìn)行分析。數(shù)據(jù)準(zhǔn)備階段。該階段的主要任務(wù)是:清理數(shù)據(jù)以保證數(shù)據(jù)的準(zhǔn)確性。對(duì)數(shù)據(jù)進(jìn)行必要的轉(zhuǎn)換。如生成一些新的字段以供分析;將連續(xù)字段離散化;將字符型字段數(shù)值化等。目的是將數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換成合適的形式。填充缺失數(shù)據(jù)。對(duì)各種缺失字段,利用適當(dāng)方法進(jìn)行填

9、補(bǔ)對(duì)數(shù)據(jù)進(jìn)行合并、匯總等。將數(shù)據(jù)文件進(jìn)行合并,將個(gè)體數(shù)據(jù)進(jìn)行匯總,生成各組數(shù)據(jù)。數(shù)據(jù)分析階段:利用各種數(shù)據(jù)分析工具對(duì)數(shù)據(jù)進(jìn)行分析,得出結(jié)論。數(shù)據(jù)分析階段可分為幾個(gè)部分:預(yù)分析:包括概括性描述統(tǒng)計(jì)和探索性統(tǒng)計(jì)推斷兩部分,使用統(tǒng)計(jì)圖和統(tǒng)計(jì)表對(duì)數(shù)據(jù)進(jìn)行更好的理解,基于對(duì)數(shù)據(jù)的理解開(kāi)始嘗試進(jìn)行分析。精確分析:基于上一步得到的各種信息,開(kāi)始嘗試擬和最佳的統(tǒng)計(jì)模型,以尋求對(duì)數(shù)據(jù)中所蘊(yùn)涵信息最完美的解釋。完成這一部分工作往往需要統(tǒng)計(jì)知識(shí)和專(zhuān)業(yè)知識(shí)相互補(bǔ)充,所使用的統(tǒng)計(jì)方法一般是多元統(tǒng)計(jì)分析方法。 結(jié)果報(bào)告階段:結(jié)果報(bào)告的目的是將整個(gè)數(shù)據(jù)分析項(xiàng)目的結(jié)果以一種非學(xué)術(shù)化的方式表達(dá)出來(lái),使得決策者能夠快速理解,并基

10、于此分析結(jié)果做出決策。模型發(fā)布階段:結(jié)果報(bào)告僅僅是對(duì)基于歷史數(shù)據(jù)所建立的模型加以闡述。當(dāng)需要利用該模型進(jìn)行預(yù)測(cè)時(shí),具體的做法是在分析軟件中加以預(yù)測(cè),該階段的目標(biāo)是將分析階段得到的模型、信息和知識(shí)帶給機(jī)構(gòu)決策者以便他們能為機(jī)構(gòu)作出更好的未來(lái)規(guī)劃。在大多數(shù)分析過(guò)程中,不一定會(huì)經(jīng)歷所有的這7步。例如,根據(jù)分析目的,所需的數(shù)據(jù)僅是日常工作產(chǎn)生的交易數(shù)據(jù),那么就不必再經(jīng)歷“數(shù)據(jù)收集”階段,而直接進(jìn)入“數(shù)據(jù)獲取”階段。另外,各階段之間可能交叉進(jìn)行。例如,有時(shí)在對(duì)原始數(shù)據(jù)進(jìn)行分析之后,即進(jìn)入“數(shù)據(jù)分析”階段后,突然發(fā)現(xiàn)其他數(shù)據(jù)也是分析必需的,所以又返回“數(shù)據(jù)收集”階段。又如,在“數(shù)據(jù)分析”階段發(fā)現(xiàn)某個(gè)字段因

11、其格式不能參與分析,所以就需要進(jìn)行“數(shù)據(jù)準(zhǔn)備”階段所做的工作。2、用SPSS做數(shù)據(jù)分析作為一家信息統(tǒng)計(jì)決策支持服務(wù)的提供商,SPSS公司在以上涉及的各個(gè)數(shù)據(jù)分析階段均有相應(yīng)的產(chǎn)品與其對(duì)應(yīng),其核心功能是數(shù)據(jù)分析階段。建立SPSS數(shù)據(jù)文件,包括:定義數(shù)據(jù)文件結(jié)構(gòu);錄入、修改和編輯待分析的數(shù)據(jù)分析數(shù)據(jù)。根據(jù)設(shè)計(jì)初步判斷可能用到的統(tǒng)計(jì)方法,先進(jìn)行必要的預(yù)分析,以確定數(shù)據(jù)是否滿足方法的要求;根據(jù)預(yù)分析的結(jié)果,選擇適當(dāng)?shù)慕y(tǒng)計(jì)方法和模型進(jìn)行分析。結(jié)果的說(shuō)明和解釋?zhuān)艚Y(jié)果不合適,則重新選擇預(yù)分析和統(tǒng)計(jì)分析方法。數(shù)據(jù)和分析結(jié)果導(dǎo)出并保存(三)SPSS數(shù)據(jù)文件的建立與管理SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件:姓

12、名性別學(xué)號(hào) 變量名張三女0101 記錄李四男01021、定義數(shù)據(jù)文件的變量(Variable view)例1.1:下面是國(guó)外某工廠的職員對(duì)周?chē)h(huán)境滿足程度的調(diào)查問(wèn)卷(如下圖所示),1、對(duì)滿足度的調(diào)查對(duì)于下面事項(xiàng)您感覺(jué)滿足程度,請(qǐng)?jiān)跈M線上用“鉤”表示。 很不滿意 不滿足 一般 滿足 很滿足(1)家庭 (2)工廠 (3)政治現(xiàn)實(shí) (4)經(jīng)濟(jì)狀況 2、個(gè)人情況調(diào)查性別(1男,2女)學(xué)歷(1高中,2專(zhuān)科,3大學(xué)以上)年齡身高體重(cm/kg)平均收入(千元)生活費(fèi)(千元)家庭人口(人)住房面積(平方米)試據(jù)此定義數(shù)據(jù)文件結(jié)構(gòu)。打開(kāi)數(shù)據(jù)編輯窗口后單擊下方的Variable View標(biāo)簽,切換到變量定義界

13、面,開(kāi)始定義新變量。根據(jù)以上問(wèn)卷內(nèi)容,定義x1x13,共13個(gè)變量來(lái)分別表示對(duì)家庭的滿意程度、表示對(duì)工廠的滿意程度、表示對(duì)政治的滿意程度、表示對(duì)經(jīng)濟(jì)的滿意程度、性別、學(xué)歷、年齡、身高、體重、平均收入、生活費(fèi)、家庭人口和住房面積。下面來(lái)具體看一看變量視圖中各個(gè)欄目的意義和用法:變量名(Variable name)Name欄:用于設(shè)定變量名,變量名是變量存取的唯一標(biāo)志。SPSS11中變量名長(zhǎng)度應(yīng)在8位以?xún)?nèi),但SPSS13已無(wú)此限制。雖然鍵入中文也可以,但最好使用英文,由于SPSS是英文軟件,變量名采用中文可能會(huì)有潛在的沖突(100%的兼容性是不存在的,典型的例子就是微軟公司的產(chǎn)品);其次,當(dāng)需要將

14、數(shù)據(jù)轉(zhuǎn)換為其他格式時(shí),中文變量名也可能不能被完全識(shí)別,這里分別對(duì)13個(gè)變量命名為x1x13。Type欄:選擇該框時(shí)右側(cè)會(huì)出現(xiàn)形如的按鈕,單擊它會(huì)彈出變量類(lèi)型對(duì)話框,用于設(shè)置變量類(lèi)型,相應(yīng)的可以在右側(cè)更改變量運(yùn)算寬度等格式,一般按默認(rèn)的普通數(shù)值型(Numeric)即可。SPSS 中變量一共有三種:數(shù)值型、字符型(String)和日期型(Date),根據(jù)不同的顯示方式,數(shù)值型又被細(xì)分為五種,所以SPSS中的變量類(lèi)型共有八種,但實(shí)際上只要分得清楚數(shù)值型、字符型和日期型就可以了。這里13個(gè)變量全部定義為普通數(shù)值型。With欄:設(shè)置變量運(yùn)算寬度,如數(shù)值型默認(rèn)為8位,一般不用變。該寬度只會(huì)改變輸出結(jié)果的顯

15、示寬度,數(shù)據(jù)的存儲(chǔ)結(jié)果和運(yùn)算精度完全不受影響。Decimals欄:設(shè)置小數(shù)位,默認(rèn)為2位,即數(shù)值型變量默認(rèn)情況下為5位整數(shù)、1位小數(shù)點(diǎn)位和2位小數(shù)。Label欄:用于定義變量名標(biāo)簽,該變量名標(biāo)簽是對(duì)對(duì)變量名的進(jìn)一步描述,長(zhǎng)度可達(dá)120個(gè)字符,可以是中文,變量名標(biāo)簽會(huì)在結(jié)果中輸出,閱讀會(huì)非常方便。如上題中若用x1這個(gè)變量表示對(duì)家庭的滿意程度,x1為變量名,變量名標(biāo)簽可定義為“對(duì)家庭的滿意程度”,從而是x1的含義較明確。Value:用于定義變量值標(biāo)簽,變量值標(biāo)簽是對(duì)對(duì)變量的每一個(gè)可能取值的進(jìn)一步描述。該功能非常有用。以變量x5為例,單擊value框右部的省略號(hào),會(huì)彈出變量值標(biāo)簽對(duì)話框如圖所示。|上

16、部的兩個(gè)文本框分別為變量值輸入框和變量值標(biāo)簽輸入框,分別在其中輸入“1”和“男”,此時(shí)下方的Add鈕變黑,單擊它,該變量值標(biāo)簽就會(huì)被加入下方的標(biāo)簽框內(nèi)。與此類(lèi)似定義變量值“2”為“女”,最后按OK,變量值標(biāo)簽就設(shè)置完成。這樣,一方面使閱讀該數(shù)據(jù)文件的人能清楚得理解數(shù)據(jù),另外做任何分析,在結(jié)果中都有相應(yīng)的標(biāo)簽出現(xiàn),閱讀結(jié)果也就更方便了。Missing欄:用于定義變量缺失值。SPSS中默認(rèn)缺失值用表示,如果所用數(shù)據(jù)集中還有其他表示方法,則用該框來(lái)定義。Columns欄:定義顯示的列寬,實(shí)際上它用的非常少,因?yàn)楦淖兞袑捄?jiǎn)便的方法就是將鼠標(biāo)放在數(shù)據(jù)窗口中兩個(gè)變量名的中間直接拖動(dòng)。Align欄:定義顯示

17、對(duì)齊方式,按照默認(rèn)的右對(duì)齊即可。Measure欄:定義變量的測(cè)量尺度,這一項(xiàng)不應(yīng)被忽略,它可以對(duì)變量進(jìn)行精確的定義。僅靠變量類(lèi)型還不足以完全傳遞所有信息,比如說(shuō)有序分類(lèi)變量和連續(xù)性變量的類(lèi)型都是數(shù)值型,并無(wú)差異。為此,在SPSS中又引入了測(cè)量尺度的概念,它和變量類(lèi)型聯(lián)合起來(lái)可以對(duì)變量作更精確的限定,測(cè)量尺度一共有以下三種:標(biāo)度測(cè)量 (scale Measurement) :是測(cè)量的最高水平,數(shù)值可以是兩個(gè)測(cè)量間的差值,比如溫度,35和50相差就是15;可以是兩個(gè)測(cè)量間的比值,如比例測(cè)量,如重量,80公斤就是40公斤的兩倍??梢允褂脴?biāo)度測(cè)量的數(shù)據(jù)只能是數(shù)值型變量。本例中的月收入、年齡等均為標(biāo)度測(cè)

18、量。有序測(cè)量(Ordinal Measurement):比標(biāo)度測(cè)量的信息量少一些,測(cè)量數(shù)值代表了有序分類(lèi),如4、3、2、1代表了優(yōu)、良、中、差,顯然這里“優(yōu)”并非“中”的兩倍,即測(cè)量數(shù)值不代表絕對(duì)的數(shù)量大小。能使用有序測(cè)量的數(shù)據(jù)可以是數(shù)值型,也可以是字符型變量。本例中的學(xué)歷即為有序測(cè)量。名義測(cè)量(Nominal Measurement):是幾種測(cè)量中最低的水平,其數(shù)值僅代表某些分類(lèi)或?qū)傩?,它們之間無(wú)法比較出大小。比如說(shuō)測(cè)量的血型值,只能分為A、B、AB、O四種,不可能分出哪個(gè)高哪個(gè)低。能使用名義測(cè)量的數(shù)據(jù)可以是數(shù)值型,也可以是字符型變量。本例中的性別即為名義測(cè)量。2、數(shù)據(jù)錄入和保存直接錄入在數(shù)

19、據(jù)編輯窗口單擊Data View標(biāo)簽,切換到數(shù)據(jù)視圖,在該視圖下可直接輸入數(shù)據(jù),輸入時(shí)注意數(shù)據(jù)和變量的對(duì)應(yīng)關(guān)系。中小批量的數(shù)據(jù),直接用SPSS輸入比較方便的,如果數(shù)據(jù)量非常大,就應(yīng)備考慮采用專(zhuān)用數(shù)據(jù)庫(kù)軟件,如Access來(lái)錄入。數(shù)據(jù)錄入技巧和其他常用統(tǒng)計(jì)軟件相比,SPSS數(shù)據(jù)界面最大的優(yōu)勢(shì)就是支持鼠標(biāo)的拖放操作,以及拷貝粘貼等命令,下面的數(shù)據(jù)錄入技巧就是對(duì)這些功能的利用。連續(xù)多個(gè)相同值的輸入:如果變量有連續(xù)多個(gè)相同數(shù)據(jù)輸入,比如連續(xù)幾個(gè)單元格都要輸入1,可以在第一格內(nèi)輸入1并回車(chē),然后回到剛才的單元格并單擊copy,最后用拖放方式選中所有應(yīng)輸入1的單元格,單擊右鍵并選擇paste,所有選中的單

20、元格就:會(huì)都被剛才拷貝的1填充。將Excel數(shù)據(jù)直接引入SPSS:Excel已經(jīng)打開(kāi)原數(shù)據(jù),并且數(shù)據(jù)量較少的時(shí)候,可以直接用拷貝粘貼的方法將數(shù)據(jù)引入SPSS。先在Excel中選中所有的數(shù)據(jù)(不包括變量名),然后選擇拷貝命令,然后切換到SPSS,最好使行1列1單元格成為當(dāng)前單元格,然后執(zhí)行粘貼命令,數(shù)據(jù)就會(huì)全部轉(zhuǎn)入SPSS,再定義相應(yīng)的變量即可。如果數(shù)據(jù)中含有文本,則不能直接粘貼,否則會(huì)丟失數(shù)據(jù)。這是因?yàn)镾PSS默認(rèn)的數(shù)據(jù)格式均為數(shù)值型,這樣將文本粘貼過(guò)來(lái)就會(huì)變?yōu)槿笔е?。將Word中的數(shù)據(jù)表格直接引入SPSS:如果表格中全部都是數(shù)值,則可以選中整個(gè)表格,選擇拷貝命令然后切換到SPSS,再執(zhí)行粘貼

21、命令,數(shù)據(jù)就會(huì)全部轉(zhuǎn)入SPSS,并且原來(lái)的單元格會(huì)自動(dòng)對(duì)應(yīng)為SPSS中的一個(gè)單元格。此時(shí)再定義相應(yīng)的變量名即可。用SPSS直接打開(kāi)其他文件:SPSS可以直接打開(kāi)多種其他類(lèi)型文件,如各種版本的Excel文件、dBase文件、純文本文件等,這些文件可由SPSS直接引入。SPSS數(shù)據(jù)文件建立起來(lái)以后,單擊保存,可以保存為SPSS數(shù)據(jù)文件類(lèi)型,擴(kuò)展名為.sav;也可以存為其他多種文件類(lèi)型,如Excel、DBF、Access等。(四)SPSS數(shù)據(jù)管理SPSS數(shù)據(jù)(的基本加工和處理的)管理命令集中在Transform菜單和Data菜單,這些命令不屬于統(tǒng)計(jì)分析的范疇,其處理結(jié)果在數(shù)據(jù)文件上體現(xiàn)出來(lái),而不在結(jié)

22、果輸出窗口,主要提供的是數(shù)據(jù)管理方面的基本功能,也可以看成是對(duì)數(shù)據(jù)預(yù)處理的過(guò)程。其中Data菜單主要實(shí)現(xiàn)變量級(jí)別的數(shù)據(jù)管理,如計(jì)算新變量、變量取值重新編碼等,Transform菜單主要實(shí)現(xiàn)文件級(jí)別的數(shù)據(jù)管理,如變量排序、文件合并拆分等。1、變量級(jí)別的數(shù)據(jù)管理Transform菜單Transform菜單主要集中了一些對(duì)變量進(jìn)行變換的過(guò)程,如對(duì)原始數(shù)據(jù)進(jìn)行四則運(yùn)算、對(duì)數(shù)據(jù)重新編碼、求變量秩次等,在統(tǒng)計(jì)分析的預(yù)處理中起著重要作用,下面列出常用的三個(gè)。計(jì)算新變量Compute過(guò)程計(jì)算新變量就是在原有SPSS數(shù)據(jù)文件的基礎(chǔ)之上,根據(jù)用戶(hù)要求,使用SPSS算術(shù)表達(dá)式以及函數(shù),對(duì)所有記錄或滿足條件的記錄,計(jì)

23、算出一個(gè)新結(jié)果,并將結(jié)果存入一個(gè)指定的變量中。這個(gè)指定變量可以是一個(gè)新變量,也可以是一個(gè)已經(jīng)存在的變量。Coumpute命令能輕松完成這樣的任務(wù)。例1.2:根據(jù)調(diào)查問(wèn)卷.sav中的數(shù)據(jù),如果要對(duì)所有記錄的月收入上全部加上100元,并把新的月收入存入一個(gè)新變量,操作對(duì)話框如圖1-2。Target Variable框?yàn)橛脕?lái)存儲(chǔ)新數(shù)據(jù)的目標(biāo)變量名,可以是新變量,也可以是文件中已經(jīng)存在的變量(此時(shí)會(huì)覆蓋原內(nèi)容),此處輸入xx10;左下方為候選變量列表,用于將計(jì)算所需變量直接引入;Numeric Expression框用于給目標(biāo)變量賦值,這里選入x10,并給出賦值表達(dá)式:x10+100;Numeric

24、Expression框下方為軟鍵盤(pán)和備構(gòu)造表達(dá)式所需的函數(shù)。按OK后,原數(shù)據(jù)文件中會(huì)產(chǎn)生一個(gè)新變量xx10,其大小為對(duì)應(yīng)x10的值加上100。圖1-2 Compute過(guò)程主對(duì)話框?qū)ψ兞窟M(jìn)行分組和并Recode過(guò)程數(shù)據(jù)分析中,將連續(xù)變量轉(zhuǎn)換為等級(jí)變量,或者將分類(lèi)變量不同的變量等級(jí)進(jìn)行合并是經(jīng)常采取的方法,Recode過(guò)程主要完成這一類(lèi)工作。例1.3:根據(jù)調(diào)查問(wèn)卷.sav中的數(shù)據(jù),根據(jù)年齡對(duì)受訪者重新分組,年齡小于等于30為一組,用1表示;年齡大于30為一組,用2表示,并將分組變量存入新變量xx7。操作如下:選擇菜單Transform,Recode Different Variables,Reco

25、de對(duì)話框如圖1-3所示。圖1-3 Recode into Different Variables 過(guò)程主對(duì)話框?qū)⒛挲g(x7)選入Input Variable-Variable框,此時(shí)Output Variable框變黑,在其中鍵入新變量名xx7,并單擊Change,可見(jiàn)原來(lái)的x7-?變成了x7-xx7,意即由原變量x7生成新變量xx7。現(xiàn)在單擊O1d and New values,系統(tǒng)彈出變量值定義對(duì)話框如圖1-4所示。根據(jù)時(shí)間情況確定舊值和新值,需要注意的是所有范圍包含了端點(diǎn),而且前面設(shè)定的變換會(huì)優(yōu)先于后側(cè)的變換。這里選擇Range:Lower through,右側(cè)框中輸入30,然后在右上

26、方的Value右側(cè)框中鍵入對(duì)應(yīng)的新變量值1,時(shí)下方Add鍵變黑,單擊它,Old -New框中就會(huì)加入Lower thru 30 -1;再選擇Range: through highest,右側(cè)框中輸入30,然后在右上方的Value右側(cè)框中鍵入對(duì)應(yīng)的新變量值2,時(shí)下方Add鍵變黑,單擊它,Old -New框中就會(huì)加入30 thru Highest 30 -2?,F(xiàn)在單擊Continue,再單擊OK,系統(tǒng)就會(huì)按要求生成新變量xx7。圖1-4 變量值定義子對(duì)話框求變量秩次Rank Case過(guò)程:Rank Cases過(guò)程就是用來(lái)排次序的一個(gè)專(zhuān)用過(guò)程。具體來(lái)說(shuō),它根據(jù)某變量的大小來(lái)排出次序(秩次),然后將秩

27、次結(jié)果存儲(chǔ)到一個(gè)新變量中去。例1.4:根據(jù)調(diào)查問(wèn)卷.sav中的數(shù)據(jù),計(jì)算年齡的秩次。操作如圖1-5。圖1-5 Rank Case過(guò)程主對(duì)話框單擊OK后系統(tǒng)會(huì)自動(dòng)生成一個(gè)新變量Rx7(即原變量前加r表示Rank之意),其取值為x7的秩次。2、文件級(jí)別的數(shù)據(jù)管理Data菜單Transform菜單是對(duì)變量進(jìn)行操作,而在許多情況下,我們需要對(duì)整個(gè)數(shù)據(jù)文進(jìn)行加工整理,比如根據(jù)統(tǒng)計(jì)分析的要求對(duì)數(shù)據(jù)進(jìn)分組、合并等操作。Data菜單主要是對(duì)整個(gè)文件的加工整理,排序、篩選、分組、合并、轉(zhuǎn)置等。這里只介紹最常用的四個(gè)過(guò)程。記錄排序Sort cases過(guò)程即變量排序過(guò)程,變量排序是非常常用的一項(xiàng)功能,學(xué)會(huì)它的使用技

28、巧會(huì)使工作效率大大提高,例如:數(shù)據(jù)輸入完畢后, 某個(gè)變量按升序或降序排列,利于發(fā)現(xiàn)輸入錯(cuò)誤、查找數(shù)據(jù)及了解數(shù)據(jù)。例1.5:根據(jù)調(diào)查問(wèn)卷.sav中的數(shù)據(jù),按月收入對(duì)所有記錄重新排序。在如下的Sort cases對(duì)話框中,將x10選入Sort by框,再按OK即可,原數(shù)據(jù)文件的記錄將按月收入從小到大排列。如果希望從大到小排列,則選擇Descending,即為降序排列。圖1-6 Sort cases主對(duì)話框數(shù)據(jù)匯總Aggregate過(guò)程Aggregate過(guò)程用于對(duì)數(shù)據(jù)進(jìn)分類(lèi)匯總,所謂分類(lèi)匯總就是按指定的分類(lèi)變量對(duì)觀測(cè)值進(jìn)行組,對(duì)每組記錄的各變量值求指定的描述統(tǒng)計(jì)量,并對(duì)結(jié)果進(jìn)行存儲(chǔ)。例1.6:根據(jù)調(diào)

29、查問(wèn)卷.sav中的數(shù)據(jù),計(jì)算男女兩個(gè)人群的平均月收入。該問(wèn)題屬于分組進(jìn)行描述統(tǒng)計(jì),用Aggregate過(guò)程。操作界面如圖1-7。圖1-7 Aggregate過(guò)程主對(duì)話框圖中Break Variables框用于選擇分組變量,這里選入x5(性別);Summaries of Variables框用于選擇被匯總的變量,這里選入x10(月收入);Name & Label用于定義新產(chǎn)生的匯總變量的名稱(chēng)和標(biāo)簽;function按鈕用來(lái)定義匯總函數(shù),共有五組函數(shù),分別為常用匯總函數(shù)、特定值、記錄數(shù)、百分比和百分片斷。以最常用的一組可選的函數(shù)有均數(shù)、中位數(shù)、總和、標(biāo)準(zhǔn)差四種,這里選擇均值;Save 用于定義分類(lèi)

30、匯總結(jié)果的存儲(chǔ)方式:將分類(lèi)匯總結(jié)果加入當(dāng)前數(shù)據(jù)文件,還是產(chǎn)生一個(gè)只包含分類(lèi)匯總接的新文件,還是用分類(lèi)匯總的結(jié)果代替當(dāng)前文件。這里按默認(rèn)選擇即可。單擊OK完成。這時(shí)當(dāng)前文件后面會(huì)產(chǎn)生一個(gè)新變量x10_mean,其值分別為男女的平均月收入。多個(gè)數(shù)據(jù)文件的合并Merge file過(guò)程Merge file過(guò)程用于合并數(shù)據(jù)文件,實(shí)際上包括了兩個(gè)過(guò)程,分別對(duì)應(yīng)了兩種合并方式:縱向合并,從外部數(shù)據(jù)文件中增加記錄到當(dāng)前數(shù)據(jù)文件中,用Add Cases對(duì)話;橫向合并從,指外部數(shù)據(jù)文件增加變量到當(dāng)前數(shù)據(jù)文件,用Add variable對(duì)話框完成。注意縱向合并要求互相合并的數(shù)據(jù)文件有相同的變量,否則會(huì)舍棄不匹配的變

31、量;橫向合并對(duì)數(shù)據(jù)集要求高,默認(rèn)按記錄號(hào)合并,若按關(guān)鍵變量匹配,則記錄應(yīng)按關(guān)鍵變量升序,且關(guān)鍵變量一一對(duì)應(yīng)。例1.7:將數(shù)據(jù)集tables.sav中的記錄添加到tab1.sav中,注意在tab1.sav中的變量 xingbie對(duì)應(yīng)了tables.sav中的sex。因?yàn)槭怯涗浱砑?,所以用Add Cases。首先應(yīng)當(dāng)打開(kāi)文件tab1.sav,然后選擇菜單DataMerge FileAdd Cases,系統(tǒng)會(huì)彈出打開(kāi)數(shù)據(jù)文件對(duì)話框,選中需要添加的數(shù)據(jù)文件tables.sav并按OK,系統(tǒng)才彈出Add Cases對(duì)話框如圖1-8所示。圖1-8 Add Cases過(guò)程主對(duì)話如圖,左側(cè)顯示的是新、老數(shù)據(jù)文

32、件中不匹配的變量名。星號(hào)表示為當(dāng)前數(shù)據(jù)集中變量,加號(hào)代表是添加數(shù)據(jù)集中的變量,左側(cè)顯示的是已匹配的變量名,可以用Rename按鈕對(duì)不匹配變量改名再納入,這里我們用鼠標(biāo)強(qiáng)行匹配(即選中兩個(gè)需要匹配的變量再單擊Pare按鈕),此時(shí)兩個(gè)變量以Sex & xingbie的形式加入右側(cè),表明最終的變量數(shù)值為兩者的接和,但變量名仍以當(dāng)前數(shù)據(jù)集的sex為準(zhǔn)。右下方的Indicate case source variable復(fù)選框用于定義一個(gè)新變量以區(qū)分哪些記錄是新添加的,這里不使用。選擇完后單擊OK,該操作就完成了。例1.8:數(shù)據(jù)集brain1.sav中包含了ID號(hào)190(有缺號(hào))的病人的性別、年齡和血小板

33、值,brain2.sav則包含了11100號(hào)病人的收縮壓、舒張壓和遲發(fā)性腦損傷結(jié)果。將兩個(gè)數(shù)據(jù)集按ID號(hào)合并,并盡可能多的保留病人記錄。根據(jù)題意,我們要將兩個(gè)數(shù)據(jù)集按ID號(hào)相同的原則進(jìn)行合并,并且要保留110和91100這些只存在于一個(gè)數(shù)據(jù)集內(nèi)的記錄。首先我們要將兩個(gè)數(shù)據(jù)集分別按ID進(jìn)行排序,然后重新打開(kāi)brain1.sav,選擇菜單DataMerge FileAdd Variables,系統(tǒng)會(huì)首先彈出打開(kāi)文件對(duì)話框,指定需要合并的第二個(gè)數(shù)據(jù)文件名,找到brain2.sav并單擊打開(kāi),系統(tǒng)就會(huì)彈出添加變量對(duì)話框如圖1-9所示:圖1-9 添加變量對(duì)話框New Working Data File框

34、內(nèi)被納入合并后新數(shù)據(jù)集的變量列表,同樣,星號(hào)表示來(lái)自當(dāng)前數(shù)據(jù)集,加號(hào)表示來(lái)自第二個(gè)數(shù)據(jù)集;Excluded variables框里為未被納入的變量列表;選中Match Case on key variables in sorted file,即按已排序關(guān)鍵字合并,此時(shí)系統(tǒng)默認(rèn)按記錄號(hào)相等來(lái)合并,顯然這不符合我們的要求,將ID選入Key Variable框作為關(guān)鍵子;下側(cè)的三個(gè)單選框變黑可用,它們分別表示納入兩個(gè)文件提供的所有記錄、以當(dāng)前數(shù)據(jù)為主納入外部文件的變量和以外部數(shù)據(jù)為主納入當(dāng)前文件的變量,顯然我們這里要選擇第一種情況。單擊OK即可。新產(chǎn)生的文件將包含1100號(hào)病人的ID、性別、年齡、血

35、小板值、收縮壓、舒張壓和遲發(fā)性腦損傷七個(gè)變量的信息。文件拆分Split file過(guò)程Split file過(guò)程用于將數(shù)據(jù)文件分組進(jìn)行處理。一般來(lái)講,若沒(méi)有特別設(shè)置,統(tǒng)計(jì)分析時(shí)將會(huì)把所有記錄一起處理。若想分組進(jìn)行處理,則可以在分析以前用Split file過(guò)程先將文件拆分為兩部分,則之后的分析將分組進(jìn)行。其對(duì)話框如圖1-10及解釋如下:圖1-10 Split file過(guò)程主對(duì)話Analyze all cases,do not create groups和下面的兩個(gè)單選框?yàn)橐唤M,選中本框表示不拆分文件;Compare groups表示按所選變量拆分文件,各組分析結(jié)果放在一起便于比較;Organize

36、 output by groups意即按所選變量拆分文件,各組分析結(jié)果單獨(dú)放置;Groups based on框用于選擇拆分?jǐn)?shù)據(jù)文件的變量;Sort the file by grouping variables與File is already sorted為一組,用于選擇是否要求拆分時(shí)將數(shù)據(jù)按所用的拆分變量排序,或所用的拆分變量已經(jīng)排過(guò)序了。(五)SPSS的結(jié)果瀏覽窗口和結(jié)果的導(dǎo)出SPSS的結(jié)果瀏覽窗口和Windows資源管理器的結(jié)構(gòu)完全相同,操作也幾乎相同。除了菜單欄和工具欄以外,窗口被分為左右兩部分:左側(cè)為大綱視圖,又稱(chēng)結(jié)構(gòu)視圖,用于概要地顯示結(jié)果的結(jié)構(gòu),在宏觀上對(duì)結(jié)果進(jìn)行管理;右側(cè)顯示詳

37、細(xì)的統(tǒng)計(jì)分析結(jié)果(統(tǒng)計(jì)表、統(tǒng)計(jì)圖及文本)兩側(cè)的元素是完全一一對(duì)應(yīng),當(dāng)選中左側(cè)大綱視圖中的某一元素,則右側(cè)的該元素的具體輸出結(jié)果也被選中。1、結(jié)果的導(dǎo)出選中要導(dǎo)出的結(jié)果,右擊彈出屬性菜單,單擊Export,打開(kāi)Export對(duì)話框如圖1-11。其中Export下拉列表用于確定需要輸出的內(nèi)容,有全部結(jié)果、無(wú)統(tǒng)計(jì)圖的文檔和只輸出統(tǒng)計(jì)圖三種選擇;在Export File框里輸入輸出目標(biāo)文件位置和目標(biāo)文件名,也可以用右側(cè)的Browse按鈕指定;Export What單選鈕組用于確定輸出的范圍,有全部對(duì)象、全部可見(jiàn)對(duì)象和所選擇的對(duì)象三種選擇;Export Format下拉列表用于選擇導(dǎo)出文件的格式,有HTM

38、L、Excel、PowerPoit和文本格式等。選好后單擊OK,系統(tǒng)就會(huì)將結(jié)果按你的要求輸出。圖1-11 Export主對(duì)話框2、如何在WORD等軟件中引用分析結(jié)果現(xiàn)在Word、Excel等辦公處理軟件使用的越來(lái)越廣,SPSS漂亮的輸出結(jié)果如果無(wú)法在Word等中使用將會(huì)帶來(lái)極大地不便。統(tǒng)計(jì)表格:選中需要的統(tǒng)計(jì)表,在拷貝時(shí)會(huì)有兩種選擇:拷貝(Copy)或拷貝對(duì)象(Copy Object),拷貝時(shí)是將統(tǒng)計(jì)表按普通的Word表格來(lái)拷貝,粘貼后格式大部分會(huì)丟失,但被轉(zhuǎn)換為Word表格,可以進(jìn)一步修改;拷貝對(duì)象是將統(tǒng)計(jì)表拷貝為特殊的圖片,格式與以前完全一樣,但不能進(jìn)行修改。含中文字符的統(tǒng)計(jì)表格:如果所用

39、的統(tǒng)計(jì)表格里有中文字符,則不能直接用拷貝粘貼的方法讀入Word,粘貼過(guò)去的中文可能會(huì)全部變成亂碼,需要一律重新輸入。這時(shí)可在Word中使用編輯菜單的“選擇性粘貼”然后選擇其中的無(wú)格式文本,這樣整個(gè)表格就會(huì)按照Tab鍵分隔的純文本形式粘貼入Word,里面的中文也完好無(wú)損。再將文本選中,使用表格菜單中的“文字轉(zhuǎn)換到表格”,就又可以轉(zhuǎn)換為表格,且中文完好無(wú)損。統(tǒng)計(jì)圖:和統(tǒng)計(jì)表的情況類(lèi)似,這里也有拷貝或拷貝對(duì)象兩種選擇,但我們推薦一直使用后者,直接粘貼過(guò)去的就是普通的圖片。在Excel 2000中使用輸出結(jié)果:在 Excel2000建議中使用普通的拷貝/粘貼方式來(lái)操作。Excel的兼容性要比Word好

40、些,可以完全兼容SPSS輸出的表格,表格內(nèi)容就會(huì)基本無(wú)損的被移入Excel工作表單中,含中文的表格粘貼過(guò)來(lái)后,中文并不會(huì)變?yōu)閬y字符,并且可以進(jìn)一步修改貼。三、實(shí)驗(yàn)報(bào)告1、紐約55名棒球佼佼者樣本的位置數(shù)據(jù)列在下表,每一項(xiàng)數(shù)據(jù)表示這些佼佼者們所擔(dān)任的首要位置:投手(P)、接手(H)、一壘(1)、二壘(2)、三壘(3)、游擊手(S)、左外場(chǎng)(L)、中外場(chǎng)(C)和右外場(chǎng)(R)。L P C H 2 P R 1 S S 1 L P R P R 1 2 H S P P P R C S L R P C C P P R P 3 H 2 L P2 3 P H L P 1 C P P P S 1 L R 根據(jù)以上

41、信息建立SPSS數(shù)據(jù)文件。2、美國(guó)個(gè)人投資協(xié)會(huì)報(bào)道了90家新的影子股票。術(shù)語(yǔ)“影子”表示中小型企業(yè)的股票,不被證券公司緊緊跟隨。有關(guān)股票在哪交易(OTC、AMEX、NYSE),每股贏余和價(jià)格/贏余比率的信息由20個(gè)影子股票的樣本給出。(數(shù)據(jù)見(jiàn)影子價(jià)格)每股贏余數(shù)據(jù)用組限0.000.19,0.200.39等,價(jià)格/贏余比率數(shù)據(jù)用組限0.09.9,10.019.9。根據(jù)以上規(guī)則實(shí)現(xiàn)對(duì)數(shù)據(jù)的重新編碼。完成以上兩道題,并完成實(shí)驗(yàn)報(bào)告。四、上機(jī)選做練習(xí)題1、下面是30名學(xué)生對(duì)食堂情況的反饋問(wèn)卷,根據(jù)問(wèn)卷內(nèi)容完成對(duì)SPSS數(shù)據(jù)文件變量的設(shè)計(jì)。(1)你在食堂用餐時(shí)認(rèn)為下面內(nèi)容的重要程度如何完全不重要 一般

42、非常重要 1 2 3 4 5 6 7衛(wèi)生飯量等待時(shí)間味道親切(2)你每周去這個(gè)食堂幾次?(3)性別(1男,2女)2、根據(jù)成績(jī)表.sav中的數(shù)據(jù),按90以上(包括90)、8090(包括80)、7080(包括70)、6070(包括60)及60以下的標(biāo)準(zhǔn),對(duì)現(xiàn)代企業(yè)管理的成績(jī)進(jìn)行重新編碼,用優(yōu)、良、中、及格和不及格表示。第二單元 描述統(tǒng)計(jì)與基本統(tǒng)計(jì)分析統(tǒng)計(jì)描述是對(duì)所收集的數(shù)據(jù)資料進(jìn)行加工整理、綜合概括,通過(guò)圖示、列表和計(jì)數(shù)對(duì)資料進(jìn)行分析和描述。但統(tǒng)計(jì)描述只能對(duì)統(tǒng)計(jì)數(shù)據(jù)的結(jié)構(gòu)和總體情況進(jìn)行描述,并不能深入了解統(tǒng)計(jì)數(shù)據(jù)的內(nèi)部規(guī)律。統(tǒng)計(jì)描述主要分三方面的內(nèi)容:?jiǎn)巫兞拷孛鏀?shù)據(jù)的描述;相對(duì)數(shù)的統(tǒng)計(jì)描述;雙變量

43、截面數(shù)據(jù)的描述。描述性統(tǒng)計(jì)分析是統(tǒng)計(jì)分析的第一步,做好這一步是進(jìn)行正確的統(tǒng)計(jì)推斷的先決條件。SPSS的許多模塊均可進(jìn)行描述性統(tǒng)計(jì),但專(zhuān)門(mén)為該目的而設(shè)計(jì)的模塊集中在Descriptive Statistics菜單中。有五個(gè)過(guò)程:Frequencies過(guò)程的主要功能是產(chǎn)生頻數(shù)表;Descriptive 過(guò)程則是一般性的統(tǒng)計(jì)描述;Explore過(guò)程用于對(duì)數(shù)據(jù)概括不清時(shí)的探索性分析;Crosstabs過(guò)程則完成計(jì)數(shù)資料和等級(jí)資料的統(tǒng)計(jì)描述和一般的統(tǒng)計(jì)檢驗(yàn);Ratio過(guò)程描述了兩個(gè)定比變量的比率。實(shí)驗(yàn)二 單變量截面數(shù)據(jù)的描述性分析一、實(shí)驗(yàn)?zāi)康?、能夠應(yīng)用SPSS完成描述統(tǒng)計(jì)量的計(jì)算:計(jì)算算術(shù)平均數(shù)、中位

44、數(shù)、眾數(shù);計(jì)算全距、四分位間距、標(biāo)準(zhǔn)差、方差等,并根據(jù)統(tǒng)計(jì)指標(biāo)對(duì)數(shù)據(jù)分布給予解釋?zhuān)?、能夠做出數(shù)據(jù)的頻數(shù)分布表,并利用頻數(shù)分布表解決問(wèn)題;3、能夠完成統(tǒng)計(jì)圖的繪制(主要包括直方圖、箱圖、莖葉圖等),并作出合理的解釋?zhuān)?、能根據(jù)統(tǒng)計(jì)指標(biāo)的含義解決實(shí)際問(wèn)題。二、實(shí)驗(yàn)原理及步驟講解(一)單變量截面數(shù)據(jù)的描述統(tǒng)計(jì)概述單變量截面數(shù)據(jù)又稱(chēng)一維變量,是指總體各單位所承載的某一數(shù)據(jù)標(biāo)志的一系列觀察結(jié)果。一維變量的統(tǒng)計(jì)數(shù)據(jù)經(jīng)過(guò)整理后,形成了次數(shù)分布的各種圖表,這些圖表在一定程度上已經(jīng)表現(xiàn)了一組數(shù)據(jù)的分布規(guī)律和特征。如果仔細(xì)觀察這些數(shù)據(jù)就可以發(fā)現(xiàn),即使在同一組內(nèi),一方面各種數(shù)據(jù)存在參差不齊,另一方面各種數(shù)據(jù)又有集

45、中在某一個(gè)數(shù)值周?chē)内厔?shì),這就是單變量截面數(shù)據(jù)次數(shù)分布的三個(gè)重要特征:集中趨勢(shì)、離散趨勢(shì)及偏態(tài)和峰度。1、集中趨勢(shì)頻數(shù)分布數(shù)列中各觀察值有一種向中心集中的趨勢(shì),在中心附近的觀察值數(shù)目較多,遠(yuǎn)離中心的較少,這稱(chēng)為集中趨勢(shì)。常用的集中趨勢(shì)的指標(biāo)是:眾數(shù)、中位數(shù)、均值。眾數(shù):在數(shù)據(jù)分布中出現(xiàn)最多的變量的值。它代表數(shù)據(jù)集中程度。對(duì)于不分組的資料,確定眾數(shù)意義不大,甚至沒(méi)意義。中位數(shù):中位數(shù)就是一組n個(gè)數(shù)據(jù)的資料, x1,x2xn,若按大小順序排列,處在數(shù)列的中點(diǎn)的數(shù)據(jù)。也就是說(shuō),把一個(gè)有序變量的全部數(shù)值分成數(shù)量相等的兩部分,一半比它大,一半比它小。中位數(shù)是反映現(xiàn)象的一般水平和集中趨勢(shì)的代表性數(shù)值。均值

46、:也稱(chēng)算術(shù)平均值,它是一個(gè)分布數(shù)列的全部值的和除以數(shù)列項(xiàng)數(shù)所得的商。均值是變量集中趨勢(shì)的主要測(cè)量度,同時(shí)均值也是變量的重心,是變量規(guī)律性的反映。其中均值適用于正態(tài)分布和對(duì)稱(chēng)分布資料,對(duì)嚴(yán)重偏態(tài)的分布會(huì)失去其代表性,中位數(shù)適用于所有分布類(lèi)型的資料。2、離散趨勢(shì)離散趨勢(shì)與集中趨勢(shì)相反,離散趨勢(shì)反映的是一組資料中各觀測(cè)值之間的差異和離散程度。集中趨勢(shì)和離散趨勢(shì)的計(jì)量指標(biāo)相反,離散趨勢(shì)較小時(shí),集中趨勢(shì)指標(biāo)的代表性就高。常用離散趨勢(shì)指標(biāo)有:方差和標(biāo)準(zhǔn)差、四分位間距、極差等。四分位間距是從小到大排序后的數(shù)列中的第三個(gè)四分位數(shù)和第一個(gè)四分位數(shù)之差。它避免了受極端值影響,但數(shù)據(jù)資料的利用率很低。方差和標(biāo)準(zhǔn)差:

47、四分位間距是用于有序變量的較為粗糙的離散趨勢(shì)的計(jì)量,而方差和標(biāo)準(zhǔn)差是測(cè)量離散趨勢(shì)的最重要、最常用的計(jì)量指標(biāo)。其中方差和標(biāo)準(zhǔn)差只適用于正態(tài)分布資料,四分位間距適用于各種分布類(lèi)型的資料。3、分布特征偏態(tài)和峰度的計(jì)量除了以上兩種基本趨勢(shì)之外,隨著對(duì)數(shù)據(jù)特征的了解的深入,還應(yīng)了解 數(shù)據(jù)應(yīng)當(dāng)是服從什么分布的。針對(duì)每一種分布類(lèi)型,都可以由一系列的只來(lái)描述數(shù)據(jù)偏離分布的程度。例如對(duì)于正態(tài)分布,偏度系數(shù)、峰度系數(shù)反映當(dāng)前數(shù)據(jù)偏離正態(tài)分布的嚴(yán)重程度。一般這些指標(biāo)使用較少。偏度系數(shù)(skewness)是描述頻數(shù)分布數(shù)列中各觀察值是否對(duì)稱(chēng)地分布在中心兩側(cè),或者說(shuō)某一側(cè)的觀察值是否比另一側(cè)的觀察值對(duì)中心偏離得更遠(yuǎn)一些

48、。偏態(tài)系數(shù)小于0時(shí),均值在眾數(shù)左側(cè),是一種左偏的分布,圖象左邊有“小尾巴”;偏態(tài)系數(shù)大于0時(shí),均值在眾數(shù)右側(cè),是一種右偏的分布,圖象右邊有“小尾巴”;偏態(tài)系數(shù)等于0時(shí),圖形與正態(tài)分布圖形相似,為對(duì)稱(chēng)形分布。峰度系數(shù)可描述頻數(shù)分布數(shù)列中各觀察值是否較為均勻地分布,還是側(cè)重出現(xiàn)在中心附近。即描述次數(shù)分布曲線的高峰形態(tài)。峰越高尖,峰度值越大;峰越低闊,峰度值越小。峰度高低程度以正態(tài)分布為標(biāo)準(zhǔn)進(jìn)行比較,正態(tài)分布的峰度系數(shù)為0,大于0者成為高狹峰,小于0者稱(chēng)為低闊峰。SPSS的許多模塊都可以進(jìn)行描述性分析,單變量截面數(shù)據(jù)的描述性分析的專(zhuān)門(mén)工具有三個(gè):Frequencies、Descriptive和 Ex

49、plore,集中在Descriptive Statistics菜單中。其中Frequencies過(guò)程的特色是產(chǎn)生頻數(shù)分布表,對(duì)分類(lèi)資料和定量資料都適用;Descriptive過(guò)程進(jìn)行一般性的統(tǒng)計(jì)描述,適用于定量資料;Explore過(guò)程用于對(duì)數(shù)據(jù)分布不清時(shí)的探索性分析,能給出各種可能用到的統(tǒng)計(jì)指標(biāo)和統(tǒng)計(jì)圖,適用于定量資料。下面分別介紹。(二)頻數(shù)(Frequencies)過(guò)程頻數(shù)分布表是描述性統(tǒng)計(jì)中最常用的方法之一,F(xiàn)requencies過(guò)程就是專(zhuān)門(mén)為產(chǎn)生頻數(shù)分布表設(shè)計(jì)的,它不僅能產(chǎn)生頻數(shù)分布表,而且還能產(chǎn)生常用的條圖、圓圖等統(tǒng)計(jì)圖。例2.1:根據(jù)調(diào)查問(wèn)卷.sav中的數(shù)據(jù),對(duì)年齡進(jìn)行頻數(shù)分析,你

50、能得到什么信息?AnalyzeDescriptive StatisticsFrequenciesVariable框:x7 *選入要分析的變量Statistics : Mean Median Std.deviation *要求計(jì)算均數(shù)、中位數(shù)和標(biāo)準(zhǔn)差 Percentiles:鍵入2.5:Add *要求計(jì)算P2.5和P97.5百分位數(shù) Percentiles:鍵入97.5:Add Continue Charts Bar charts *做頻數(shù)分布的直方圖 ContinueOK 主要界面說(shuō)明【主對(duì)話框】(見(jiàn)圖2-1)1、Variable(s)框:用于選入需要進(jìn)行描述的變量,若選入多個(gè),系統(tǒng)會(huì)分別進(jìn)行

51、分析。2、Display frequency tables:確定是否在結(jié)果中輸出頻數(shù)表,默認(rèn)輸出。圖2-1 Frequencies過(guò)程主對(duì)話框【Statistics子對(duì)話框】(見(jiàn)圖2-2)該對(duì)話框的功能為定義需要計(jì)算的各種描述統(tǒng)計(jì)量。(或以表格形式給出)1、Percentile Values復(fù)選框組:定義需要輸出的百分位數(shù),可計(jì)算四分位數(shù),可以計(jì)算四分位數(shù)(Quartiles)、每隔指定百分位輸出當(dāng)前百分位數(shù)(Cut points for equal groups)或直接指定某個(gè)百分位數(shù)(Percentiles),本例就在其中直接指定輸出P2.5和P97.5。2、Central tendenc

52、y復(fù)選框組:用于定義描述集中趨勢(shì)的一組指標(biāo):均數(shù)(Mean)、中位數(shù)(Median)、眾數(shù)(Mode)、總和(Sum)。圖2-2 Statistics子對(duì)話框3、Dispersion復(fù)選框組:用于定義描述離散趨勢(shì)的一組指標(biāo):標(biāo)準(zhǔn)差(Std. Deviation)、方差(Variance)、全距(Range)、最小值例Minimum)、最大值(Maximum)、標(biāo)準(zhǔn)誤(S.E mean)。4、Distribution復(fù)選框組:用于定義描述分布特征的兩個(gè)指:偏度系數(shù)(Skewness)和峰度系數(shù)(kurtosis)。5、Values are group midpoints:當(dāng)輸出的數(shù)據(jù)是分組頻數(shù)數(shù)

53、據(jù),并且具體數(shù)值是組中值時(shí),選中該復(fù)選框以通知SPSS,這樣它在計(jì)算各種百分位數(shù)的時(shí)候會(huì)將數(shù)據(jù)按頻數(shù)表對(duì)待,而不會(huì)認(rèn)為同一組內(nèi)的數(shù)據(jù)取值都是組中值的大小。當(dāng)然,如果你不計(jì)算百分位數(shù),選不選它無(wú)所謂。【Charts子對(duì)話框】(見(jiàn)圖2-3)該對(duì)話框用于設(shè)定所做的統(tǒng)計(jì)圖。1、Chart type單選鈕組:定義統(tǒng)計(jì)圖類(lèi)型,有四種選擇:無(wú)、條圖(Bar charts)、餅圖(Pie charts)、直方圖(Histograms)。其中直方圖還可以選擇是否加上正態(tài)曲線(With normal curve)。2、Chart Values單選鈕組:當(dāng)選擇繪制條圖和餅圖時(shí)定義是按照頻數(shù)還是按百分比做圖(即影響縱

54、坐標(biāo)刻度)?!綟ormat子對(duì)話框】(見(jiàn)圖2-4)用于定義輸出頻數(shù)表的格式,不過(guò)一般不用更改,使用默認(rèn)設(shè)置即可。1、Order by單選鈕組:定義頻數(shù)表的排列次序,有四個(gè)選項(xiàng):Ascending values:根據(jù)數(shù)值按升序從小到大作頻數(shù)分布。Descending values:根據(jù)數(shù)值按降序從大到小作頻數(shù)分布。Ascending counts:根據(jù)頻數(shù)按升序從少到多作頻數(shù)分布。Descending counts:根據(jù)頻數(shù)按降序從多到少作頻數(shù)分布。 圖2-3 Charts子對(duì)話框 圖2-4 Format子對(duì)話框2、Multiple variables單選鈕組:如果選擇了兩個(gè)以上變量做頻數(shù)表,則

55、Compare variables可以將它們的結(jié)果在同一個(gè)頻數(shù)表過(guò)程輸出結(jié)果中顯示,便于互相比較;Organize output by variables則將結(jié)果在不同的頻數(shù)表中顯示結(jié)果。主要結(jié)果解釋Statistics年齡 NValid28 Missing2Mean32.21Median31.00Std. Deviation5.724Skewness.386Std. Error of Skewness.441Kurtosis-.240Std. Error of Kurtosis.858Percentiles2.522.00 2528.00 5031.00 7535.00 97.545.00上

56、表輸出了各種統(tǒng)計(jì)量,表格做上方指分析的變量為年齡,有效人數(shù)為28人 (即對(duì)年齡應(yīng)答人數(shù)),缺失值2(有2人沒(méi)對(duì)年齡作回答),平均年齡為32.21歲,中位數(shù)為31,均值和中位數(shù)相差不大,說(shuō)明數(shù)據(jù)分布應(yīng)該基本對(duì)稱(chēng);標(biāo)準(zhǔn)差為5.724歲;峰度系數(shù)為-0.240, 表示正偏,即圖象右邊有小尾巴。表格最下方為五個(gè)百分位數(shù)。年齡 FrequencyPercentValid PercentCumulative PercentValid2213.33.63.6 2313.33.67.1 2513.33.610.7 2613.33.614.3 2713.33.617.9 28310.010.728.6 3041

57、3.314.342.9 31310.010.753.6 3226.77.160.7 3413.33.664.3 35413.314.378.6 3713.33.682.1 3913.33.685.7 4013.33.689.3 4113.33.692.9 4213.33.696.4 4513.33.6100.0 Total2893.3100.0 MissingSystem26.7 Total30100.0 上表為對(duì)年齡做的頻數(shù)分布表,Valid右側(cè)為原始值,為頻數(shù),Percent為各組頻數(shù)占總例數(shù)的百分比(包括缺失值),Valid Percent為各組頻數(shù)占總例數(shù)的有效百分比(即不包括缺失值)

58、,Cumulative Percent,各組頻數(shù)占總例數(shù)的累積百分比,如89.3表示40歲以下的人占總?cè)藬?shù)的89.3%。SPSS的頻數(shù)分布表是按單個(gè)值給出的頻數(shù)分布和累積頻數(shù)分布,而不能按某種要求確定組距和組數(shù),所以它更適合對(duì)離散變量做頻數(shù)分析,對(duì)于連續(xù)變量做頻數(shù)分析意義不太大。如果想用Frequencies過(guò)程得到分組的頻數(shù)分布表,可以先用Recode過(guò)程產(chǎn)生一個(gè)新變量代表所需的各組段,再對(duì)該新的分類(lèi)變量做頻數(shù)表。圖2-5 直方圖上圖為直方圖,可見(jiàn)數(shù)據(jù)基本上呈正態(tài)分布,圖上曲線為正態(tài)曲線,可以把直方圖與理論上的正態(tài)曲線作比較。右側(cè)為年齡的均值、標(biāo)準(zhǔn)差和有效例數(shù)。實(shí)例引申把分析變量該成x1(對(duì)

59、家庭的滿意程度),則得到的頻數(shù)表為:對(duì)家庭的滿意程度 FrequencyPercentValid PercentCumulative PercentValid很不滿意310.010.010.0 不滿意1033.333.343.3 一般826.726.770.0 滿意620.020.090.0 很滿意310.010.0100.0 Total30100.0100.0 這是一張分類(lèi)變量的頻數(shù)表,可見(jiàn)對(duì)家庭很不滿意的人占10%,不滿意的人占33.3%,無(wú)所謂的占26.7%,累計(jì)占到70%,說(shuō)明現(xiàn)代社會(huì)人們對(duì)家庭的滿意程度上并不是很理想。相對(duì)于連續(xù)變量的頻數(shù)表,分類(lèi)變量的頻數(shù)表更有意義。(三)Descr

60、iptive 過(guò)程Descriptive 過(guò)程是連續(xù)資料統(tǒng)計(jì)描述應(yīng)用最多的過(guò)程,它對(duì)變量進(jìn)行描述性統(tǒng)計(jì)分析,計(jì)算出一系列的統(tǒng)計(jì)指標(biāo)。AnalyzeAnalyzeDescriptive StatisticsDescriptiveVariable框:x10 *選入要分析的變量月收入OK主要界面介紹【主對(duì)話框】(見(jiàn)圖2-6)1、Variables框:用于選入需要進(jìn)行描述的變量,如果選入多個(gè),系統(tǒng)會(huì)對(duì)它們依次進(jìn)行描述,并輸出在同一張表格里。2、 standardized values as variables: 確定是否要將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)正態(tài)變換并存為新變量。當(dāng)要把數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)正態(tài)變換時(shí)這是一個(gè)非常

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論