




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、SPSS統(tǒng)計(jì)分析基礎(chǔ)入門統(tǒng)計(jì)分析基礎(chǔ)入門傅天珍傅天珍 2013.12.04LOGOSPSSP 數(shù)據(jù)無處不在 - 將數(shù)據(jù)轉(zhuǎn)化為信息PP 現(xiàn)象、問題在演繹 - 通過調(diào)查,求真數(shù)據(jù)準(zhǔn)備統(tǒng)計(jì)學(xué)統(tǒng)計(jì)工具信息Solution:為什么學(xué)為什么學(xué) SPSS Statistics? SPSS SAS難難易易LOGOSPSSSPSS Statistics是什么?是什么?u Statistical Package for the Social Sciences “社會(huì)科學(xué)統(tǒng)計(jì)軟件包社會(huì)科學(xué)統(tǒng)計(jì)軟件包”:原名:原名u Statistical Product and Service Solutions “統(tǒng)計(jì)產(chǎn)品與服務(wù)
2、解決方案統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案” :2000年更改年更改 世界上最早的統(tǒng)計(jì)分析軟件世界上最早的統(tǒng)計(jì)分析軟件:19681968年,由美國(guó)斯坦福大學(xué)的年,由美國(guó)斯坦福大學(xué)的3 3位研究生于研制,廣泛應(yīng)用位研究生于研制,廣泛應(yīng)用于自然科學(xué)、技術(shù)科學(xué)、社會(huì)科學(xué)的各個(gè)領(lǐng)域于自然科學(xué)、技術(shù)科學(xué)、社會(huì)科學(xué)的各個(gè)領(lǐng)域 世界上應(yīng)用最廣泛的專業(yè)統(tǒng)計(jì)軟件世界上應(yīng)用最廣泛的專業(yè)統(tǒng)計(jì)軟件:目前世界上流行的三大統(tǒng)計(jì)分析軟件之一(:目前世界上流行的三大統(tǒng)計(jì)分析軟件之一(SASSAS、SPSSSPSS及及SYSTATSYSTAT)。)。全球約有全球約有2828萬萬家產(chǎn)品用戶,世界上許多家產(chǎn)品用戶,世界上許多有影響的報(bào)刊雜志有
3、影響的報(bào)刊雜志紛紛就紛紛就SPSSSPSS的自的自動(dòng)統(tǒng)計(jì)繪圖、數(shù)據(jù)的深入分析、使用方便、功能齊全等方面給予了高度的評(píng)價(jià)與稱贊動(dòng)統(tǒng)計(jì)繪圖、數(shù)據(jù)的深入分析、使用方便、功能齊全等方面給予了高度的評(píng)價(jià)與稱贊 影響和信譽(yù)極高影響和信譽(yù)極高:在國(guó)際學(xué)術(shù)界有條不成文的規(guī)定,即在國(guó)際學(xué)術(shù)界有條不成文的規(guī)定,即在國(guó)際學(xué)術(shù)交流中,凡是用在國(guó)際學(xué)術(shù)交流中,凡是用SPSSSPSS軟件完成的計(jì)算和統(tǒng)計(jì)分析,可以不必說明算法軟件完成的計(jì)算和統(tǒng)計(jì)分析,可以不必說明算法目前最新版本:目前最新版本:IBM SPSS Statistics 20.0IBM SPSS Statistics 20.0多國(guó)語(yǔ)言版多國(guó)語(yǔ)言版SPSSSPS
4、S Statistics的基本特點(diǎn)的基本特點(diǎn) 易用性強(qiáng):易用性強(qiáng):“易學(xué)易用易普及易學(xué)易用易普及” 操作界面極為友好,操作簡(jiǎn)單,大多數(shù)操作界面極為友好,操作簡(jiǎn)單,大多數(shù)操作可通過鼠標(biāo)拖曳、點(diǎn)擊操作可通過鼠標(biāo)拖曳、點(diǎn)擊“菜單菜單”、“按按鈕鈕”和和“對(duì)話框?qū)υ捒颉眮硗瓿蓙硗瓿?良好的幫助系統(tǒng)和自學(xué)功能良好的幫助系統(tǒng)和自學(xué)功能 適用于非專業(yè)統(tǒng)計(jì)分析人員適用于非專業(yè)統(tǒng)計(jì)分析人員 也為高級(jí)用戶提供編程功能也為高級(jí)用戶提供編程功能 兼容性好兼容性好 數(shù)據(jù)輸入:數(shù)據(jù)輸入:ExcelExcel、LotusLotus、 OracleOracle、SQL SQL ServerServer、AccessAcces
5、s、dBASEdBASE、文本,以及各類、文本,以及各類統(tǒng)計(jì)軟件的數(shù)據(jù)形式統(tǒng)計(jì)軟件的數(shù)據(jù)形式SASSAS,StataStata文件文件 數(shù)據(jù)輸出:數(shù)據(jù)輸出:WordWord、HTMLHTML、XMLXML、 ExcelExcel、 PowerPointPowerPoint、PDFPDF 功能強(qiáng)大功能強(qiáng)大 全面、成熟的統(tǒng)計(jì)過程:全面、成熟的統(tǒng)計(jì)過程:非常全面地非常全面地涵蓋了數(shù)據(jù)分析的整個(gè)流程,提供了數(shù)據(jù)涵蓋了數(shù)據(jù)分析的整個(gè)流程,提供了數(shù)據(jù)獲取、數(shù)據(jù)管理與準(zhǔn)備、數(shù)據(jù)分析、結(jié)果獲取、數(shù)據(jù)管理與準(zhǔn)備、數(shù)據(jù)分析、結(jié)果報(bào)告這樣一個(gè)數(shù)據(jù)分析的完整過程。報(bào)告這樣一個(gè)數(shù)據(jù)分析的完整過程。 全面的統(tǒng)計(jì)技術(shù):全面
6、的統(tǒng)計(jì)技術(shù):自帶自帶11種類型種類型136個(gè)個(gè)函數(shù),提供了如數(shù)據(jù)匯總、計(jì)數(shù)、交叉分函數(shù),提供了如數(shù)據(jù)匯總、計(jì)數(shù)、交叉分析、分類、描述性統(tǒng)計(jì)分析、因子分析、析、分類、描述性統(tǒng)計(jì)分析、因子分析、回歸及聚類分析等廣泛的基本統(tǒng)計(jì)分析功回歸及聚類分析等廣泛的基本統(tǒng)計(jì)分析功能。能。 全新的演示圖形系統(tǒng),能夠產(chǎn)生更全新的演示圖形系統(tǒng),能夠產(chǎn)生更加專業(yè)的圖片:加專業(yè)的圖片:高分辨率、色彩豐富的高分辨率、色彩豐富的餅圖、條形圖、直方圖、散點(diǎn)圖、三維圖餅圖、條形圖、直方圖、散點(diǎn)圖、三維圖形以及更多圖表都是形以及更多圖表都是 SPSS Statistics中的中的標(biāo)準(zhǔn)功能。標(biāo)準(zhǔn)功能。LOGOSPSS怎么學(xué)習(xí)怎么學(xué)習(xí)
7、SPSS Statistics?理論是研究的基石:理論是研究的基石: SPSS只是一個(gè)統(tǒng)計(jì)工具,需掌只是一個(gè)統(tǒng)計(jì)工具,需掌握統(tǒng)計(jì)學(xué)理論基礎(chǔ)握統(tǒng)計(jì)學(xué)理論基礎(chǔ)模仿是最好的學(xué)習(xí)模仿是最好的學(xué)習(xí)選一種適合自己的學(xué)習(xí)途徑:選一種適合自己的學(xué)習(xí)途徑: 網(wǎng)絡(luò)資源教程上課培訓(xùn)班網(wǎng)絡(luò)資源教程上課培訓(xùn)班v自習(xí)參考書自習(xí)參考書 1. SPSS1. SPSS統(tǒng)計(jì)分析基礎(chǔ)、應(yīng)用與實(shí)戰(zhàn)精粹統(tǒng)計(jì)分析基礎(chǔ)、應(yīng)用與實(shí)戰(zhàn)精粹. . 王璐、王沁王璐、王沁. . 化學(xué)工業(yè)出版社化學(xué)工業(yè)出版社. 2012-3. 2012-3(非常適合初學(xué)者)(非常適合初學(xué)者) 2. SPSS2. SPSS統(tǒng)計(jì)分析基礎(chǔ)教程統(tǒng)計(jì)分析基礎(chǔ)教程( (第第2
8、2版版). ). 張文彤張文彤, , 鄺春偉鄺春偉. . 高等教育出版社高等教育出版社; ; 第第2 2版版 (2011(2011年年1111月月1 1日日, 20.0), 20.0) 3. 3. 問卷統(tǒng)計(jì)分析實(shí)務(wù)問卷統(tǒng)計(jì)分析實(shí)務(wù)-SPSS-SPSS操作與應(yīng)用操作與應(yīng)用. .吳明隆吳明隆. . 重慶大學(xué)出版社重慶大學(xué)出版社. 2010-5-1.(. 2010-5-1.(讀秀有全文,讀秀有全文,14.0)14.0) 4. SPSS 4. SPSS統(tǒng)計(jì)分析與數(shù)據(jù)挖掘統(tǒng)計(jì)分析與數(shù)據(jù)挖掘. . 謝龍漢,尚濤謝龍漢,尚濤. . 電子工業(yè)出版社電子工業(yè)出版社. 2012-1-1. (19.0. 2012-
9、1-1. (19.0,有光盤,有光盤) ) 5. 5. 統(tǒng)計(jì)分析與統(tǒng)計(jì)分析與SPSSSPSS的應(yīng)用(第三版)的應(yīng)用(第三版). . 薛薇薛薇. .中國(guó)人民大學(xué)出版社中國(guó)人民大學(xué)出版社. 2011-1-1. 2011-1-1(教材,入門)(教材,入門) 6. SPSS6. SPSS在生物統(tǒng)計(jì)中的應(yīng)用(第二版)在生物統(tǒng)計(jì)中的應(yīng)用(第二版). . 張力。廈門大學(xué)出版社。張力。廈門大學(xué)出版社。2008.82008.8 內(nèi)容情況:內(nèi)容情況:一般一般SPSS教程教程1225章,章,200600頁(yè)頁(yè)SPSS軟件自帶教程:大于軟件自帶教程:大于1000頁(yè)頁(yè)人大經(jīng)濟(jì)論壇:人大經(jīng)濟(jì)論壇: SPSS初中級(jí)視頻課程初
10、中級(jí)視頻課程張文彤主講;張文彤主講;15講講12h SPSS高級(jí)視頻課程高級(jí)視頻課程張文彤主講;張文彤主講;17講講15hSPSS官方初中級(jí)培訓(xùn)班:官方初中級(jí)培訓(xùn)班:3天天LOGOSPSS圖書館電子參考資料圖書館電子參考資料u 圖書館主頁(yè)圖書館主頁(yè)數(shù)據(jù)導(dǎo)航數(shù)據(jù)導(dǎo)航中文資源中文資源非書資料管理系統(tǒng)非書資料管理系統(tǒng)安裝虛擬光驅(qū)安裝虛擬光驅(qū)下載下載u 圖書館主頁(yè)圖書館主頁(yè)書目查詢書目查詢光盤下載光盤下載LOGOSPSS進(jìn)行統(tǒng)計(jì)分析前不對(duì)數(shù)據(jù)進(jìn)行整理和歸納。進(jìn)行統(tǒng)計(jì)分析前不對(duì)數(shù)據(jù)進(jìn)行整理和歸納。得到數(shù)據(jù)文件后,直接進(jìn)行得到數(shù)據(jù)文件后,直接進(jìn)行統(tǒng)計(jì)分析或繪制圖表,根本沒有對(duì)數(shù)據(jù)屬性進(jìn)行定義,也沒有對(duì)數(shù)據(jù)
11、文統(tǒng)計(jì)分析或繪制圖表,根本沒有對(duì)數(shù)據(jù)屬性進(jìn)行定義,也沒有對(duì)數(shù)據(jù)文件進(jìn)行科學(xué)必要的預(yù)處理。件進(jìn)行科學(xué)必要的預(yù)處理。亂用各類統(tǒng)計(jì)方法。亂用各類統(tǒng)計(jì)方法。沒有從實(shí)際問題的要求出發(fā),不注意方法的使用條沒有從實(shí)際問題的要求出發(fā),不注意方法的使用條件,認(rèn)為只要能輸出結(jié)果即可。例如,定性數(shù)據(jù)采用連續(xù)性數(shù)據(jù)的統(tǒng)計(jì)件,認(rèn)為只要能輸出結(jié)果即可。例如,定性數(shù)據(jù)采用連續(xù)性數(shù)據(jù)的統(tǒng)計(jì)方法,沒有對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化等。方法,沒有對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化等。對(duì)分析結(jié)果輸出的圖表不知道其統(tǒng)計(jì)意義,更不知輸出量的實(shí)際意義對(duì)分析結(jié)果輸出的圖表不知道其統(tǒng)計(jì)意義,更不知輸出量的實(shí)際意義,因此無法對(duì)數(shù)據(jù)處理結(jié)果進(jìn)行深層次的分析研究。因此無法對(duì)數(shù)據(jù)處理結(jié)果
12、進(jìn)行深層次的分析研究。SPSS軟件使用時(shí)常犯的錯(cuò)誤軟件使用時(shí)常犯的錯(cuò)誤LOGOSPSS基礎(chǔ)知識(shí)介紹基礎(chǔ)知識(shí)介紹 SPSS界面與菜單介紹界面與菜單介紹 數(shù)據(jù)準(zhǔn)備數(shù)據(jù)準(zhǔn)備 描述性統(tǒng)計(jì)分析描述性統(tǒng)計(jì)分析 簡(jiǎn)單統(tǒng)計(jì)推斷簡(jiǎn)單統(tǒng)計(jì)推斷 相關(guān)分析相關(guān)分析 回歸分析回歸分析 圖形的實(shí)現(xiàn)圖形的實(shí)現(xiàn)SPSS Statistics& 圖書館購(gòu)買:圖書館購(gòu)買: IBM SPSS Statistics 20.0(簡(jiǎn)稱簡(jiǎn)稱SPSS20.0) : 下載路徑:下載路徑:圖書館主頁(yè)幫助與指南常用軟件圖書館主頁(yè)幫助與指南常用軟件LOGOSPSS1. SPSS界面界面與菜單介紹與菜單介紹 4個(gè)主要窗口個(gè)主要窗口:數(shù)據(jù)編輯窗
13、口、數(shù)據(jù)編輯窗口、結(jié)果輸出窗口結(jié)果輸出窗口、語(yǔ)法編輯窗口、腳、語(yǔ)法編輯窗口、腳本編輯窗本編輯窗口口變量視圖變量視圖:定義數(shù)據(jù)的格式(變量名、類型、寬度等),每一行代表對(duì):定義數(shù)據(jù)的格式(變量名、類型、寬度等),每一行代表對(duì)一個(gè)變量的定義,每一列則代表定義該變量時(shí)用到的某種屬性一個(gè)變量的定義,每一列則代表定義該變量時(shí)用到的某種屬性數(shù)據(jù)編輯窗口:數(shù)據(jù)編輯窗口: 建立新數(shù)據(jù)、編輯和建立新數(shù)據(jù)、編輯和顯示已有數(shù)據(jù)文件;顯示已有數(shù)據(jù)文件; 兩個(gè)視圖區(qū)兩個(gè)視圖區(qū)LOGOSPSS結(jié)果查看窗口:結(jié)果查看窗口: 隨執(zhí)行統(tǒng)計(jì)分析隨執(zhí)行統(tǒng)計(jì)分析命令打開,顯示分命令打開,顯示分析結(jié)果、統(tǒng)計(jì)報(bào)告、析結(jié)果、統(tǒng)計(jì)報(bào)告、圖表
14、等圖表等 如果在運(yùn)行時(shí)產(chǎn)如果在運(yùn)行時(shí)產(chǎn)生錯(cuò)誤,也會(huì)輸出生錯(cuò)誤,也會(huì)輸出提示信息提示信息 允許對(duì)輸出結(jié)果允許對(duì)輸出結(jié)果進(jìn)行常規(guī)編輯整理,進(jìn)行常規(guī)編輯整理,窗口內(nèi)容可以直接窗口內(nèi)容可以直接保存,保存,“*.spv”LOGOSPSS菜單介紹菜單介紹數(shù)據(jù)準(zhǔn)備數(shù)據(jù)準(zhǔn)備二二 要利用要利用SPSSSPSS進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析,首要的工作就是建立進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析,首要的工作就是建立SPSSSPSS數(shù)據(jù)文件;數(shù)據(jù)文件; 實(shí)際中收集、調(diào)查得到的數(shù)據(jù)資料往往是零亂的,不實(shí)際中收集、調(diào)查得到的數(shù)據(jù)資料往往是零亂的,不能直接進(jìn)行統(tǒng)計(jì)分析;能直接進(jìn)行統(tǒng)計(jì)分析; 主要由菜單欄中的主要由菜單欄中的【數(shù)據(jù)】【數(shù)據(jù)】和和【轉(zhuǎn)換】【轉(zhuǎn)
15、換】命令來實(shí)現(xiàn)命令來實(shí)現(xiàn) 規(guī)范化操作中不可忽略的一步。規(guī)范化操作中不可忽略的一步。LOGOSPSS 2.1 數(shù)據(jù)數(shù)據(jù)文件的建立文件的建立四種創(chuàng)建數(shù)據(jù)文件的方法:四種創(chuàng)建數(shù)據(jù)文件的方法: 新建數(shù)據(jù)文件 直接打開已有數(shù)據(jù)文件:*.sav、*.sys,*.xls,*.sas7bdat,*.txt等 使用數(shù)據(jù)庫(kù)查詢:與大型數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)交換,如SQL、Oracle,也適用于Excel 從文本向?qū)?dǎo)入數(shù)據(jù)文件LOGOSPSS 實(shí)例實(shí)例2-1:Excel數(shù)據(jù)的導(dǎo)入數(shù)據(jù)的導(dǎo)入1. 整理excel文檔,第一行設(shè)置為變量,與spss格式相同2. 打開SPSS軟件,菜單欄中選擇【文件】【打開】【數(shù)據(jù)】命令,彈出【
16、打開數(shù)據(jù)】對(duì)話框3. 選擇2-1.xls文件4. 點(diǎn)選【從第一行數(shù)據(jù)讀取變量名】5. 【確定】文件2-1.xls是上證指數(shù)從2007年1月4日至2008年10月16日的數(shù)據(jù)資料,包括了開盤價(jià)、當(dāng)日最高價(jià)、當(dāng)日最低價(jià)和收盤價(jià)等選項(xiàng),請(qǐng)將該數(shù)據(jù)導(dǎo)入至SPSS中。LOGOSPSSLOGOSPSS2.2 SPSS數(shù)據(jù)文件的屬性數(shù)據(jù)文件的屬性v SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件,包括文件結(jié)數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件,包括文件結(jié)構(gòu)和數(shù)據(jù),在軟件中創(chuàng)建好數(shù)據(jù)后,首先應(yīng)該進(jìn)行構(gòu)和數(shù)據(jù),在軟件中創(chuàng)建好數(shù)據(jù)后,首先應(yīng)該進(jìn)行數(shù)據(jù)數(shù)據(jù)文件的屬性定義文件的屬性定義或者或者結(jié)構(gòu)定義結(jié)構(gòu)定義。 變量屬性:變量屬性
17、:變量名變量名、變量類型變量類型、變量、變量名標(biāo)簽、名標(biāo)簽、變量值變量值、缺失值的定義、度、缺失值的定義、度量的尺度、及數(shù)據(jù)的顯示屬性(顯示量的尺度、及數(shù)據(jù)的顯示屬性(顯示寬度、列寬度、對(duì)齊方式)寬度、列寬度、對(duì)齊方式)u 例:新建例:新建 數(shù)據(jù)錄入數(shù)據(jù)錄入“變量視圖變量視圖”定義變量;定義變量; “數(shù)據(jù)視圖數(shù)據(jù)視圖”在定義好的在定義好的變量列填入相應(yīng)數(shù)據(jù)變量列填入相應(yīng)數(shù)據(jù)LOGOSPSSu 實(shí)例實(shí)例2-2: 左邊是對(duì)人們信息獲取情況的一個(gè)調(diào)研表,請(qǐng)定義問卷調(diào)查表的變量信息。打開新數(shù)據(jù)表:文件新建數(shù)據(jù)打開新數(shù)據(jù)表:文件新建數(shù)據(jù)變量視圖變量視圖變量名變量名數(shù)據(jù)類型數(shù)據(jù)類型描述性的描述性的變量標(biāo)簽
18、變量標(biāo)簽描述性的值標(biāo)簽描述性的值標(biāo)簽用戶定義的缺失值用戶定義的缺失值LOGOSPSS 缺失值缺失值:如果直接進(jìn)行數(shù)據(jù)分析,:如果直接進(jìn)行數(shù)據(jù)分析,SPSS將把缺失數(shù)據(jù)作為正常數(shù)據(jù),造成非常大的將把缺失數(shù)據(jù)作為正常數(shù)據(jù),造成非常大的誤差誤差 數(shù)據(jù)中存在漏填數(shù)據(jù)數(shù)據(jù)中存在漏填數(shù)據(jù) 數(shù)據(jù)中存在明顯錯(cuò)誤或明顯不合理的數(shù)據(jù)(如年數(shù)據(jù)中存在明顯錯(cuò)誤或明顯不合理的數(shù)據(jù)(如年齡齡130) 缺失數(shù)據(jù)處理步驟:缺失數(shù)據(jù)處理步驟: 1、指定缺失數(shù)據(jù),指明哪些數(shù)據(jù)屬于缺失數(shù)據(jù)、指定缺失數(shù)據(jù),指明哪些數(shù)據(jù)屬于缺失數(shù)據(jù)(空缺數(shù)據(jù),首先填一個(gè)特定標(biāo)記數(shù)據(jù))(空缺數(shù)據(jù),首先填一個(gè)特定標(biāo)記數(shù)據(jù)) 2、統(tǒng)計(jì)分析時(shí)對(duì)缺失數(shù)據(jù)進(jìn)行一
19、定處理、統(tǒng)計(jì)分析時(shí)對(duì)缺失數(shù)據(jù)進(jìn)行一定處理(選擇(選擇缺失數(shù)據(jù)處理方法)缺失數(shù)據(jù)處理方法) LOGOSPSS數(shù)據(jù)視圖數(shù)據(jù)視圖變量名稱變量名稱個(gè)案或個(gè)案或觀查值觀查值 SPSS數(shù)據(jù)文件中的一列數(shù)據(jù)稱為一個(gè)變量,每個(gè)變量都應(yīng)有一個(gè)變量名。 SPSS數(shù)據(jù)文件中的一行數(shù)據(jù)稱為一條個(gè)案或觀測(cè)量。 LOGOSPSS2.3 數(shù)據(jù)管理和轉(zhuǎn)換數(shù)據(jù)管理和轉(zhuǎn)換 通常情況下,剛剛建立的數(shù)據(jù)文件并不能立即進(jìn)行統(tǒng)計(jì)分析剛剛建立的數(shù)據(jù)文件并不能立即進(jìn)行統(tǒng)計(jì)分析,這是因?yàn)槭占降臄?shù)據(jù)還是原始數(shù)據(jù),還不能直接利用分析,需要對(duì)原始數(shù)據(jù)進(jìn)行進(jìn)一步的加工、整理進(jìn)一步的加工、整理。 數(shù)據(jù)變換是正式分析前的重要一步,通過數(shù)據(jù)變換數(shù)據(jù)變換,
20、一個(gè)優(yōu)秀的統(tǒng)計(jì)分析員可以將原始記錄整理成所需的任何格式,從而為后面的精確分析打下堅(jiān)實(shí)的基礎(chǔ)。張文彤u 變量級(jí)別的數(shù)據(jù)管理變量級(jí)別的數(shù)據(jù)管理主要集中了一些對(duì)變量進(jìn)行變換的過程,如對(duì)原始數(shù)據(jù)進(jìn)行主要集中了一些對(duì)變量進(jìn)行變換的過程,如對(duì)原始數(shù)據(jù)進(jìn)行排序、轉(zhuǎn)置、四則排序、轉(zhuǎn)置、四則運(yùn)算、對(duì)數(shù)據(jù)重新編碼、求出變量的秩次運(yùn)算、對(duì)數(shù)據(jù)重新編碼、求出變量的秩次等,這些功能往往在統(tǒng)計(jì)分析的預(yù)處等,這些功能往往在統(tǒng)計(jì)分析的預(yù)處理中起著非常重要的作用。理中起著非常重要的作用。u 文件級(jí)別的數(shù)據(jù)管理文件級(jí)別的數(shù)據(jù)管理對(duì)數(shù)據(jù)進(jìn)行加工整理,比如根據(jù)統(tǒng)計(jì)分析的要求對(duì)數(shù)據(jù)進(jìn)行加工整理,比如根據(jù)統(tǒng)計(jì)分析的要求對(duì)數(shù)據(jù)文件進(jìn)行分組
21、、合并、對(duì)數(shù)據(jù)文件進(jìn)行分組、合并、加權(quán)、篩選等操作加權(quán)、篩選等操作觀察值的名次觀察值的名次:如:如3 3、5 5、-2-2、0 0、7 7數(shù)列各觀測(cè)量的秩為:數(shù)列各觀測(cè)量的秩為:3 3、4 4、1 1、2 2、5 5LOGOSPSS案例2-3:文件合并 問題:?jiǎn)栴}:已知2-3-1.sav和2-3-2.sav中的數(shù)據(jù)是北京、天津、河北等省市在2005年部分行業(yè)的固定投資額(億元)數(shù)據(jù),請(qǐng)將2-3-1.sav和2-3-2.sav的數(shù)據(jù)文件縱向合并。LOGOSPSS例:我國(guó)城市和農(nóng)村居民消費(fèi)價(jià)格例:我國(guó)城市和農(nóng)村居民消費(fèi)價(jià)格分類指數(shù)數(shù)據(jù)見右表。分類指數(shù)數(shù)據(jù)見右表。 由于不同產(chǎn)品的價(jià)格漲跌不同,由于不
22、同產(chǎn)品的價(jià)格漲跌不同,請(qǐng)請(qǐng)找出城市和農(nóng)村居民消費(fèi)價(jià)找出城市和農(nóng)村居民消費(fèi)價(jià)格指數(shù)都較去年上漲超過格指數(shù)都較去年上漲超過 1%(指數(shù)(指數(shù)101)的項(xiàng)目數(shù)的項(xiàng)目數(shù)。案例案例2-4:變量值計(jì)數(shù)(消費(fèi)價(jià)格指數(shù)的上漲項(xiàng)目):變量值計(jì)數(shù)(消費(fèi)價(jià)格指數(shù)的上漲項(xiàng)目) 變量值計(jì)數(shù):變量值計(jì)數(shù):計(jì)算一些變量在同一個(gè)觀測(cè)量中滿足要求的特定變量值計(jì)算一些變量在同一個(gè)觀測(cè)量中滿足要求的特定變量值出現(xiàn)的次數(shù)。出現(xiàn)的次數(shù)。Step1:轉(zhuǎn)換轉(zhuǎn)換對(duì)個(gè)案內(nèi)的值計(jì)數(shù);對(duì)個(gè)案內(nèi)的值計(jì)數(shù);Step2:輸入目標(biāo)計(jì)數(shù)變量(輸入目標(biāo)計(jì)數(shù)變量(x,增加率),增加率)Step3:選擇計(jì)數(shù)變量選擇計(jì)數(shù)變量Step4:設(shè)置計(jì)數(shù)規(guī)則;設(shè)置計(jì)數(shù)規(guī)則;
23、Step5:完成操作完成操作結(jié)果輸出結(jié)果輸出描述性統(tǒng)計(jì)分析描述性統(tǒng)計(jì)分析三三統(tǒng)計(jì)分析的目的:統(tǒng)計(jì)分析的目的:研究總體的數(shù)量特征。研究者一般研究總體的數(shù)量特征。研究者一般通過樣本來研究總體。通過樣本來研究總體。首先了解數(shù)據(jù)的整體情況首先了解數(shù)據(jù)的整體情況,隨后才能考慮做深入的推,隨后才能考慮做深入的推斷斷兩種方式實(shí)現(xiàn):兩種方式實(shí)現(xiàn): 第一,數(shù)值計(jì)算,計(jì)算常用的基本統(tǒng)計(jì)量的值,準(zhǔn)確反映第一,數(shù)值計(jì)算,計(jì)算常用的基本統(tǒng)計(jì)量的值,準(zhǔn)確反映數(shù)據(jù)的基本統(tǒng)計(jì)特征;數(shù)據(jù)的基本統(tǒng)計(jì)特征; 第二,圖形繪制,即繪制常見的基本統(tǒng)計(jì)圖形,直觀展現(xiàn)第二,圖形繪制,即繪制常見的基本統(tǒng)計(jì)圖形,直觀展現(xiàn)數(shù)據(jù)的分布特點(diǎn)。數(shù)據(jù)的分
24、布特點(diǎn)。LOGOSPSSu描述性統(tǒng)計(jì)分析是統(tǒng)計(jì)分析的第一步和先決條件描述性統(tǒng)計(jì)分析是統(tǒng)計(jì)分析的第一步和先決條件u在進(jìn)行統(tǒng)計(jì)分析和建模前,常需對(duì)數(shù)據(jù)做一些描述性統(tǒng)計(jì),了解數(shù)據(jù)的基本統(tǒng)計(jì)指標(biāo)在進(jìn)行統(tǒng)計(jì)分析和建模前,常需對(duì)數(shù)據(jù)做一些描述性統(tǒng)計(jì),了解數(shù)據(jù)的基本統(tǒng)計(jì)指標(biāo) 定量數(shù)據(jù):均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤等定量數(shù)據(jù):均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤等 計(jì)數(shù)或分類數(shù)據(jù):頻率、比率等計(jì)數(shù)或分類數(shù)據(jù):頻率、比率等u SPSS的許多模塊均可完成描述性分析,但專門為該目的而設(shè)計(jì)的幾個(gè)模塊則集中在描的許多模塊均可完成描述性分析,但專門為該目的而設(shè)計(jì)的幾個(gè)模塊則集中在描述菜單中:述菜單中:【分析分析】【描述統(tǒng)計(jì)描述統(tǒng)計(jì)】1.1.基本
25、統(tǒng)計(jì)量基本統(tǒng)計(jì)量 頻率頻率(F)(F):該過程產(chǎn)生頻數(shù)表;:該過程產(chǎn)生頻數(shù)表; 描述描述(D)(D):進(jìn)行一般性統(tǒng)計(jì)描述;:進(jìn)行一般性統(tǒng)計(jì)描述; 探索探索(E)(E):用于對(duì)數(shù)據(jù)概況不清時(shí)的探索性分析:用于對(duì)數(shù)據(jù)概況不清時(shí)的探索性分析3 描述性統(tǒng)計(jì)分析描述性統(tǒng)計(jì)分析3.1 頻數(shù)分析頻數(shù)分析l 使用目的:了解變量取值的狀況,對(duì)把握數(shù)據(jù)分布特征非常有用,是描述性統(tǒng)計(jì)中最常用的方法之一。l 例如,了解某班學(xué)生考試的學(xué)習(xí)成績(jī)、了解某地區(qū)居民的收入水平等都可以借助于頻數(shù)分析。u 作用: (1)編制頻數(shù)表,按要求給出某百分位點(diǎn)的數(shù)值 頻率頻率:各類別的記錄數(shù):各類別的記錄數(shù) 有效百分比有效百分比:即各記錄
26、數(shù)占有效樣本數(shù)的百分比,有效樣本數(shù)總樣本:即各記錄數(shù)占有效樣本數(shù)的百分比,有效樣本數(shù)總樣本缺失樣本數(shù)缺失樣本數(shù) 累計(jì)百分比累計(jì)百分比:即各百分比逐級(jí)累加起來的結(jié)果。最終取值為:即各百分比逐級(jí)累加起來的結(jié)果。最終取值為100100 (2)繪制常用的條圖、餅圖等統(tǒng)計(jì)圖 (3)還可以進(jìn)行分位數(shù)、描述集中趨勢(shì)的基本統(tǒng)計(jì)量等計(jì)算功能 案例案例3-1:利用頻數(shù)分析產(chǎn)品銷售信息:利用頻數(shù)分析產(chǎn)品銷售信息 假設(shè)某公司每周大約賣出假設(shè)某公司每周大約賣出2000萬件產(chǎn)品,但市場(chǎng)的需求不穩(wěn)定,該萬件產(chǎn)品,但市場(chǎng)的需求不穩(wěn)定,該公司的生產(chǎn)經(jīng)理想更好的掌握近期該產(chǎn)品的分布情況。公司的生產(chǎn)經(jīng)理想更好的掌握近期該產(chǎn)品的分布
27、情況。利用頻數(shù)分利用頻數(shù)分析析你能得到什么你能得到什么有助于生產(chǎn)及銷售的的信息有助于生產(chǎn)及銷售的的信息? 近期公司該產(chǎn)品每周的銷售數(shù)據(jù)(單位:百萬):近期公司該產(chǎn)品每周的銷售數(shù)據(jù)(單位:百萬):24 18 18 26 24 23 16 18 21 20 21 24 19 19 14 22 21 26 27 15 19 17 20 20 19 22 23 16 23 21 15 19 21 20 22 15 24 19u Step1:打開打開 “3-1” “3-1”(savsav、xlsxls)【分析分析】【描述統(tǒng)計(jì)描述統(tǒng)計(jì)】【頻率頻率】uStep2:設(shè)置設(shè)置“統(tǒng)計(jì)統(tǒng)計(jì)量量”、“圖表圖表”內(nèi)容內(nèi)
28、容uStep3:結(jié)果輸出:結(jié)果輸出l 描述分析目的描述分析目的:獲取數(shù)據(jù)的均值、標(biāo)準(zhǔn)差、峰度等數(shù)據(jù),進(jìn)一步把握數(shù)據(jù)的:獲取數(shù)據(jù)的均值、標(biāo)準(zhǔn)差、峰度等數(shù)據(jù),進(jìn)一步把握數(shù)據(jù)的集中趨勢(shì)集中趨勢(shì)、離散程度離散程度和和分布形狀分布形狀。3.2 描述分析描述分析u 基本描述統(tǒng)計(jì)量:基本描述統(tǒng)計(jì)量:(1)表示數(shù)據(jù)的中心位置(集中趨勢(shì))表示數(shù)據(jù)的中心位置(集中趨勢(shì)) :均值、中位數(shù)、眾數(shù)均值、中位數(shù)、眾數(shù)等等(2)表示數(shù)據(jù)的離散程度(離散趨勢(shì)):)表示數(shù)據(jù)的離散程度(離散趨勢(shì)):全距、全距、方差、標(biāo)準(zhǔn)差、極差、變異系數(shù)方差、標(biāo)準(zhǔn)差、極差、變異系數(shù)等等(3)刻畫分布形態(tài)的描述統(tǒng)計(jì)量(與正態(tài)分布比較):數(shù)據(jù)分布是
29、否對(duì)稱,)刻畫分布形態(tài)的描述統(tǒng)計(jì)量(與正態(tài)分布比較):數(shù)據(jù)分布是否對(duì)稱,偏度、峰度偏度、峰度等等l眾數(shù):眾數(shù):就是數(shù)據(jù)中出現(xiàn)次數(shù)或出現(xiàn)頻率最多的數(shù)值就是數(shù)據(jù)中出現(xiàn)次數(shù)或出現(xiàn)頻率最多的數(shù)值l中位數(shù):中位數(shù):即一組數(shù)據(jù)按升序排序后,處于中間位置上的數(shù)據(jù)值即一組數(shù)據(jù)按升序排序后,處于中間位置上的數(shù)據(jù)值l全距:全距:也稱極差,是數(shù)據(jù)的最大值與最小值之間的絕對(duì)離差也稱極差,是數(shù)據(jù)的最大值與最小值之間的絕對(duì)離差l偏度:偏度:描述變量取值分布形態(tài)對(duì)稱性的統(tǒng)計(jì)量,描述變量取值分布形態(tài)對(duì)稱性的統(tǒng)計(jì)量,0:對(duì)稱;:對(duì)稱;0:右偏;:右偏;0:左偏:左偏l峰度:峰度:描述變量取值分布形態(tài)陡峭程度的統(tǒng)計(jì)量,描述變量取
30、值分布形態(tài)陡峭程度的統(tǒng)計(jì)量,0:同正態(tài)分布;:同正態(tài)分布;0:尖峰分布;:尖峰分布; 0:平峰分布。:平峰分布。u Step:打開數(shù)據(jù)文件(打開數(shù)據(jù)文件(3-2.sav)【分析】【描述統(tǒng)計(jì)】【)【分析】【描述統(tǒng)計(jì)】【描述描述】3.2 描述分析描述分析l 例例3-2: 請(qǐng)你分析不同性別演員獲奧斯卡金獎(jiǎng)的年齡差異性。請(qǐng)你分析不同性別演員獲奧斯卡金獎(jiǎng)的年齡差異性。 男:男:32 37 36 32 51 53 33 61 35 45 55 39 76 37 42 40 32 60 38 56 48 48 40 43 62 43 42 44 41 56 39 46 31 47 45 60 女:女:50
31、44 35 80 26 28 41 21 61 38 49 33 74 30 33 41 31 35 41 42 37 26 34 34 35 26 61 60 34 24 30 37 31 27 39 343.2 描述分析描述分析u 輸出結(jié)果:輸出結(jié)果:結(jié)果:結(jié)果:男演員的獲獎(jiǎng)年齡波動(dòng)幅度小于女演員,且都不服從正態(tài)分布。男演員的獲獎(jiǎng)年齡波動(dòng)幅度小于女演員,且都不服從正態(tài)分布。3.3 探索分析探索分析4 基本思想基本思想 從數(shù)據(jù)本身出發(fā),不拘泥于模型的假設(shè)而采用從數(shù)據(jù)本身出發(fā),不拘泥于模型的假設(shè)而采用非常靈活的方法來探討數(shù)據(jù)非常靈活的方法來探討數(shù)據(jù)分布的大致情況分布的大致情況,從復(fù)雜的數(shù)據(jù)中分
32、離出數(shù)據(jù)的基本模式和特點(diǎn),讓分析從復(fù)雜的數(shù)據(jù)中分離出數(shù)據(jù)的基本模式和特點(diǎn),讓分析者發(fā)現(xiàn)其中的規(guī)律,者發(fā)現(xiàn)其中的規(guī)律,為傳統(tǒng)的統(tǒng)計(jì)推斷提供良好的基礎(chǔ)和減少盲目性為傳統(tǒng)的統(tǒng)計(jì)推斷提供良好的基礎(chǔ)和減少盲目性4 主要內(nèi)容主要內(nèi)容(1)檢查數(shù)據(jù)是否有錯(cuò)。)檢查數(shù)據(jù)是否有錯(cuò)。過大或過小的數(shù)據(jù)均可能是異常值、影響點(diǎn)或錯(cuò)誤值。要檢查過大或過小的數(shù)據(jù)均可能是異常值、影響點(diǎn)或錯(cuò)誤值。要檢查這樣的數(shù)據(jù),并分析原因,然后決定是否從分析中剔除這些數(shù)據(jù)這樣的數(shù)據(jù),并分析原因,然后決定是否從分析中剔除這些數(shù)據(jù)(2)獲得數(shù)據(jù)分布特征。獲得數(shù)據(jù)分布特征。很多統(tǒng)計(jì)方法模型對(duì)數(shù)據(jù)的分布有要求,如方差分析就需要數(shù)很多統(tǒng)計(jì)方法模型對(duì)數(shù)
33、據(jù)的分布有要求,如方差分析就需要數(shù)據(jù)服從正態(tài)分布據(jù)服從正態(tài)分布(3)對(duì)數(shù)據(jù)的初步觀察,發(fā)現(xiàn)一些內(nèi)在規(guī)律對(duì)數(shù)據(jù)的初步觀察,發(fā)現(xiàn)一些內(nèi)在規(guī)律4用途:用途:用于計(jì)算指定變量的探索性統(tǒng)計(jì)量和有關(guān)的圖形。既可以對(duì)觀測(cè)量整體分析用于計(jì)算指定變量的探索性統(tǒng)計(jì)量和有關(guān)的圖形。既可以對(duì)觀測(cè)量整體分析,也可以進(jìn)行分組分析。從這個(gè)過程,也可以進(jìn)行分組分析。從這個(gè)過程可以獲得箱線圖、莖葉圖、直方圖、各種正態(tài)可以獲得箱線圖、莖葉圖、直方圖、各種正態(tài)檢驗(yàn)圖、頻數(shù)表、方差齊性檢驗(yàn)等結(jié)果,以及檢驗(yàn)圖、頻數(shù)表、方差齊性檢驗(yàn)等結(jié)果,以及對(duì)非正態(tài)或正態(tài)非齊性數(shù)據(jù)進(jìn)行變換對(duì)非正態(tài)或正態(tài)非齊性數(shù)據(jù)進(jìn)行變換,并表明和檢驗(yàn)連續(xù)變量的數(shù)值分
34、布情況,并表明和檢驗(yàn)連續(xù)變量的數(shù)值分布情況。3.3 探索分析探索分析l 例例3-3:對(duì)對(duì)中國(guó)南北城市的溫度差異中國(guó)南北城市的溫度差異性作探索性作探索性分析性分析u 數(shù)據(jù)準(zhǔn)備數(shù)據(jù)準(zhǔn)備1:“變量視圖變量視圖”定義變量定義變量u 數(shù)據(jù)準(zhǔn)備數(shù)據(jù)準(zhǔn)備2:“數(shù)據(jù)視圖數(shù)據(jù)視圖”輸入數(shù)據(jù)輸入數(shù)據(jù)3.3 探索分析探索分析u Step1:打開數(shù)據(jù)(打開數(shù)據(jù)(3-3.3-3.savsav)【分析分析】【描述統(tǒng)計(jì)描述統(tǒng)計(jì)】【探索探索】u Step2:選擇標(biāo)簽值選擇標(biāo)簽值u Step3:選擇輸出的描述性統(tǒng)計(jì)量選擇輸出的描述性統(tǒng)計(jì)量u Step4:結(jié)果輸出結(jié)果輸出3.3 探索分析探索分析 分析樣本數(shù)據(jù)的穩(wěn)健性,求出分析樣
35、本數(shù)據(jù)的穩(wěn)健性,求出中心趨勢(shì)的最大似然比的穩(wěn)健中心趨勢(shì)的最大似然比的穩(wěn)健估計(jì)值估計(jì)值 4種穩(wěn)健估計(jì)量:種穩(wěn)健估計(jì)量:Huber(穩(wěn)?。ǚ€(wěn)健估計(jì)量)、估計(jì)量)、Hampel(非降穩(wěn)?。ǚ墙捣€(wěn)健估計(jì)量),估計(jì)量),Andrew(波估計(jì)(波估計(jì)量),量),Tukey(復(fù)權(quán)估計(jì)量)(復(fù)權(quán)估計(jì)量)結(jié)果:結(jié)果:1. 北方城市的標(biāo)準(zhǔn)北方城市的標(biāo)準(zhǔn)差大于南方城市,差大于南方城市,說明北方年平均溫說明北方年平均溫度變化較南方更大。度變化較南方更大。2. 從分布形態(tài)看,從分布形態(tài)看,南方城市年均氣溫南方城市年均氣溫呈尖峰、右偏特征;呈尖峰、右偏特征;北方城市則為平峰、北方城市則為平峰、左偏。左偏。3.3 探索分析
36、探索分析 Step4:結(jié)果輸出結(jié)果輸出結(jié)果:結(jié)果:由由M值差異可以得出,南北方數(shù)據(jù)差異明顯。值差異可以得出,南北方數(shù)據(jù)差異明顯。莖葉圖:莖葉圖:第一列:頻數(shù),表示所在行觀察值頻數(shù);第一列:頻數(shù),表示所在行觀察值頻數(shù);第二列:莖,實(shí)際觀察值除以圖下方莖寬后的整數(shù)部分第二列:莖,實(shí)際觀察值除以圖下方莖寬后的整數(shù)部分第三列:葉,實(shí)際觀察值除以圖下方莖寬后的小數(shù)部分第三列:葉,實(shí)際觀察值除以圖下方莖寬后的小數(shù)部分它在反映數(shù)據(jù)整體趨勢(shì)的同時(shí),還能精確反映數(shù)值的大它在反映數(shù)據(jù)整體趨勢(shì)的同時(shí),還能精確反映數(shù)值的大小,分析小樣本時(shí)優(yōu)勢(shì)明顯,在國(guó)外非常流行。小,分析小樣本時(shí)優(yōu)勢(shì)明顯,在國(guó)外非常流行。LOGOSP
37、SS箱 圖箱圖:箱圖:中間粗線為中位數(shù);中間粗線為中位數(shù);方框的兩端分別表示四分位數(shù)方框的兩端分別表示四分位數(shù)(75%)和下四分位數(shù))和下四分位數(shù)(25%),兩者間的距離為四),兩者間的距離為四分位數(shù)間距;分位數(shù)間距;方框外上、下兩個(gè)細(xì)線分別表方框外上、下兩個(gè)細(xì)線分別表示除去異常值外的最大、最小示除去異常值外的最大、最小值;值;凡是與四分位數(shù)值的距離超過凡是與四分位數(shù)值的距離超過1.5倍的都定義為異常值。倍的都定義為異常值。中位數(shù)75%百分位數(shù)25%百分位數(shù)最小值最大值異常值簡(jiǎn)單統(tǒng)計(jì)推斷簡(jiǎn)單統(tǒng)計(jì)推斷四四 均值比較均值比較-T檢驗(yàn)檢驗(yàn) 方差分析方差分析 非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)- -卡方檢驗(yàn)卡方檢驗(yàn)
38、 假設(shè)的簡(jiǎn)單分類假設(shè)的簡(jiǎn)單分類假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)參數(shù)檢驗(yàn)參數(shù)檢驗(yàn)(一般為定量數(shù)據(jù))雙樣本雙樣本單樣本單樣本T檢驗(yàn)(小樣本)Z檢驗(yàn)(大樣本)配對(duì)樣本配對(duì)樣本獨(dú)立樣本獨(dú)立樣本配對(duì)樣本配對(duì)樣本獨(dú)立樣本獨(dú)立樣本非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)(可為非定量數(shù)據(jù))單樣本:?jiǎn)螛颖荆嚎ǚ綑z驗(yàn);K-S檢驗(yàn);二項(xiàng)式檢驗(yàn)雙樣本雙樣本LOGOSPSS4.1 均值比較均值比較-T檢驗(yàn)檢驗(yàn)v 總體中的每個(gè)個(gè)體之間存在差異,即使嚴(yán)格總體中的每個(gè)個(gè)體之間存在差異,即使嚴(yán)格遵守隨機(jī)抽樣原則,也會(huì)由于抽到一些數(shù)值較遵守隨機(jī)抽樣原則,也會(huì)由于抽到一些數(shù)值較大或較小的個(gè)體致使樣本統(tǒng)計(jì)量與總體參數(shù)之大或較小的個(gè)體致使樣本統(tǒng)計(jì)量與總體參數(shù)之間有所不同
39、:間有所不同:兩個(gè)變量均值不同的樣本是否來自同一總體兩個(gè)變量均值不同的樣本是否來自同一總體? ?其差異是否有統(tǒng)計(jì)學(xué)意義?其差異是否有統(tǒng)計(jì)學(xué)意義?4.1 均值比較均值比較-T檢驗(yàn)檢驗(yàn)類型:類型: 均值分析:均值分析:用于分組計(jì)算、比較制定變量的描述性統(tǒng)計(jì)量,如總和、均值、方差、標(biāo)用于分組計(jì)算、比較制定變量的描述性統(tǒng)計(jì)量,如總和、均值、方差、標(biāo)準(zhǔn)差、觀測(cè)數(shù)等,還可以給出方差分析表和線性檢驗(yàn)結(jié)果。準(zhǔn)差、觀測(cè)數(shù)等,還可以給出方差分析表和線性檢驗(yàn)結(jié)果。區(qū)別與區(qū)別與“描述描述”,必須分組求,必須分組求均值,目的在于比較均值,目的在于比較 單樣本單樣本T檢驗(yàn):檢驗(yàn):某個(gè)變量的樣本均數(shù)與某個(gè)變量的樣本均數(shù)與給
40、定總體的已知均數(shù)給定總體的已知均數(shù)相比,其差異是否有顯著相比,其差異是否有顯著(例:周歲兒童的平均身高是否為(例:周歲兒童的平均身高是否為75厘米)厘米) 非配對(duì)或獨(dú)立非配對(duì)或獨(dú)立T檢驗(yàn):檢驗(yàn):檢驗(yàn)由兩個(gè)檢驗(yàn)由兩個(gè)獨(dú)立樣本獨(dú)立樣本估計(jì)的總體均數(shù)之間的差異是否顯著(如兩估計(jì)的總體均數(shù)之間的差異是否顯著(如兩種不同餌料養(yǎng)殖羅非魚)種不同餌料養(yǎng)殖羅非魚) 配對(duì)配對(duì)T檢驗(yàn):檢驗(yàn):兩組樣本彼此不獨(dú)立,又稱為成對(duì)樣本(如家兔接種某疫苗前后體溫)兩組樣本彼此不獨(dú)立,又稱為成對(duì)樣本(如家兔接種某疫苗前后體溫)u T檢驗(yàn)的先決條件是:檢驗(yàn)的先決條件是:樣本的抽樣呈正態(tài)分布,方差齊性(樣本的抽樣呈正態(tài)分布,方差齊
41、性(F檢驗(yàn))檢驗(yàn))u T檢驗(yàn)是檢驗(yàn)是0假設(shè)假設(shè),即總體均值與指定檢驗(yàn)值之間不存在顯著差異,即總體均值與指定檢驗(yàn)值之間不存在顯著差異u T檢驗(yàn)的結(jié)果:如果在置信度為檢驗(yàn)的結(jié)果:如果在置信度為95下,下,顯著性水平顯著性水平0.05,則接受假設(shè);則接受假設(shè);如果如果一般線性模型一般線性模型-單變量單變量分?jǐn)?shù)分?jǐn)?shù)因變量;因變量; 學(xué)校、課程學(xué)校、課程固定因子固定因子輸出結(jié)果輸出結(jié)果4.3 非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)-卡方檢驗(yàn)卡方檢驗(yàn)LOGOSPSS4.3 非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)-卡方檢驗(yàn)卡方檢驗(yàn) 在實(shí)踐中,常碰到一些樣本的總體分布不明確,或者總體參數(shù)的假設(shè)條件不成立,或不服從正態(tài)分布時(shí),采用非參數(shù)檢驗(yàn) 非參
42、數(shù)檢驗(yàn):不假定總體分布情況下,來實(shí)現(xiàn)對(duì)總體參數(shù)的推斷 包括:卡方、二項(xiàng)式分布、游程、單樣本K-S檢驗(yàn),以及兩個(gè)獨(dú)立樣本、多個(gè)獨(dú)立樣本、兩個(gè)相關(guān)樣本、多個(gè)相關(guān)樣本非參數(shù)檢驗(yàn) 與參數(shù)檢驗(yàn)相比,優(yōu)勢(shì)如下:與參數(shù)檢驗(yàn)相比,優(yōu)勢(shì)如下: 穩(wěn)健性??傮w分布的約束條件大大放寬,對(duì)個(gè)別偏離較大的數(shù)據(jù)不至于太敏感。穩(wěn)健性。總體分布的約束條件大大放寬,對(duì)個(gè)別偏離較大的數(shù)據(jù)不至于太敏感。 對(duì)數(shù)據(jù)的測(cè)量尺度無約束,對(duì)數(shù)據(jù)的要求也不嚴(yán)格,什么數(shù)據(jù)都可以做。對(duì)數(shù)據(jù)的測(cè)量尺度無約束,對(duì)數(shù)據(jù)的要求也不嚴(yán)格,什么數(shù)據(jù)都可以做。 適用于小樣本、無分布樣本、數(shù)據(jù)污染樣本、混雜樣本等。適用于小樣本、無分布樣本、數(shù)據(jù)污染樣本、混雜樣本等
43、。n 但是,如果參數(shù)檢驗(yàn)?zāi)P偷乃屑僭O(shè)在數(shù)據(jù)中都能滿足,且達(dá)到所要求的水平,但是,如果參數(shù)檢驗(yàn)?zāi)P偷乃屑僭O(shè)在數(shù)據(jù)中都能滿足,且達(dá)到所要求的水平,那么用非參數(shù)檢驗(yàn)可能導(dǎo)致低效率,最終浪費(fèi)數(shù)據(jù)。那么用非參數(shù)檢驗(yàn)可能導(dǎo)致低效率,最終浪費(fèi)數(shù)據(jù)。4.3 非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)-卡方檢驗(yàn)卡方檢驗(yàn)1.使用目的使用目的l 卡方檢驗(yàn)(Chi-Squar Test)也稱為卡方擬合優(yōu)度檢驗(yàn),是K.Pearson給出的一種最常用的非參數(shù)檢驗(yàn)方法最常用的非參數(shù)檢驗(yàn)方法。它用于檢驗(yàn)觀測(cè)數(shù)據(jù)是否與某種概率分布的理論數(shù)值相符合,進(jìn)而推斷觀測(cè)數(shù)據(jù)是否是來自于該分布的樣本的問題。l 如:根據(jù)投擲骰子實(shí)驗(yàn)中出現(xiàn)的點(diǎn)數(shù)檢驗(yàn)骰子是否均
44、勻,即各點(diǎn)出現(xiàn)的概率是否均為1/6。 2.基本原理基本原理l 進(jìn)行卡方檢驗(yàn)時(shí),首先提出零假設(shè)首先提出零假設(shè) :樣本樣本X來自的總體分布服從期望分布或來自的總體分布服從期望分布或某一理論分布某一理論分布。接著,利用實(shí)際觀測(cè)值的頻數(shù)與理論的期望頻數(shù)之間的差異來構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,它描述了觀察值和理論值之間的偏離程度描述了觀察值和理論值之間的偏離程度。 3.軟件使用方法軟件使用方法l 【分析】【分析】 【非參數(shù)檢驗(yàn)】【非參數(shù)檢驗(yàn)】【舊對(duì)話框】【舊對(duì)話框】【卡方卡方】v 案例案例4-4l 某公司經(jīng)營(yíng)多年,形成了一套成熟的企業(yè)文化和管理體系,例如根據(jù)多年的運(yùn)營(yíng)經(jīng)驗(yàn),經(jīng)理層、監(jiān)察員、辦事員三種職務(wù)類別人員比例
45、大約在15:5:80為宜,這樣運(yùn)行效率最高。目前公司進(jìn)行人事調(diào)整,公司人員結(jié)構(gòu)發(fā)生變動(dòng),有員工擔(dān)心是否人事調(diào)整已經(jīng)導(dǎo)致職務(wù)類型比例的失調(diào)有員工擔(dān)心是否人事調(diào)整已經(jīng)導(dǎo)致職務(wù)類型比例的失調(diào)。l 三種職務(wù)的期望構(gòu)成比為15、5和80。而目前樣本中觀察到的三種職務(wù)的人數(shù)比為84:27:363,構(gòu)成比分別是17.7、5.7和76.6,和理論值有差異。那么這種差異是由隨機(jī)誤差造成的,還是真的構(gòu)成比和這種差異是由隨機(jī)誤差造成的,還是真的構(gòu)成比和以前有所變化?以前有所變化?該問題就可以用2檢驗(yàn)來實(shí)現(xiàn)。相應(yīng)的假設(shè)檢驗(yàn)如下。 H0:目前三個(gè)職業(yè)的總體構(gòu)成比仍然是:目前三個(gè)職業(yè)的總體構(gòu)成比仍然是15、5和和80。
46、H1:目前三個(gè)職業(yè)的總體構(gòu)成比不再是:目前三個(gè)職業(yè)的總體構(gòu)成比不再是15、5和和80 。4.3 非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)-卡方檢驗(yàn)卡方檢驗(yàn)l Step1Step1:打開數(shù)據(jù)(:打開數(shù)據(jù)(4-4.4-4.savsav)【分析】【)【分析】【非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)】【】【舊對(duì)話框舊對(duì)話框】【】【卡方卡方】 職務(wù)類別:職務(wù)類別:“1”“1”表示辦事員,表示辦事員,“2”“2”表示監(jiān)察員,表示監(jiān)察員,“3”“3”表示經(jīng)理。表示經(jīng)理。l Step2Step2:選擇檢驗(yàn)變量:選擇檢驗(yàn)變量 在左側(cè)的候選變量列表框中選擇在左側(cè)的候選變量列表框中選擇“Employment Category“Employment Ca
47、tegory(職務(wù))(職務(wù))”變量變量作為檢驗(yàn)變量,將其添加至【檢驗(yàn)變量列表】列表框中。作為檢驗(yàn)變量,將其添加至【檢驗(yàn)變量列表】列表框中。l Step3Step3:選擇期望值:選擇期望值 在【期望值】選項(xiàng)組中點(diǎn)選【值】單選鈕,以指定期望概率值。接著在【在【期望值】選項(xiàng)組中點(diǎn)選【值】單選鈕,以指定期望概率值。接著在【值】的文本框中分別輸入值】的文本框中分別輸入0.80.8、0.050.05和和0.150.15這三個(gè)數(shù)值,并且單擊【添加這三個(gè)數(shù)值,并且單擊【添加】按鈕加以確定?!堪粹o加以確定。l Step4Step4:完成操作:完成操作4.3 非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)-卡方檢驗(yàn)卡方檢驗(yàn)結(jié)果輸出:結(jié)果輸
48、出:P值0.174大于顯著性水平0.05。因此接受零假設(shè)因此接受零假設(shè),認(rèn)為目前三個(gè)職業(yè)的總體構(gòu)成比仍然是15、5和80,人數(shù)的調(diào)動(dòng)只是隨機(jī)誤差造成的,公司人員結(jié)構(gòu)沒有顯著性改變。 5. 相關(guān)分析相關(guān)分析相關(guān)分析:相關(guān)分析:研究變量相互關(guān)系的密切程度和變化趨勢(shì),并用適當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)描述。研究變量相互關(guān)系的密切程度和變化趨勢(shì),并用適當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)描述。& 最常見的是兩兩相關(guān)分析,最常見的是兩兩相關(guān)分析,例如:魚的體長(zhǎng)與體重、作物的產(chǎn)量與施肥量等問題 統(tǒng)計(jì)關(guān)系常見類型:統(tǒng)計(jì)關(guān)系常見類型:&線性相關(guān)線性相關(guān):兩變量呈線性共同增大;:兩變量呈線性共同增大; 呈線性一增一減呈線性一增一減&a
49、mp;非線性相關(guān):非線性相關(guān):曲線相關(guān);曲線相關(guān); 兩變量存在相關(guān)趨勢(shì)兩變量存在相關(guān)趨勢(shì)&不相關(guān)不相關(guān)常用方法:常用方法:&l 散點(diǎn)圖散點(diǎn)圖&l 計(jì)算相關(guān)系數(shù):計(jì)算相關(guān)系數(shù):區(qū)間是區(qū)間是-1,1,是兩個(gè)變量之間的線性關(guān)聯(lián)的一個(gè)度量是兩個(gè)變量之間的線性關(guān)聯(lián)的一個(gè)度量 相關(guān)分析案例相關(guān)分析案例某科技人員飼養(yǎng)了某科技人員飼養(yǎng)了35尾團(tuán)頭魴,共重尾團(tuán)頭魴,共重7.2kg,在水溫,在水溫29的條件下,測(cè)量攝食量與的條件下,測(cè)量攝食量與耗氧率之間的關(guān)系,請(qǐng)對(duì)攝食量與耗氧率作相關(guān)行分析。耗氧率之間的關(guān)系,請(qǐng)對(duì)攝食量與耗氧率作相關(guān)行分析。 SPSS SPSS操作步驟:操作步驟:數(shù)據(jù)準(zhǔn)備
50、數(shù)據(jù)準(zhǔn)備【分析分析】【相關(guān)相關(guān)】【雙變量雙變量】結(jié)果輸出:結(jié)果輸出:P=0.0000.01,差異極顯著,差異極顯著,表明攝食量和耗氧量之間存在表明攝食量和耗氧量之間存在極顯著的正相關(guān)關(guān)系,耗氧量極顯著的正相關(guān)關(guān)系,耗氧量隨著攝食量的增加而增加隨著攝食量的增加而增加 Pearson 簡(jiǎn)單相關(guān)系數(shù):簡(jiǎn)單相關(guān)系數(shù):適用于雙變量正態(tài)分布資料(一般用適用于雙變量正態(tài)分布資料(一般用字母字母r表示)表示) Spearman 等級(jí)相關(guān)系數(shù)等級(jí)相關(guān)系數(shù):適用于有序數(shù)據(jù)和不滿足正態(tài)分布:適用于有序數(shù)據(jù)和不滿足正態(tài)分布假設(shè)的等間隔數(shù)據(jù),非參數(shù)統(tǒng)計(jì)假設(shè)的等間隔數(shù)據(jù),非參數(shù)統(tǒng)計(jì) Kendall 等級(jí)相關(guān)系數(shù)等級(jí)相關(guān)系
51、數(shù):對(duì)有序變量或兩個(gè)秩變量間相關(guān)程度:對(duì)有序變量或兩個(gè)秩變量間相關(guān)程度的度量統(tǒng)計(jì)量,非參數(shù)統(tǒng)計(jì)的度量統(tǒng)計(jì)量,非參數(shù)統(tǒng)計(jì)6. 回歸分析回歸分析l 探察變量之間的數(shù)量變化規(guī)律,并通過一定的數(shù)學(xué)表達(dá)式來描述一定的數(shù)學(xué)表達(dá)式來描述這種關(guān)系,進(jìn)而確定一個(gè)或幾個(gè)變量的變化對(duì)另一個(gè)變量的影響程度l 只要系數(shù)之間是線性組合的,并可通過變換可轉(zhuǎn)換為線性方程的,都可嘗試用線性模型進(jìn)行擬合回歸分析與相關(guān)分析的關(guān)系回歸分析與相關(guān)分析的關(guān)系二者均為研究?jī)蓚€(gè)或兩個(gè)以上變量之間關(guān)系的方法。從廣二者均為研究?jī)蓚€(gè)或兩個(gè)以上變量之間關(guān)系的方法。從廣義上說,義上說,相關(guān)分析包括了回歸分析相關(guān)分析包括了回歸分析。二者有區(qū)別:二者有區(qū)
52、別:1、相關(guān)分析的兩個(gè)變量平行,不一定存在、相關(guān)分析的兩個(gè)變量平行,不一定存在因果關(guān)系因果關(guān)系;回歸回歸分析變量之間存在因果關(guān)系分析變量之間存在因果關(guān)系,自變量是因,因變量是果,自變量是因,因變量是果,一個(gè)回歸方程內(nèi)因變量只有一個(gè),自變量可以有多個(gè)一個(gè)回歸方程內(nèi)因變量只有一個(gè),自變量可以有多個(gè)。2、相關(guān)分析僅僅研究變量之間的相互關(guān)系的、相關(guān)分析僅僅研究變量之間的相互關(guān)系的密切程度和變密切程度和變化趨勢(shì)化趨勢(shì),并用適當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)描述。,并用適當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)描述。如果用一個(gè)或多個(gè)變?nèi)绻靡粋€(gè)或多個(gè)變量的取值來估計(jì)另一個(gè)變量的取值,這就是量的取值來估計(jì)另一個(gè)變量的取值,這就是回歸分析回歸分析。4 回歸分類一元線性回歸分析一元線性回歸分析 一元線性回
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 【復(fù)習(xí)大串講】【中職專用】高二語(yǔ)文上學(xué)期期末綜合測(cè)試題(三)(職業(yè)模塊)(原卷版)
- 單位員工招聘合同范本
- 獸醫(yī)聘用勞務(wù)合同范本
- 光催化課題申報(bào)書
- 會(huì)所物資出售合同范本
- 廚具采買合同范本寫
- 吊裝合同范例簡(jiǎn)易版本
- 醫(yī)院雇傭合同范本
- 企業(yè)各類合同范本
- 吊車及場(chǎng)地合作合同范本
- 中班美工區(qū)角活動(dòng)教案10篇
- SJG 103-2021 無障礙設(shè)計(jì)標(biāo)準(zhǔn)-高清現(xiàn)行
- 皇冠假日酒店智能化系統(tǒng)安裝工程施工合同范本
- 路面工程重點(diǎn)、關(guān)鍵、和難點(diǎn)工程的施工方案(技術(shù)標(biāo))
- 合肥市城市大腦·數(shù)字底座白皮書2020
- 機(jī)電預(yù)留預(yù)埋工程施工組織設(shè)計(jì)方案
- 2022年三八婦女節(jié)婦女權(quán)益保障法律知識(shí)競(jìng)賽題庫(kù)及答案(共290題)
- 引水罐的設(shè)計(jì)計(jì)算
- Of studies原文譯文及賞析
- 安全閥基本知識(shí)講義
- 不銹鋼排煙風(fēng)管施工實(shí)施方案
評(píng)論
0/150
提交評(píng)論