SPSS統(tǒng)計方法體系與案例實驗進(jìn)階 課件_第1頁
SPSS統(tǒng)計方法體系與案例實驗進(jìn)階 課件_第2頁
SPSS統(tǒng)計方法體系與案例實驗進(jìn)階 課件_第3頁
SPSS統(tǒng)計方法體系與案例實驗進(jìn)階 課件_第4頁
SPSS統(tǒng)計方法體系與案例實驗進(jìn)階 課件_第5頁
已閱讀5頁,還剩417頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

《SPSS統(tǒng)計方法體系與案例實驗進(jìn)階》本書將統(tǒng)計學(xué)方法原理條件、實驗操作示范和案例應(yīng)用分析需要一體化貫通起來,這樣更有利于初學(xué)者對于統(tǒng)計學(xué)方法的復(fù)習(xí)鞏固、辯證區(qū)分、規(guī)范使用,消除生搬硬套或亂選誤用的現(xiàn)象。本書兼顧統(tǒng)計學(xué)方法的復(fù)習(xí)回顧、軟件操作流程的演示和輸出結(jié)果的詳細(xì)闡述,確定框架結(jié)構(gòu),形成脈絡(luò)體系,從而幫助教師在教學(xué)過程中發(fā)揮“我做你看、我?guī)阕?、你做我看”的作用,引?dǎo)學(xué)生模仿觀察、分解練習(xí)、完整試做、反饋糾錯,從方法與軟件、理論與實踐結(jié)合的角度,成為提高授課、自學(xué)或答疑效果的友好幫手。內(nèi)容特色學(xué)習(xí)目標(biāo):1、掌握SPSS數(shù)據(jù)文件的建立和管理2、掌握SPSS數(shù)據(jù)文件的結(jié)構(gòu)、定義、保存重點:1、SPSS數(shù)據(jù)文件的建立和管理2、SPSS數(shù)據(jù)文件的結(jié)構(gòu)、定義、保存第1章SPSS數(shù)據(jù)文件的建立

第1章SPSS數(shù)據(jù)編碼、錄入與保存一、SPSS軟件簡介“統(tǒng)計產(chǎn)品和服務(wù)解決方案”StatisticalProductandServiceSolutions,原先叫作“社會科學(xué)統(tǒng)計軟件包”StatisticalProgramforSocialSciences,縮寫SPSS.1968年斯坦福大學(xué)研究生最早編制了這個軟件,2009年被IBM收購,已成為全球三大數(shù)據(jù)分析軟件之一.SPSS軟件依據(jù)菜單窗口式點擊操作和對話框參數(shù)設(shè)置來驅(qū)動窗口界面,展示豐富的數(shù)據(jù)管理、結(jié)果分析功能,它以表格和圖形形式得到輸出結(jié)果,界面清晰、形象直觀、易學(xué)易用.應(yīng)用者只要熟悉統(tǒng)計理論方法適用條件和原理,掌握電腦Windows操作系統(tǒng)技能,就可以為科研活動中的數(shù)據(jù)操作分析服務(wù).二、SPSS17.0界面與菜單(1)SPSS啟動:雙擊(或單擊)程序的桌面快捷方式圖標(biāo)啟動.通過“開始”菜單的“程序”運行方式啟動.(2)SPSS17.0中文版主界面第1章SPSS數(shù)據(jù)編碼、錄入與保存第1章SPSS數(shù)據(jù)編碼、錄入與保存第1章SPSS數(shù)據(jù)編碼、錄入與保存(3)SPSS17.0主菜單:★文件(File):文件新建、打開、保存、打印等.★編輯(Edit):文本內(nèi)容的選擇、拷貝、剪貼、尋找和替換等.★視圖(View):主界面中工具視圖的開關(guān).★數(shù)據(jù)(Data):變量定義;個案的選擇、排序、標(biāo)識;變量加權(quán)、匯總;文件的合并、拆分、轉(zhuǎn)置;正交設(shè)計等.★轉(zhuǎn)換(Transform):變量的數(shù)值計算、賦值處理、缺失值替代等.★分析(Analyze):常用統(tǒng)計分析方法,如描述性分析、假設(shè)檢驗、方差分析、相關(guān)性分析、回歸分析、聚類與判別分析、因子分析與對應(yīng)分析、生存分析等.★圖形(Graphs):散點圖、餅圖、條形圖、直方圖、箱圖等.第1章SPSS數(shù)據(jù)編碼、錄入與保存(4)變量視圖:定義、顯示變量和編輯變量特征,平面二維表格,頂部為變量特征,左則是變量序號.定義內(nèi)容:變量名稱,類型,寬度,小數(shù),標(biāo)簽,值,缺失,列,對齊,度量標(biāo)準(zhǔn).(5)輸出窗口:第1章SPSS數(shù)據(jù)編碼、錄入與保存第1章SPSS數(shù)據(jù)編碼、錄入與保存三、數(shù)據(jù)編碼(1)SPSS工作步驟:★SPSS數(shù)據(jù)的準(zhǔn)備如資料分析、定義變量并制定編碼方案、錄入和保存數(shù)據(jù)文件.★數(shù)據(jù)的加工整理如數(shù)據(jù)審核、校對、篩選、分組、糾錯及新變量生成.★數(shù)據(jù)的統(tǒng)計分析根據(jù)實際分析需要,選擇適當(dāng)方法并將其操作實現(xiàn),如菜單選擇和參數(shù)界面設(shè)置.★數(shù)據(jù)結(jié)果的解讀和呈現(xiàn)解釋統(tǒng)計分析結(jié)果以及統(tǒng)計學(xué)意義,結(jié)合實際而制定表達(dá)結(jié)論.第1章SPSS數(shù)據(jù)編碼、錄入與保存(2)數(shù)據(jù)文件建立

新建數(shù)據(jù)文件①定義變量②錄入數(shù)據(jù)③保存數(shù)據(jù).外部調(diào)用已建立數(shù)據(jù)文件.☆單擊“變量視圖”切換到變量定義界面.按行展示變量,按列展示變量名、變量類型、變量長度、小數(shù)位數(shù)、變量標(biāo)簽、變量值標(biāo)簽、缺失值、變量寬度、對齊方式和數(shù)據(jù)量度.變量之間可以新插入、刪除或者移動位置.☆單擊“數(shù)據(jù)視圖”切換到數(shù)據(jù)錄入界面,按照值標(biāo)簽編碼值逐行錄入個案數(shù)據(jù).個案數(shù)據(jù)可以查找、篩選、刪除.第1章SPSS數(shù)據(jù)編碼、錄入與保存(3)變量的編碼方案根據(jù)問題實際意義定義變量并建立數(shù)據(jù)庫.變量個數(shù)應(yīng)表示出所有信息.變量名不宜太長,要便于識別查找.問卷篇幅太長則適用于“字母+數(shù)字序號”的變量名稱.數(shù)據(jù)編碼是指將原始數(shù)據(jù)資料(如問卷、試驗結(jié)果等)問題轉(zhuǎn)化為軟件識別變量,完成變量個數(shù)、變量名稱、變量類型及變量賦值方法的設(shè)置過程.常見情況:☆一般字符型問題:答案是唯一的字符型數(shù)據(jù),如姓名、籍貫等.字符型;字符直接錄入.☆一般數(shù)值型問題:答案是唯一的數(shù)值型數(shù)據(jù),如身高、體重等.數(shù)值型;數(shù)值直接錄入.第1章SPSS數(shù)據(jù)編碼、錄入與保存☆唯一選項數(shù)值型問題:答案是多選一的數(shù)值型數(shù)據(jù).如定序資料(學(xué)習(xí)成績|優(yōu)、良、中、差)選一個;定類資料(專業(yè)|預(yù)防醫(yī)學(xué)、臨床醫(yī)學(xué)、麻醉學(xué)、口腔醫(yī)學(xué))選一個.數(shù)值型;選項編碼錄入.☆限定多選項型問題:答案是由多個選項中限定數(shù)量選擇多個數(shù)據(jù).如選修課程中(數(shù)學(xué)史、古典文學(xué)、哲學(xué)、攝影)選兩門.變量個數(shù)即選項個數(shù);數(shù)值型;選項編碼錄入.☆任意多選項型問題:答案是由多個選項中任意選定若干個數(shù)據(jù).如晚餐食物中(豬頭肉、番茄沙拉、饅頭、西瓜、稀粥)選若干種.變量個數(shù)所有選項個數(shù);數(shù)值型;二值編碼錄入.☆日期型(Date):答案是日期型數(shù)據(jù),選定格式并按此格式錄入.如1990年6月12日選擇yy/mm/dd,須按此格式輸入90/06/12.第1章SPSS數(shù)據(jù)編碼、錄入與保存第1章SPSS數(shù)據(jù)編碼、錄入與保存建立或打開數(shù)據(jù)庫:由調(diào)查問卷、實驗數(shù)據(jù)或報表資料可以新建一個數(shù)據(jù)文件;也可以打開已有數(shù)據(jù)文件(*.sav)或其它類型(*.xls等)的數(shù)據(jù)文件.新建文件,包括變量定義和數(shù)據(jù)輸入環(huán)節(jié):首先根據(jù)編碼方案定義變量,依次對名稱、類型、寬度、小數(shù)點位數(shù)、值標(biāo)簽、缺失值定義和設(shè)置;其次按照編碼方案依次錄入個案變量賦值.進(jìn)入SPSS主界面,單擊左下角“變量視圖(VariableView)”.第1章SPSS數(shù)據(jù)編碼、錄入與保存第1章SPSS數(shù)據(jù)編碼、錄入與保存☆變量名稱(Name)以字母、漢字或@開頭,包括漢字、字母或下劃線.☆變量類型(Type)一般默認(rèn)為數(shù)值型,其次為字符型或日期型.☆變量標(biāo)簽(Label)用于解釋變量含義,設(shè)置以后則以標(biāo)簽名直觀顯示.☆值標(biāo)簽(Values)選項離散值編碼及含義,設(shè)置以后則以標(biāo)簽名顯示.☆寬度(Width)一般默認(rèn),字符型變量值容許輸入最大字符數(shù),超出則無法輸入.☆小數(shù)(Decimals)變量值小數(shù)位數(shù),一般默認(rèn)為2,超出則以四舍五入后顯示.☆缺失(Missing)一般默認(rèn),或者設(shè)置為與變量賦值差異大的規(guī)定值,如-1、99999.一旦設(shè)定則須按該值錄入,軟件識別該值為缺失而不參與統(tǒng)計分析.☆列寬(Columns)一般默認(rèn),用于顯示每列變量的寬度.☆對齊(Align)一般默認(rèn),用于顯示每列變量值的對齊方式:居左,居右和居中.☆測量(Measure)一般默認(rèn),定量、定序和定類.第1章SPSS數(shù)據(jù)編碼、錄入與保存第1章SPSS數(shù)據(jù)編碼、錄入與保存第1章SPSS數(shù)據(jù)編碼、錄入與保存在SPSS主菜單“視圖(View)”,“值標(biāo)簽(ValueLabels)”開關(guān)功能菜單,對應(yīng)查看.第1章SPSS數(shù)據(jù)編碼、錄入與保存結(jié)果輸出窗口又叫查看器,隨著執(zhí)行命令而自動打開,用于顯示統(tǒng)計分析結(jié)果.左邊為輸出結(jié)果導(dǎo)航目錄,右邊為輸出執(zhí)行命令及圖表結(jié)果.第1章SPSS數(shù)據(jù)編碼、錄入與保存【實例1】[問題敘述]掌握變量定義、數(shù)據(jù)編碼、錄入數(shù)據(jù)和保存數(shù)據(jù)文件的SPSS操作實現(xiàn).新型農(nóng)村合作醫(yī)療調(diào)查問卷(共1000份),隨機(jī)抽取1份并摘錄部分題目.將調(diào)查問卷信息轉(zhuǎn)化并錄入數(shù)據(jù)庫,在今后統(tǒng)計分析中備用.1.姓名:王俊

.2.性別(單選):√a.男b.女3.學(xué)歷(單選):a.初中及以下b.高中及中?!蘡.大專d.本科及以上4.參加新農(nóng)合至今約

8年.5.是否有常發(fā)?。▎芜x):√a.是b.否;6.常發(fā)病為哪些(多選):

√a.呼吸系統(tǒng)b.消化系統(tǒng)√c.內(nèi)分泌系統(tǒng)d.泌尿系統(tǒng)e.其他7.對新農(nóng)合的總體滿意度(單選):a.很高b.高√c.一般d.差e.很差第1章SPSS數(shù)據(jù)編碼、錄入與保存[操作步驟]表1新農(nóng)合基本信息調(diào)查編碼方案表題號“變量視圖”“數(shù)據(jù)視圖”變量名稱數(shù)據(jù)編碼變量類型答好一份變量錄入1姓名按實際姓名錄入字符型王俊王俊2性別1-男2-女?dāng)?shù)值型男√13學(xué)歷1-初中及以下2-高中及中專3-大專4-本科及以上數(shù)值型大?!?4參加新農(nóng)合年數(shù)按實際錄入數(shù)值型

885是否有常發(fā)病1-是0-否數(shù)值型√16呼吸系統(tǒng)疾病1-有0-無數(shù)值型√1第1章SPSS數(shù)據(jù)編碼、錄入與保存6消化系統(tǒng)疾病1-有0-無數(shù)值型未選06分泌系統(tǒng)疾病1-有0-無數(shù)值型√16泌尿系統(tǒng)疾病1-有0-無數(shù)值型未選06其他疾病1-有0-無數(shù)值型未選07新農(nóng)合滿意度10-很高8-高6-一般4-差0-很差數(shù)值型一般√6界面選擇:SPSS主界面→變量視圖.第1章SPSS數(shù)據(jù)編碼、錄入與保存第1章SPSS數(shù)據(jù)編碼、錄入與保存單擊“數(shù)據(jù)視圖”,進(jìn)入數(shù)據(jù)編輯界面.默認(rèn)文件保存類型為(.sav),保存為“NO1建數(shù)據(jù)庫(新農(nóng)合問卷).sav”.第1章SPSS數(shù)據(jù)編碼、錄入與保存【實例2】[問題敘述]已知病例資料,請定義變量及編碼方案,旨在形成數(shù)據(jù)庫并為今后分析備用.請定義變量、變量類型、制定編碼方案、錄入數(shù)據(jù)并保存數(shù)據(jù)庫.編號籍貫(填寫)字符型性別(選項)數(shù)值型年齡(填寫)數(shù)值型血型(選項)數(shù)值型職業(yè)(選項)數(shù)值型糖尿病史(填寫)數(shù)值型總膽固醇(填寫)數(shù)值型療效(選項)數(shù)值型1山東男58B工人無5.33有效2廣西男69O商人無4.63好轉(zhuǎn)3山東男58B工人無5.33有效4湖北女42A商人無6.12顯效5天津男43O農(nóng)民有4.54好轉(zhuǎn)第1章SPSS數(shù)據(jù)編碼、錄入與保存表3變量定義及編碼名稱編碼類型籍貫按實際錄入字符型性別1-男、2-女?dāng)?shù)值型年齡按實際錄入數(shù)值型血型1-A、2-B、3-O、4-AB數(shù)值型糖尿病史1-有、0-無數(shù)值型總膽固醇按實際錄入數(shù)值型療效1-無效、2-好轉(zhuǎn)、3-有效、4-顯效數(shù)值型[操作步驟]打開SPSS軟件,切換到“變量視圖”;根據(jù)變量定義及編碼方案將原始資料轉(zhuǎn)化為數(shù)據(jù)庫.第1章SPSS數(shù)據(jù)編碼、錄入與保存第1章SPSS數(shù)據(jù)編碼、錄入與保存第1章SPSS數(shù)據(jù)編碼、錄入與保存【練習(xí)1】[問題敘述]農(nóng)村社區(qū)衛(wèi)生服務(wù)調(diào)查問卷(共500份),從中隨機(jī)抽取1份并摘錄部分題目.建立數(shù)據(jù)庫,保存為實驗1-2.sav.農(nóng)村社區(qū)衛(wèi)生服務(wù)需求、利用及滿意度現(xiàn)況調(diào)查表(回收一份問卷)一、基本信息:1.您所在縣城:

諸城市

2.您的體重(kg):74

3.您的年齡:35

4.您的性別(單選):(1)√男(2)女5.您的文化程度(單選):(1)初中及以下(2)高中/中專(3)√大專(4)本科及以上6.您每年家庭收入約為

60000

元,您個人每年收入約為

30000

元7.您目前的婚姻狀況(單選):(1)未婚(2)√已婚(3)喪偶(4)離婚第1章SPSS數(shù)據(jù)編碼、錄入與保存二、專業(yè)信息:8.目前家里最需要醫(yī)生提供的服務(wù)(單選):(1)老年人護(hù)理知識和服務(wù)(2)√慢性病防治知識和服務(wù)(3)婦女兒童保健知識和服務(wù)(4)看病和健康方面知識和服務(wù)(5)其他9.您是否需要下列服務(wù)(單選):(1)當(dāng)有需要時,醫(yī)生馬上上門服務(wù)(2)√醫(yī)生能與我家建立聯(lián)系,定期給予健康建議,提供想要的服務(wù)(3)其他10.您對照顧長期臥床老人和產(chǎn)婦方面意向:如開展專門的照顧老人的服務(wù),能否接受:(1)√能(2)不能多少護(hù)理費用能接受

800

元/月.如開展專門的照顧坐月子婦女的服務(wù),能否接受:(1)√能(2)不能多少護(hù)理費用能接受

元/月.第1章SPSS數(shù)據(jù)編碼、錄入與保存11.全科醫(yī)療機(jī)構(gòu)開展了哪些服務(wù)內(nèi)容(多選)?(1)家庭病床(2)√戶籍制保健(3)√簡易門診(4)√社區(qū)護(hù)理(5)呼叫服務(wù)(6)√熱線電話咨詢(7)其他12.近三年來,您平均每年的醫(yī)療費用大概有

2000

元,可以報銷

元.13.您對村衛(wèi)生室的服務(wù)滿意嗎(單選)?(1)很滿意(2)√滿意(3)一般(4)不滿意(5)很不滿意14.您對鄉(xiāng)鎮(zhèn)衛(wèi)生院的服務(wù)滿意嗎(單選)?(1)很滿意(2)滿意(3)√一般(4)不滿意(5)很不滿意[操作步驟](略)第1章SPSS數(shù)據(jù)編碼、錄入與保存【練習(xí)2】[問題敘述]根據(jù)某醫(yī)院結(jié)石患者手術(shù)指標(biāo)數(shù)據(jù)建立數(shù)據(jù)庫,保存為實驗1-2.sav.編號性別腎周積液結(jié)石表面積手術(shù)時間灌注量腎部位結(jié)石側(cè)腎盂壓力1女有69.081157400上段105.322男有43.18454500上段110.633女有112.26564900上段170.854男有91.89903500上段120.645男有27.48805000上段130.656女有141.30657000上段140.587男有91.85784700上段132.64……………………第1章SPSS數(shù)據(jù)編碼、錄入與保存【練習(xí)3】[問題敘述]根據(jù)農(nóng)戶調(diào)查問卷(共500份),從中隨機(jī)抽取1份如下農(nóng)戶基本經(jīng)營狀況調(diào)查問卷

1.家庭人口狀況

總?cè)丝谄渲心行耘詣趧恿蛯W(xué)人口65歲以上勞動力人口532311家庭戶性質(zhì):①本地戶②外來戶

(遷入年份:1988)

2.就業(yè)類型:①純農(nóng)戶②非農(nóng)戶③農(nóng)兼非④非兼農(nóng)⑤未就業(yè)

第1章SPSS數(shù)據(jù)編碼、錄入與保存3.純農(nóng)就業(yè)者情況

經(jīng)營范圍經(jīng)營項目安排生產(chǎn)難題做法農(nóng)產(chǎn)品去向產(chǎn)品出售渠道1.種植業(yè)2.養(yǎng)殖業(yè)3.林業(yè)4.其他1.自家需要2.憑習(xí)慣3.隨大流4.合同訂單5.去年市場行情6.當(dāng)年市場行情7.政府命令8.其它1.找當(dāng)?shù)剞r(nóng)技人員2.自己找資料學(xué)習(xí)摸索3.請教有經(jīng)驗的農(nóng)民4.聽天由命5.電視、雜志等媒體6.其他1.自己消費2.小部分出售3.大部分出售4.全部出售1.按合同交貨2.賣給加工企業(yè)3.賣給商販4.委托出售5.自己零售6.批發(fā)市場7.其他第1章SPSS數(shù)據(jù)編碼、錄入與保存4.兼業(yè)者從事非農(nóng)產(chǎn)業(yè)情況家里有1人參加非農(nóng)勞動,是否壯勞力?①是②否業(yè)務(wù)范圍:①工業(yè)②建筑業(yè)③運輸④倉儲⑤餐飲業(yè)⑥社會服務(wù)業(yè)⑦其他工作年數(shù)

5年,(按整數(shù)算,超過半年算一年)投入時間大約占全年工作時間的%

70%收入大約占全年總收入的%

90%

5.是否擁有下列生產(chǎn)工具及設(shè)施(如有則劃√)

耕牛拖拉機(jī)抽水機(jī)收割機(jī)大棚汽車其它大農(nóng)具√√√√自家還是合伙購買或租用?1231如有還須選擇:自家購買=1,合伙=2,租用=3

第1章SPSS數(shù)據(jù)編碼、錄入與保存6.是否擁有下列消費品及生活設(shè)施(如有則劃√)

彩電電冰箱洗衣機(jī)電話手機(jī)電腦撥號上網(wǎng)寬帶上網(wǎng)轎車摩托車√√√√√√操作要求:(1)根據(jù)問卷建立數(shù)據(jù)庫,確定變量個數(shù)、變量名稱、變量類型、編碼方案(2)錄入數(shù)據(jù)并注意缺失值,保存為“1建數(shù)據(jù)庫(調(diào)查農(nóng)戶問卷).sav”

第1章SPSS數(shù)據(jù)編碼、錄入與保存“數(shù)據(jù)(Data)”和“轉(zhuǎn)換(Transform)”

2.1數(shù)據(jù)(Data)菜單的預(yù)處理合并文件、排序個案、分類匯總、加權(quán)個案.一、合并文件合并文件就是將兩個以上文件合并為一個數(shù)據(jù)文件,包括添加個案和添加變量.☆添加個案,也稱縱向合并.常用于變量屬性及數(shù)目一致情況下,合并多個數(shù)據(jù)文件中的所有個案.如果錄入數(shù)據(jù)工作量大,不妨先統(tǒng)一做好空白數(shù)據(jù)文件(定義變量、編碼方案),然后傳給多個人分批錄入個案、保存文件,再由“添加個案”實現(xiàn)逐個文件合并.☆添加變量,也稱橫向合并.第1章SPSS數(shù)據(jù)編碼、錄入與保存學(xué)習(xí)目標(biāo):1、掌握數(shù)據(jù)文件的合并、排序等常見操作2、掌握變量計算、分類匯總、加權(quán)個案等常見操作重點:1、文件合并、排序2、重新編碼為不同變量、分類匯總、加權(quán)個案第2章SPSS的數(shù)據(jù)預(yù)處理二、排序個案排序個案是將已經(jīng)錄好的數(shù)據(jù)文件,按一個或多個主次變量進(jìn)行個案排序.多個變量排序是按所選變量先后依次排序,首先按照主排序變量排序,然后對主排序變量中相同數(shù)據(jù)再按照第二排序變量排序,直至排序結(jié)束.排序還有助于發(fā)現(xiàn)缺失值、異常值、極端值,粗略了解數(shù)據(jù)離散程度.排序會將整個文件中所有個案按照某個變量排序;排序且保存以后數(shù)據(jù)庫將重新排列,如有標(biāo)識變量(個案編號:如姓名、戶名或?qū)W號),還可據(jù)此重新排序而恢復(fù),否則保存以后就把原來更新覆蓋了.第2章SPSS的數(shù)據(jù)預(yù)處理三、分類匯總分類匯總是指對數(shù)據(jù)文件按照某個變量分類、匯總計算(均值、中位數(shù)等).如將專業(yè)或性別作為分類變量,匯總成績均值、身高中位數(shù)或體重標(biāo)準(zhǔn)差.多個分類變量也可以同時納入其中、按照所有可能的交叉類別進(jìn)行匯總.如將專業(yè)和性別作為分類變量,歸總計算不同專業(yè)+不同性別學(xué)習(xí)成績均值.四、加權(quán)個案加權(quán)個案常用于計數(shù)資料的分析.該操作就是相當(dāng)于告訴軟件,當(dāng)前變量是個經(jīng)過計數(shù)匯總以后的頻數(shù)變量.今后交叉表或生存分析資料,若輸入具有某種特征的人數(shù),則須將其加權(quán)處理.一旦對變量加權(quán),若不取消則在此后分析中加權(quán)仍然生效;“變量加權(quán)以后,軟件認(rèn)定這是個頻數(shù)變量、計數(shù)資料”.第2章SPSS的數(shù)據(jù)預(yù)處理菜單選擇:主菜單“數(shù)據(jù)(Data)”→“加權(quán)個案(WeightCases)”.選中“加權(quán)個案(Weightcasesby)”按鈕,將變量選入”頻數(shù)變量(FrequencyVariable)”框,點擊“確定(OK)”.第2章SPSS的數(shù)據(jù)預(yù)處理【實例1】[問題敘述]某醫(yī)院2012年11月和12月泌尿科室測量的各15例病人各項基本情況及體征指標(biāo).表2-12012年11月15例病人指標(biāo)數(shù)據(jù)病人編號分組年齡年齡組性別身高體重收縮壓舒張壓心率心電圖1260311746517.09.06812133121645413.010.07913224121615315.08.07604134111686816.010.06005226111778018.010.07016165321607018.010.0701……………………………第2章SPSS的數(shù)據(jù)預(yù)處理(1)分別建立兩個數(shù)據(jù)文件;合并并另存為“實例2-1.sav”.(2)“實例2-1.sav”按照“分組”升序和“年齡”降序排序,另存為“實例2-1-3.sav”.(3)“實例2-1.sav”以變量“年齡組”為分組變量,按年齡組匯總計算身高、體重、年齡的均值以及收縮壓、舒張壓、心率的中位數(shù),另存為“實例2-1-4.sav”.[實驗?zāi)康腯理解“數(shù)據(jù)(Data)”預(yù)處理常見命令的作用,掌握數(shù)據(jù)合并、排序、分類匯總等處理命令的操作實現(xiàn)方法.[操作步驟](1)首先建立兩個及以上的數(shù)據(jù)文件.菜單選擇:主菜單“文件(Files)”→“打開(Open)”→“數(shù)據(jù)(Data)”打開當(dāng)前的數(shù)據(jù)文件;主菜單“數(shù)據(jù)(Data)”→“合并文件(MergeFile)”→“添加個案(AddCases)”.第2章SPSS的數(shù)據(jù)預(yù)處理第2章SPSS的數(shù)據(jù)預(yù)處理第2章SPSS的數(shù)據(jù)預(yù)處理其中“新的活動數(shù)據(jù)集中的變量”列出兩個數(shù)據(jù)文件中的同名變量,合并以前須滿足變量同名且須同類型,否則即使變量同名也無法實現(xiàn)合并.“(*)”、“(+)”表明變量來源,(*)指當(dāng)前的活動文件,(+)指待合并的文件,系統(tǒng)默認(rèn)不同名變量具有不同屬性.點擊“確定(OK)”按鈕.另存為數(shù)據(jù)文件“實例2-1.sav”,如果點擊保存則第一個文件就覆蓋替代了.(2)菜單選擇:主菜單“數(shù)據(jù)(Data)”→“排序個案(SortCases)”.第2章SPSS的數(shù)據(jù)預(yù)處理圖2-4個案排序界面第2章SPSS的數(shù)據(jù)預(yù)處理界面設(shè)置:將選變量“分組”進(jìn)入“排序依據(jù)(Sortby)”框,并選“升序(Ascending)”;再選變量“年齡”進(jìn)入“排序依據(jù)(Sortby)”框,并選“降序(Descending)”最后點擊“確定(OK)”按鈕.表2-3按分組(升序)和年齡(降序)復(fù)合排序結(jié)果第2章SPSS的數(shù)據(jù)預(yù)處理(3)菜單選擇:主菜單“數(shù)據(jù)(Data)”→“分類匯總(Aggregate)”.第2章SPSS的數(shù)據(jù)預(yù)處理界面設(shè)置:將變量“年齡組”選入“分組變量(Breakvariables)”框,將變量“身高”、“體重”、“年齡”、“收縮壓”、“舒張壓”及“心率”選入“變量摘要”框;點擊“函數(shù)(Function)”按鈕,設(shè)置匯總變量的計算函數(shù),每個匯總變量每次只能選擇一種函數(shù),系統(tǒng)默認(rèn)為均值函數(shù).設(shè)置“身高”、“體重”及“年齡”的匯總函數(shù)為默認(rèn),設(shè)置“收縮壓”、“舒張壓”及“心率”的匯總函數(shù)為中值,點擊“繼續(xù)(Continue)”按鈕;在“保存(Save)”區(qū)域,數(shù)據(jù)集名稱為“實例2-1-4”,點擊“確定(OK)”按鈕.第2章SPSS的數(shù)據(jù)預(yù)處理第2章SPSS的數(shù)據(jù)預(yù)處理2.2轉(zhuǎn)換(Transform)菜單的預(yù)處理轉(zhuǎn)換菜單傾向于對數(shù)據(jù)文件中單個變量進(jìn)行處理.常用預(yù)處理命令:計算變量、重新編碼為相同變量、重新編碼為不同變量、替換缺失值.一、計算變量(ComputeVariables)計算變量是利用數(shù)學(xué)表達(dá)式或函數(shù)產(chǎn)生新變量,并對新變量賦值.1.改變原始數(shù)據(jù)的分布形態(tài).很多統(tǒng)計方法對數(shù)據(jù)分布類型有要求,通過計算可對原有的分布類型進(jìn)行轉(zhuǎn)換,如某個指數(shù)函數(shù)形式變化的變量,由對數(shù)函數(shù)y=ln(x)轉(zhuǎn)換為線性函數(shù).類似Excel軟件,SPSS軟件提供了許多函數(shù),用戶需要時可以查用設(shè)置.第2章SPSS的數(shù)據(jù)預(yù)處理(1)左上角“目標(biāo)變量”矩形框中鍵入目標(biāo)變量,即新變量.(2)右上角“數(shù)字表達(dá)式”下矩形框中,設(shè)置表達(dá)式.(3)左下方矩形框中選擇原始變量,單擊向右箭頭按鈕選入,設(shè)置表達(dá)式.(4)中間計算器有數(shù)字、加減乘除乘方和各種關(guān)系符號等,設(shè)置表達(dá)式.公式中須注意單位換算、英文運算符為半角形式.(5)右邊中部“函數(shù)組”包含18組函數(shù),如算術(shù)函數(shù)、同積函數(shù)、分布函數(shù)、邏輯函數(shù)、字符串函數(shù)、日期時間函數(shù)、缺失值函數(shù)等.2.產(chǎn)生新的變量.計算變量將對所有個案同步執(zhí)行,新變量及賦值相應(yīng)出現(xiàn)在數(shù)據(jù)文件中.第2章SPSS的數(shù)據(jù)預(yù)處理二、變量重新編碼(RecodeintoVariables)問題答案可能是正向的,如12345,也可能是反向的,如54321.因此不同問題答案與實際賦值方向不同,須轉(zhuǎn)換為同一方向;或有些連續(xù)變量希望輸出頻數(shù)分布表,需要分組,利用變量重新編碼實現(xiàn).兩種情況:點值~點值之間的轉(zhuǎn)換、區(qū)間范圍~點值之間的轉(zhuǎn)換.如滿意度賦值“1,2,3,4,5”逆向編碼為“5,4,3,2,1”;如成績“<60”編碼為(不及格)“1”、“60~80”編碼為(中等)“2”、“81~90”編碼為(良好)“3”、“91~100”編碼為(優(yōu)秀)“4”.保存方式有兩種:重新編碼為“相同變量(RecodeintoSameVariables)”及重新編碼為“不同變量(RecodeintoDifferentVariables)”.第2章SPSS的數(shù)據(jù)預(yù)處理此過程將對變量所有個案給出新的編碼數(shù)值.重新編碼為相同變量是將原來數(shù)值直接替換覆蓋為新的數(shù)值,變量名不變;重新編碼為不同變量是保留原變量并由新舊數(shù)值對應(yīng)關(guān)系,命名為新變量.三、替換缺失值(ReplaceMissingValues)原始數(shù)據(jù)缺失或錯誤不可避免,統(tǒng)計分析時會自動過濾缺失數(shù)據(jù)的個案.替換缺失值就是將缺失數(shù)據(jù)以某種方式補(bǔ)充完整,但是并不常用.菜單選擇:主菜單“轉(zhuǎn)換“(Transform)”→“替換缺失值(ReplaceMissingValues)”.選擇有缺失值的變量到“新變量(NewVariables)”框,默認(rèn)“序列均值(Seriesmean)”(4種替換方法)替換缺失值,在原數(shù)據(jù)文件中產(chǎn)生已補(bǔ)缺數(shù)值的新變量,變量名后默認(rèn)加“

1”,點擊“確定(OK)”按鈕.第2章SPSS的數(shù)據(jù)預(yù)處理第2章SPSS的數(shù)據(jù)預(yù)處理四、個案編秩在某些統(tǒng)計分析進(jìn)程中(比如秩和檢驗)須對變量按秩進(jìn)行分析.操作步驟:選擇菜單【轉(zhuǎn)換】→【個案排秩…】,出現(xiàn)“個案排秩”對話框.選擇對話框左邊源變量“結(jié)石表面積”進(jìn)入右邊“變量”矩形框中.變量:設(shè)定要排秩的變量.新生成的秩變量的名稱以原變量名稱前加字母“R”的形式出現(xiàn)在原文件中.若選擇分組變量,系統(tǒng)將按此變量的不同組別分別進(jìn)行排秩.例如把“性別”調(diào)入排序標(biāo)準(zhǔn)矩形框,那么將會分別按男性和女性,對“結(jié)石表面積”排秩.第2章SPSS的數(shù)據(jù)預(yù)處理第2章SPSS的數(shù)據(jù)預(yù)處理【實例2】[問題敘述]自行設(shè)計網(wǎng)絡(luò)成癮問卷共10題,李克特等級賦值1-5分,共調(diào)查學(xué)生20名.題目T1T2T3T4T5T6T7T8T9T10011111111111022221311122031122111121041122111121054211333123062222133232072232111144083311211111091112111123……………………………第2章SPSS的數(shù)據(jù)預(yù)處理(1)打分累積網(wǎng)絡(luò)成癮總得分,生成一個新變量“網(wǎng)絡(luò)成癮得分”.(2)規(guī)定評判標(biāo)準(zhǔn):0~14為1級,正常使用;15~24為2級,使用過度;25~39為3級,成癮傾向;40~50為4級,成癮.生成“網(wǎng)絡(luò)成癮得分”變量,重新編碼生成“網(wǎng)絡(luò)成癮等級”變量,自動得到網(wǎng)絡(luò)成癮等級,另存為文件“實例2-2.sav”.[實驗?zāi)康腯理解“轉(zhuǎn)換(Transform)”預(yù)處理命令,掌握計算變量、變量重新編碼及替換缺失值等處理命令的操作實現(xiàn)方法.[操作步驟]

菜單選擇:主菜單“轉(zhuǎn)換(Transform)”→“計算變量(ComputerVariable)”.第2章SPSS的數(shù)據(jù)預(yù)處理第2章SPSS的數(shù)據(jù)預(yù)處理界面設(shè)置:在“目標(biāo)變量(TargetVariable)”框輸入生成新變量名稱,輸入“網(wǎng)絡(luò)成癮得分”;在“數(shù)字表達(dá)式(NumericExpression)”框中定義數(shù)學(xué)表達(dá)式,可以通過鍵盤或計算板輸入,也可利用系統(tǒng)函數(shù)將變量選入計算.10個變量T1~T10相加;點擊“確定(OK)”按鈕.表2-6變量計算結(jié)果(2)菜單選擇:“轉(zhuǎn)換(Transform)”→“重新編碼為不同變量”.第2章SPSS的數(shù)據(jù)預(yù)處理第2章SPSS的數(shù)據(jù)預(yù)處理界面設(shè)置:選變量“網(wǎng)絡(luò)成癮得分”進(jìn)入“數(shù)字變量→輸出變量”框,在”輸出變量”區(qū)域的“名稱”處輸入“網(wǎng)絡(luò)成癮等級”,點擊“更改”按鈕;點擊“舊值和新值”按鈕.“舊值”選“范圍”輸入0,“到”輸入49.9999;“新值”選“值”輸入1,點擊“添加”;(1)”舊值”選“范圍,從最低到值”框輸入14;“新值”選“值”框輸入1,點擊“添加”;(2)”舊值”選“范圍”框輸入15,“到”輸入24;“新值”選“值”輸入2,點擊“添加”;(3)”舊值”選“范圍”輸入25,“到”輸入39;“新值”選“值”輸入3,點擊“添加”;(4)”舊值”選“范圍,從值到最高”輸入40;“新值”選“值”輸入4,點擊“添加”;點擊“繼續(xù)”按鈕,點擊”確定”按鈕.最后另存為文件名“實例2-2.sav”.重新編碼過程中,范圍包含邊界值并組成閉區(qū)間,根據(jù)實際要靈活設(shè)置.第2章SPSS的數(shù)據(jù)預(yù)處理第2章SPSS的數(shù)據(jù)預(yù)處理表2-7重新編碼為不同變量結(jié)果第2章SPSS的數(shù)據(jù)預(yù)處理【練習(xí)1】[問題敘述]從某醫(yī)院查體中各隨機(jī)抽取糖尿病患者與正常人各15名.編號性別年齡心率身高(cm)體重(kg)1男7788165652女5665173663女5178165884男8080151685男6276166646男4776183887男6280162728女6881173699女577617568………………編號性別年齡心率身高(cm)體重(kg)16女50701625517男52751839018女63781626019男75801738820男62761657221女49801514922男53811666823女57761556424女74-16565………………第2章SPSS的數(shù)據(jù)預(yù)處理(1)數(shù)據(jù)文件“實驗2-1-1.sav”和“實驗2-1-2.sav”,合并并另存為“實驗2-1.sav”.(2)按“性別”升序和“年齡”降序?qū)€案進(jìn)行排序.(3)按“性別”分組對年齡、身高、體重匯總,計算年齡、身高及體重均值,心率中位數(shù).(4)計算體重指數(shù)(體重指數(shù)=體重/身高2,單位kg/m2),按照公式生成“體重指數(shù)”變量.(5)對變量“心率”缺失值,按序列均值補(bǔ)缺.(6)按變量“年齡”分組,≤50為1組、51~60為2組、61~70為3組、≥71為4組,生成變量“年齡組”,另存為“實驗2-1-3.sav”.第2章SPSS的數(shù)據(jù)預(yù)處理數(shù)據(jù)資料有計量資料和計數(shù)資料兩種類型.數(shù)據(jù)資料描述性分析是基礎(chǔ),主要包括頻數(shù)(頻率)分布表、分布圖直觀分析、指標(biāo)特征描述分析,便于認(rèn)識數(shù)據(jù)資料基本特征,以及進(jìn)一步推斷分析.一、核心知識1、數(shù)據(jù)資料(1)分類資料特點是以不同類別選項表示.★定類資料:等級最低,僅給出互不相容的類別并標(biāo)注名稱.這些類別可用文字表示,也可用數(shù)值編碼表示;事物按屬性分類或分組.數(shù)值本身無實質(zhì)差異性,僅是區(qū)分不同類別的一種標(biāo)記符號;類別雖有屬性類別之分,但無大小程度之別.運算特點:“=,≠”.第2章SPSS的數(shù)據(jù)預(yù)處理學(xué)習(xí)目標(biāo):1、掌握頻數(shù)分析、統(tǒng)計圖2、掌握描述統(tǒng)計量的計算3、掌握交叉分組的頻數(shù)分析重點:1、頻數(shù)分析、統(tǒng)計圖2、常見描述統(tǒng)計量的計算3、交叉分組的頻數(shù)分析第3章數(shù)據(jù)資料的描述性分析二項分類如性別男女、病人生存與死亡;多項無序分類,如血型分為A、B、AB、O;例:戶口、民族、職業(yè)、專業(yè)、婚姻狀況等.未婚=1、已婚=2、離婚=3、喪偶=4;血型為O型,A型,B型和AB型.★定序資料:數(shù)據(jù)表現(xiàn)為“類別”但有序.事物按等級或程度順序計量,類別取值反映排列次序;既有屬性類別之分、也有大小程度之別.但是每個相鄰數(shù)值間的距離并非程度差異的真實反映.運算特點:=,≠,>,<.例:療效分為顯效、有效、好轉(zhuǎn)和無效,糖尿病分為-、+、++、+++.例:滿意度(非常不滿意=1,不滿意=2,中立=3,滿意=4,非常滿意=5);考試等級優(yōu)、良、中、及格、不及格;成績名次(第1,第2,第3,…)第3章數(shù)據(jù)資料的描述性分析(2)定量資料又稱數(shù)值資料,是以具體數(shù)值與特定計量單位的連續(xù)型數(shù)據(jù),也可以是無單位計數(shù)尺度數(shù)據(jù),例如血清膽固醇含量3.0~6.5mmol/L為區(qū)間內(nèi)連續(xù)變化實數(shù),脈搏或紅細(xì)胞計數(shù)為一系列的離散點值.★定距資料:數(shù)值大小反映排列次序,無絕對意義上的0點.數(shù)學(xué)運算特點:=,≠,>,<,+,-.例:溫度,年歷,智商,海拔等.如25與20度之間相差5度,15度與10度差5度;但是不能說30度比15度熱一倍!★定比資料:等級最高,數(shù)值大小反映排列次序和倍數(shù).相鄰取值之間是等距的;有絕對0點.數(shù)學(xué)運算特點:=,≠,>,<,+,-,×,÷.例:年齡,身高,體重,收入等.第3章數(shù)據(jù)資料的描述性分析2、描述分析(1)數(shù)值資料描述性統(tǒng)計.集中趨勢指標(biāo)有均數(shù)、中位數(shù)、四分位數(shù)、百分位數(shù)及眾數(shù)等;離散趨勢指標(biāo)有方差、標(biāo)準(zhǔn)差、極差、四分位間距及變異系數(shù)等.第3章數(shù)據(jù)資料的描述性分析近似正態(tài)分布資料可用均數(shù)±標(biāo)準(zhǔn)差描述特征;偏態(tài)分布資料可用中位數(shù)±四分位數(shù)間距描述特征.數(shù)據(jù)個數(shù)較少時,直接觀察原始數(shù)據(jù)就能了解所有信息;數(shù)據(jù)量如果超出直接處理和記憶,可將原始數(shù)據(jù)分組匯總為計數(shù)資料分析.(2)計數(shù)資料常用構(gòu)成比、率和相對比描述特征,通過繪圖直觀演示.第3章數(shù)據(jù)資料的描述性分析對于兩個分組或分類的計數(shù)資料,還可通過分類交叉表進(jìn)行描述性分析.二、實驗?zāi)康?.理解均數(shù)、中位數(shù)、眾數(shù)及四分位數(shù)的含義,掌握集中趨勢指標(biāo)操作方法;2.理解方差、標(biāo)準(zhǔn)差、極差及四分位間距的含義,掌握離散趨勢指標(biāo)操作方法;3.理解構(gòu)成比、率和相對比的含義,掌握相對數(shù)計算和統(tǒng)計圖繪制的操作方法.4.理解交叉表的含義,掌握行列分類交叉表的操作方法.三、案例分析【實例1】[問題敘述]已知56例成年男性測定血清膽固醇水平資料,單位mmol/L.第3章數(shù)據(jù)資料的描述性分析3.214.035.246.273.546.525.425.015.125.253.212.543.332.363.683.473.513.554.324.524.024.306.016.236.276.354.274.324.525.246.273.546.525.425.425.015.254.023.216.414.306.013.473.513.553.556.325.124.324.525.423.514.324.524.524.02(1)計算集中趨勢和離散趨勢指標(biāo):計算算術(shù)均數(shù)、中位數(shù)、四分位數(shù)、眾數(shù)、方差、標(biāo)準(zhǔn)差、極差、四分位間距和變異系數(shù).了解數(shù)據(jù)分布的偏度和峰度.(2)數(shù)據(jù)資料統(tǒng)計分組為6組:[0,3)、[3,4)、[4,5)、[5,6)、[6,7)、[7,+∞),分組計算頻數(shù)、構(gòu)成比,繪制餅圖、直方圖.(3)繪制箱線圖和莖葉圖(簡單了解).第3章數(shù)據(jù)資料的描述性分析

[操作步驟]建立數(shù)值變量“血清膽固醇”,錄入數(shù)據(jù).(1)點擊主菜單“分析”,點擊“描述統(tǒng)計”,點擊“交叉表”.選擇變量“血清膽固醇”進(jìn)入“變量”框;點擊“統(tǒng)計量”.選“均值”、“中位數(shù)”、“眾數(shù)”、“方差”、“標(biāo)準(zhǔn)差”、“極差”等;點擊“繼續(xù)”,點擊“確定”.第3章數(shù)據(jù)資料的描述性分析血清膽固醇N有效56缺失0均值4.6014中值4.4200眾數(shù)4.52標(biāo)準(zhǔn)差1.11240方差1.237偏度.184全距4.16百分位數(shù)253.5500504.4200755.4200(2)點擊主菜單“轉(zhuǎn)換”,點擊“重新編碼為不同變量”.將變量“血清膽固醇”選入“數(shù)字變量”,點擊輸出變量”框,在“輸出變量”區(qū)域的“名稱”處輸入“分組”,點擊“更改”,完成輸出變量名稱的定義.第3章數(shù)據(jù)資料的描述性分析第3章數(shù)據(jù)資料的描述性分析第3章數(shù)據(jù)資料的描述性分析“舊值”選“范圍”輸入0,“到”輸入2.9999;“新值”選“值”輸入1,點擊“添加”;“舊值”選“范圍”輸入3,“到”輸入3.9999;“新值”選“值”輸入2,點擊“添加”;“舊值”選“范圍”輸入4,“到”輸入4.9999;“新值”選“值”輸入3,點擊“添加”;“舊值”選“范圍”輸入5,“到”輸入5.9999;“新值”選“值”輸入4,點擊“添加”;“舊值”選“范圍”輸入6,“到”輸入6.9999;“新值”選“值”輸入5,點擊“添加”;“舊值”選“范圍,從值到最高輸入7;“新值”選“值”輸入6,點擊“添加”;點擊“繼續(xù)”,返回,點擊“確定”.對變量“成績段”,值標(biāo)簽設(shè)置編碼:1=“[0,50)”、2=“[50,60)”、3=“[60,70)”、4=“[70,80)”、5=“[80,90)”、6=“[90,100]”.第3章數(shù)據(jù)資料的描述性分析第3章數(shù)據(jù)資料的描述性分析點擊主菜單“分析”,點擊“描述統(tǒng)計”,點擊“頻率”.選擇變量“分組”,點擊“繼續(xù)”;點擊“確定”.第3章數(shù)據(jù)資料的描述性分析表2頻數(shù)及構(gòu)成比分組頻數(shù)百分比有效百分比累積百分比有效[0,3)23.63.63.6[3,4)1526.826.830.4[4,5)1628.628.658.9[5,6)1221.421.480.4[6,7)1119.619.6100.0合計56100.0100.0經(jīng)分析,落在[0,3)、[3,4)、[4,5)、[5,6)、[6,7)、[7,+∞)區(qū)間范圍中的各組頻數(shù)分別為2、15、16、12、11,共56例.各組構(gòu)成百分比為3.6%、26.8%、28.6%、21.4%、19.6.第3章數(shù)據(jù)資料的描述性分析點擊“圖表”,點擊繪制餅圖或直方圖(帶正態(tài)曲線).第3章數(shù)據(jù)資料的描述性分析定類資料由餅圖或條形圖表示.血清膽固醇屬于定序資料,直方圖描述也很合適.(3)繪制箱線圖和莖葉圖(僅作了解).點擊主菜單“分析”,點擊“描述統(tǒng)計”,點擊“探索”.將血清膽固醇選入右邊的因變量列表,點擊“繪制”按鈕.第3章數(shù)據(jù)資料的描述性分析第3章數(shù)據(jù)資料的描述性分析“箱圖”中默認(rèn)點選“按因子水平分組”,“描述性”中點選“莖葉圖”第3章數(shù)據(jù)資料的描述性分析【實例2】[問題敘述]由數(shù)據(jù)庫獲得性別與職業(yè)、糖尿病與療效的分類交叉表描述性分析,即匯總交叉類別之間的頻數(shù)、行類別的百分比和列類別的百分比.見NO3建數(shù)據(jù)庫(病歷復(fù)雜資料簡表).sav.編號籍貫(填空)字符型性別(選擇)數(shù)值型年齡(選擇)數(shù)值型血型(選擇)數(shù)值型職業(yè)(選擇)數(shù)值型糖尿病史(選擇)數(shù)值型總膽固醇(選擇)數(shù)值型療效(選擇)數(shù)值型1山東男58B工人無5.33有效2廣西男69O商人無4.63好轉(zhuǎn)3山東男58B工人無5.33有效4湖北女42A商人無6.12顯效5天津男43O農(nóng)民有4.54好轉(zhuǎn)第3章數(shù)據(jù)資料的描述性分析[操作步驟]

點擊主菜單“分析”,點擊“描述統(tǒng)計”,點擊“交叉表”.選擇變量“性別”進(jìn)入行列表框;選擇變量“職業(yè)”進(jìn)入行列表框.第3章數(shù)據(jù)資料的描述性分析點擊“單元格”.第3章數(shù)據(jù)資料的描述性分析點擊計數(shù)中的“觀察值”、點擊百分比中的“行”、“列”,點擊“繼續(xù)”.性別*職業(yè)交叉制表職業(yè)合計工人農(nóng)民商人性別男計數(shù)2041741性別中的%48.8%9.8%41.5%100.0%職業(yè)中的%66.7%33.3%81.0%65.1%女計數(shù)108422性別中的%45.5%36.4%18.2%100.0%職業(yè)中的%33.3%66.7%19.0%34.9%第3章數(shù)據(jù)資料的描述性分析(2)點擊主菜單“分析”,點擊“描述統(tǒng)計”,點擊“交叉表”.選擇變量“糖尿病史”進(jìn)入行;選擇變量“療效評定”進(jìn)入列,點擊“單元格”.第3章數(shù)據(jù)資料的描述性分析點擊計數(shù)中的“觀察值”、點擊百分比中的“行”、“列”、“總數(shù)”,點擊“繼續(xù)”.療效評定合計無效好轉(zhuǎn)有效顯效糖尿病史無計數(shù)81720449糖尿病史中的%16.3%34.7%40.8%8.2%100.0%療效評定中的%100.0%81.0%100.0%28.6%77.8%總數(shù)的%12.7%27.0%31.7%6.3%77.8%有計數(shù)0401014糖尿病史中的%.0%28.6%.0%71.4%100.0%療效評定中的%.0%19.0%.0%71.4%22.2%總數(shù)的%.0%6.3%.0%15.9%22.2%第3章數(shù)據(jù)資料的描述性分析【練習(xí)1】[問題敘述]已知某校某班級60名學(xué)生醫(yī)藥數(shù)理統(tǒng)計課的期末成績.836780718162737557869664894791896683847972746196826994817057838578549979647784997692797294865381936985637866778180698376求該班級的平均成績、標(biāo)準(zhǔn)差、極差、中位數(shù)、四分位數(shù)間距;設(shè)置分?jǐn)?shù)段為6段,[0,50)、[50,60)、[60,70)、[70,80)、[80,90)、[90,100].按分?jǐn)?shù)段統(tǒng)計人數(shù),計算各分?jǐn)?shù)段構(gòu)成比,繪制直方圖.第3章數(shù)據(jù)資料的描述性分析建立數(shù)值變量“學(xué)生成績”,錄入并建立數(shù)據(jù)庫.菜單選擇:點擊主菜單“轉(zhuǎn)換”,點擊“重新編碼為不同變量”.將變量“學(xué)習(xí)成績”選入“數(shù)字變量”,點擊“輸出變量”框,在“輸出變量”區(qū)域的“名稱”處輸入“成績段”,點擊“更改”,完成輸出變量名稱的定義.點擊“舊值和新值”.“舊值”選“范圍”輸入0,“到”輸入49.9999;”新值”選“值”輸入1,點擊“添加”;“舊值”選“范圍”輸入50,“到”輸入59.9999;”新值”選“值”輸入2,點擊“添加”;“舊值”選“范圍”輸入60,“到”輸入69.9999;”新值”選“值”輸入3,點擊“添加”;“舊值”選“范圍”輸入70,“到”輸入79.9999;”新值”選“值”輸入4,點擊“添加”;“舊值”選“范圍”輸入80,“到”輸入89.9999;”新值”選“值”輸入5,點擊“添加”;“舊值”選“范圍”輸入90,“到”輸入100;”新值”選“值”輸入6,點擊“添加”;第3章數(shù)據(jù)資料的描述性分析點擊“繼續(xù)”,返回,點擊”確定”.第3章數(shù)據(jù)資料的描述性分析第3章數(shù)據(jù)資料的描述性分析對變量“成績段”,值標(biāo)簽設(shè)置編碼:第3章數(shù)據(jù)資料的描述性分析

(2)主菜單“分析”→“描述統(tǒng)計”→“頻率”.點擊主菜單“分析”,點擊“描述統(tǒng)計”,點擊“頻率”.選擇變量“學(xué)習(xí)成績”進(jìn)入“變量”框;點擊“統(tǒng)計量”按鈕,得統(tǒng)計量設(shè)置界面:選“標(biāo)準(zhǔn)差”、“范圍”、“均值”、“中位數(shù)”、“四分位數(shù)”,點擊“繼續(xù)”.返回,點擊取消“顯示頻率表格”,點擊“確定”.第3章數(shù)據(jù)資料的描述性分析

[結(jié)果分析]N有效60缺失0均值77.23中值79.00標(biāo)準(zhǔn)差11.934全距52百分位數(shù)2569.005079.007584.7560名學(xué)生學(xué)習(xí)成績的均值為77.23,中位數(shù)為79.00,標(biāo)準(zhǔn)差為11.934,極差為52,四分位間距為84.75-69.00=15.75.第3章數(shù)據(jù)資料的描述性分析主菜單“分析”→“描述統(tǒng)計”→“頻率”.變量“學(xué)習(xí)成績”選入“變量”框.單擊“圖表”按鈕,選擇“直方圖”,選“帶正態(tài)曲線”,點擊“繼續(xù)”;點擊“確定”.第3章數(shù)據(jù)資料的描述性分析主菜單“分析”→“描述統(tǒng)計”→“頻率”;變量“成績段”選入“變量”框.第3章數(shù)據(jù)資料的描述性分析單擊“圖表”按鈕,選擇“條形圖”,點擊“繼續(xù)”;點擊“確定”.

[結(jié)果分析]成績段頻數(shù)百分比有效百分比累積百分比有效[0,50)11.71.71.7[50,60)46.76.78.3[60,70)1118.318.326.7[70,80)1626.726.753.3[80,90)1931.731.785.0[90,100]915.015.0100.0合計60100.0100.0第3章數(shù)據(jù)資料的描述性分析各組段的頻數(shù)分別為1、4、11、16、19、9;各組段構(gòu)成百分比分別為1.7%、6.7%、18.3%、26.7%、31.7%、15.0%.按學(xué)習(xí)成績繪制直方圖、按成績段繪制餅圖:第3章數(shù)據(jù)資料的描述性分析【練習(xí)2】[問題敘述]根據(jù)資料作如下描述性分析:(1)計算結(jié)石表面積、結(jié)石側(cè)腎盂壓力的均數(shù)和標(biāo)準(zhǔn)差;(2)計算手術(shù)時間、灌注量的中位數(shù)和四分位間距;(3)繪制性別、腎部位、腎周積液(有無)的頻數(shù)及構(gòu)成比分布表和餅圖.編號性別腎周積液結(jié)石表面積手術(shù)時間灌注量腎部位結(jié)石側(cè)腎盂壓力1女有69.081157400上段105.322男有43.18454500上段110.633女有112.26564900上段170.854男有91.89903500上段120.645男有27.48805000上段130.656女有141.30657000上段140.58第3章數(shù)據(jù)資料的描述性分析【練習(xí)3】[問題敘述]調(diào)查表中已知學(xué)生的學(xué)習(xí)情況、午餐地點,性別中對學(xué)習(xí)情況進(jìn)行交叉頻數(shù)和百分比分析、午餐地點中對性別進(jìn)行交叉頻數(shù)和百分比分析.注:數(shù)據(jù)庫文件見“NO3交叉表分析(性別學(xué)習(xí)午餐).sav”.性別*學(xué)習(xí)情況交叉制表學(xué)習(xí)情況合計優(yōu)秀良好中等較差性別男計數(shù)616249124296性別中的%20.6%20.9%16.6%41.9%100.0%女計數(shù)3520811249404性別中的%8.7%51.5%27.7%12.1%100.0%合計計數(shù)96270161173700性別中的%13.7%38.6%23.0%24.7%100.0%第3章數(shù)據(jù)資料的描述性分析性別*午餐地點交叉制表午餐地點合計宿舍餐廳大服性別男計數(shù)7617149296午餐地點中的%60.3%37.5%41.5%42.3%女計數(shù)5028569404午餐地點中的%39.7%62.5%58.5%57.7%合計計數(shù)126456118700午餐地點中的%100.0%100.0%100.0%100.0%第3章數(shù)據(jù)資料的描述性分析學(xué)習(xí)目標(biāo):1、掌握單樣本t檢驗、獨立樣本t檢驗、配對樣本t檢驗3、掌握單因素方差分析及其兩兩比較重點:1、樣本t檢驗、獨立樣本t檢驗、配對樣本t檢驗2、單因素方差分析及其兩兩比較第4章總體均值的參數(shù)假設(shè)檢驗一、核心知識統(tǒng)計推斷規(guī)則:

給定顯著性水平

(0.01、0.05),根據(jù)抽樣分布(N(0,1)、t分布)查表得臨界值和拒絕域;服從該分布的統(tǒng)計量值與臨界值比較大小;作出推斷,雙側(cè)檢驗:|統(tǒng)計量|≥臨界值,落入拒絕域,拒絕H0.P值的意義:H0成立情況下,超出統(tǒng)計量值的概率(尾部面積);第4章總體均值的參數(shù)假設(shè)檢驗若P≤

,拒絕原假設(shè)H0;P值越小則拒絕理由越充分.若P>,不拒絕原假設(shè)H0;P值越大則不拒絕理由越充分.“假設(shè)→確定統(tǒng)計量、求值→查表確定P值→與顯著性水平

比較→結(jié)論分析”.1、t檢驗知識樣本數(shù)據(jù)屬于數(shù)值資料類型,可以通過已知的樣本信息,對總體均值與常數(shù)、或總體均值之間差異性比較推斷,大致有三種:1.1單樣本t檢驗單個總體均數(shù)未知,通過觀察位置總體中一組樣本值,對總體均數(shù)是否等于某個常數(shù)做出判斷,稱為單樣本t檢驗.通過樣本數(shù)據(jù)檢驗總體均值與已知總體均值(常數(shù))差異是否有統(tǒng)計學(xué)意義.第4章總體均值的參數(shù)假設(shè)檢驗原假設(shè)H0:總體均值與某常數(shù)相等;(1)數(shù)值型,且若已知總體正態(tài)分布,總體方差未知,對樣本容量沒有限制;(2)總體非正態(tài)分布,總體方差未知時,大樣本也可以適用.1.2兩個獨立樣本t檢驗完全隨機(jī)設(shè)計:在兩個獨立總體中隨機(jī)抽取樣本,或?qū)⑼|(zhì)受試對象隨機(jī)分配到不同處理組,觀察實驗效應(yīng)(指標(biāo)),由此推斷兩組總體差異是否有統(tǒng)計學(xué)意義.兩組樣本容量不必相同,組中數(shù)據(jù)隨機(jī)排列、無順序可言.兩個總體均值均未知,通過獨立樣本組,對兩個總體均數(shù)是否相等做出判斷,用兩個獨立樣本t檢驗.通過兩個獨立樣本數(shù)據(jù)檢驗兩個獨立總體均值差異是否有統(tǒng)計學(xué)意義.第4章總體均值的參數(shù)假設(shè)檢驗原假設(shè)H0:兩個總體均值相等.須滿足條件:(1)資料類型為數(shù)值型,所在總體服從正態(tài)分布;(2)兩個樣本所在總體方差未知(齊性?非齊性?);(3)兩個樣本相互獨立.兩步實施:(1)先檢驗兩個總體方差的齊性.(2)再根據(jù)兩個總體方差是否齊性,決定檢驗統(tǒng)計量和自由度.第4章總體均值的參數(shù)假設(shè)檢驗1.3兩個配對樣本t檢驗配對設(shè)計:將條件相同或相近的受試對象配成對子,再將每對中的兩個受試對象隨機(jī)分配到不同處理組.可以節(jié)約樣本,又排除受試對象非處理因素(混雜因素)影響,盡量突顯處理因素作用,配對設(shè)計可增強(qiáng)組間的均衡性,從而提高了處理因素的實驗效能.(1)同質(zhì)受試對象配成對子分別接受兩種不同處理;(2)同一受試對象接受處理前后.配對比較:兩組樣本容量相同、一一對應(yīng)、不能打亂對子內(nèi)的排列順序.第4章總體均值的參數(shù)假設(shè)檢驗“對子數(shù)據(jù)”的差值序列為直接計算依據(jù),而原始數(shù)據(jù)是間接計算依據(jù).兩個總體均數(shù)均未知,通過兩組相關(guān)樣本,對兩個總體均值是否相等做出判斷,用配對樣本t檢驗.旨在通過樣本數(shù)據(jù)檢驗兩個配對總體均值差異是否有統(tǒng)計學(xué)意義.原假設(shè)H0:兩個總體均值之差為0.須滿足條件:(1)資料類型為數(shù)值型,且兩個樣本所在總體服從正態(tài)分布;(2)兩個樣本所在總體的方差未知;(3)兩個樣本為配對樣本.第4章總體均值的參數(shù)假設(shè)檢驗2、方差分析知識分析完全隨機(jī)設(shè)計的多個獨立總體均數(shù)差異是否有統(tǒng)計學(xué)意義.處理結(jié)果稱為效應(yīng),影響處理結(jié)果的條件稱為因素.因素所處的不同狀態(tài)(三個及以上)稱為該因素的水平.由各水平樣本效應(yīng)情況來推斷各水平總體效應(yīng)之間的差異,確定該因素對處理結(jié)果的影響是否有統(tǒng)計學(xué)意義.原假設(shè)H0:多總體均值相等.基本原理:全部觀察值間總變異(總離均差平方和)分解成組間變異和組內(nèi)變異,總的自由度也相應(yīng)分解成組間自由度和組內(nèi)自由度;組間變異體現(xiàn)隨機(jī)誤差和處理因素的作用,組內(nèi)變異表示隨機(jī)誤差的影響;繼續(xù)算出各部分的均方,構(gòu)造F檢驗統(tǒng)計量,比較處理因素在各組間有無差異.第4章總體均值的參數(shù)假設(shè)檢驗須滿足條件:(1)各組樣本隨機(jī)獨立;(2)各組樣本來自正態(tài)總體;(3)相互比較的各組樣本總體方差相等.拒絕原假設(shè)(總體均數(shù)全部相等)時,一般要進(jìn)行兩兩比較:幾個實驗組與對照組比較時可用Dunnett法;實驗次數(shù)較少時可用LSD法;多個均數(shù)間兩兩比較進(jìn)行探索性研究;試驗次數(shù)不多時可用S-N-K法;各組試驗數(shù)相等時可用Tukey或Bonferroni法(實驗組數(shù)<5);各組試驗數(shù)不等時可用Scheffe法.第4章總體均值的參數(shù)假設(shè)檢驗注意:兩兩比較方法有多種,它們之間各有優(yōu)缺點且沒有絕對替代性,有些情況下甚至不須嚴(yán)格選擇,得出結(jié)論之間也有略微差別;大家可以查書但不必重點關(guān)注.在各組不滿足方差齊性條件時,軟件給出了兩兩比較近似方法.二、實驗?zāi)康?.掌握單組總體均值與常數(shù)差異是否有統(tǒng)計學(xué)意義的t檢驗操作方法;2.掌握兩組獨立總體均值差異是否有統(tǒng)計學(xué)意義的t檢驗操作方法;3.掌握兩組配對總體均值差異是否有統(tǒng)計學(xué)意義的t檢驗操作方法;4.掌握多組總體均值差異是否有統(tǒng)計學(xué)意義的方差分析操作方法.第4章總體均值的參數(shù)假設(shè)檢驗三、案例分析【實例1】[問題敘述]廠家宣稱某種藥劑的平均有效期是21.5天,現(xiàn)在從生產(chǎn)線上隨機(jī)抽樣檢測藥劑共6只,有效期分別為:19、18、22、20、16、25.請由此樣本推斷,現(xiàn)在生產(chǎn)線上的藥劑有效期是否與廠家宣稱有差別?菜單選擇:主菜單“分析”→“比較均值”→“單樣本T檢驗”.界面設(shè)置:選擇變量“藥劑有效期”進(jìn)入“檢驗變量”框;將常數(shù)21.5輸入“檢驗值”框,點擊“確定”.[操作步驟]一個(或多個)檢驗變量,變量類型為數(shù)值型;一個已知總體均值(常數(shù)).定義數(shù)值型變量“藥劑有效期”,將所有數(shù)據(jù)錄入;已知總體均值為21.5.第4章總體均值的參數(shù)假設(shè)檢驗第4章總體均值的參數(shù)假設(shè)檢驗[結(jié)果分析]

單個樣本統(tǒng)計量N均值標(biāo)準(zhǔn)差均值的標(biāo)準(zhǔn)誤藥劑有效期620.00003.162281.29099單個樣本檢驗檢驗值=21.5tdfSig.(雙側(cè))均值差值差分的95%置信區(qū)間下限上限藥劑有效期-1.1625.298-1.50000-4.81861.8186第4章總體均值的參數(shù)假設(shè)檢驗經(jīng)分析,6只藥劑有效期樣本均值為20.0000,標(biāo)準(zhǔn)差為1.29099.在單樣本t檢驗中,統(tǒng)計量t值為-1.162,對應(yīng)的概率值P=0.298,遠(yuǎn)大于顯著性水平

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論