版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上精選優(yōu)質(zhì)文檔-傾情為你奉上專心-專注-專業(yè)專心-專注-專業(yè)精選優(yōu)質(zhì)文檔-傾情為你奉上專心-專注-專業(yè)SPSS工具簡介最新統(tǒng)計要與大量的數(shù)據(jù)打交道,涉及繁雜的計算和圖表繪制。現(xiàn)代的數(shù)據(jù)分析工作如果離開統(tǒng)計軟件幾乎是無法正常開展。在準確理解和掌握了各種統(tǒng)計方法原理之后,再來掌握幾種統(tǒng)計分析軟件的實際操作,是十分必要的。常見的統(tǒng)計軟件有SAS,SPSS,MINITAB,EXCEL等。這些統(tǒng)計軟件的功能和作用大同小異,各自有所側(cè)重。其中的SAS和SPSS是目前在大型企業(yè)、各類院校以及科研機構(gòu)中較為流行的兩種統(tǒng)計軟件。特別是SPSS,其界面友好、功能強大、易學(xué)、易用,包含了幾乎
2、全部尖端的統(tǒng)計分析方法,具備完善的數(shù)據(jù)定義、操作管理和開放的數(shù)據(jù)接口以及靈活而美觀的統(tǒng)計圖表制作。SPSS在各類院校以及科研機構(gòu)中更為流行。SPSS(Statistical Product and Service Solutions,意為統(tǒng)計產(chǎn)品與服務(wù)解決方案)。自20世紀60年代SPSS誕生以來,為適應(yīng)各種操作系統(tǒng)平臺的要求經(jīng)歷了多次版本更新,各種版本的SPSS for Windows大同小異,在本試驗課程中我們選擇PASW Statistics 20.0作為統(tǒng)計分析應(yīng)用試驗活動的工具。SPSS的運行模式SPSS主要有三種運行模式:批處理模式這種模式把已編寫好的程序(語句程序)存為一個文件,
3、提交給開始菜單上SPSS for WindowsProduction Mode Facility程序運行。完全窗口菜單運行模式這種模式通過選擇窗口菜單和對話框完成各種操作。用戶無須學(xué)會編程,簡單易用。程序運行模式這種模式是在語句(Syntax)窗口中直接運行編寫好的程序或者在腳本(script)窗口中運行腳本程序的一種運行方式。這種模式要求掌握SPSS的語句或腳本語言。本試驗指導(dǎo)手冊為初學(xué)者提供入門試驗教程,采用“完全窗口菜單運行模式”。SPSS的啟動在windows開始程序PASW,在它的次級菜單中單擊“SPSS 12.0 for Windows”即可啟動SPSS軟件,進入SPSS for
4、Windows對話框,如圖1.1,圖1.2所示。圖1.1 SPSS啟動圖1.1 PASW Statistics 啟動對話框SPSS軟件的退出SPSS軟件的退出方法與其他Windows應(yīng)用程序相同,有兩種常用的退出方法:按FileExist的順序使用菜單命令退出程序。直接單擊SPSS窗口右上角的“關(guān)閉”按鈕,回答系統(tǒng)提出的是否存盤的問題之后即可安全退出程序。SPSS的主要窗口介紹SPSS軟件運行過程中會出現(xiàn)多個界面,各個界面用處不同。其中,最主要的界面有三個:數(shù)據(jù)編輯窗口、結(jié)果輸出窗口和語句窗口。數(shù)據(jù)編輯窗口啟動SPSS后看到的第一個窗口便是數(shù)據(jù)編輯窗口,如圖1.3所示。在數(shù)據(jù)編輯窗口中可以進行
5、數(shù)據(jù)的錄入、編輯以及變量屬性的定義和編輯,是SPSS的基本界面。主要由以下幾部分構(gòu)成:標題欄、菜單欄、工具欄、編輯欄、變量名欄、觀測序號、窗口切換標簽、狀態(tài)欄。菜單欄工具欄編輯欄觀測序號變量名欄窗口切換標簽狀態(tài)欄標題欄圖1.3 數(shù)據(jù)瀏覽界面標題欄:顯示數(shù)據(jù)編輯的數(shù)據(jù)文件名。菜單欄:通過對這些菜單的選擇,用戶可以進行幾乎所有的SPSS操作。關(guān)于菜單的詳細的操作步驟將在后續(xù)實驗內(nèi)容中分別介紹。為了方便用戶操作,SPSS軟件把菜單項中常用的命令放到了工具欄里。當鼠標停留在某個工具欄按鈕上時,會自動跳出一個文本框,提示當前按鈕的功能。另外,如果用戶對系統(tǒng)預(yù)設(shè)的工具欄設(shè)置不滿意,也可以用視圖工具欄 設(shè)定
6、命令對工具欄按鈕進行定義。編輯欄:可以輸入數(shù)據(jù),以使它顯示在內(nèi)容區(qū)指定的方格里。變量名欄:列出了數(shù)據(jù)文件中所包含變量的變量名觀測序號:列出了數(shù)據(jù)文件中的所有觀測值。觀測的個數(shù)通常與樣本容量的大小一致。窗口切換標簽:用于“數(shù)據(jù)視圖”和“變量視圖”的切換。即數(shù)據(jù)瀏覽窗口與變量瀏覽窗口。數(shù)據(jù)瀏覽窗口用于樣本數(shù)據(jù)的查看、錄入和修改。變量瀏覽窗口用于變量屬性定義的輸入和修改。狀態(tài)欄:用于說明顯示SPSS當前的運行狀態(tài)。SPSS被打開時,將會顯示“PASW Statistics Processor”的提示信息。結(jié)果輸出窗口在SPSS中大多數(shù)統(tǒng)計分析結(jié)果都將以表和圖的形式在結(jié)果觀察窗口中顯示。窗口右邊部分顯
7、示統(tǒng)計分析結(jié)果,左邊是導(dǎo)航窗口,用來顯示輸出結(jié)果的目錄,可以通過單擊目錄來展開右邊窗口中的統(tǒng)計分析結(jié)果。當用戶對數(shù)據(jù)進行某項統(tǒng)計分析,結(jié)果輸出窗口將被自動調(diào)出。當然,用戶也可以通過雙擊后綴名為.spo的SPSS輸出結(jié)果文件來打開該窗口。 試驗1 數(shù)據(jù)文件管理一、試驗?zāi)康呐c要求通過本試驗項目,使學(xué)生理解并掌握SPSS軟件包有關(guān)數(shù)據(jù)文件創(chuàng)建和整理的基本操作,學(xué)習(xí)如何將收集到的數(shù)據(jù)輸入計算機,建成一個正確的SPSS數(shù)據(jù)文件,并掌握如何對原始數(shù)據(jù)文件進行整理,包括數(shù)據(jù)查詢,數(shù)據(jù)修改、刪除,數(shù)據(jù)的排序等等。二、試驗原理SPSS數(shù)據(jù)文件是一種結(jié)構(gòu)性數(shù)據(jù)文件,由數(shù)據(jù)的結(jié)構(gòu)和數(shù)據(jù)的內(nèi)容兩部分構(gòu)成,也可以說由變
8、量和觀測兩部分構(gòu)成。一個典型的SPSS數(shù)據(jù)文件如表2.1 所示。觀測變量數(shù)據(jù)內(nèi)容表2.1 SPSS數(shù)據(jù)文件結(jié)構(gòu)姓名性別年齡張三145李四223 王五245SPSS變量的屬性SPSS中的變量共有10個屬性,分別是變量名(Name)、變量類型(Type)、長度(Width)、小數(shù)點位置(Decimals)、變量名標簽(Label)、變量名值標簽(Value)、缺失值(Missing)、數(shù)據(jù)列的顯示寬度(Columns)、對其方式(Align)和度量尺度(Measure)。定義一個變量至少要定義它的兩個屬性,即變量名和變量類型,其他屬性可以暫時采用系統(tǒng)默認值,待以后分析過程中如果有需要再對其進行設(shè)置
9、。在spss數(shù)據(jù)編輯窗口中單擊“變量視窗”標簽,進入變量視窗界面(如圖2.1所示)即可對變量的各個屬性進行設(shè)置。圖2.1 變量視窗三、試驗內(nèi)容與步驟1創(chuàng)建一個數(shù)據(jù)文件數(shù)據(jù)文件的創(chuàng)建分成三個步驟:(1)選擇菜單 【文件】【新建】【數(shù)據(jù)】新建一個數(shù)據(jù)文件,進入數(shù)據(jù)編輯窗口。窗口頂部標題為“PASW Statistics數(shù)據(jù)編輯器”。(2)單擊左下角【變量視窗】標簽進入變量視圖界面,根據(jù)試驗的設(shè)計定義每個變量類型。(3)變量定義完成以后,單擊【數(shù)據(jù)視窗】標簽進入數(shù)據(jù)視窗界面,將每個具體的變量值錄入數(shù)據(jù)庫單元格內(nèi)。2讀取外部數(shù)據(jù)當前版本的SPSS可以很容易地讀取Excel數(shù)據(jù),步驟如下:(1)按【文件
10、】【打開】【數(shù)據(jù)】的順序使用菜單命令調(diào)出打開數(shù)據(jù)對話框,在文件類型下拉列表中選擇數(shù)據(jù)文件,如圖2.2所示。圖2.2 Open File對話框(2)選擇要打開的Excel文件,單擊“打開”按鈕,調(diào)出打開Excel數(shù)據(jù)源對話框,如圖2.3所示。對話框中各選項的意義如下:工作表 下拉列表:選擇被讀取數(shù)據(jù)所在的Excel工作表。范圍 輸入框:用于限制被讀取數(shù)據(jù)在Excel工作表中的位置。圖2.3 Open Excel Data Source對話框3數(shù)據(jù)編輯在SPSS中,對數(shù)據(jù)進行基本編輯操作的功能集中在Edit和Data菜單中。4SPSS數(shù)據(jù)的保存SPSS數(shù)據(jù)錄入并編輯整理完成以后應(yīng)及時保存,以防數(shù)據(jù)
11、丟失。保存數(shù)據(jù)文件可以通過【文件】【保存】或者【文件】【另存為】菜單方式來執(zhí)行。在數(shù)據(jù)保存對話框(如圖2.5所示)中根據(jù)不同要求進行SPSS數(shù)據(jù)保存。圖2.5 SPSS數(shù)據(jù)的保存5. 數(shù)據(jù)整理在SPSS中,數(shù)據(jù)整理的功能主要集中在【數(shù)據(jù)】和【轉(zhuǎn)換】兩個主菜單下。(1)數(shù)據(jù)排序(Sort Case)對數(shù)據(jù)按照某一個或多個變量的大小排序?qū)⒂欣趯?shù)據(jù)的總體瀏覽,基本操作說明如下:選擇菜單【數(shù)據(jù)】【排列個案】,打開對話框,如圖2.7所示。(2)抽樣(Select Case)在統(tǒng)計分析中,有時不需要對所有的觀測進行分析,而可能只對某些特定的對象有興趣。利用SPSS的Select Case命令可以實現(xiàn)這
12、種樣本篩選的功能。以SPSS安裝配套數(shù)據(jù)文件Growth study.sav為例,選擇年齡大于10的觀測,基本操作說明圖2.7 排列個案 對話框如下:打開數(shù)據(jù)文件Growth study.sav,選擇【數(shù)據(jù)】【選擇個案】命令,打開對話框,如圖2.8圖2.8 選擇個案對話框指定抽樣的方式:【全部個案】不進行篩選;【如果條件滿足】按指定條件進行篩選。本例設(shè)置:產(chǎn)品數(shù)量150,如圖2.9所示; 圖2.9 選擇個案 對話框設(shè)置完成以后,點擊continue,進入下一步。確定未被選擇的觀測的處理方法,這里選擇默認選項【過濾掉未選定的個案】。單擊ok進行篩選,結(jié)果如圖2.10圖2.10 選擇個案的結(jié)果(3
13、)增加個案的數(shù)據(jù)合并(【合并文件】【添加個案】)將新數(shù)據(jù)文件中的觀測合并到原數(shù)據(jù)文件中,在SPSS中實現(xiàn)數(shù)據(jù)文件縱向合并的方法如下:選擇菜單【數(shù)據(jù)】【合并文件】【添加個案】,如圖2.11,選擇需要追加的數(shù)據(jù)文件,單擊打開按鈕,彈出Add Cases對話框,如圖2.12。圖2.11 選擇個體數(shù)據(jù)來源的文件圖2.12 選擇變量(4)增加變量的數(shù)據(jù)合并(【合并文件】【添加變量】)增加變量時指把兩個或多個數(shù)據(jù)文件實現(xiàn)橫向?qū)?。例如將不同課程的成績文件進行合并,收集來的數(shù)據(jù)被放置在一個新的數(shù)據(jù)文件中。在SPSS中實現(xiàn)數(shù)據(jù)文件橫向合并的方法如下:選擇菜單【數(shù)據(jù)】【合并文件】【添加變量】,選擇合并的數(shù)據(jù)文件
14、,單擊“打開”,彈出添加變量,如圖2.12所示。圖2.12單擊Ok執(zhí)行合并命令。這樣,兩個數(shù)據(jù)文件將按觀測的順序一對一地橫向合并。(5)數(shù)據(jù)拆分(Split File)在進行統(tǒng)計分析時,經(jīng)常要對文件中的觀測進行分組,然后按組分別進行分析。例如要求按性別不同分組。在SPSS中具體操作如下:選擇菜單【數(shù)據(jù)】【分割文件】,打開對話框,如圖2.13所示。圖2.13 分割文件對話框選擇拆分數(shù)據(jù)后,輸出結(jié)果的排列方式,該對話框提供了3種方式:對全部觀測進行分析,不進行拆分;在輸出結(jié)果種將各組的分析結(jié)果放在一起進行比較;按組排列輸出結(jié)果,即單獨顯示每一分組的分析結(jié)果。選擇分組變量選擇數(shù)據(jù)的排序方式單擊ok按
15、鈕,執(zhí)行操作(6)計算新變量在對數(shù)據(jù)文件中的數(shù)據(jù)進行統(tǒng)計分析的過程中,為了更有效地處理數(shù)據(jù)和反映事務(wù)的本質(zhì),有時需要對數(shù)據(jù)文件中的變量加工產(chǎn)生新的變量。比如經(jīng)常需要把幾個變量加總或取加權(quán)平均數(shù),SPSS中通過【計算】菜單命令來產(chǎn)生這樣的新變量,其步驟如下:選擇菜單【轉(zhuǎn)換】【計算變量】,打開對話框,如圖2.14所示。圖2.14 Compute Variable對話框在目標變量輸入框中輸入生成的新變量的變量名。單擊輸入框下面類型與標簽按鈕,在跳出的對話框中可以對新變量的類型和標簽進行設(shè)置。在數(shù)字表達式輸入框中輸入新變量的計算表達式。例如“年齡20”。單擊【如果】按鈕,彈出子對話框,如圖2.15所示
16、。包含所有個體:對所有的觀測進行計算;如果個案滿足條件則包括:僅對滿足條件的觀測進行計算。單擊Ok按鈕,執(zhí)行命令,則可以在數(shù)據(jù)文件中看到一個新生成的變量。圖2.15如果子對話框 四、備擇試驗?zāi)澈娇展?8名職員性別和工資情況的調(diào)查數(shù)據(jù),如表2.3所示,試在SPSS中進行如下操作:(1)將數(shù)據(jù)輸入到SPSS的數(shù)據(jù)編輯窗口中,將gender定義為字符型變量,將salary定義為數(shù)值型變量,并保存數(shù)據(jù)文件,命名為“試驗1-1.sav”。(2)插入一個變量income,定義為數(shù)值型變量。(3)將數(shù)據(jù)文件按性別分組(4)查找工資大于40000美元的職工(5)當工資大于40000美元時,職工的獎金是工資的
17、20;當工資小于40000美元時,職工的獎金是工資的10%,假設(shè)實際收入工資獎金,計算所有職工的實際收入,并添加到income變量中。表2.3 某航空公司38名職員情況的調(diào)查數(shù)據(jù)表IdGenderSalaryIdGenderSalary1M$ 5700020F$ 262502M$ 4020021F$ 388503F$ 2145022M$ 217504F$ 2190023F$ 240005M$ 4500024F$ 169506M$ 3210025F$ 211507M$ 3600026M$ 310508F$ 2190027M$ 603759F$ 2790028M$ 3255010F$ 240002
18、9M$ 11F$ 3030030M$ 3120012M$ 2835031M$ 3615013M$ 2775032M$ 14F$ 3510033M$ 4200015M$ 2730034M$ 9200016M$ 4080035M$ 8125017M$ 4600036F$ 3135018M$37M$ 2910019M$ 4230038M$ 31350試驗2 描述統(tǒng)計一、試驗?zāi)康呐c要求統(tǒng)計分析的目的在于研究總體特征。但是,由于各種各樣的原因,我們能夠得到的往往只能是從總體中隨機抽取的一部分觀察對象,他們構(gòu)成了樣本,只有通過對樣本的研究,我們才能對總體的實際情況作出可能的推斷。因此描述性統(tǒng)計分析是統(tǒng)計分
19、析的第一步,做好這一步是進行正確統(tǒng)計推斷的先決條件。通過描述性統(tǒng)計分析可以大致了解數(shù)據(jù)的分布類型和特點、數(shù)據(jù)分布的集中趨勢和離散程度,或?qū)?shù)據(jù)進行初步的探索性分析(包括檢查數(shù)據(jù)是否有錯誤,對數(shù)據(jù)分布特征和規(guī)律進行初步觀察)。本本試驗旨在于:引到學(xué)生利用正確的統(tǒng)計方法對數(shù)據(jù)進行適當?shù)恼砗惋@示,描述并探索出數(shù)據(jù)內(nèi)在的數(shù)量規(guī)律性,掌握統(tǒng)計思想,培養(yǎng)學(xué)生學(xué)習(xí)統(tǒng)計學(xué)的興趣,為繼續(xù)學(xué)習(xí)推斷統(tǒng)計方法及應(yīng)用各種統(tǒng)計方法解決實際問題打下必要而堅實的基礎(chǔ)。二、試驗原理描述統(tǒng)計是統(tǒng)計分析的基礎(chǔ),它包括數(shù)據(jù)的收集、整理、顯示,對數(shù)據(jù)中有用信息的提取和分析,通常用一些描述統(tǒng)計量來進行分析。集中趨勢的特征值:算術(shù)平均數(shù)
20、、調(diào)和平均數(shù)、幾何平均數(shù)、眾數(shù)、中位數(shù)等。其中均數(shù)適用于正態(tài)分布和對稱分布資料,中位數(shù)適用于所有分布類型的資料。離散趨勢的特征值:全距、內(nèi)距、平均差、方差、標準差、標準誤、離散系數(shù)等。其中標準差、方差適用于正態(tài)分布資料,標準誤實際上反映了樣本均數(shù)的波動程度。分布特征值:偏態(tài)系數(shù)、峰度系數(shù)、他們反映了數(shù)據(jù)偏離正態(tài)分布的程度。三、試驗內(nèi)容與步驟下面給出的一個例題是來自SPSS軟件自帶的數(shù)據(jù)文件“Employee.data”,該文件包含某公司員工的工資、工齡、職業(yè)等變量,我們將利用此例題給出相關(guān)的描述統(tǒng)計說明,本例中,我們將以員工的當前工資為例,計算該公司員工當前工資的一些描述統(tǒng)計量,如均值、頻數(shù)、
21、方差等描述統(tǒng)計量的計算。1頻數(shù)分析(Frequencies)頻數(shù)分析多適用于離散變量,其功能是描述離散變量的分布特征?;窘y(tǒng)計分析往往從頻數(shù)分析開始。通過頻數(shù)分析能夠了解變量取值的狀況,對把握數(shù)據(jù)的分布特征是非常有用的。比如,在某項調(diào)查中,想要知道被調(diào)查者的性別分布狀況。頻數(shù)分析的第一個基本任務(wù)是編制頻數(shù)分布表。SPSS中的頻數(shù)分布表包括的內(nèi)容有:(1)頻數(shù)(Frequency)即變量值落在某個區(qū)間中的次數(shù)。(2)百分比(Percent)即各頻數(shù)占總樣本數(shù)的百分比。(3)有效百分比(Valid Percent)即各頻數(shù)占有效樣本數(shù)的百分比。這里有效樣本數(shù)總樣本缺失樣本數(shù)。(4)累計百分比(Cu
22、mulative Percent)即各百分比逐級累加起來的結(jié)果。最終取值為百分之百。頻數(shù)分析的第二個基本任務(wù)是繪制統(tǒng)計圖。統(tǒng)計圖是一種最為直接的數(shù)據(jù)刻畫方式,能夠非常清晰直觀地展示變量的取值狀況。頻數(shù)分析中常用的統(tǒng)計圖包括:條形圖,餅圖,直方圖等。頻數(shù)分析的應(yīng)用步驟在SPSS中的頻數(shù)分析的實現(xiàn)步驟如下:選擇菜單“【文件】【打開】【數(shù)據(jù)】”在對話框中找到需要分析的數(shù)據(jù)文件“SPSS/Employee data”,然后選擇“打開”。選擇菜單“【分析】【描述統(tǒng)計】【頻率】”。如圖2.1所示 詢問是否輸出頻數(shù)分布表圖2.1 Frequencies對話框確定所要分析的變量,例如 年齡在變量選擇確定之后,
23、在同一窗口上,點擊“Statistics”按鈕,打開統(tǒng)計量對話框,如下圖2.2所示,選擇統(tǒng)計輸出選項。圖2.2 統(tǒng)計量子對話框圖2.3 Charts子對話框結(jié)果輸出與分析點擊Frequencies 對話框中的“OK”按鈕,即得到下面的結(jié)果。表2.4 描述性統(tǒng)計量StatisticsGender NValid474 Missing0表2.4中給出了總樣本量(N),其中變量Gender的有效個數(shù)(Valid)為474個、缺失值(missing)為0。表2.5 Gender頻數(shù)分布表 FrequencyPercentValid PercentCumulative PercentValidFemale
24、21645.645.645.6 Male25854.454.4100.0 Total474100.0100.0 表2.5中,F(xiàn)requency是頻數(shù),Percent是按總樣本量為分母計算的百分比,Valid Percent是以有效樣本量為分母計算的百分比,Cumulative Percent是累計百分比。圖2.5變量Gender的條形圖,圖2.6變量Gender的餅圖。圖2.5 變量gender的條形圖圖2.6 變量gender的餅圖2描述統(tǒng)計(Descriptives) 描述統(tǒng)計主要對定距型或定比型數(shù)據(jù)的分布特征作具體分析。SPSS的【描述】命令專門用于計算各種描述統(tǒng)計性統(tǒng)計量。本節(jié)利用某年
25、國內(nèi)上市公司的財務(wù)數(shù)據(jù)來介紹描述統(tǒng)計量在SPSS中的計算方法。具體操作步驟如下:選擇菜單【分析】【描述統(tǒng)計】【描述】,如圖2.7所示圖2.7 描述 對話框?qū)⒋治龅淖兞恳迫隫ariables列表框,例如將每股收益率、凈資產(chǎn)收益率、資產(chǎn)負債率等2個變量進行描述性統(tǒng)計,以觀察上市公司股權(quán)集中度情況和負債比率的高低。Save standardized values as variables,對所選擇的每個變量進行標準化處理,產(chǎn)生相應(yīng)的Z分值,作為新變量保存在數(shù)據(jù)窗口中。其變量名為相應(yīng)變量名前加前綴z。標準化計算公式:單擊【選項】按鈕,如圖2.8 所示,選擇需要計算的描述統(tǒng)計量。各描述統(tǒng)計量同F(xiàn)req
26、uencies命令中的Statistics子對話框中大部分相同,這里不再重復(fù)。圖2.8 選項 子對話框在主對話框中單擊ok執(zhí)行操作。結(jié)果輸出與分析在結(jié)果輸出窗口中給出了所選變量的相應(yīng)描述統(tǒng)計,如表2.6所示。從表中可以看到,我國上市公司前兩大股東持股比例之比平均高達102.9,說明“一股獨大”的現(xiàn)象比較嚴重;前五大股東持股比例之和平均為51.8%,資產(chǎn)負債率平均為46.78%。另外,從偏態(tài)和峰度指標看出,前兩大股東持股比例之比的分布呈現(xiàn)比較明顯的右偏,而且比較尖峭。為了驗證這一結(jié)論,可以利用Frequencies命令畫出變量z的直方圖,如圖2.9表2.6 描述統(tǒng)計量表Descriptive S
27、tatistics NMeanStd.SkewnessKurtosisStatisticStatisticStatisticStatisticStd. ErrorStatisticStd. Error前兩大股東持股比例之比315102.865199.4.168.13722.404.274前五大股東持股比例的平方和315.51836.602.137-.318.274資產(chǎn)負債率315.4677.16773-.165.137-.414.274Valid N (listwise)315 圖2.9 變量Z的直方圖3探索分析(Explore) 調(diào)用此過程可對變量進行更為深入詳盡的描述性統(tǒng)計分析,故稱之為探
28、索分析。它在一般描述性統(tǒng)計指標的基礎(chǔ)上,增加有關(guān)數(shù)據(jù)其他特征的文字與圖形描述,顯得更加細致與全面,對數(shù)據(jù)分析更進一步。 探索分析一般通過數(shù)據(jù)文件在分組與不分組的情況下獲得常用統(tǒng)計量和圖形。一般以圖形方式輸出,直觀幫助研究者確定奇異值、影響點、還可以進行假設(shè)檢驗,以及確定研究者要使用的某種統(tǒng)計方式是否合適。 在打開的數(shù)據(jù)文件上,選擇如下命令:選擇菜單“【分析】【描述統(tǒng)計】【探索】”,打開對話框。因變量列表;待分析的變量名稱,例如將每股收益率作為研究變量。因子列表:從源變量框中選擇一個或多個變量進入因子列表,分組變量可以將數(shù)據(jù)按照該觀察值進行分組分析。標準個案:在源變量表中指定一個變量作為觀察值的
29、標識變量。在輸出欄中,選擇兩者都,表示輸出圖形及描述統(tǒng)計量。選擇【統(tǒng)計量】按鈕,選擇想要計算的描述統(tǒng)計量。如圖所示對所要計算的變量的頻數(shù)分布及其統(tǒng)計量值作圖 打開“Plots對話框”,出現(xiàn)如下圖。結(jié)果的輸出與說明 (1)Case Processing Summary 表 在Case Processing Summary 表中可以看出female 有216個個體,Male258個個體,均無缺失值。 (2)Descriptives 表 Descriptives Gender StatisticStd. ErrorCurrent SalaryFemaleMean$26,031.92$514.258
30、95% Confidence Interval for MeanLower Bound$25,018.29 Upper Bound$27,045.55 5% Trimmed Mean$25,248.30 Median$24,300.00 Variance.268 Std. Deviation$7,558.021 Minimum$15,750 Maximum$58,125 Range$42,375 Interquartile Range$7,013 Skewness1.863.166 Kurtosis4.641.330 MaleMean$41,441.78$1,213.968 95% Confi
31、dence Interval for MeanLower Bound$39,051.19 Upper Bound$43,832.37 5% Trimmed Mean$39,445.87 Median$32,850.00 Variance.303 Std. Deviation$19,499.214 Minimum$19,650 Maximum$135,000 Range$115,350 Interquartile Range$22,675 Skewness1.639.152 Kurtosis2.780.302(3)職位員工薪水直方圖顯示 (4)莖葉圖描述 莖葉圖自左向右可以分為3 大部分:頻數(shù)(
32、Frequency)、莖(Stem)和葉(Leaf)。莖表示數(shù)值的整數(shù)部分,葉表示數(shù)值的小數(shù)部分。每行的莖和每個葉組成的數(shù)字相加再乘以莖寬(Stem Width),即莖葉所表示的實際數(shù)值的近似值。Current Salary Stem-and-Leaf Plot forgender= Female Frequency Stem & Leaf 2.00 1 . 55 16.00 1 . 77777 14.00 1 . 999 31.00 2 . 35.00 2 . 33 38.00 2 . 55555 22.00 2 . 17.00 2 . 7.00 3 . 8.00 3 . 8.00 3 .
33、5.00 3 . 66777 2.00 3 . 88 11.00 Extremes (=40800) Stem width: 10000 Each leaf: 1 case(s)(5)箱圖 圖中灰色區(qū)域的方箱為箱圖的主體,上中下3 條線分別表示變量值的第75、50、25百分位數(shù),因此變量的50%觀察值落在這一區(qū)域中。 方箱中的中心粗線為中位數(shù)。箱圖中的觸須線是中間的縱向直線,上端截至線為變量的最大值,下端截至線為變量的最小值。 四、備擇試驗完成下列試驗內(nèi)容,并按試驗(1)所附試驗報告的格式撰寫報告。1.表2.7為某班級16位學(xué)生的身高數(shù)據(jù),對其進行頻數(shù)分析,并對實驗報告作出說明。表2.7 某班
34、16位學(xué)生的身高數(shù)據(jù)學(xué)號性別身高(cm)學(xué)號性別身高(cm)1M1709M1502F17310M1573F16911F1774M15512M1605F17413F1696F17814M1547M15615F1728F17116F1802.測量18臺電腦筆記重量,見表2.8,對其進行描述統(tǒng)計量分析,并對試驗結(jié)果作出說明。表2.8 18臺筆記本電腦重量表序號123456789重量1.751.921.591.851.831.681.891.701.79序號101112131415161718重量1.661.801.832.051.911.761.881.831.79試驗3:統(tǒng)計推斷一、試驗?zāi)康呐c要求
35、1.熟悉點估計概念與操作方法2.熟悉區(qū)間估計的概念與操作方法3.熟練掌握T檢驗的SPSS操作4.學(xué)會利用T檢驗方法解決身邊的實際問題 二、試驗原理1.參數(shù)估計的基本原理2.假設(shè)檢驗的基本原理三、試驗演示內(nèi)容與步驟 1.單個總體均值的區(qū)間估計 例題:為研究在黃金時段中,即每晚8:30-9:00 內(nèi),電視廣告所占時間的多少。美國廣告協(xié)會抽樣調(diào)查了20個最佳電視時段中廣告所占的時間(單位:分鐘)。請給出每晚8:30 開始的半小時內(nèi)廣告所占時間區(qū)間估計,給定的置信度為95。 操作程序: 打開SPSS,建立數(shù)據(jù)文件:“ 電視節(jié)目市場調(diào)查.sav”。這里,研究變量為:time,即每天看電視的時間。 選擇區(qū)
36、間估計選項,方法如下: 選擇菜單【分析】【描述統(tǒng)計】【探索】” ,打開圖3.1Explore 對話框。從源變量清單中將“time”變量移入Dependent List框中。圖3.1 Explore對話框單擊上圖右方的“統(tǒng)計量”按鈕打開“探索:統(tǒng)計量”對話框。在設(shè)置均值的置信水平,如鍵入95,完成后單擊“繼續(xù)”按鈕回到主窗口。圖3.2 探索 統(tǒng)計量設(shè)置窗口返回主窗口點擊ok運行操作。計算結(jié)果簡單說明:表3.1 描述統(tǒng)計量Descriptives StatisticStd. ErrortimeMean6.5350.13480 95% Confidence Interval for MeanLowe
37、r Bound6.2529 Upper Bound6.8171 5% Trimmed Mean6.5167 Median6.4500 Variance.363 Std. Deviation.60287 Minimum5.60 Maximum7.80 Range2.20 Interquartile Range.95 Skewness.295.512 Kurtosis-.612.992 如上表顯示。從上表“ 95 Confidence Interval for Mean ”中可以得出,每晚8:30 開始的半小時內(nèi)廣告所占時間區(qū)間估計(置信度為95) 為:(6.2529,6.8171),其中l(wèi)owe
38、r Bound 表示置信區(qū)間的下限,Upper Bound表示置信區(qū)間的上限。點估計是:6.5350。 2兩個總體均值之差的區(qū)間估計例題:The Wall Street Journal(1994,7 )聲稱在制造業(yè)中,參加工會的婦女比未參加工會的婦女的報酬要多2.5 美元。想通過統(tǒng)計方法,對這個觀點是否正確給出檢驗。 假設(shè)抽取了7位女性工會會員與8位非工會會員女性報酬數(shù)據(jù)。要求對制造業(yè)中參加工會會員的女性報酬與未參加工會的女性報酬平均工資之差進行區(qū)間估計,預(yù)設(shè)的置信度為95。 打開SPSS,按如下圖示格式輸入原始數(shù)據(jù),建立數(shù)據(jù)文件:“工會會員工資差別.spss”。這里,“會員”表示是否為工會會
39、員的變量,y 表示是工會會員,n表示非工會會員,“報酬”表示女性員工報酬變量,單位:千美元。 計算兩總體均值之差的區(qū)間估計,采用“獨立樣本T 檢驗”方法。選擇菜單“ 【分析】【比較均值】獨立樣本T檢驗”, 打開對話框。 變量選擇 (1)從源變量清單中將“報酬”變量移入檢驗變量框中。表示要求該變量的均值的區(qū)間估計。 (2)從源變量清單中將“group”變量移入分組變量框中。表示總體的分類變量。 圖3.3 獨立樣本T檢驗 對話框定義分組 單擊定義組按鈕,打開Define Groups 對話框。在Group1 中輸入1,在Group2 中輸入2(1表示非工會會員,2 表示工會會員)。完成后單擊“繼續(xù)
40、”按鈕回到主窗口。圖3.4 define groups設(shè)置窗口計算結(jié)果 單擊上圖中“OK”按鈕,輸出結(jié)果如下圖所示。 (1)Group Statistics(分組統(tǒng)計量)表 分別給出不同總體下的樣本容量、均值、標準差和平均標準誤。從該表中可以看出,參加工會的婦女平均報酬為19.925,不參加工會的婦女平均報酬為20.1429。 表3.2 分組統(tǒng)計量Group Statistics 會員NMeanStd. DeviationStd. Error Mean報酬1.00819.9250.46522.16448 2.00720.1429.52236.19743(2)Independent Sample
41、 Test (獨立樣本T 檢驗)表 Levenes Test for Equality of Variance,為方差檢驗,在Equal variances assumed (原假設(shè):方差相等)下,F(xiàn)=0.623, 因為其P-值大于顯著性水平,即:Sig.=0.4440.05, 說明不能拒絕方差相等的原假設(shè),接受兩個總體方差是相等的假設(shè)。因此參加工會會員的女性報酬與未參加工會的女性報酬平均工資之差95的區(qū)間估計為0.76842,0.33271。T-test for Equality of Means 為檢驗總體均值是否相等的t 檢驗,由于在本例中,其P-值大于顯著性水平,即:Sig.=0.40
42、80.05, 因此不應(yīng)該拒絕原假設(shè),也就是說參加工會的婦女跟未參加工會的婦女的報酬沒有顯著差異。本次抽樣推斷結(jié)論不支持The Wall Street Journal(1994,7 )提出的“參加工會的婦女比未參加工會的婦女的報酬要多2.5 美元”觀點,即參加工會的婦女不比未參加工會的婦女的報酬多。表3.3 獨立樣本T檢驗結(jié)果Independent Samples Test Levenes Test for Equality of Variancest-test for Equality of Means FSig.tdfSig. (2-tailed)Mean DifferenceStd. Er
43、ror Difference95% Confidence Interval of the Difference LowerUpper報酬Equal variances assumed.623.444-.85513.408-.21786.25485-.76842.33271 Equal variances not assumed -.84812.187.413-.21786.25697-.77679.341083單個總體均值的假設(shè)檢驗 (單樣本T檢驗)例子:某種品牌的沐浴肥皂制造程序的設(shè)計規(guī)格中要求每批平均生產(chǎn)120 塊肥皂,高于或低于該數(shù)量均被認為是不合理的,在由10 批產(chǎn)品所組成的一個樣本中
44、,每批肥皂的產(chǎn)量數(shù)據(jù)見下表,在0.05 的顯著水平下,檢驗該樣本結(jié)果能否說明制造過程運行良好? 判斷檢驗類型 該例屬于“大樣本、總體標準差未知。假設(shè)形式為:H0:0, H1 :0軟件實現(xiàn)程序 打開已知數(shù)據(jù)文件,然后選擇菜單“【分析】【比較均值】單樣本T檢驗”,打開One-Sample T Test 對話框。從源變量清單中將“產(chǎn)品數(shù)量”向右移入“Test Variables”框中。圖3.5 one-sample T test窗口在“Test Value” 框里輸入一個指定值(即假設(shè)檢驗值,本例中假設(shè)為120),T 檢驗過程將對每個檢驗變量分別檢驗它們的平均值與這個指定數(shù)值相等的假設(shè)。 “One-
45、Sample T Test”窗口中“OK”按鈕,輸出結(jié)果如下表所示。 (1)“One-Sample Statistics”(單個樣本的統(tǒng)計量)表 分別給出樣本的容量、均值、標準差和平均標準誤。去去去試驗4:方差分析一、試驗?zāi)繕伺c要求1幫助學(xué)生深入了解方差及方差分析的基本概念,掌握方差分析的基本思想和原理2掌握方差分析的過程。3增強學(xué)生的實踐能力,使學(xué)生能夠利用SPSS統(tǒng)計軟件,熟練進行單因素方差分析、兩因素方差分析等操作,激發(fā)學(xué)生的學(xué)習(xí)興趣,增強自我學(xué)習(xí)和研究的能力。二、試驗原理在現(xiàn)實的生產(chǎn)和經(jīng)營管理過程中,影響產(chǎn)品質(zhì)量、數(shù)量或銷量的因素往往很多。例如,農(nóng)作物的產(chǎn)量受作物的品種、施肥的多少及種
46、類等的影響;某種商品的銷量受商品價格、質(zhì)量、廣告等的影響。為此引入方差分析的方法。方差分析也是一種假設(shè)檢驗,它是對全部樣本觀測值的變動進行分解,將某種控制因素下各組樣本觀測值之間可能存在的由該因素導(dǎo)致的系統(tǒng)性誤差與隨即誤差加以比較,據(jù)以推斷各組樣本之間是否存在顯著差異。若存在顯著差異,則說明該因素對各總體的影響是顯著的。方差分析有3個基本的概念:觀測變量、因素和水平。觀測變量是進行方差分析所研究的對象;因素是影響觀測變量變化的客觀或人為條件;因素的不同類別或不通取值則稱為因素的不同水平。在上面的例子中,農(nóng)作物的產(chǎn)量和商品的銷量就是觀測變量,作物的品種、施肥種類、商品價格、廣告等就是因素。在方差
47、分析中,因素常常是某一個或多個離散型的分類變量。根據(jù)觀測變量的個數(shù),可將方差分析分為單變量方差分析和多變量方差分析;根據(jù)因素個數(shù),可分為單因素方差分析和多因素方差分析。在SPSS中,有Oneway ANOVA(單變量單因素方差分析)、GLM Univariate(單變量多因素方差分析);GLM Multivariate (多變量多因素方差分析),不同的方差分析方法適用于不同的實際情況。本節(jié)僅練習(xí)最為常用的單因素單變量方差分析。三、試驗演示內(nèi)容與步驟 單因素方差分析也稱一維方差分析,對兩組以上的均值加以比較。檢驗由單一因素影響的一個分析變量由因素各水平分組的均值之間的差異是否有統(tǒng)計意義。并可以進
48、行兩兩組間均值的比較,稱作組間均值的多重比較。主要采用One-way ANOVA過程。采用One-way ANOVA過程要求:因變量屬于正態(tài)分布總體,若因變量的分布明顯是非正態(tài),應(yīng)該用非參數(shù)分析過程。若對被觀測對象的試驗不是隨機分組的,而是進行的重復(fù)測量形成幾個彼此不獨立的變量,應(yīng)該用Repeated Measure菜單項,進行重復(fù)測量方差分析,條件滿足時,還可以進行趨勢分析。假設(shè)某汽車經(jīng)銷商為了研究東部、西部和中部地區(qū)市場上汽車的銷量是否存在顯著差異,在每個地區(qū)隨機抽取幾個城市進行調(diào)查統(tǒng)計,調(diào)查數(shù)據(jù)放置于數(shù)據(jù)文件“汽車銷量調(diào)查.sav”中。在SPSS中試驗該檢驗的步驟如下:步驟1:選擇菜單【
49、分析】【比較均值】【單因素方差分析】,依次將觀測變量銷量移入因變量列表框,將因素變量地區(qū)移入因子列表框。 圖4.1 One-Way ANOVA對話框單擊兩兩比較按鈕,如圖4.2,該對話框用于進行多重比較檢驗,即各因素水平下觀測變量均值的兩兩比較。方差分析的原假設(shè)是各個因素水平下的觀測變量均值都相等,備擇假設(shè)是各均值不完全相等。假如一次方差分析的結(jié)果是拒絕原假設(shè),我們只能判斷各觀測變量均值不完全相等,卻不能得出各均值完全不相等的結(jié)論。各因素水平下觀測變量均值的更為細致的比較就需要用多重比較檢驗。圖4.2 兩兩比較對話框假定方差齊性選項欄中給出了在觀測變量滿足不同因素水平下的方差齊性條件下的多種檢
50、驗方法。這里選擇最常用的LSD檢驗法;未假定方差齊性選項欄中給出了在觀測變量不滿足方差齊性條件下的多種檢驗方法。這里選擇Tamhanes T2檢驗法;Significance level輸入框中用于輸入多重比較檢驗的顯示性水平,默認為5。單擊選項按鈕,彈出options子對話框,如圖所示。在對話框中選中描述性復(fù)選框,輸出不同因素水平下觀測變量的描述統(tǒng)計量;選擇方差同質(zhì)性檢驗復(fù)選框,輸出方差齊性檢驗結(jié)果;選中均值圖復(fù)選框,輸出不同因素水平下觀測變量的均值直線圖。在主對話框中點擊ok按鈕,可以得到單因素分析的結(jié)果。試驗結(jié)果分析:表4.1給出了不同地區(qū)汽車銷量的基本描述統(tǒng)計量以及95%的置信區(qū)間。圖
51、4.3 選項子對話框表4.1 各個地區(qū)汽車銷量描述統(tǒng)計量Descriptives銷量 NMeanStd. DeviationStd. Error95% Confidence Interval for MeanMinimumMaximum Lower BoundUpper Bound 西10157.9022.2787.045141.96173.84120194中9176.4419.7176.572161.29191.60135198東7196.1430.92711.689167.54224.75145224Total26174.6227.8455.461163.37185.86120224表4.
52、2給出了Levene方差齊性檢驗結(jié)果。從表中可以看到,Levene統(tǒng)計量對應(yīng)的p值大于0.05,所以得到不同地區(qū)汽車銷量滿足方差齊性的結(jié)論。Levene統(tǒng)計量對應(yīng)的p值大于0.05,所以得到不同地區(qū)汽車銷量滿足方差齊性的結(jié)論。表4.2 各地區(qū)汽車銷量方差齊性檢驗表Test of Homogeneity of Variances Levene Statisticdf1df2Sig.1.262223.302表4.3是單因素方差分析,輸出的方差分析表解釋如下:總離差SST19384.154,組間平方和SSR6068.174,組內(nèi)平方和或殘差平方和SSE13315.979,相應(yīng)的自由度分別為25,2,
53、23;組間均方差MSR3034.087,組內(nèi)均方差578.956,F(xiàn)5.241,由于p0.013【相關(guān)】【雙變量】,打開對話框,將變量“住房支出”與“年收入”移入variables列表框,點擊ok運行,結(jié)果如表5.2所示。表5.2 住房支出與年收入相關(guān)系數(shù)表Correlations 住房支出(千美元)年收入(千美元)住房支出(千美元)Pearson Correlation1.966(*) Sig. (2-tailed).000 N2020年收入(千美元)Pearson Correlation.966(*)1 Sig. (2-tailed).000. N2020* Correlation is
54、significant at the 0.01 level (2-tailed).從表中可得到兩變量之間的皮爾遜相關(guān)系數(shù)為0.966,雙尾檢驗概率p值尾0.000【回歸】【線性】”,打開Linear Regression 對話框。將變量住房支出y移入Dependent列表框中,將年收入x移入Independents列表框中。在Method 框中選擇Enter 選項,表示所選自變量全部進入回歸模型。圖5.5 Linear Regresssion對話框步驟2:單擊Statistics按鈕,如圖在Statistics子對話框。該對話框中設(shè)置要輸出的統(tǒng)計量。這里選中估計、模型擬合度復(fù)選框。圖5.6 Statistics子對話框估計:輸出有關(guān)回歸系數(shù)的統(tǒng)計量,包括回歸系數(shù)、回歸系數(shù)的標準差、標準化的回歸系數(shù)、t統(tǒng)計量及其對應(yīng)的p值等。置信區(qū)間:輸出每個回歸系數(shù)的95的置信度估計區(qū)間。協(xié)方差矩陣:輸出解釋變量的相關(guān)系數(shù)矩陣和協(xié)差陣。模型擬合度:輸出可決系數(shù)、調(diào)整的可決系數(shù)、回歸方程的標準誤差、回歸方程F檢驗的方差分析。步驟3:單擊繪制按鈕,在Plots子對話框中的標準化殘差圖選項欄中選中正態(tài)概率圖復(fù)選框,以便對
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 果品綜合檢測成本控制分析
- 國旗下講話稿刻苦學(xué)習(xí)3篇
- 軍訓(xùn)期間的感受200字(17篇)
- 無編站骨干選拔理論考試(戰(zhàn)訓(xùn)業(yè)務(wù)理論)練習(xí)測試卷
- 高考數(shù)學(xué)復(fù)習(xí)解答題提高第一輪專題復(fù)習(xí)專題04數(shù)列求通項(隔項等差(等比)數(shù)列)(典型題型歸類訓(xùn)練)(學(xué)生版+解析)
- 教育教學(xué)設(shè)施和生活安全管理制度(4篇)
- 廣東各地英語語法填空匯編
- 高中語法講解與練習(xí)之直接引語與間接引語
- 第4章 人群健康研究課件
- 會計數(shù)據(jù)分析 Solutions-Manual Chapter-5-EOC-SM
- 專科護理門診管理制度
- 基層婦幼人才培訓(xùn)方案
- 香蕉纖維完整
- 《國家機構(gòu)》課件
- 2023年山東師范大學(xué)招聘工作人員78人筆試參考題庫(共500題)答案詳解版
- 正高級會計師答辯面試資料
- 英語詞匯的奧秘智慧樹知到課后章節(jié)答案2023年下武昌工學(xué)院
- 檢驗科規(guī)章制度
- 幼兒園優(yōu)質(zhì)公開課:大班科學(xué)繪本《樹葉尺子-任意單位測量長度》PPT
- 南寧市武鳴區(qū)寧武、雙橋、甘圩鎮(zhèn)集中連片供水工程環(huán)評報告
- 高中物理必修一各章節(jié)課后練習(xí)題(附答案解析)
評論
0/150
提交評論