




已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1,第四章,描述性統計分析,2,主要內容,4.1 基本描述性統計量的定義及計算 4.2 頻數分析 4.3 描述性分析 4.4 探索性分析 4.5 交叉列聯表分析 4.6 多選項分析,3,4.1 基本描述性統計量的定義及計算,1描述集中趨勢的統計量 均值(Mean) 眾數(Mode) 中位數(Median) 總和(Sum) 百分位數(Percentile Value),4,4.1 基本描述性統計量的定義及計算,2描述離散趨勢的統計量 樣本方差(Variance) 樣本標準差(Std. deviation) 極差(Range) 均值標準誤差(Standard Error of Mean),5,4.1 基本描述性統計量的定義及計算,3描述總體分布形態(tài)的統計量 偏度(Skewness) 峰度(Kurtosis),6,主要內容,4.1 基本描述性統計量的定義及計算 4.2 頻數分析 4.3 描述性分析 4.4 探索性分析 4.5 交叉列聯表分析 4.6 多選項分析,4.2 頻數分析,1頻數分析目的和主要功能 頻數就是一個變量在各個變量值上取值的個案數,基本統計分析往往從頻數分析開始。通過頻數分析能夠了解變量取值的狀況,對把握數據的分布特征是非常有用的。 例如,調查消費者擁有數碼產品的數量,首先分析受訪者的總人數、家庭收入情況、受教育程度、性別等,獲取樣本是否具有總體代表性、抽樣是否存在系統偏差等信息。這些可以通過頻數分析來實現,經過頻數分析可以得到如下結果: (1)頻數分布表:該表中包含頻數、各頻數占總樣本數的百分比、有效百分比、累計百分比。 (2)統計圖:用統計圖形展示變量的取值狀況,頻數分析中提供的統計圖形可以是條形圖、餅圖或者直方圖。,8,4.2 頻數分析,2頻數分析過程的操作界面 (1)候選變量框 列出數據文件中所有的變量 (2)Variables框 從候選變量框中選擇要分析的變量 移入此框中,可同時選擇多個變量, 此時,SPSS就將分別產生多張 頻數表或統計圖形。 (3)Display frequency tables復選框 此復選框設置是否顯示頻數表, 系統默認選中,表示要顯示頻數表。,圖4-1,9,4.2 頻數分析,2頻數分析過程的操作界面 (4)Statistics按鈕 單擊該按鈕會彈出新的對話框, 該對話框主要用于確定將要在 輸出結果中出現的統計量, 選中統計量前的復選框表示 輸出該統計量。 (5)Charts按鈕 用于確定將輸出的圖形類型 和圖形取值。 (6)Format按鈕 定義輸出頻數表的格式,圖4-1,10,4.2 頻數分析,3實例分析 【例4-1】以下是調查問卷中針對被調查人設置的兩個問題: 1、您的家庭月收入大約是:(請包括所有工資、獎金、津貼等在內,以人民幣為單位)單選 500-10001 1000-19992 2000-29993 3000-39994 4000-49995 5000-59996 6000-69997 7000-79998 8000-89999 9000-999910 10000及以上11 2、 您的教育程度:(指您受過的最高或正在接受的教育程度)單選 沒有受過正式教育/小學.1 初中2 高中/中專/技校3 大專/大學非本科/高職高專4 大學本科5 研究生及以上6 從問卷中收集到的數據如表4.1所示,圖4-1,11,4.2 頻數分析,3實例分析 試對收集到的數據進行頻數分析,表4.1,12,4.2 頻數分析,3實例分析 第1步 數據組織; 根據表4.1生成SPSS數據文件,建2個變量:“收入”、“教育”, 數據文件的格式同表4.1類似。 第2步 打開主對話框; 選擇Analyze Descriptive Statistics Frequencies,打開同圖4-1一樣的頻數分析主對話框。 第3步 確定要輸出的統計量; 單擊Statistics按鈕,在Statistics子對話框中選擇Mode(眾數)統計量。 第4步 確定要輸出的統計圖形; 單擊Charts按鈕,在Charts子對話框中選擇Histograms (直方圖) 運行結果及分析。,13,4.2 頻數分析,3實例分析 運行結果及分析。,圖4-2 變量“教育”的直方圖,表4.2 變量“教育”的頻數分布表,14,主要內容,4.1 基本描述性統計量的定義及計算 4.2 頻數分析 4.3 描述性分析 4.4 探索性分析 4.5 交叉列聯表分析 4.6 多選項分析,15,4.3 描述性分析,1描述性分析目的和主要功能 描述性分析主要用于輸出變量的各類描述性統計量的值,通過上一節(jié)的學習可知,頻數分析同樣可以做到,都是以計算數值型單變量的統計量為主。描述性統計分析沒有圖形功能,也不能生成頻數表,但描述性分析可以將原始數據轉換成標準正態(tài)評分值,并以變量形式存入數據文件中,以便后續(xù)分析時應用。,16,4.3 描述性分析,2描述性分析的操作界面,列出數據文件中的變量,從中選擇要作描述性分析的變量,將需作描述性分析的變量選入此框中,可同時選擇多個變量,此時,SPSS就將分別產生多個變量的描述性分析結果,點擊Option按鈕設置需計算的描述性統計量。,圖4-3,17,4.3 描述性分析,3實例分析 書P100【例4-2】 選擇“身高”變量作描述性分析,選定要計算的統計量后,運算得到表4.3所示的結果 表4.3,18,主要內容,4.1 基本描述性統計量的定義及計算 4.2 頻數分析 4.3 描述性分析 4.4 探索性分析 4.5 交叉列聯表分析 4.6 多選項分析,19,4.4 探索性分析,1探索性分析目的和主要功能 與前面介紹的兩種分析方法相比,探索性分析更加強大,它是對數據的探索和考察,可以對變量進行更為深入詳盡的統計分析。在進行統計分析前,通常需要尋求和確定適合所研究的問題的統計方法, SPSS提供的探索性分析是解決此類問題的有效辦法。 探索性分析提供了很多關于數據的概括分析和圖表直觀描述的方法,不僅對個案數據有效,而且還可以針對分組個案。在輸出常用描述性統計量的基礎之上,探索性分析增加了有關數據詳細分布特征的文字與圖形表述,如莖葉圖、箱圖等,顯得更加詳細、完整,還可以以方差齊性為目的的變量交換提供線索,有助于用戶制定更進一步分析的方案。,20,4.4 探索性分析,2探索性分析的操作界面,(1)Depend List框 選擇待分析的變量,可以同時選擇多個變量。注意:選擇的變量必須是數值型變量,(2)Factor List框 選擇分組變量,根據該變量的取值不同,分組分析Dependlist框中的變量??梢圆贿x,也可以多選。,(3)statistics按鈕:設置輸出的統計量; Plots按鈕:設置輸出的圖形; Option按鈕:設置缺失值的處理。,圖4-4,21,4.4 探索性分析,3實例分析 【例4-3】表4.4是2007年各地區(qū)人口出生率和死亡率的統計數據,試對其作探索性分析并做是否服從正態(tài)分布的檢驗。 表4.4各地區(qū)人口自然變動情況,22,4.4 探索性分析,3實例分析 第1步 數據組織; 根據表4.4生成SPSS數據文件,建2個變量:“出生率”、“死亡率”, 數據文件的格式 第2步 打開主對話框; 選擇Analyze Descriptive Statistics Explore,選擇變量“出生率”、“死亡率”移入“Dependent List”文本框中。,23,4.4 探索性分析,3實例分析 第3步 確定探索性分析的描述統計量; 單擊Statistics按鈕,在Statistics子對話框(圖4-5)中選擇Descriptives 復選框、M-estimators復選框,單擊Continue返回主對話框。,圖4-5,24,4.4 探索性分析,3實例分析 第4步 確定探索性分析輸出的統計圖形; 單擊Plots按鈕,在如圖4-6的Plots子對話框中選擇“Dependents together”(不同因變量顯示在一個箱圖中)、“Stem-and-leaf”(莖葉圖)、Normality Plots with tests(正態(tài)分布檢測統計圖)。單擊Continue返回主對話框。,圖4-6,25,4.4 探索性分析,3實例分析 結果分析,表4.5 描述性統計量,26,4.4 探索性分析,3實例分析 結果分析,表4.6 M估計值,27,4.4 探索性分析,3實例分析 結果分析 分別利用Kolmogorov-Smimov檢驗和Shapiro-Wilk檢驗兩種方法來確定變量是否服從正態(tài)分布。其中,Statistic表示檢驗統計量的值,df代表自由度,Sig.表示顯著性水平。一般來說,Sig.0.05則代表接受零假設,即接受變量服從正態(tài)分布的假設。本例中,兩個變量的兩種方法的Sig.值均大于0.05,因此兩個變量均服從正態(tài)分布。,表4.7 正態(tài)檢驗結果,28,4.4 探索性分析,3實例分析 結果分析,圖4-7 箱圖,29,4.4 探索性分析,3實例分析 結果分析,圖4-8 出生率QQ趨勢圖,Q-Q圖可以用來檢驗數據是否服從某種分布,在Q-Q圖中,檢驗數據是否較好地服從給定分布的標準有兩個:看Q-Q圖上的數據點與直線的重合度;Q-Q趨勢圖上的點是否關于直線Y=0在較小的范圍內上下波動。,30,4.4 探索性分析,3實例分析 結果分析,圖4-9 出生率QQ圖,31,4.4 探索性分析,3實例分析 結果分析 莖葉圖利用原始數據以圖形的形式表現了分布的形狀,圖中包括頻數(Frequency)、莖(Stem)和葉(Leaf)3部分 ,右圖中的下方說明中給出了本圖的莖寬為10,每片葉子代表一個數據。對應圖中的第一行數據,從左到右依次為:頻數為6,莖為0,有6片葉子。也就是指第一組里包含6個數據,其近似值為:6、6、7、7、7、7,圖4-10 出生率莖葉圖,出生率 Stem-and-Leaf Plot Frequency Stem & Leaf 6.00 0 . 667777 5.00 0 . 99999 7.00 1 . 0011111 7.00 1 . 2222333 5.00 1 . 44555 1.00 1 . 7 Stem width: 10.00 Each leaf: 1 case(s),32,主要內容,4.1 基本描述性統計量的定義及計算 4.2 頻數分析 4.3 描述性分析 4.4 探索性分析 4.5 交叉列聯表分析 4.6 多選項分析,33,4.5 交叉列聯表分析,1交叉列聯表分析目的和主要功能 在分析變量之間的關系時,通常分析變量之間的相關程度。對于數值型變量,分析其相關性通常是計算相關系數或進行回歸分析,這在后面的章節(jié)中有較為詳細的介紹。而對于定類型變量,則通常采用交叉列聯表進行分析。 交叉列聯表分析主要用于研究離散變量的定類型有無相關性,給出了多個變量在不同取值下的數據分布。在分析中,可對二維和多維列聯表(RC表)資料進行統計描述和檢驗,并計算相應的百分數指標,另外,還可計算四格表確切概率(Fishers Exact Test)且有單雙側、對數似然比檢驗(One-Tail、Two-Tail)以及線性關系的Mantel-Haenszel檢驗,34,4.5 交叉列聯表分析,2交叉列聯表分析的操作界面,選擇列聯表的列變量,可多選,列變量必須是數值型或字符型等分類變量,選擇列聯表的行變量,可多選,同列變量一樣,也必須是數值型或字符型等分類變量,選擇分層變量,用Previous和Next按鈕控制分層的層數,圖4-11,35,4.5 交叉列聯表分析,2交叉列聯表分析的操作界面,圖4-12,單擊圖4-11中的Statistics按鈕,彈出如圖4-12所示的對話框。在該對話框中可以選擇要輸出的統計量,卡方檢驗:選擇是否對行變量和列變量的獨立性進行卡方檢驗 。,相關系數檢驗:選擇是否計算相關系數,用于檢驗兩個變量的線性相關程度。,Nominal選項組:用于定義分類變量的相關性指標,Ordinal選項組:用于定義有序變量的相關性系數,36,4.5 交叉列聯表分析,2交叉列聯表分析的操作界面,Counts選項組用于選擇交叉表單元格中頻數輸出格式:實際頻數、期望頻數,圖4-13,Percentage選項組:選擇交叉列聯表單元格中百分比顯示格式。,Residuals選項組:選擇交叉列聯表單元格中殘差顯示格式。,Noninteger Weights選項組: 當頻數因為加權而變成小數時,選擇該選項對頻數進行調整,37,4.5 交叉列聯表分析,3實例分析 【例4-4】在設置學生評價實驗教學的調查表中,“實驗準備”是其中的一項指標,為分析“實驗準備”情況與評價結果的關系,建立的SPSS數據文件中的部分數據如圖4-14所示,變量值標簽如表4.8所示。,圖4-14,表4.8,38,4.5 交叉列聯表分析,3實例分析 對該數據文件中的兩個變量進行交叉列聯表分析的具體步驟如下: 第1步 數據組織; 數據文件中建立兩個變量:“實驗準備”、“評價結果”,并根據 表4.8定義各變量的變量值標簽。 第2步 打開主對話框; 選擇Analyze Descriptive Statistics Crosstabs ,打開同圖4-11一樣的交叉列聯表分析主對話框,選擇“Display clustered bar charts”復選框繪制分組條形圖。 第3步 確定分析的行、列變量; 將變量“實驗準備”加入Rows文本框作為交叉表的行變量,選擇變量“評價結果”加入columns文本框作為交叉表的列變量。,39,4.5 交叉列聯表分析,3實例分析 第4步 確定探要輸出的統計量; 單擊Statistics按鈕,在同圖4-12一樣的對話框上選擇“Chi-square”復選框,對兩變量的獨立性作卡方檢驗。單擊Continue按鈕返回主對話框,在主對話框中單擊OK按鈕完成分析。,40,4.5 交叉列聯表分析,3實例分析 結果分析 (1)交叉列聯表,41,4.5 交叉列聯表分析,3實例分析 結果分析 (2)卡方檢驗結果,各種檢驗方法顯著水平都遠遠小于0.05,所示有理由拒絕實驗準備與評價結果是獨立的假設,即認為實驗準備這個評價指標是同評價結果是相關的,42,4.5 交叉列聯表分析,3實例分析 結果分析 (3)分組條形圖,43,主要內容,4.1 基本描述性統計量的定義及計算 4.2 頻數分析 4.3 描述性分析 4.4 探索性分析 4.5 交叉列聯表分析 4.6 多選項分析,44,4.6 多選項分析,1多選項分析目的和主要功能 SPSS的多選項分析主要是針對問卷調查中的多選項問題的。多選項問題在問卷調查中普遍存在,要求被調查者從問卷中給出的若干個可選答案中選擇一個以上的答案。 例如,調查消費者擁有的數碼產品的種類,有如下的選項: (1)數碼相機 (2)數碼攝像機 (3)MP3 (4)DVD機 很顯然,該問題可選的答案在一個以上,對于此類的多選項問題,通常,在SPSS中處理此類問題的一般步驟為以下兩大步驟: (1)將多選項問題分解; (2)利用頻數分析或者列聯表分組下的頻數分析方法進行分析。,45,4.6 多選項分析,2多選項問題的分解方法 (1)多選項二分法(Multiple Dichotomies Method) ; (2)多選項分類法(Multiple Category Method),46,4.6 多選項分析,3實例分析 【例4-5】對50個消費者進行調查,擁有的數碼產品的種類,有如下的選項: (1)數碼相機 (2)數碼攝像機 (3)MP3 (4)DVD機 可多選,試按性別統計擁有各種數碼產品的數量。 第1步 分解多選項問題,定義多選項變量集;,47,4.6 多選項分析,3實例分析 第1步 分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 淀粉在鞋材制造中的應用考核試卷
- 自動售貨機行業(yè)市場驅動因素研究考核試卷
- 石英砂加工與石英玻璃制造考核試卷
- 四川省廣安市華瑩市2025年四下數學期末教學質量檢測試題含解析
- 蘭州工業(yè)學院《綜合商務英語Ⅲ》2023-2024學年第一學期期末試卷
- 四川省巴中市平昌縣2024-2025學年初三生物試題寒假周考試卷含解析
- 山東省濟寧市曲阜師大附屬實驗校2025年初三5月百校聯考物理試題含解析
- 吉林省四平市伊通縣重點中學2024-2025學年第二學期初三數學試題期末教學質量(一模)監(jiān)測卷含解析
- 湘贛十四校聯考2024-2025學年高三下學期開學考試生物試題含解析
- 盤錦市重點中學2025年高三下學期階段性考試(期末考)歷史試題含解析
- 工程維保服務內容措施及售后服務專項方案
- 管片基礎知識與管片選型
- 產品標識和可追溯性管理培訓
- 互聯網醫(yī)療合作協議書
- 辦公用品售后服務方案
- 區(qū)塊鏈與電子商務安全的保障
- 2024-2026年版中國運動康復產業(yè)白皮書
- 不銹鋼營銷計劃書
- 部編版五年級語文上冊期末群文閱讀 試卷附答案
- 區(qū)塊鏈與電子商務培訓
- DB21-T 2850-2017旅游景區(qū)安全管理規(guī)范
評論
0/150
提交評論