版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第四章連續(xù)變量的描述統(tǒng)計第1頁,共47頁,2023年,2月20日,星期三1.連續(xù)變量的統(tǒng)計描述概述2.集中趨勢的描述指標3.離散趨勢的描述指標4.實例操作Part2:第四章連續(xù)變量的描述統(tǒng)計第2頁,共47頁,2023年,2月20日,星期三學習要求掌握SPSS軟件中用于連續(xù)變量統(tǒng)計描述的Explore、Frequencies、Descriptive過程學習要求理解連續(xù)變量的均值、方差等統(tǒng)計描述指標第3頁,共47頁,2023年,2月20日,星期三4.1連續(xù)變量的統(tǒng)計描述概述統(tǒng)計描述的工具統(tǒng)計圖
統(tǒng)計表統(tǒng)計描述指標
第4頁,共47頁,2023年,2月20日,星期三數(shù)據(jù)分布的特征集中趨勢(位置)離中趨勢
(分散程度)偏態(tài)和峰度(形狀)第5頁,共47頁,2023年,2月20日,星期三連續(xù)變量統(tǒng)計描述的常用指標均值眾數(shù)中位數(shù)極差四分位差方差統(tǒng)計描述指標集中趨勢離散趨勢第6頁,共47頁,2023年,2月20日,星期三4.2集中趨勢的描述指標一組數(shù)據(jù)向其中心值靠攏的傾向和程度;測度集中趨勢就是尋找數(shù)據(jù)一般水平的代表值或中心值;第7頁,共47頁,2023年,2月20日,星期三集中趨勢測度-均值集中趨勢的測度值之一;最常用的測度值;一組數(shù)據(jù)的均衡點所在;設一組數(shù)據(jù)為:x1
,x2
,…,xn
,簡單算術平均數(shù)的計算公式為:第8頁,共47頁,2023年,2月20日,星期三集中趨勢測度-中位數(shù)集中趨勢的測度值之一;排序后處于中間位置上的值:Me50%50%第9頁,共47頁,2023年,2月20日,星期三集中趨勢測度-眾數(shù)集中趨勢的測度值之一;出現(xiàn)次數(shù)最多的變量值;第10頁,共47頁,2023年,2月20日,星期三數(shù)據(jù)類型與集中趨勢測度值數(shù)據(jù)類型和所適用的集中趨勢測度值數(shù)據(jù)類型定類數(shù)據(jù)定序數(shù)據(jù)定距數(shù)據(jù)定比數(shù)據(jù)適用的測度值※眾數(shù)※中位數(shù)※均值※均值—四分位數(shù)眾數(shù)調和平均數(shù)—眾數(shù)中位數(shù)幾何平均數(shù)——四分位數(shù)中位數(shù)———四分位數(shù)———眾數(shù)第11頁,共47頁,2023年,2月20日,星期三4.3離中趨勢的描述指標數(shù)據(jù)分布的另一個重要特征;離中趨勢的各測度值是對數(shù)據(jù)離散程度所作的描述;反映各變量值遠離其中心值的程度從另一個側面,從令一側面說明了集中趨勢測度值的代表程度;第12頁,共47頁,2023年,2月20日,星期三離中趨勢測度-極差離散程度的測度值之一;一組數(shù)據(jù)的最大值與最小值之差,計算公式為:
R=max(xi)-min(xi)第13頁,共47頁,2023年,2月20日,星期三離中趨勢測度-方差離散程度最常用的測度值;反映了各變量值與均值的平均差異;計算公式:第14頁,共47頁,2023年,2月20日,星期三離中趨勢測度-四分位差離中趨勢的測度值之一;排序后處于75%和25%位置上的值的差QU-QL
:QLQMQU25%25%25%25%第15頁,共47頁,2023年,2月20日,星期三數(shù)據(jù)類型與離中趨勢測度值數(shù)據(jù)類型和所適用的離散程度測度值數(shù)據(jù)類型定類數(shù)據(jù)定序數(shù)據(jù)定距數(shù)據(jù)或定比數(shù)據(jù)適用的測度值—※四分位差
※方差或標準差——
※離散系數(shù)(比較時用)——平均差——極差——四分位差第16頁,共47頁,2023年,2月20日,星期三4.4數(shù)據(jù)分布的形狀測度扁平分布尖峰分布峰度左偏分布右偏分布與標準正態(tài)分布比較!偏態(tài)第17頁,共47頁,2023年,2月20日,星期三數(shù)據(jù)分布的形狀測度-偏態(tài)數(shù)據(jù)分布偏斜程度的測度;計算公式:偏態(tài)系數(shù)=0為對稱分布;偏態(tài)系數(shù)>0為右偏分布;偏態(tài)系數(shù)<0為左偏分布。第18頁,共47頁,2023年,2月20日,星期三算例【例】已知2007年我國農村居民家庭按純收入分組的有關數(shù)據(jù)如下表。試計算偏態(tài)系數(shù)。2007年農村居民家庭純收入數(shù)據(jù)按純收入分組(元)戶數(shù)比重(%)500以下500~10001000~15001500~20002000~25002500~30003000~35003500~40004000~45004500~50005000以上2.2812.4520.3519.5214.9310.356.564.132.681.814.94第19頁,共47頁,2023年,2月20日,星期三計算過程農村居民家庭純收入數(shù)據(jù)偏態(tài)及峰度計算表按純收入分組(百元)組中值xi戶數(shù)比重(%)fi(xi-x)fi3(xi-x)fi45以下5—1010—1515—2020—2525—3030—3535—4040—4545—5050以上2.57.512.517.522.527.532.537.542.547.552.52.2812.4520.3519.5214.9310.356.564.132.681.814.94-154.64-336.46-144.87-11.840.1823.1689.02171.43250.72320.741481.812927.154686.511293.5346.520.20140.60985.492755.005282.948361.9846041.33合計—1001689.2572521.25第20頁,共47頁,2023年,2月20日,星期三計算結果根據(jù)上表數(shù)據(jù)計算得:將計算結果代入公式得:結論:偏態(tài)系數(shù)為正值,說明農村居民家庭純收入的分布為右偏分布。
第21頁,共47頁,2023年,2月20日,星期三農村居民家庭純收入數(shù)據(jù)的直方圖1000500←15002000250030003500400045005000→結論:說明農村居民家庭純收入的分布為右偏分布,即收入較少的家庭占據(jù)多數(shù),而收入較高的家庭則占少數(shù)。
按純收入分組(元)252015105戶數(shù)比重(%)第22頁,共47頁,2023年,2月20日,星期三數(shù)據(jù)分布的形狀測度-峰度數(shù)據(jù)分布扁平程度的測度;計算公式:峰度系數(shù)=3扁平程度適中;峰度系數(shù)<3為扁平分布;峰度系數(shù)>3為尖峰分布。第23頁,共47頁,2023年,2月20日,星期三4.5連續(xù)變量的統(tǒng)計描述實例操作【例】:某班30名學生《統(tǒng)計學》期末考試成績如下,試對該考試進行統(tǒng)計描述分析。
117122124129107117130122110118123126127123118112100125117122126122118108112127123119113120第24頁,共47頁,2023年,2月20日,星期三描述統(tǒng)計過程SPSS軟件中用于連續(xù)變量統(tǒng)計描述的工具主要有Frequencies、Descriptive、Explore三大過程。第25頁,共47頁,2023年,2月20日,星期三Frequencies過程頻數(shù)分布表是描述性統(tǒng)計中最常用的方法之一,F(xiàn)requencies過程就是專門為產生頻數(shù)表而設計的。Frequencies過程不僅可以產生詳細的頻數(shù)表,還可以按要求給出百分位點的數(shù)值,以及常用的條圖、圓圖等統(tǒng)計圖。第26頁,共47頁,2023年,2月20日,星期三《統(tǒng)計學》成績【例】:某班30名學生《統(tǒng)計學》期末考試成績如下,試對該考試進行分析。117117123112126127122130126100122123124122127125118119129110123117108113107118118122112120第27頁,共47頁,2023年,2月20日,星期三主對話框選擇要分析的變量選定頻數(shù)表格式做統(tǒng)計圖定義需計算的統(tǒng)計量第28頁,共47頁,2023年,2月20日,星期三Statistics子對話框離散趨勢集中趨勢百分位數(shù)分布第29頁,共47頁,2023年,2月20日,星期三結果輸出-表格Frequencies過程的表格輸出不僅主要有均值、中位數(shù)、眾數(shù)、標準差等等常用的描述統(tǒng)計指標。第30頁,共47頁,2023年,2月20日,星期三Charts子對話框條圖正態(tài)曲線直方圖餅圖Charts子對話框主要是定義輸出的圖形類型:條圖、餅圖、直方圖。第31頁,共47頁,2023年,2月20日,星期三結果輸出-直方圖第32頁,共47頁,2023年,2月20日,星期三Format子對話框限制分組數(shù)選擇兩個以上變量作頻數(shù)表定義頻數(shù)表排列順序Format
子對話框主要是定義輸出頻數(shù)表的格式。第33頁,共47頁,2023年,2月20日,星期三Descriptive過程它可對變量進行描述性統(tǒng)計分析,計算并列出一系列相應的統(tǒng)計指標,這和其他過程相比并無不同。該過程可將原始數(shù)據(jù)轉換成標準正態(tài)分值,并以變量的形式存入數(shù)據(jù)庫供以后分析。第34頁,共47頁,2023年,2月20日,星期三主對話框選擇要分析的變量第35頁,共47頁,2023年,2月20日,星期三Options子對話框Options子對話框主要是選擇需要輸出的描述統(tǒng)計指標:均值、中位數(shù)、眾數(shù)、標準差等等。第36頁,共47頁,2023年,2月20日,星期三結果輸出-表格第37頁,共47頁,2023年,2月20日,星期三Explore過程可對變量進行更深入詳盡的描述性統(tǒng)計分析,主要用于對資料的性質、分布特點等完全不清楚時,故又稱為探索性分析。在常用的描述性統(tǒng)計指標的基礎上,它增加了有關數(shù)據(jù)詳細分布特征的文字與圖形描述,如莖葉圖、箱式圖等。第38頁,共47頁,2023年,2月20日,星期三主對話框選入所需分析變量選定分組變量選定標簽變量選定結果中包括的內容第39頁,共47頁,2023年,2月20日,星期三Statistics子對話框所有以上兩個過程有的指標集中趨勢輸出5個最大與最小值百分位數(shù)第40頁,共47頁,2023年,2月20日,星期三Plots子對話框箱式圖的繪制方式莖葉圖和直方圖正態(tài)圖和正態(tài)檢驗判斷離散程度是否相同(比較合適的變量變換方法)第41頁,共47頁,2023年,2月20日,星期三結果輸出-表格第42頁,共47頁,2023年,2月20日,星期三結果輸出-表格第43頁,共47頁,2023年,2月20日,星期三結果輸出-直方圖第44頁,共47頁,2023年,2月20日,星期三結果輸出-箱圖離群點
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度養(yǎng)殖場廢棄物資源化利用技術承包合同范本4篇
- 2022版義務教育階段英語課程標準模擬測試卷
- 2025年度整棟醫(yī)療設施出租經營合同4篇
- 2025年度存量房交易資金監(jiān)管服務合同范本2篇
- 2024智能健康監(jiān)測設備研發(fā)與生產合同
- 2025別墅庭院園藝景觀植物租賃與養(yǎng)護合同3篇
- 2025年度新能源汽車動力電池回收利用技術合作合同范本3篇
- 2024美容院員工勞動合同及保密協(xié)議
- 2025年度醫(yī)院兒科病房改造與承包運營協(xié)議4篇
- 2025年度床上用品行業(yè)環(huán)保公益活動合作合同3篇
- 搖臂鉆床日常點檢表
- 經濟開發(fā)區(qū)擴區(qū)可行性研究報告
- 會計職業(yè)道德課件(完整版)
- 金屬探測器檢查記錄表
- 2022年五年級數(shù)學興趣小組活動記錄
- Q∕GDW 12127-2021 低壓開關柜技術規(guī)范
- 商品房預售合同登記備案表
- 版式設計發(fā)展歷程-ppt課件
- 通信機房蓄電池放電試驗報告
- 病原細菌的分離培養(yǎng)
- EDA課程設計報告書--八音電子琴
評論
0/150
提交評論