《統(tǒng)計(jì)學(xué)-基于SPSS》(03)第3章-數(shù)據(jù)的描述性分析:概括性度量(S3)_第1頁
《統(tǒng)計(jì)學(xué)-基于SPSS》(03)第3章-數(shù)據(jù)的描述性分析:概括性度量(S3)_第2頁
《統(tǒng)計(jì)學(xué)-基于SPSS》(03)第3章-數(shù)據(jù)的描述性分析:概括性度量(S3)_第3頁
《統(tǒng)計(jì)學(xué)-基于SPSS》(03)第3章-數(shù)據(jù)的描述性分析:概括性度量(S3)_第4頁
《統(tǒng)計(jì)學(xué)-基于SPSS》(03)第3章-數(shù)據(jù)的描述性分析:概括性度量(S3)_第5頁
已閱讀5頁,還剩48頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、統(tǒng)計(jì)學(xué)基于SPSS課程內(nèi)容描述統(tǒng)計(jì)、推斷統(tǒng)計(jì)、其他常用方法使用軟件SPSS學(xué)分與課時(shí)3學(xué)分,117周,每周3課時(shí)第 3 章 數(shù)據(jù)的描述性分析:概括性度量 3.1 水平的描述 3.2 差異的描述3.3 分布形狀的描述3.4 數(shù)據(jù)的綜合描述 Statistic2019-5-5學(xué)習(xí)目標(biāo)描述水平的統(tǒng)計(jì)量描述差異的統(tǒng)計(jì)量描述分布形狀的統(tǒng)計(jì)量各統(tǒng)計(jì)量的的特點(diǎn)及應(yīng)用場合用SPSS計(jì)算描述統(tǒng)計(jì)量2019-5-5問題與思考怎樣分析學(xué)生的考試成績 50個(gè)學(xué)生考試分?jǐn)?shù)數(shù)據(jù) 如何來分析這些數(shù)據(jù)呢?除此圖表外,還可以做哪些分析?你認(rèn)為可以用哪些統(tǒng)計(jì)量來描述考試成績?這些統(tǒng)計(jì)量的用途是什么?選擇這些統(tǒng)計(jì)量的理由是什么?本

2、章介紹的描述性分析方法就將解決這些問題2019-5-5數(shù)據(jù)分布的特征3.1 水平的描述 3.1.1 平均數(shù) 3.1.2 分位數(shù) 3.1.3 水平代表值的選擇 第 3 章 數(shù)據(jù)的描述性分析:概括性度量 3.1.1 平均數(shù)3.1 水平的描述2019-5-5平均數(shù)(mean)也稱為均值,常用的統(tǒng)計(jì)量之一消除了觀測值的隨機(jī)波動易受極端值的影響根據(jù)總體數(shù)據(jù)計(jì)算的,稱為平均數(shù),記為;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本平均數(shù),記為x2019-5-5簡單算數(shù)平均(Simple mean)設(shè)一組數(shù)據(jù)為:x1 ,x2 , ,xn (總體數(shù)據(jù)xN) 樣本平均數(shù)總體平均數(shù)2019-5-5簡單算數(shù)平均(例題分析)【例31】2

3、018年4月份北京每天的最高氣溫?cái)?shù)據(jù)如表表31所示。計(jì)算日最高氣溫的平均數(shù)。日期氣溫日期氣溫4月1日254月16日234月2日254月17日254月3日154月18日254月4日124月19日264月5日104月20日274月6日124月21日224月7日124月22日204月8日184月23日204月9日204月24日244月10日244月25日284月11日224月26日274月12日214月27日314月13日114月28日314月14日194月29日244月15日204月30日263.1.2 分位數(shù)3.1 水平的描述2019-5-5中位數(shù)(median)排序后處于中間位置上的值。不受極

4、端值影響Me50%50%2. 位置確定3. 數(shù)值確定2019-5-5中位數(shù)的計(jì)算 (例題分析)2019-5-5四分位數(shù)用3個(gè)點(diǎn)等分?jǐn)?shù)據(jù)(quartile)排序后處于25%和75%位置上的值不受極端值的影響QLQMQU25%25%25%25%2019-5-5四分位數(shù)的計(jì)算(位置的確定)SPSS 算法Excel 算法2019-5-5四分位數(shù)的計(jì)算(位置的確定)2019-5-5百分位數(shù)(percentile)2019-5-5百分位數(shù)(例題分析)2019-5-5百分位數(shù)(例題分析) 用SPSS計(jì)算分位數(shù)第1步:選擇【分析】【描述統(tǒng)計(jì)頻率】。第2步:在出現(xiàn)的對話框中,將【溫度 】選入【變量】,然后點(diǎn)擊【

5、統(tǒng)計(jì)量】。第3步:在出現(xiàn)的對話框中,選中【四分位數(shù)】,在【百分位數(shù)】框內(nèi)寫入要計(jì)算的百分位數(shù)(如0.1,0.9等等)并依次單擊【增加】。然后點(diǎn)擊【繼續(xù)】,點(diǎn)擊【確定】。(注:如果選中【割點(diǎn)】,在框內(nèi)輸入要分割的分位點(diǎn)(默認(rèn)按10進(jìn)行等分),可以得到各分位數(shù)。)2019-5-5眾數(shù)(mode)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值適合于數(shù)據(jù)量較多時(shí)使用不受極端值的影響一組數(shù)據(jù)可能沒有眾數(shù)或有幾個(gè)眾數(shù)mo3.1.3 水平代表值的選擇 3.1 水平的描述2019-5-5眾數(shù)、中位數(shù)和平均數(shù)的關(guān)系2019-5-5眾數(shù)、中位數(shù)、平均數(shù)的特點(diǎn)和應(yīng)用平均數(shù)易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良,實(shí)際中最常用數(shù)據(jù)對稱分布或接近對

6、稱分布時(shí)代表性較好中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時(shí)代表性接好眾數(shù)不受極端值影響具有不惟一性數(shù)據(jù)分布偏斜程度較大且有明顯峰值時(shí)代表性較好第 3 章 數(shù)據(jù)的描述性分析:概括性度量 3.2 差異的描述 3.2.1 極差和四分位差 3.2.2 方差和標(biāo)準(zhǔn)差 3.2.3 變異系數(shù) 3.2.4 標(biāo)準(zhǔn)得分 3.2.1 極差和四分位差3.2 差異的描述2019-5-5極差(range)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡單測度值易受極端值影響未考慮數(shù)據(jù)的分布計(jì)算公式為:R = max(xi) - min(xi)2019-5-5四分位差(quartile deviation)也稱為內(nèi)距或四分間距

7、上四分位數(shù)與下四分位數(shù)之差:Qd = QU QL反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性3.2.2 方差和標(biāo)準(zhǔn)差3.2 差異的描述2019-5-5方差和標(biāo)準(zhǔn)差(variance and standard deviation)數(shù)據(jù)離散程度的最常用測度值反映各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差(標(biāo)準(zhǔn)差),記為2();根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差(標(biāo)準(zhǔn)差),記為s2(s)2019-5-5方差和標(biāo)準(zhǔn)差 (variance and standard deviation)3.2.3 變異系數(shù)3.2 差異的描述2019-5-5變異系數(shù)(coefficien

8、t of variation)1.標(biāo)準(zhǔn)差與其相應(yīng)的均值之比對數(shù)據(jù)相對離散程度的測度消除了數(shù)據(jù)水平高低和計(jì)量單位的影響4.用于對不同組別數(shù)據(jù)離散程度的比較5. 計(jì)算公式為2019-5-5變異系數(shù) (例題分析)【 例35】評價(jià)哪名運(yùn)動員的發(fā)揮更穩(wěn)定2019-5-5變異系數(shù) (例題分析)【 例35】評價(jià)哪名運(yùn)動員的發(fā)揮更穩(wěn)定3.2.4 標(biāo)準(zhǔn)得分3.2 差異的描述2019-5-5標(biāo)準(zhǔn)得分(standard score)1. 也稱標(biāo)準(zhǔn)化值2.對某一個(gè)值在一組數(shù)據(jù)中相對位置的度量3.可用于判斷一組數(shù)據(jù)是否有離群點(diǎn)(outlier)用于對變量的標(biāo)準(zhǔn)化處理均值等于0,方差等于1計(jì)算公式為2019-5-5用SP

9、SS計(jì)算標(biāo)準(zhǔn)得分 2019-5-5標(biāo)準(zhǔn)分?jǐn)?shù) (例題分析)【例36】的標(biāo)準(zhǔn)得分 日期氣溫Z氣溫日期氣溫Z氣溫4月1日250.60284月16日230.25844月2日250.60284月17日250.60284月3日15-1.11964月18日250.60284月4日12-1.63634月19日260.77514月5日10-1.98084月20日270.94734月6日12-1.63634月21日220.08614月7日12-1.63634月22日20-0.25844月8日18-0.60284月23日20-0.25844月9日20-0.25844月24日240.43064月10日240.4306

10、4月25日281.11964月11日220.08614月26日270.94734月12日21-0.08614月27日311.63634月13日11-1.80854月28日311.63634月14日19-0.43064月29日240.43064月15日20-0.25844月30日260.77512019-5-5經(jīng)驗(yàn)法則經(jīng)驗(yàn)法則表明:當(dāng)一組數(shù)據(jù)對稱分布時(shí)約有68%的數(shù)據(jù)在平均數(shù)加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有95%的數(shù)據(jù)在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有99%的數(shù)據(jù)在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi) 2019-5-5切比雪夫不等式(Chebyshevs inequality)如果一組數(shù)據(jù)不是對稱分布,

11、經(jīng)驗(yàn)法則就不再適用,這時(shí)可使用切比雪夫不等式,它對任何分布形狀的數(shù)據(jù)都適用切比雪夫不等式提供的是“下界”,也就是“所占比例至少是多少”對于任意分布形態(tài)的數(shù)據(jù),根據(jù)切比雪夫不等式,至少有1-1/k2的數(shù)據(jù)落在平均數(shù)加減k個(gè)標(biāo)準(zhǔn)差之內(nèi)。其中k是大于1的任意值,但不一定是整數(shù)2019-5-5切比雪夫不等式(Chebyshevs inequality)對于k=2,3,4,該不等式的含義是至少有75%的數(shù)據(jù)落在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)至少有89%的數(shù)據(jù)落在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)至少有94%的數(shù)據(jù)落在平均數(shù)加減4個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)3.3 分布形狀的度量 偏態(tài)與峰度第 3 章 數(shù)據(jù)的描述性分析

12、:概括性度量 2019-5-5數(shù)據(jù)分布的形狀偏態(tài)與峰度2019-5-5偏態(tài)(skewness)統(tǒng)計(jì)學(xué)家K.Pearson于1895年首次提出。是指數(shù)據(jù)分布的不對稱性 測度統(tǒng)計(jì)量是偏度系數(shù)(coefficient of skewness)偏度系數(shù)=0為對稱分布;0為右偏分布;0為左偏分布偏度系數(shù)大于1或小于-1,為高度偏態(tài)分布;偏度系數(shù)在0.51或-1-0.5之間,為是中等偏態(tài)分布;偏度系數(shù)越接近0,偏斜程度就越低計(jì)算公式 2019-5-5峰度(kurtosis)統(tǒng)計(jì)學(xué)家K.Pearson于1905年首次提出。數(shù)據(jù)分布峰值的高低 測度統(tǒng)計(jì)量是峰態(tài)系數(shù)(coefficient of kurtosis)峰態(tài)系數(shù)=0扁平峰度適中峰態(tài)系數(shù)0為尖峰分布計(jì)算公式3.4 數(shù)據(jù)的綜合描述 例題分析第 3 章 數(shù)據(jù)的描述性分析:概括性度量 2019-5-5用SPSS計(jì)算描述統(tǒng)計(jì)量2019-5-5用SPSS計(jì)算描述統(tǒng)計(jì)量(例題分析)2019-5-5用S

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論