實(shí)訓(xùn)二 用統(tǒng)計(jì)量描述數(shù)據(jù)_第1頁
實(shí)訓(xùn)二 用統(tǒng)計(jì)量描述數(shù)據(jù)_第2頁
實(shí)訓(xùn)二 用統(tǒng)計(jì)量描述數(shù)據(jù)_第3頁
實(shí)訓(xùn)二 用統(tǒng)計(jì)量描述數(shù)據(jù)_第4頁
實(shí)訓(xùn)二 用統(tǒng)計(jì)量描述數(shù)據(jù)_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

一些人使用統(tǒng)計(jì)就像喝醉酒的人使用街燈柱—支撐的功能多于照明。

——AndrewLang

統(tǒng)計(jì)名言實(shí)訓(xùn)二

用統(tǒng)計(jì)量描述數(shù)據(jù)2.1

水平的度量2.2差異的度量2.3分布形狀的度量學(xué)習(xí)目標(biāo)度量水平的統(tǒng)計(jì)量度量差異的統(tǒng)計(jì)量度量分布形狀的統(tǒng)計(jì)量各統(tǒng)計(jì)量的的特點(diǎn)及應(yīng)用場合用Excel計(jì)算描述統(tǒng)計(jì)量數(shù)據(jù)分布的特征數(shù)據(jù)水平(集中趨勢)分布形狀(偏態(tài)和峰態(tài))數(shù)據(jù)差異

(離中趨勢)集中趨勢

(centraltendency)一組數(shù)據(jù)向其中心值靠攏的傾向和程度測度集中趨勢就是尋找數(shù)據(jù)水平的代表值或中心值2.1水平的度量

2.1.1平均數(shù)

2.1.2中位數(shù)

2.1.3四分位數(shù)

2.1.4眾數(shù)

2.1.5

用哪個(gè)值代表一組數(shù)據(jù)?實(shí)訓(xùn)二

用統(tǒng)計(jì)量描述數(shù)據(jù)2.1.1

平均數(shù)2.1水平的度量xx平均數(shù)

(mean)也稱為均值,常用的統(tǒng)計(jì)量之一消除了觀測值的隨機(jī)波動易受極端值的影響根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體平均數(shù),記為;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本平均數(shù),記為x簡單平均數(shù)

(Simplemean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xn(總體數(shù)據(jù)xN)(未分組資料數(shù)據(jù))樣本平均數(shù)總體平均數(shù)加權(quán)平均數(shù)

(Weightedmean)(1)單項(xiàng)式分組設(shè)各組的變量值為:X1,X2,…,Xk

,相應(yīng)的頻數(shù)為:

f1,f2,…,fk樣本加權(quán)平均:總體加權(quán)平均:加權(quán)平均數(shù)

(Weightedmean)(2)組距式分組設(shè)各組的組中值為:M1,M2,…,Mk

相應(yīng)的頻數(shù)為:

f1,f2,…,fk樣本加權(quán)平均:總體加權(quán)平均:Excel中的統(tǒng)計(jì)函數(shù)AVERAGE—計(jì)算算術(shù)平均數(shù)GEOMEAN—計(jì)算幾何平均數(shù)4.1.2中位數(shù)4.1水平的度量中位數(shù)

(median)定義:排序后處于中間位置上的值。不受極端值影響Me50%50%中位數(shù)的計(jì)算一

(未分組資料)1.位置確定2.數(shù)值確定中位數(shù)的計(jì)算二

(單項(xiàng)式分組資料)計(jì)算步驟:1、計(jì)算各組的向上(或向下)累計(jì)次數(shù);2、確定中位數(shù)組,即累計(jì)次數(shù)達(dá)到的那一組;3、中位數(shù)組對應(yīng)的變量值即為中位數(shù)。中位數(shù)的計(jì)算三

(組距式分組資料)計(jì)算步驟:1、找出中位數(shù)所在的組,即累計(jì)次數(shù)達(dá)到的那一組。2、用公式計(jì)算中位數(shù)的值。Excel中的統(tǒng)計(jì)函數(shù)MEDIAN—計(jì)算中位數(shù)2.1.3四分位數(shù)2.1水平的度量四分位數(shù)—用3個(gè)點(diǎn)等分?jǐn)?shù)據(jù)

(quartile)排序后處于25%和75%位置上的值不受極端值的影響QLQMQU25%25%25%25%四分位數(shù)的計(jì)算

(未分組資料—位置的確定)定義算法四分位數(shù)的計(jì)算一

(未分組資料—位置的確定)

Excel給出的四分位數(shù)位置的確定方法

2008年8月Excel中的統(tǒng)計(jì)函數(shù)QUARTILE—計(jì)算四分位數(shù)(注:0-最小值;1-下四分位數(shù);2-中位數(shù);3-上四分位數(shù);4-最大值)2008年8月2.1.4眾數(shù)2.1水平的度量眾數(shù)

(mode)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值適合于數(shù)據(jù)量較多時(shí)使用不受極端值的影響一組數(shù)據(jù)可能沒有眾數(shù)或有幾個(gè)眾數(shù)mo眾數(shù)

(眾數(shù)的確定方法)根據(jù)單項(xiàng)式數(shù)列確定眾數(shù)單項(xiàng)式數(shù)列中,眾數(shù)就是出現(xiàn)次數(shù)最多的那個(gè)變量值。

規(guī)格(CM)80859095100105110115120合計(jì)銷售量(件)609014016030015013080701180[例]某商店各種規(guī)格羊毛衫銷售資料如表所示,可以看出,100CM的銷售量最大,為300件,因此100CM就是眾數(shù)。眾數(shù)

(眾數(shù)的確定方法)2、根據(jù)組距式數(shù)列確定眾數(shù)(1)先確定次數(shù)最多一組為眾數(shù)所在的組(2)用公式計(jì)算眾數(shù)的近似值下限公式:上限公式:

Excel中的統(tǒng)計(jì)函數(shù)MODE—計(jì)算眾數(shù)2.1.5用哪個(gè)值代表一組數(shù)據(jù)?2.1水平的度量眾數(shù)、中位數(shù)和平均數(shù)的關(guān)系左偏分布(a)均值

中位數(shù)

眾數(shù)對稱分布(b)

均值=

中位數(shù)=

眾數(shù)右偏分布(c)眾數(shù)

中位數(shù)均值眾數(shù)、中位數(shù)、平均數(shù)的特點(diǎn)和應(yīng)用平均數(shù)易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良,實(shí)際中最常用數(shù)據(jù)對稱分布或接近對稱分布時(shí)代表性較好中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時(shí)代表性接好眾數(shù)不受極端值影響具有不惟一性數(shù)據(jù)分布偏斜程度較大且有明顯峰值時(shí)代表性較好2.2差異的度量

2.2.1極差和四分位差

2.2.2平均差

2.2.3方差和標(biāo)準(zhǔn)差

2.2.4比較幾組數(shù)據(jù)的離散程度:離散系數(shù)實(shí)訓(xùn)二用統(tǒng)計(jì)量描述數(shù)據(jù)離中趨勢數(shù)據(jù)分布的另一個(gè)重要特征反映各變量值遠(yuǎn)離其中心值的程度(離散程度)從另一個(gè)側(cè)面說明了集中趨勢測度值的代表程度2.2.1極差和四分位差2.2差異的度量極差

(range)又稱全距,指一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡單測度值,可以簡單衡量平均數(shù)的代表性大小。極差越小,平均數(shù)代表性越大;極差越大,平均數(shù)代表性越小易受極端值影響未考慮數(shù)據(jù)的分布計(jì)算公式為:R=max(xi)-min(xi)四分位差

(quartiledeviation)也稱為內(nèi)距或四分間距,主要用于對順序數(shù)據(jù)離散程度的測度上四分位數(shù)與下四分位數(shù)之差:Qd

=QU

–QL反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性25%75%未分組數(shù)據(jù)看分布—箱線圖

(箱線圖的構(gòu)成)中位數(shù)4681012Q75%Q25%XMaxXMin箱線圖2008年8月未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖

(例題分析—Median/Quart./Range)8門課程考試成績的箱線圖2008年8月2.2.2平均差2.2差異的度量平均差

(meandeviation)又稱平均絕對離差(meanabsolutedeviation)總體或樣本中每一個(gè)數(shù)據(jù)與平均數(shù)離差的絕對值的算術(shù)平均數(shù)。(記為A.D.)反映各數(shù)據(jù)與平均數(shù)的平均離差量。平均差越大,數(shù)據(jù)離散程度越大,平均數(shù)代表性越?。黄骄钤叫?,數(shù)據(jù)離散程度越小,平均數(shù)代表性越大;平均差的計(jì)算

(meandeviation)一、未分組資料(簡單平均法)計(jì)算步驟:1、求各數(shù)據(jù)與平均數(shù)的離差,即2、求離差的絕對值,即3、計(jì)算平均差平均差的計(jì)算

(meandeviation)二、分組資料(加權(quán)平均法)計(jì)算步驟:1、求各組變量值(組中值)與平均數(shù)的離差,即2、求離差的絕對值,即3、計(jì)算平均差Excel中的統(tǒng)計(jì)函數(shù)AVEDEV—計(jì)算平均差2.2.3方差和標(biāo)準(zhǔn)差2.2差異的度量方差和標(biāo)準(zhǔn)差

(varianceandstandarddeviation)數(shù)據(jù)離散程度的最常用測度值反映各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差(標(biāo)準(zhǔn)差),記為2();根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差(標(biāo)準(zhǔn)差),記為s2(s)標(biāo)準(zhǔn)差和方差相比,具有與原始數(shù)據(jù)一樣的計(jì)量單位,因此實(shí)際中應(yīng)用更為普遍。標(biāo)準(zhǔn)差可以衡量水平相同的平均數(shù)的代表性大小。方差和標(biāo)準(zhǔn)差的計(jì)算

(varianceandstandarddeviation)計(jì)算步驟:1、求出平均數(shù)2、求出各數(shù)據(jù)與平均數(shù)的離差3、求出各數(shù)據(jù)與平均數(shù)離差的平方4、用公式計(jì)算樣本方差和標(biāo)準(zhǔn)差

(samplevarianceandstandarddeviation)未分組數(shù)據(jù)組距分組數(shù)據(jù)未分組數(shù)據(jù)組距分組數(shù)據(jù)方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式注意:樣本方差用自由度n-1去除!總體方差和標(biāo)準(zhǔn)差

(PopulationvarianceandStandarddeviation)未分組數(shù)據(jù)組距分組數(shù)據(jù)未分組數(shù)據(jù)組距分組數(shù)據(jù)方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式Excel中的統(tǒng)計(jì)函數(shù)STDEV—計(jì)算樣本標(biāo)準(zhǔn)差2.2.4比較幾組數(shù)據(jù)的離散程度

離散系數(shù)2.2差異的度量離散系數(shù)

(coefficientofvariation)1. 又叫標(biāo)準(zhǔn)差系數(shù),是標(biāo)準(zhǔn)差與其相應(yīng)的均值之比對數(shù)據(jù)相對離散程度的測度消除了數(shù)據(jù)水平高低和計(jì)量單位的影響4. 用于對不同水平的數(shù)據(jù)離散程度的比較5.計(jì)算公式為離散系數(shù)

(例題分析)【例一】評價(jià)哪名運(yùn)動員的發(fā)揮更穩(wěn)定發(fā)揮比較穩(wěn)定的運(yùn)動員是塞爾維亞的亞斯娜·舍卡里奇和中國的郭文珺(2—1),發(fā)揮不穩(wěn)定的運(yùn)動員蒙古的卓格巴德拉赫·蒙赫珠勒(3—8)和波蘭的萊萬多夫斯卡·薩貢2.3分布形狀的度量偏態(tài)與峰態(tài)實(shí)訓(xùn)二

用統(tǒng)計(jì)量描述數(shù)據(jù)數(shù)據(jù)分布的形狀—偏態(tài)與峰態(tài)扁平分布尖峰分布偏態(tài)峰態(tài)左偏分布右偏分布與標(biāo)準(zhǔn)正態(tài)分布比較!偏態(tài)

(skewness)統(tǒng)計(jì)學(xué)家Pearson于1895年首次提出數(shù)據(jù)分布偏斜程度的測度3. 偏態(tài)系數(shù)=0為對稱分布4. 偏態(tài)系數(shù)>0為右偏分布5.偏態(tài)系數(shù)<0為左偏分布6.偏態(tài)系數(shù)大于1或小于-1,被稱為高度偏態(tài)分布;偏態(tài)系數(shù)在0.5~1或-1~-0.5之間,被認(rèn)為是中等偏態(tài)分布;偏態(tài)系數(shù)越接近0,偏斜程度就越低偏態(tài)系數(shù)

(coefficientofskewness)根據(jù)原始數(shù)據(jù)計(jì)算根據(jù)分組數(shù)據(jù)計(jì)算峰態(tài)

(kurtosis)統(tǒng)計(jì)學(xué)家Pearson于1905年首次提出數(shù)據(jù)分布扁平程度的測度峰態(tài)系數(shù)=0扁平峰度適中峰態(tài)系數(shù)<0為扁平分布峰態(tài)系數(shù)>0為尖峰分布峰態(tài)系數(shù)

(coefficientofkurtosis)根據(jù)原始數(shù)據(jù)計(jì)算根據(jù)分組數(shù)據(jù)計(jì)算Excel中的統(tǒng)計(jì)函數(shù)MODE—計(jì)算眾數(shù)MEDIAN—計(jì)算中位數(shù)QUARTILE—計(jì)算四分位數(shù)AVERAGE—計(jì)算平均數(shù)AVEDEV—計(jì)算平均差STDEV—計(jì)算樣本標(biāo)準(zhǔn)差STDEVP—計(jì)算總體標(biāo)準(zhǔn)差SKEW—計(jì)算偏態(tài)系數(shù)KURT—計(jì)算峰態(tài)系數(shù)用Excel計(jì)算描述統(tǒng)計(jì)量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論