趙娜《應(yīng)用統(tǒng)計(jì)分析》課件-(04)第4章 數(shù)據(jù)的概括性度量_第1頁(yè)
趙娜《應(yīng)用統(tǒng)計(jì)分析》課件-(04)第4章 數(shù)據(jù)的概括性度量_第2頁(yè)
趙娜《應(yīng)用統(tǒng)計(jì)分析》課件-(04)第4章 數(shù)據(jù)的概括性度量_第3頁(yè)
趙娜《應(yīng)用統(tǒng)計(jì)分析》課件-(04)第4章 數(shù)據(jù)的概括性度量_第4頁(yè)
趙娜《應(yīng)用統(tǒng)計(jì)分析》課件-(04)第4章 數(shù)據(jù)的概括性度量_第5頁(yè)
已閱讀5頁(yè),還剩70頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)學(xué)

STATISTICS第4章數(shù)據(jù)的概括性度量

(第六版)

統(tǒng)計(jì)學(xué)

作者:中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

賈俊平

4-1作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS第4章數(shù)據(jù)的概括性度量

(第六版)

4.1集中趨勢(shì)的度量

4.2離散程度的度量

4.3偏態(tài)與峰態(tài)的度量

4-2作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS學(xué)習(xí)目標(biāo)

(第六版)

1.集中趨勢(shì)各測(cè)度值的計(jì)算方法

2.集中趨勢(shì)各測(cè)度值的特點(diǎn)及應(yīng)用場(chǎng)合

3.離散程度各測(cè)度值的計(jì)算方法

4.離散程度各測(cè)度值的特點(diǎn)及應(yīng)用場(chǎng)合

5.偏態(tài)與峰態(tài)的測(cè)度方法

6.用Excel計(jì)算描述統(tǒng)計(jì)量并進(jìn)行分析

4-3作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS4.1集中趨勢(shì)的度量

(第六版)

4.1.1分類數(shù)據(jù):眾數(shù)

4.1.2順序數(shù)據(jù):中位數(shù)和分位數(shù)

4.1.3數(shù)值型數(shù)據(jù):平均數(shù)

4.1.4眾數(shù)、中位數(shù)和平均數(shù)的比較

4-4作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)集中趨勢(shì)

STATISTICS

(第六版)(centraltendency)

1.1.一一組數(shù)據(jù)向其中心值靠攏的傾向和程度組數(shù)據(jù)向其中心值靠攏的傾向和程度

2.2.測(cè)度集中趨勢(shì)就是尋找數(shù)據(jù)水平的代表值或中心值測(cè)度集中趨勢(shì)就是尋找數(shù)據(jù)水平的代表值或中心值

3.3.不同類型的數(shù)據(jù)用不同的集中趨勢(shì)測(cè)度值不同類型的數(shù)據(jù)用不同的集中趨勢(shì)測(cè)度值

4.4.低層次數(shù)據(jù)的測(cè)度值適用于高層次的測(cè)量數(shù)據(jù),但高低層次數(shù)據(jù)的測(cè)度值適用于高層次的測(cè)量數(shù)據(jù),但高

層次數(shù)據(jù)的測(cè)度值并不適用于低層次的測(cè)量數(shù)據(jù)層次數(shù)據(jù)的測(cè)度值并不適用于低層次的測(cè)量數(shù)據(jù)

4-5作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS

(第六版)

分類數(shù)據(jù):眾數(shù)

4-6作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)眾數(shù)

STATISTICS

(第六版)(mode)

1.一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值

2.適合于數(shù)據(jù)量較多時(shí)使用

3.不受極端值的影響

4.一組數(shù)據(jù)可能沒(méi)有眾數(shù)或有幾個(gè)眾數(shù)

5.主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和

數(shù)值型數(shù)據(jù)

4-7作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)眾數(shù)

STATISTICS

(第六版)(不惟一性)

無(wú)眾數(shù)

原始數(shù)據(jù):10591268

一個(gè)眾數(shù)

原始數(shù)據(jù):659855

多于一個(gè)眾數(shù)

原始數(shù)據(jù):252828364242

4-8作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)分類數(shù)據(jù)的眾數(shù)

STATISTICS

(第六版)(例題分析)

不同品牌飲料的頻數(shù)分布解:這里的變量為“飲

料品牌”,這是個(gè)分類

百分比

飲料品牌頻數(shù)比例變量,不同類型的飲料

(%)就是變量值

果汁60.1212所調(diào)查的50人中,購(gòu)

礦泉水100.2020買碳酸飲料的人數(shù)最多,

綠茶110.2222為15人,占總被調(diào)查人

數(shù)的,因此眾數(shù)為

其他80.161630%

“可口可樂(lè)”這一品牌,

碳酸飲料150.3030

合計(jì)501100=碳酸飲料

Mo=碳酸飲料

4-9作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)順序數(shù)據(jù)的眾數(shù)

STATISTICS

(第六版)(例題分析)

甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布解:這里的數(shù)據(jù)為順

甲城市序數(shù)據(jù)。變量為“回

回答類別答類別”

戶數(shù)(戶)百分比(%)

甲城市中對(duì)住房

非常不滿意248

表示不滿意的戶數(shù)最

不滿意

10836多,為108戶,因此

一般9331眾數(shù)為“不滿意”這

滿意4515一類別,即

非常滿意3010

=不滿意

Mo=不滿意

合計(jì)300100.0

4-10作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS

(第六版)

順序數(shù)據(jù):中位數(shù)和分位數(shù)

4-11作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)中位數(shù)

STATISTICS

(第六版)(median)

1.排序后處于中間位置上的值排序后處于中間位置上的值

50%50%

Me

2.不受極端值的影響不受極端值的影響

3.主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能

用于分類數(shù)據(jù)用于分類數(shù)據(jù)

4.各變量值與中位數(shù)的離差絕對(duì)值之和最小,即各變量值與中位數(shù)的離差絕對(duì)值之和最小,即

4-12作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)中位數(shù)

STATISTICS

(第六版)(位置和數(shù)值的確定)

位置確定

數(shù)值確定

4-13作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)順序數(shù)據(jù)的中位數(shù)

STATISTICS

(第六版)(例題分析)

甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布解:解:中位數(shù)的位置為中位數(shù)的位置為

甲城市=

回答類別(300+1)/2(300+1)/2=150.5150.5

戶數(shù)(戶)累計(jì)頻數(shù)

從從累累計(jì)計(jì)頻頻數(shù)數(shù)看看,,

非常不滿意2424中中位位數(shù)數(shù)在在““一一般般””這這

不滿意108132一組別中一組別中

一般93225中位數(shù)為中位數(shù)為

滿意45270

非常滿意30300Me=一般

合計(jì)300—

4-14作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)數(shù)值型數(shù)據(jù)的中位數(shù)

STATISTICS

(第六版)(9個(gè)數(shù)據(jù)的算例)

【例】9個(gè)家庭的人均月收入數(shù)據(jù)

原始數(shù)據(jù):15007507801080850960200012501630

排序:75078085096010801250150016302000

位置:112233445566778899

中位數(shù)1080

4-15作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)數(shù)值型數(shù)據(jù)的中位數(shù)

STATISTICS

(第六版)(10個(gè)數(shù)據(jù)的算例)

【例】:10個(gè)家庭的人均月收入數(shù)據(jù)

排序:66075078085096010801250150016302000

位置:1122334455667788991010

4-16作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)四分位數(shù)

STATISTICS

(第六版)(quartile)

1.排序后處于25%和75%位置上的值

25%25%25%25%

QQLLQQMMQQUU

2.不受極端值的影響

3.計(jì)算公式

4-17作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)順序數(shù)據(jù)的四分位數(shù)

STATISTICS

(第六版)(例題分析)

甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布

解:QL位置=(300)/4=75

甲城市Q位置=(3×300)/4

回答類別U

戶數(shù)(戶)累計(jì)頻數(shù)=225

非常不滿意2424從累計(jì)頻數(shù)看,QL在“

不滿意108132不

一般93225滿意”這一組別中;QU在

滿意45270“一般”這一組別中

非常滿意30300

四分位數(shù)為

不滿意

合計(jì)300—QL=不滿意

一般

4-18作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院QU=一般

統(tǒng)計(jì)學(xué)數(shù)值型數(shù)據(jù)的四分位數(shù)

STATISTICS

(第六版)(9個(gè)數(shù)據(jù)的算例)

【例】:9個(gè)家庭的人均月收入數(shù)據(jù)(4種方法計(jì)算)

原始數(shù)據(jù):15007507801080850960200012501630

排序:75078085096010801250150016302000

位置:112233445566778899

4-19作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS

(第六版)

數(shù)值型數(shù)據(jù):平均數(shù)

4-20作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)平均數(shù)

STATISTICS

(第六版)(mean)

1.也稱為均值也稱為均值

2.集中趨勢(shì)的最常用測(cè)度值集中趨勢(shì)的最常用測(cè)度值

3.一組數(shù)據(jù)的均衡點(diǎn)所在一組數(shù)據(jù)的均衡點(diǎn)所在xx

3.體現(xiàn)了數(shù)據(jù)的必然性特征體現(xiàn)了數(shù)據(jù)的必然性特征

4.易受極端值的影響易受極端值的影響

5.有簡(jiǎn)單平均數(shù)和加權(quán)平均數(shù)之分有簡(jiǎn)單平均數(shù)和加權(quán)平均數(shù)之分

6.根根據(jù)據(jù)總總體體數(shù)數(shù)據(jù)據(jù)計(jì)計(jì)算算的的,,稱稱為為平平均均數(shù)數(shù),,記記為為;;根根據(jù)據(jù)

樣本數(shù)據(jù)計(jì)算的,稱為樣本平均數(shù),記為樣本數(shù)據(jù)計(jì)算的,稱為樣本平均數(shù),記為xx

4-21作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)簡(jiǎn)單平均數(shù)

STATISTICS

(第六版)(Simplemean)

設(shè)設(shè)一組數(shù)據(jù)為:一組數(shù)據(jù)為:xx11,,xx22,,……,,xxnn((總體數(shù)據(jù)總體數(shù)據(jù)xxNN))

樣本平均數(shù)樣本平均數(shù)

總體平均數(shù)總體平均數(shù)

4-22作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)加權(quán)平均數(shù)

STATISTICS

(第六版)(Weightedmean)

設(shè)設(shè)各組的組中值為:各組的組中值為:MM11,,MM22,,……,,MMkk

相應(yīng)的頻數(shù)為:相應(yīng)的頻數(shù)為:ff11,,ff22,,……,,ffkk

樣本樣本加權(quán)平均加權(quán)平均

總體總體加權(quán)平均加權(quán)平均

4-23作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)加權(quán)平均數(shù)

STATISTICS

(第六版)(例題分析)

某電腦公司銷售量數(shù)據(jù)分組表

按銷售量分組組中值(Mi)頻數(shù)(fi)Mifi

140~1501454580

150~16015591395

160~170165162640

170~180175274725

180~190185203700

190~200195173315

200~210205102050

210~22021581720

220~2302254900

230~24023551175

合計(jì)—12022200

4-24作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)幾何平均數(shù)

STATISTICS

(第六版)(geometricmean)

1.nn個(gè)變量值乘積的個(gè)變量值乘積的nn次方根次方根

2.適用于對(duì)比率數(shù)據(jù)的平均適用于對(duì)比率數(shù)據(jù)的平均

3.主要用于計(jì)算平均增長(zhǎng)率主要用于計(jì)算平均增長(zhǎng)率

4.計(jì)算公式為計(jì)算公式為

5.5.可看作是平均數(shù)的一種變形可看作是平均數(shù)的一種變形

4-25作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)幾何平均數(shù)

STATISTICS

(第六版)(例題分析)

【【例例】】一一位位投投資資者者購(gòu)購(gòu)持持有有一一種種股股票票,,連連續(xù)續(xù)44年年收收益益率率

分分別別為為4.5%4.5%、、2.1%2.1%、、25.5%25.5%、、1.9%1.9%。。計(jì)計(jì)算算該該投投資資

者在這四年內(nèi)的平均收益率者在這四年內(nèi)的平均收益率

幾何平均:幾何平均:

算術(shù)平均:算術(shù)平均:

4-26作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS

(第六版)

眾數(shù)、中位數(shù)和平均數(shù)的比較

4-27作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS眾數(shù)、中位數(shù)和平均數(shù)的關(guān)系

(第六版)

均值均值中位數(shù)中位數(shù)眾數(shù)眾數(shù)均值均值==中位數(shù)中位數(shù)==眾數(shù)眾數(shù)眾數(shù)眾數(shù)中位數(shù)中位數(shù)均值均值

左偏分布左偏分布左偏分布對(duì)稱分布對(duì)稱分布對(duì)稱分布右偏分布右偏分布右偏分布

4-28作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS眾數(shù)、中位數(shù)、平均數(shù)的特點(diǎn)和應(yīng)用

(第六版)

1.眾數(shù)眾數(shù)

n不受極端值影響

n具有不惟一性

n數(shù)據(jù)分布偏斜程度較大且有明顯峰值時(shí)應(yīng)用

2.中位數(shù)中位數(shù)

n不受極端值影響

n數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用

3.平均數(shù)平均數(shù)

n易受極端值影響

n數(shù)學(xué)性質(zhì)優(yōu)良

n數(shù)據(jù)對(duì)稱分布或接近對(duì)稱分布時(shí)應(yīng)用

4-29作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS4.2離散程度的度量

(第六版)

4.2.1分類數(shù)據(jù):異眾比率

4.2.2順序數(shù)據(jù):四分位差

4.2.3數(shù)值型數(shù)據(jù):方差和標(biāo)準(zhǔn)差

4.2.4相對(duì)離散程度:離散系數(shù)

4-30作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS離中趨勢(shì)

(第六版)

1.數(shù)據(jù)分布的另一個(gè)重要特征數(shù)據(jù)分布的另一個(gè)重要特征

2.反映各變量值遠(yuǎn)離其中心值的程度反映各變量值遠(yuǎn)離其中心值的程度((離散程度離散程度))

3.從另一個(gè)側(cè)面說(shuō)明了集中趨勢(shì)測(cè)度值的代表程度從另一個(gè)側(cè)面說(shuō)明了集中趨勢(shì)測(cè)度值的代表程度

4.不同類型的數(shù)據(jù)有不同的離散程度測(cè)度值不同類型的數(shù)據(jù)有不同的離散程度測(cè)度值

4-31作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS

(第六版)

分類數(shù)據(jù):異眾比率

4-32作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)異眾比率

STATISTICS

(第六版)(variationratio)

1.對(duì)分類數(shù)據(jù)離散程度的測(cè)度

2.非眾數(shù)組的頻數(shù)占總頻數(shù)的比例

3.計(jì)算公式為

4.用于衡量眾數(shù)的代表性

4-33作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)異眾比率

STATISTICS

(第六版)(例題分析)

解:

不同品牌飲料的頻數(shù)分布

百分

飲料品牌頻數(shù)比例

比(%)

果汁60.1212

礦泉水100.2020

綠茶110.2222在所調(diào)查的50人當(dāng)中,購(gòu)

其他80.1616買其他品牌飲料的人數(shù)占

70%,異眾比率比較大。因

碳酸飲料150.3030

此,用“碳酸飲料”代表消

合計(jì)501100費(fèi)者購(gòu)買飲料品牌的狀況,

其代表性不是很好

4-34作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS

(第六版)

順序數(shù)據(jù):四分位差

4-35作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)四分位差

STATISTICS

(第六版)(quartiledeviation)

1.對(duì)順序數(shù)據(jù)離散程度的測(cè)度

2.也稱為內(nèi)距或四分間距

3.上四分位數(shù)與下四分位數(shù)之差

Qd=QU–QL

4.反映了中間50%數(shù)據(jù)的離散程度

5.不受極端值的影響

6.用于衡量中位數(shù)的代表性

4-36作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)四分位差

STATISTICS

(第六版)(例題分析)

甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布解:設(shè)非常不滿意為

甲城市1,不滿意為2,一般為

回答類別3,滿意為4,非常滿

戶數(shù)(戶)累計(jì)頻數(shù)

意為5。已知

非常不滿意2424

QL=不滿意=2

不滿意108132

一般

一般93225QU==3

滿意45270四分位差為

非常滿意30300

Qd=QU-QL

合計(jì)300—

=3–2=1

4-37作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS

(第六版)

數(shù)值型數(shù)據(jù):方差和標(biāo)準(zhǔn)差

4-38作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)極差

STATISTICS

(第六版)(range)

1.一組數(shù)據(jù)的最大值與最小值之差

2.離散程度的最簡(jiǎn)單測(cè)度值

3.易受極端值影響

4.未考慮數(shù)據(jù)的分布

5.計(jì)算公式為計(jì)算公式為

R=max(xi)-min(xi)

4-39作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)平均差

STATISTICS

(第六版)(meandeviation)

1.各變量值與其平均數(shù)離差絕對(duì)值的平均數(shù)各變量值與其平均數(shù)離差絕對(duì)值的平均數(shù)

2.能全面反映一組數(shù)據(jù)的離散程度能全面反映一組數(shù)據(jù)的離散程度

3.數(shù)學(xué)性質(zhì)較差,實(shí)際中應(yīng)用較少數(shù)學(xué)性質(zhì)較差,實(shí)際中應(yīng)用較少

4.計(jì)算公式為計(jì)算公式為

未分組數(shù)據(jù)未分組數(shù)據(jù)

組距分組數(shù)據(jù)組距分組數(shù)據(jù)

4-40作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)平均差

STATISTICS

(第六版)(例題分析)

某電腦公司銷售量數(shù)據(jù)平均差計(jì)算表

按銷售量分組組中值(Mi)頻數(shù)(fi)

140~150145440160

150~160155930270

160~1701651620320

170~1801752710270

180~1901852000

190~2001951710170

200~2102051020200

210~220215830240

220~230225440160

230~240235550250

合計(jì)—120—2040

4-41作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)平均差

STATISTICS

(第六版)(例題分析)

含義:每一天的銷售量平均數(shù)相比,

平均相差17臺(tái)

4-42作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)方差和標(biāo)準(zhǔn)差

STATISTICS

(第六版)(varianceandstandarddeviation)

1.數(shù)據(jù)離散程度的最常用測(cè)度值

2.反映了各變量值與均值的平均差異

3.根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差(標(biāo)準(zhǔn)

差),記為2();根據(jù)樣本數(shù)據(jù)計(jì)算的,

稱為樣本方差(標(biāo)準(zhǔn)差),記為s2(s)

4-43作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)樣本方差和標(biāo)準(zhǔn)差

STATISTICS

(第六版)(sample(samplevariancevarianceandandstandardstandarddeviationdeviation))

方差的計(jì)算公式方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式

未分組數(shù)據(jù)注意:注意:未分組數(shù)據(jù)

樣本方差用自樣本方差用自

由度由度nn-1-1去除去除!!!

組距分組數(shù)據(jù)組距分組數(shù)據(jù)

4-44作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)自由度

STATISTICS

(第六版)(degreeoffreedom)

1.自由度是指數(shù)據(jù)個(gè)數(shù)與附加給獨(dú)立的觀測(cè)

值的約束或限制的個(gè)數(shù)之差

2.從字面涵義來(lái)看,自由度是指一組數(shù)據(jù)中

可以自由取值的個(gè)數(shù)

3.當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為n時(shí),若樣本平均數(shù)

確定后,則附加給n個(gè)觀測(cè)值的約束個(gè)數(shù)

就是1個(gè),因此只有n-1個(gè)數(shù)據(jù)可以自由

取值,其中必有一個(gè)數(shù)據(jù)不能自由取值

4.按著這一邏輯,如果對(duì)n個(gè)觀測(cè)值附加的

約束個(gè)數(shù)為k個(gè),自由度則為n-k

4-45作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)自由度

STATISTICS

(第六版)(degreeoffreedom)

樣本有個(gè)數(shù)值,即,,,則。

1.1.樣本有33個(gè)數(shù)值,即xx11=2=2,xx22=4=4,xx33=9=9,則xx==55。

當(dāng)確定后,,和有兩個(gè)數(shù)據(jù)可以自由取

當(dāng)xx==55確定后,xx11,xx22和xx33有兩個(gè)數(shù)據(jù)可以自由取

值,另一個(gè)則不能自由取值,比如,,那么

值,另一個(gè)則不能自由取值,比如xx11=6=6,xx22=7=7,那么

則必然取,而不能取其他值

xx33則必然取22,而不能取其他值

2.2.為為什什么么樣樣本本方方差差的的自自由由度度為為什什么么是是nn-1-1呢呢??因因?yàn)闉樵谠谟?jì)計(jì)

算算離離差差平平方方和和時(shí)時(shí),,必必須須先先求求出出樣樣本本均均值值xx,,而而xx則則

是是附附件件給給離離差差平平方方和和的的一一個(gè)個(gè)約約束束,,因因此此,,計(jì)計(jì)算算離離差差

平方和時(shí)只有平方和時(shí)只有nn-1-1個(gè)獨(dú)立的觀測(cè)值,而不是個(gè)獨(dú)立的觀測(cè)值,而不是nn個(gè)個(gè)

3.3.樣樣本本方方差差用用自自由由度度去去除除,,其其原原因因可可從從多多方方面面解解釋釋,,

從從實(shí)實(shí)際際應(yīng)應(yīng)用用角角度度看看,,在在抽抽樣樣估估計(jì)計(jì)中中,,當(dāng)當(dāng)用用樣樣本本方方差差ss22

去估計(jì)總體方差去估計(jì)總體方差σσ22時(shí),它是時(shí),它是σσ22的無(wú)偏估計(jì)量的無(wú)偏估計(jì)量

4-46作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)樣本標(biāo)準(zhǔn)差

STATISTICS

(第六版)(例題分析)

某電腦公司銷售量數(shù)據(jù)平均差計(jì)算表

按銷售量分組組中值(Mi)頻數(shù)(fi)

140~150145440160

150~160155930270

160~1701651620320

170~1801752710270

180~1901852000

190~2001951710170

200~2102051020200

210~220215830240

220~230225440160

230~240235550250

合計(jì)—120—55400

4-47作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)樣本標(biāo)準(zhǔn)差

STATISTICS

(第六版)(例題分析)

含義:每一天的銷售量與平均數(shù)相比,

平均相差21.58臺(tái)

4-48作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)總體方差和標(biāo)準(zhǔn)差

STATISTICS

(第六版)(PopulationvarianceandStandarddeviation)

方差的計(jì)算公式方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式

未分組數(shù)據(jù)未分組數(shù)據(jù)

組距分組數(shù)據(jù)組距分組數(shù)據(jù)

4-49作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS

(第六版)

相對(duì)位置的度量:標(biāo)準(zhǔn)分?jǐn)?shù)

4-50作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)標(biāo)準(zhǔn)分?jǐn)?shù)

STATISTICS

(第六版)(standardscore)

1.也稱標(biāo)準(zhǔn)化值

2.對(duì)某一個(gè)值在一組數(shù)據(jù)中相對(duì)位置的度量

3.可用于判斷一組數(shù)據(jù)是否有離群點(diǎn)(outlier)

4.用于對(duì)變量的標(biāo)準(zhǔn)化處理

5.計(jì)算公式為

4-51作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)標(biāo)準(zhǔn)分?jǐn)?shù)

STATISTICS

(第六版)(性質(zhì))

zz分分?jǐn)?shù)數(shù)只只是是將將原原始始數(shù)數(shù)據(jù)據(jù)進(jìn)進(jìn)行行了了線線性性變變換換,,它它并并沒(méi)沒(méi)有有

改改變變一一個(gè)個(gè)數(shù)數(shù)據(jù)據(jù)在在該該組組數(shù)數(shù)據(jù)據(jù)中中的的位位置置,,也也沒(méi)沒(méi)有有改改變變?cè)撛?/p>

組組數(shù)數(shù)分分布布的的形形狀狀,,而而只只是是使使該該組組數(shù)數(shù)據(jù)據(jù)均均值值為為00,,標(biāo)標(biāo)

準(zhǔn)差為準(zhǔn)差為11

4-52作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)標(biāo)準(zhǔn)分?jǐn)?shù)

STATISTICS

(第六版)(例題分析)

9個(gè)家庭人均月收入標(biāo)準(zhǔn)化值計(jì)算表

家庭編號(hào)人均月收入(元)標(biāo)準(zhǔn)化值z(mì)

115000.695

2750-1.042

3780-0.973

41080-0.278

5850-0.811

6960-0.556

720001.853

812500.116

916300.996

4-53作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS經(jīng)驗(yàn)法則

(第六版)

經(jīng)驗(yàn)法則表明:當(dāng)一組數(shù)據(jù)對(duì)稱分布時(shí)

?約有68%的數(shù)據(jù)在平均數(shù)加減1個(gè)標(biāo)準(zhǔn)差

的范圍之內(nèi)

?約有95%的數(shù)據(jù)在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差

的范圍之內(nèi)

?約有99%的數(shù)據(jù)在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差

的范圍之內(nèi)

4-54作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)切比雪夫不等式

STATISTICS

(第六版)(Chebyshev’sinequality)

1.如果一組數(shù)據(jù)不是對(duì)稱分布,經(jīng)驗(yàn)法則就不

再適用,這時(shí)可使用切比雪夫不等式,它對(duì)

任何分布形狀的數(shù)據(jù)都適用

2.切比雪夫不等式提供的是“下界”,也就是

“所占比例至少是多少”

3.對(duì)于任意分布形態(tài)的數(shù)據(jù),根據(jù)切比雪夫不

等式,至少有1-1/k2的數(shù)據(jù)落在平均數(shù)加減k

個(gè)標(biāo)準(zhǔn)差之內(nèi)。其中k是大于1的任意值,但

不一定是整數(shù)

4-55作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)切比雪夫不等式

STATISTICS

(第六版)(Chebyshev’sinequality)

對(duì)于k=2,3,4,該不等式的含義是

1.至少有75%的數(shù)據(jù)落在平均數(shù)加減2個(gè)標(biāo)

準(zhǔn)差的范圍之內(nèi)

2.至少有89%的數(shù)據(jù)落在平均數(shù)加減3個(gè)標(biāo)

準(zhǔn)差的范圍之內(nèi)

3.至少有94%的數(shù)據(jù)落在平均數(shù)加減4個(gè)標(biāo)

準(zhǔn)差的范圍之內(nèi)

4-56作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS

(第六版)

相對(duì)離散程度:離散系數(shù)

4-57作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)離散系數(shù)

STATISTICS

(第六版)(coefficientofvariation)

1.標(biāo)準(zhǔn)差與其相應(yīng)的均值之比

2.對(duì)數(shù)據(jù)相對(duì)離散程度的測(cè)度

3.消除了數(shù)據(jù)水平高低和計(jì)量單位的影響

4.用于對(duì)不同組別數(shù)據(jù)離散程度的比較

5.計(jì)算公式為

4-58作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)離散系數(shù)

STATISTICS

(第六版)(例題分析)

【例】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)

據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤(rùn)的離散程度

某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)

產(chǎn)品銷售額(萬(wàn)元)銷售利潤(rùn)(萬(wàn)元)

企業(yè)編號(hào)

x1x2

11708.1

222012.5

339018.0

443022.0

548026.5

665040.0

795064.0

8100069.0

4-59作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)離散系數(shù)

STATISTICS

(第六版)(例題分析)

309.1923.09

v1==0.577v==0.710

536.25232.5215

結(jié)論:計(jì)算結(jié)果表明,v1<v2,說(shuō)明產(chǎn)品銷售額

的離散程度小于銷售利潤(rùn)的離散程度

4-60作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS4.3偏態(tài)與峰態(tài)的度量

(第六版)

4.3.1偏態(tài)及其測(cè)度

4.3.2峰態(tài)及其測(cè)度

4-61作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS

(第六版)

偏態(tài)

4-62作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)偏態(tài)

STATISTICS

(第六版)(skewness)

1.統(tǒng)計(jì)學(xué)家統(tǒng)計(jì)學(xué)家PearsonPearson于于18951895年首次提出年首次提出

2.數(shù)據(jù)分布偏斜程度的測(cè)度數(shù)據(jù)分布偏斜程度的測(cè)度

2.2.偏態(tài)系數(shù)偏態(tài)系數(shù)=0=0為為對(duì)稱分布對(duì)稱分布

3.3.偏態(tài)系數(shù)偏態(tài)系數(shù)>>00為為右偏分布右偏分布

4.偏態(tài)系數(shù)偏態(tài)系數(shù)<<00為為左偏分布左偏分布

5.偏偏態(tài)態(tài)系系數(shù)數(shù)大大于于11或或小小于于-1-1,,被被稱稱為為高高度度

偏偏態(tài)態(tài)分分布布;;偏偏態(tài)態(tài)系系數(shù)數(shù)在在0.50.5~~11或或-1-1~~--

0.50.5之之間間,,被被認(rèn)認(rèn)為為是是中中等等偏偏態(tài)態(tài)分分布布;;偏偏

態(tài)系數(shù)越接近態(tài)系數(shù)越接近00,偏斜程度就越低,偏斜程度就越低

4-63作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)偏態(tài)系數(shù)

STATISTICS

(第六版)(coefficientofskewness)

1.根據(jù)原始數(shù)據(jù)計(jì)算

2.根據(jù)分組數(shù)據(jù)計(jì)算

4-64作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)偏態(tài)系數(shù)

STATISTICS

(第六版)(例題分析)

某電腦公司銷售量偏態(tài)及峰度計(jì)算表

頻數(shù)

按銷售量份組(臺(tái))組中值(Mi)fi

140~1501454-25600010240000

150~1601559-2430007290000

160~17016516-1280002560000

170~18017527-27000270000

180~1901852000

190~2001951717000170000

200~21020510800001600000

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論