描述統(tǒng)計學綜合論述課件_第1頁
描述統(tǒng)計學綜合論述課件_第2頁
描述統(tǒng)計學綜合論述課件_第3頁
描述統(tǒng)計學綜合論述課件_第4頁
描述統(tǒng)計學綜合論述課件_第5頁
已閱讀5頁,還剩183頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

05.01.20231本資料來源25.12.20221本資料來源05.01.20232第2章描述統(tǒng)計學

案例導入

在一家財產(chǎn)保險公司的董事會上,董事們就公司的發(fā)展戰(zhàn)略問題展開了激烈討論,其中一個引人關注的問題就是如何借鑒國外保險公司的先進管理經(jīng)驗,提高自身的管理水平。有的董事提出,2005年公司的各項業(yè)務與去年相比沒有太大增長,除經(jīng)濟環(huán)境和市場競爭等因素外,對家庭財產(chǎn)保險的業(yè)務開展得不夠,公司在管理方式上也存在問題。他認為,中國的家庭財產(chǎn)保險市場潛力巨大,應加大擴展這一業(yè)務的力度,同時,應對公司家庭財產(chǎn)推銷員實行目標管理,并根據(jù)目標完成情況建立相應的獎懲制度。董事長認為該董事的建議有一定道理,準備采納。會后,他責成計劃部經(jīng)理盡快拿出具體的實施方案。

25.12.20222第2章描述統(tǒng)計學05.01.20233

計劃部經(jīng)理接到任務后感到有些頭痛。如果目標定得過高,多數(shù)推銷員完不成任務,會使推銷員失去信心;如果定得過低,將不利于充分挖掘員工的工作潛力,提高公司的業(yè)績水平。于是,計劃部經(jīng)理將公司160個推銷員的月銷售額分別作了統(tǒng)計,統(tǒng)計數(shù)據(jù)如表2-1所示。如果你是計劃部經(jīng)理,觀察這160個原始數(shù)據(jù)后,準備如何來制定具體的銷售目標呢?25.12.20223計劃部經(jīng)理接到任務后感05.01.20234本章重點1、描述統(tǒng)計數(shù)據(jù)分布特征的圖表法;2、數(shù)據(jù)中心位置測度的種類與方法;(1)計算平均數(shù):算術平均數(shù)、調和平均數(shù)、幾何平均數(shù);(2)位置平均數(shù):中位數(shù)、眾數(shù)、分位數(shù)。3、變異性的測度:全距、平均差、方差、標準差、變異系數(shù);4、相對位置的測度:z分數(shù)、切貝雪夫定理、經(jīng)驗法則。本章難點1、算術平均數(shù);2、方差與標準差。25.12.20224本章重點05.01.20235第一節(jié)圖表法一、次數(shù)分布

(一)、次數(shù)分布的概念及類型

次數(shù):分布在各組的單位數(shù)(f)

頻率:各組次數(shù)與總次數(shù)的比重用f/f表示;

25.12.20225第一節(jié)圖表法一、次數(shù)分布05.01.20236變量數(shù)列屬性數(shù)列將總體按某個標志分成若干組,在按一定順序進行歸并排列,形成總體單位數(shù)在各組間的分布。次數(shù)分布分類分組(標志的具體表現(xiàn))各組的單位數(shù)(次數(shù)或頻數(shù))構成要素異距數(shù)列等距數(shù)列組距數(shù)列單值數(shù)列單項式數(shù)列25.12.20226變量數(shù)列屬性數(shù)列將總體按某個標志分成若05.01.20237企業(yè)職工性別情況的分配數(shù)列(品質數(shù)列)性別職工人數(shù)(個)女男680520合計1200

某地區(qū)企業(yè)銷售收入情況的分配數(shù)列(變量數(shù)列)銷售收入(萬元)企業(yè)數(shù)(個)80-9090-100100-110110-12024166合計2825.12.20227企業(yè)職工性別情況的分配數(shù)列(品質數(shù)列)05.01.20238按銷售額分組(千元)人數(shù)(人)f12以下12-1414-1616-1818-2020-2222-2424-2626-2828以上6132936251714974合計160表2-3某保險公司160名推銷員銷售額分組數(shù)據(jù)25.12.20228按銷售額分組(千元)人數(shù)(人)f105.01.20239組距數(shù)列指每個組的變量值用一個區(qū)間來表現(xiàn)的變量數(shù)列變量是連續(xù)變量;或:總體單位數(shù)較多,變量不同取值個數(shù)也較多的離散變量。

編制條件:25.12.20229組距數(shù)列指每個組的變量值用一個區(qū)間來表05.01.202310相關概念指每組兩端表示各組界限的變量值,各組的最小值為下限,最大值為上限組限每組變量值變動區(qū)間的長度,為上下限之差組距每組變量取值范圍的中點數(shù)值組中值組中值=25.12.202210相關概念指每組兩端表示各組界限的變量05.01.202311某地區(qū)100個百貨商店月銷售額與流通費用情況銷售額(萬元)商店數(shù)(個)每百元商品銷售額中支付的流通費(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5上組限U下組限L如:組距d=U-L=100-50=50(萬元)如:組中值x=(U+L)/2=(100+200)/2=150(萬元)25.12.202211某地區(qū)100個百貨商店銷售額(萬元)05.01.202312對于離散變量,相鄰組組限可以間斷,也可重疊;對于連續(xù)變量,相鄰組組限必須重疊;符合“上組限不計入”原則;首末兩組可使用“××以下”及“××以上”的開口組。組限的表示方法25.12.202212對于離散變量,相鄰組組限可以間斷,也05.01.202313開口式組距數(shù)列組中值的計算:

首組假定下限=首組上限-相鄰組組距末組假定上限=末組下限+相鄰組組距先計算開口組的假定上、下限:

因此有:首組組中值末組組中值25.12.202213開口式組距數(shù)列組中值的計算:05.01.202314例:30名同齡兒童身高(cm):106,99,85,121,84,94,106,105,110,119,101,95,91,87,105,106,109,118,96,128,91,97,105,111,111,107,103,101,107,106。(1)將變量值按大小次序排列84,85,87,91,91,94,95,96,97,99,101,101,103,105,105,105,106,106,106,106,107,107,109,110,111,111,118,119,121,128。(2)計算全距:R=128-84=44(cm)(3)確定組數(shù)與組距令i=10cm,則組數(shù)n=44/10=4.4,取5組變量數(shù)列的編制。25.12.202214例:30名同齡兒童身高(cm):變量05.01.20231584,85,87,91,91,94,95,96,97,99,101,101,103,105,105,105,106,106,106,106,107,107,109,110,111,111,118,119,121,128。(4)編制變量數(shù)列25.12.20221584,85,87,91,91,94,05.01.202316(二)、次數(shù)分布的主要類型1、鐘形分布分布特征:中間大、兩頭小。鐘形分布進一步區(qū)分為:(1)對稱分布(2)偏態(tài)分布正偏:又稱右偏,有極大值;負偏:又稱左偏,有極小值。右偏左偏25.12.202216(二)、次數(shù)分布的主要類型1、鐘形分05.01.2023172、U形分布3、J形分布分布特征:一邊大、一邊小。(1)正J分布:右大左??;次數(shù)隨變量值的增大而增多(2)反J分布:左大右?。淮螖?shù)隨變量值的增大而減少死亡率年齡分布特征:兩頭大、中間小。25.12.2022172、U形分布死亡率年齡05.01.202318二、直方圖1、直方圖:直方圖是用直方形的高度和寬度來表示次數(shù)分布特征的圖形。橫軸表示變量;縱軸表示次數(shù)。寬表示組距,高表示次數(shù)。

2、折線圖將組中值用折線連接而成。曲線圖當組數(shù)無限增多,則組距無限減小,此時折線趨近于曲線。身高15129638090100110120130人數(shù)25.12.202218二、直方圖1、直方圖:直方圖是用直方05.01.202319分組數(shù)據(jù)—直方圖

(直方圖的繪制)日加工零件數(shù)(個)圖某電腦公雖銷售量分布的直方圖我一眼就看出來了,大多數(shù)天的日銷售臺數(shù)在170~180之間!直方圖下的面積之和等于1頻數(shù)(臺)25.12.202219分組數(shù)據(jù)—直方圖

(直方圖的繪制)日05.01.202320

將變量數(shù)列各組的次數(shù)和比率逐組累計相加而成累計次數(shù)分布,它表明總體在某一變量值的某一水平上下總共包含的總體次數(shù)和比率。累計分布分為向上累計和向下累計。組距數(shù)列中的向上累計,表明各組上限以下總共所包含的總體次數(shù)和比率有多少。組距數(shù)列中的向下累計,表明各組下限以上總共所包含的總體次數(shù)和比率有多少。三、累計分布圖25.12.202220三、累計分布圖05.01.2023212.2均值測度

次數(shù)分配數(shù)列的兩個重要特征:集中趨勢與離中趨勢。集中趨勢:反映一組數(shù)據(jù)向分布的中心集中的趨勢。離中趨勢:反映一組數(shù)據(jù)遠離中心的趨勢。測定集中趨勢的指標主要有均值。25.12.2022212.2均值測度05.01.202322

基本公式=總體標志總量/總體單位總量(一)簡單算術平均數(shù)

適用未分組或各變量值出現(xiàn)次數(shù)相同資料一、算術平均數(shù)25.12.202222基本公式=總體標志總量05.01.202323簡單均值

SimpleMean原始數(shù)據(jù): 10 5 9 13 6 825.12.202223簡單均值

SimpleMean原05.01.202324(二)加權算術平均數(shù)適用已分組資料

注意:加權算術平均數(shù)不僅受各組變量值大小的影響,還受各組次數(shù)多少的影響。次數(shù)因其對平均的結果有權衡輕重的作用,因此,也叫權數(shù)。25.12.202224(二)加權算術平均數(shù)適用已分組資料05.01.202325加權均值(WeightedMean)【例2.3】根據(jù)第三章表3-9中的數(shù)據(jù),計算電腦銷售量的平均數(shù)表2-5加權平均數(shù)計算表25.12.202225加權均值(WeightedMea05.01.202326加權均值

(權數(shù)對均值的影響)

甲乙兩組各有10名學生,他們的考試成績及其分布數(shù)據(jù)如下

甲組:考試成績(X): 020100

人數(shù)分布(F):118

乙組:考試成績(X): 020100

人數(shù)分布(F):811x甲0×1+20×1+100×8n10i=1xi82(分)x乙0×8+20×1+100×1n10i=1xi12(分)25.12.202226加權均值

(權數(shù)對均值的影響)05.01.202327權數(shù)與加權23456781925.12.202227權數(shù)與加權23456781905.01.202328權數(shù)與加權23456781925.12.202228權數(shù)與加權23456781905.01.202329權數(shù)與加權23456781925.12.202229權數(shù)與加權23456781905.01.202330

權數(shù)的種類:

A、絕對權數(shù)(次數(shù))fB、相對權數(shù)(頻率或比重)f/f

只有當各組的次數(shù)不相等時,次數(shù)才具有權數(shù)的作用。

由此可見,簡單算術平均數(shù)是加權算術平均數(shù)的一個特例。25.12.202230權數(shù)的種類:由此可見,簡單算05.01.202331A:是非標志——將總體全部單位劃分為“是”或“否”兩類的標志

(三)是非標志平均數(shù)25.12.202231A:是非標志——將總體全部單位劃分為05.01.202332B、啞變量(0—1變量)25.12.202232B、啞變量(0—1變量)05.01.202333【例】設X=(2,4,6,8),則其調和平均數(shù)可由定義計算如下:⒉再求算術平均數(shù):⒈求各標志值的倒數(shù):,,,⒊再求倒數(shù):是總體各單位標志值倒數(shù)的算術平均數(shù)的倒數(shù),又叫倒數(shù)平均數(shù)二、調和平均數(shù)harmean(harmonicmean)25.12.202233【例】設X=(2,4,6,8),則05.01.202334[例]某種蔬菜早上0.4元/斤,中午0.25元/斤,晚上0.20元/斤,某人各買1斤,求平均價格。(算術平均法)

[例]類似地某人早、中、晚各買1元,求平均價格。

(一)簡單調和平均數(shù)(各變量值均為一個單位時使用)25.12.202234[例]某種蔬菜早上0.4元/斤,中午05.01.202335式中:x代表各個變量值,n代表變量值項數(shù)25.12.202235式中:x代表各個變量值,n代表變量值05.01.202336二.加權調和平均數(shù)——適用于總體資料經(jīng)過分組整理形成變量數(shù)列的情況式中:為第組的變量值;為第組的標志總量。25.12.202236二.加權調和平均數(shù)——適用于總體資05.01.202337解:例:晚上白菜0.3元/斤,菠菜0.5元/斤,芹菜0.6元/斤,小王買了2元白菜,3元菠菜,4元芹菜,問平均每斤菜的價格?25.12.202237解:例:晚上白菜0.3元/斤,菠菜005.01.202338[例]某局所屬四個企業(yè)有關資料如下,試計算該工業(yè)局的產(chǎn)值平均計劃完成百分比。25.12.202238[例]某局所屬四個企業(yè)有關資料如下05.01.202339

算術平均數(shù)與調和平均數(shù)的適用前提:

A、已知基本公式母項資料用算術平均數(shù)計算

(子項資料未知)B、已知基本公式子項資料用調和平均數(shù)計算(母項資料未知)

調和平均數(shù)是算術平均數(shù)的變形原來只是計算時使用了不同的數(shù)據(jù)!25.12.202239算術平均數(shù)與調和平均數(shù)05.01.202340

是N項變量值連乘積的開N

次方根三、幾何平均數(shù)Geomean(geomatricmean)用于計算現(xiàn)象的平均比率或平均速度應用各個比率或速度的連乘積等于總比率或總速度;相乘的各個比率或速度不為零或負值。應用的前提條件:25.12.202240是N項變量值連乘積的開N三、05.01.202341A.簡單幾何平均數(shù)——適用于總體資料未經(jīng)分組整理尚為原始資料的情況式中:為幾何平均數(shù);為變量值的個數(shù);為第個變量值。幾何平均數(shù)的計算方法25.12.202241A.簡單幾何平均數(shù)——適用于總體資05.01.202342(二)加權幾何平均數(shù)

注意:當觀察值有一項為零或負值時,不宜用幾何平均數(shù)計算。如用同一數(shù)據(jù)分別計算算術平均數(shù)、調和平均數(shù)和幾何平均數(shù)時,則有如下關系:25.12.202242(二)加權幾何平均數(shù)注意:當觀察值05.01.202343四、中位數(shù)

把總體各變量值按大小順序排列起來,處于中點位置的變量值就是中位數(shù),用“Me”表示。(一)根據(jù)未分組資料確定中位數(shù)25.12.202243四、中位數(shù)把總體各變05.01.202344當n為奇數(shù)時,Me=中間位置的那個變量值;原始數(shù)據(jù):

2422212620排序: 2021222426位置: 123

45中位數(shù)2225.12.202244當n為奇數(shù)時,Me=中間位置的05.01.202345當n為偶數(shù)時,Me=中間位置兩側的兩個變量值的簡單平均。原始數(shù)據(jù):105 91268排序: 56891012位置: 123

4

56位置N+126+123.5中位數(shù)8+928.525.12.202245當n為偶數(shù)時,Me=中間位置兩側的05.01.2023461、由單項數(shù)列確定中位數(shù)(二)根據(jù)分組資料確定中位數(shù)25.12.2022461、由單項數(shù)列確定中位數(shù)05.01.202347中點位置=(181+1)/2=第91個人

Me

應是第91個人的年齡

Me=18歲25.12.202247中點位置=(181+1)/2=第9105.01.202348(二)根據(jù)組距數(shù)列確定中位數(shù)式中:L為中位數(shù)所在組的下限,U為上限;

i為中位數(shù)所在組的組距;Sm-1

為小于中位數(shù)的各組次數(shù)之和;Sm+1為大于中位數(shù)的各組次數(shù)之和;

fm為中位數(shù)所在組的次數(shù)。25.12.202248(二)根據(jù)組距數(shù)列確定中位數(shù)式中:05.01.202349[例]下限公式:上限公式:并且:25.12.202249[例]下限公式:05.01.202350

注意的問題:(1)中位數(shù)不受極端值的影響,比較穩(wěn)健。(2)中位數(shù)的取值只與中間位置的一或兩個數(shù)值有關,利用信息不充分,忽略了其它數(shù)據(jù)的大小,并且不適合于代數(shù)運算。25.12.202250注意的問題:05.01.202351

眾數(shù)是觀察值中出現(xiàn)得最多的變量值。用Mo表示。在數(shù)據(jù)集中,眾數(shù)組是出現(xiàn)頻率最高的一組。數(shù)據(jù)集可能有一個眾數(shù)(組),或兩(多)個眾數(shù)(組)。五、Mode眾數(shù)25.12.202251眾數(shù)是觀察值中出現(xiàn)得05.01.202352Themodalclass眾數(shù)組Forlargedatasetsthemodalclassismuchmorerelevantthantheasingle-valuemode.對于大的數(shù)據(jù)集來說,眾數(shù)組比單個眾數(shù)更合適。25.12.202252ThemodalclassFor05.01.202353TypesofMode眾數(shù)的種類Nomode無眾數(shù)data:10591268Mode:一個眾數(shù)

data:65

9855Bimodal:雙眾數(shù)data:252828

364242Multimodal:多眾數(shù)

data:3232

32333434343536363625.12.202253TypesofMode眾數(shù)的05.01.202354有時眾數(shù)是一個合適的代表值

比如在服裝行業(yè)中,生產(chǎn)商、批發(fā)商和零售商在做有關生產(chǎn)或存貨的決策時,更感興趣的是最普遍的尺寸而不是平均尺寸。

25.12.202254有時眾數(shù)是一個合適的代表值比如在服05.01.202355STAT

五、眾數(shù)眾數(shù)是指總體中出現(xiàn)次數(shù)最多的變量值,用Mo表示。A、20,15,18,20,20,22,20,23;n=8Mo=20B、20,20,15,19,19,20,19,25;n=8Mo=20Mo=19C、10,11,13,16,15,25,8,12;n=8,但沒有眾數(shù)(一)由單項數(shù)列確定眾數(shù)在單項數(shù)列中,出現(xiàn)次數(shù)最多的變量值就是眾數(shù)。確定眾數(shù)組確定眾數(shù):Mo=1825.12.202255STAT五、眾數(shù)05.01.202356式中:

L為眾數(shù)組的下限,U為上限;

i為眾數(shù)組的組距;1=fm-fm-1,即眾數(shù)組的次數(shù)與前一組次數(shù)之差;

2=fm-fm+1,即眾數(shù)組的次數(shù)與后一組次數(shù)之差。

(二)由組距數(shù)列確定眾數(shù)確定眾數(shù)組再用下述公式計算:25.12.202256式中:(二)由組距數(shù)列確定眾數(shù)05.01.2023574050607080901005040302010AGFBCED人數(shù)產(chǎn)值xy(L)(U)Mo=L+x=U-yO25.12.202257405005.01.202358STAT4050607080901005040302010AGFBCED人數(shù)產(chǎn)值xy(L)(U)Mo=L+x=U-yO第2章描述統(tǒng)計學25.12.202258STAT405005.01.202359眾數(shù)取值的特點:

眾數(shù)的數(shù)值始終偏向相鄰組中次數(shù)較大的組,當相鄰兩組的次數(shù)相等時,眾數(shù)則是眾數(shù)組的組中值。注意的問題:(1)優(yōu)點:不受極端值的影響。(2)缺點:未利用所有信息,缺乏敏感性和不適合代數(shù)運算。(3)可用于反映質量變量的集中趨勢。25.12.202259眾數(shù)取值的特點:05.01.202360六、集中趨勢測度指標的比較

(一)各種數(shù)值平均數(shù)的比較適用場合不同。若總體標志總量等于總體各單位變量值之和,可采用算術平均數(shù)計算;若總體標志總量等于總體各單位變量值之積,則應采用幾何平均數(shù)計算某些數(shù)值平均數(shù)對于被平均變量的取值有著特殊的限制。25.12.202260六、集中趨勢測度指標的比較

(一)05.01.202361(二)數(shù)值平均數(shù)與位置平均數(shù)的比較

數(shù)值平均數(shù)對于數(shù)據(jù)的概括能力比位置平均數(shù)更強。數(shù)值平均數(shù)對于數(shù)據(jù)變化的“靈敏度”很高。對極端值的“耐抗性”較低;位置平均數(shù)的“靈敏度”較低,但“耐抗性”卻很強。數(shù)值平均數(shù)只適用于定距尺度和定比尺度的數(shù)據(jù):位置平均數(shù)還適用于各種定序尺度的數(shù)據(jù),眾數(shù)甚至還適用于各種定類尺度的數(shù)據(jù)。25.12.202261(二)數(shù)值平均數(shù)與位置平均數(shù)的比較

05.01.202362(三)中位數(shù)、眾數(shù)和算術平均數(shù)的關系對稱分布

均值=中位數(shù)=眾數(shù)左偏分布均值

中位數(shù)

眾數(shù)右偏分布眾數(shù)

中位數(shù)

均值25.12.202262(三)中位數(shù)、眾數(shù)和算術平均數(shù)的關系05.01.202363

卡爾?皮爾遜經(jīng)驗公式:適度偏斜情況下,眾數(shù)與中位數(shù)之間的距離,大約為中位數(shù)到算術平均數(shù)之間距離的兩倍。25.12.202263卡爾?皮爾遜經(jīng)驗公式:適度偏斜情況05.01.202364平均指標只能反映現(xiàn)象的集中趨勢而不能反映總體各單位標志值的差異程度。例

集中趨勢和離散程度是總體分布的兩個重要特征。離散趨勢指標是反映總體各單位標志值差異(離散)程度的指標。又稱標志變動指標、離散程度指標等。平均指標與離散趨勢指標的區(qū)別:平均指標考慮的是如何消除離差,顯示集中趨勢。而離散趨勢指標考慮的是如何計算離差,反映離散的程度及離差的大小。2.3變異程度測定25.12.202264平均指標只能反映現(xiàn)象的集中趨勢而不能05.01.202365

離散趨勢指標作用:

1、衡量平均數(shù)代表性的大小25.12.202265離散趨勢指標作用05.01.202366

2、反映變量值分布的離中趨勢和離散程度

25.12.2022662、反映變量值分布的離中趨勢05.01.2023673、反映社會經(jīng)濟現(xiàn)象的均衡性和穩(wěn)定性如甲、乙兩工廠某年四個季度的產(chǎn)量資料如下(單位:萬件):甲:65、68、72、75,平均每季產(chǎn)量為70萬件;乙:34,51,95,100,平均每季產(chǎn)量為70萬件。描述數(shù)據(jù)離散趨勢的指標主要有全距、平均差、標準差、方差及變異系數(shù)等。25.12.2022673、反映社會經(jīng)濟現(xiàn)象的均衡性和穩(wěn)定05.01.202368

一、全距全距是總體各單位某一數(shù)量標志的最大值與最小值之差。全距(R)=最大值—最小值特點1、優(yōu)點:意義明確,簡單方便。

2、缺點:比較粗略,未考慮中間變量值的離散情況。25.12.202268一、全距全距是總體各單位某一數(shù)量標05.01.202369平均差是各變量值對其算術平均數(shù)離差絕對值的算術平均數(shù)。常用“A·D”表示。(一)根據(jù)未分組資料計算

二、平均差

(二)根據(jù)分組資料計算25.12.202269平均差是各變量值對其算術平均數(shù)離差絕05.01.202370簡單平均差計算舉例:表2-125.12.202270簡單平均差計算舉例:表2-105.01.202371加權平均差計算25.12.202271加權平均差計算05.01.202372

平均差的特點:(1)充分考慮了每一數(shù)值的離中情況,在反映離中趨勢方面比較靈敏,計算方法亦比較簡單。(2)絕對值運算給數(shù)學處理帶來很多不便。25.12.202272平均差的特點:05.01.202373⑴簡單標準差——適用于未分組資料是各個數(shù)據(jù)與其算術平均數(shù)的離差平方的算術平均數(shù)的開平方根,用來表示;標準差的平方又叫作方差,用來表示。三、標準差計算公式:總體單位總數(shù)第個單位的變量值總體算術平均數(shù)25.12.202273⑴簡單標準差——適用于未分組資料是05.01.202374【例A】某售貨小組5個人,某天的銷售額分別為440元、480元、520元、600元、750元,求該售貨小組銷售額的標準差。解:(比較:其銷售額的平均差為93.6元)即該售貨小組銷售額的標準差為109.62元。25.12.202274【例A】某售貨小組5個人,某天的銷售05.01.202375⑵加權標準差——適用于分組資料標準差的計算公式總體算術平均數(shù)第組變量值出現(xiàn)的次數(shù)第組的變量值或組中值25.12.202275⑵加權標準差——適用于分組資料標準05.01.202376【例B】計算下表中某廠工人日檢查產(chǎn)品數(shù)量的標準差。日檢查產(chǎn)品數(shù)量(件)組中值(件)工人數(shù)(人)40~5050~6060~7070~8080~9045556575852590505035合計—250某廠工人日檢查產(chǎn)品數(shù)量表25.12.202276【例B】計算下表中某廠工人日檢查產(chǎn)品05.01.202377解:(教材P71錯誤)即該廠工人日檢查產(chǎn)品的標準差為12件。25.12.202277解:(教材P71錯誤)即該廠工人日05.01.202378標準差的特點不易受極端數(shù)值的影響,能綜合反映全部單位標志值的實際差異程度;用平方的方法消除各標志值與算術平均數(shù)離差的正負值問題,可方便地用于數(shù)學處理和統(tǒng)計分析運算.由同一資料計算的標準差的結果一般要略大于平均差。25.12.202278標準差的特點不易受極端數(shù)值的影響,能05.01.202379

(二)標準差和方差的簡捷計算25.12.202279(二)標準差和方差的簡捷計算05.01.202380

例如,某班50名學生英語考試成績及格人數(shù)39人,不及格人數(shù)11人。則:

(三)是非標志標準差的計算25.12.202280例如,某班50名學生英05.01.202381

(四)方差的加法定理資料分組后:25.12.202281(四)方差的加法定理資料分組后:05.01.202382[例]某鄉(xiāng)9戶專業(yè)織襪戶擁有織襪機如下:2、2、3、4、6、7、8、10、12臺試求其總方差。

平均組內方差:各組內方差的平均數(shù)。25.12.202282[例]某鄉(xiāng)9戶專業(yè)織襪戶擁有織襪機如05.01.202383原始數(shù)據(jù)分組按織襪機太數(shù)分組戶數(shù)(戶)ni臺數(shù)(臺)組平均數(shù)(臺)

1~44112.7542.355~8321739~122221150合計954

95.25表2-13某鄉(xiāng)織襪專業(yè)戶資料25.12.202283原始數(shù)據(jù)分組按織襪機太數(shù)分組戶數(shù)(戶05.01.202384總方差:25.12.202284總方差:05.01.202385可比變異系數(shù)指標四、變異系數(shù)25.12.202285可比變異系數(shù)指標四、變異系數(shù)05.01.202386身高的差異水平:cm體重的差異水平:kg用變異系數(shù)可以相互比較可比25.12.202286身高的差異水平:cm體重的差異水平:05.01.202387

變異系數(shù)計算公式:25.12.202287變異系數(shù)計算公式:05.01.202388STAT

判定原則:

越大,說明數(shù)據(jù)越分散,的代表性越小;

越小,說明數(shù)據(jù)越集中,的代表性越大。同理:越大,說明數(shù)據(jù)越分散,的代表性越??;越小,說明數(shù)據(jù)越集中,的代表性越大。25.12.202288STAT判定原則:越大,說明05.01.202389一、z分數(shù)

z分數(shù)通常被稱為標準化數(shù)值。z可以解釋為觀察值偏離平均數(shù)的標準差個數(shù)。

2.4相對位置測度及異常值的檢測25.12.2022892.4相對位置測度及異常值05.01.202390標準分數(shù)(例題分析)9個家庭人均月收入標準分數(shù)計算表家庭編號人均月收入(元)標準分數(shù)z

123456789150075078010808509602000125016300.695-1.042-0.973-0.278-0.811-0.5561.8530.1160.996Indicatethatx1is0.695standarddeviationsgreaterthanthesamplemean.表示家庭人均收入與平均數(shù)相比高0.695個標準差。Indicatethatx2is1.042standarddeviationslessthanthesamplemean.表示家庭人均收入與平均數(shù)相比低1.042個標準差。兩個不同的數(shù)據(jù)集若標準分數(shù)相同,則表明它們有相同的相對位置。25.12.202290標準分數(shù)(例題分析)9個家庭人均月05.01.202391二、切貝謝夫定理

在任何數(shù)據(jù)集中,出現(xiàn)在算術平均數(shù)左右Z倍范圍之內的數(shù)據(jù)比例至少為(1–1/Z2),Z是大于1的任意數(shù)值。25.12.202291二、切貝謝夫定理在任何數(shù)據(jù)集中,出05.01.202392至少為0至少為75至少為89[例]有一組顧客購物付款時等候時間的資料,已知等候時間的均值為4分鐘,標準差為0.9分鐘,則25.12.202292至少為0[例]有一組顧客購物付款時05.01.202393-3-2-1123三、經(jīng)驗法則當資料呈對稱分布時,則有25.12.202293-3-2-1演講完畢,謝謝觀看!演講完畢,謝謝觀看!05.01.202395本資料來源25.12.20221本資料來源05.01.202396第2章描述統(tǒng)計學

案例導入

在一家財產(chǎn)保險公司的董事會上,董事們就公司的發(fā)展戰(zhàn)略問題展開了激烈討論,其中一個引人關注的問題就是如何借鑒國外保險公司的先進管理經(jīng)驗,提高自身的管理水平。有的董事提出,2005年公司的各項業(yè)務與去年相比沒有太大增長,除經(jīng)濟環(huán)境和市場競爭等因素外,對家庭財產(chǎn)保險的業(yè)務開展得不夠,公司在管理方式上也存在問題。他認為,中國的家庭財產(chǎn)保險市場潛力巨大,應加大擴展這一業(yè)務的力度,同時,應對公司家庭財產(chǎn)推銷員實行目標管理,并根據(jù)目標完成情況建立相應的獎懲制度。董事長認為該董事的建議有一定道理,準備采納。會后,他責成計劃部經(jīng)理盡快拿出具體的實施方案。

25.12.20222第2章描述統(tǒng)計學05.01.202397

計劃部經(jīng)理接到任務后感到有些頭痛。如果目標定得過高,多數(shù)推銷員完不成任務,會使推銷員失去信心;如果定得過低,將不利于充分挖掘員工的工作潛力,提高公司的業(yè)績水平。于是,計劃部經(jīng)理將公司160個推銷員的月銷售額分別作了統(tǒng)計,統(tǒng)計數(shù)據(jù)如表2-1所示。如果你是計劃部經(jīng)理,觀察這160個原始數(shù)據(jù)后,準備如何來制定具體的銷售目標呢?25.12.20223計劃部經(jīng)理接到任務后感05.01.202398本章重點1、描述統(tǒng)計數(shù)據(jù)分布特征的圖表法;2、數(shù)據(jù)中心位置測度的種類與方法;(1)計算平均數(shù):算術平均數(shù)、調和平均數(shù)、幾何平均數(shù);(2)位置平均數(shù):中位數(shù)、眾數(shù)、分位數(shù)。3、變異性的測度:全距、平均差、方差、標準差、變異系數(shù);4、相對位置的測度:z分數(shù)、切貝雪夫定理、經(jīng)驗法則。本章難點1、算術平均數(shù);2、方差與標準差。25.12.20224本章重點05.01.202399第一節(jié)圖表法一、次數(shù)分布

(一)、次數(shù)分布的概念及類型

次數(shù):分布在各組的單位數(shù)(f)

頻率:各組次數(shù)與總次數(shù)的比重用f/f表示;

25.12.20225第一節(jié)圖表法一、次數(shù)分布05.01.2023100變量數(shù)列屬性數(shù)列將總體按某個標志分成若干組,在按一定順序進行歸并排列,形成總體單位數(shù)在各組間的分布。次數(shù)分布分類分組(標志的具體表現(xiàn))各組的單位數(shù)(次數(shù)或頻數(shù))構成要素異距數(shù)列等距數(shù)列組距數(shù)列單值數(shù)列單項式數(shù)列25.12.20226變量數(shù)列屬性數(shù)列將總體按某個標志分成若05.01.2023101企業(yè)職工性別情況的分配數(shù)列(品質數(shù)列)性別職工人數(shù)(個)女男680520合計1200

某地區(qū)企業(yè)銷售收入情況的分配數(shù)列(變量數(shù)列)銷售收入(萬元)企業(yè)數(shù)(個)80-9090-100100-110110-12024166合計2825.12.20227企業(yè)職工性別情況的分配數(shù)列(品質數(shù)列)05.01.2023102按銷售額分組(千元)人數(shù)(人)f12以下12-1414-1616-1818-2020-2222-2424-2626-2828以上6132936251714974合計160表2-3某保險公司160名推銷員銷售額分組數(shù)據(jù)25.12.20228按銷售額分組(千元)人數(shù)(人)f105.01.2023103組距數(shù)列指每個組的變量值用一個區(qū)間來表現(xiàn)的變量數(shù)列變量是連續(xù)變量;或:總體單位數(shù)較多,變量不同取值個數(shù)也較多的離散變量。

編制條件:25.12.20229組距數(shù)列指每個組的變量值用一個區(qū)間來表05.01.2023104相關概念指每組兩端表示各組界限的變量值,各組的最小值為下限,最大值為上限組限每組變量值變動區(qū)間的長度,為上下限之差組距每組變量取值范圍的中點數(shù)值組中值組中值=25.12.202210相關概念指每組兩端表示各組界限的變量05.01.2023105某地區(qū)100個百貨商店月銷售額與流通費用情況銷售額(萬元)商店數(shù)(個)每百元商品銷售額中支付的流通費(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5上組限U下組限L如:組距d=U-L=100-50=50(萬元)如:組中值x=(U+L)/2=(100+200)/2=150(萬元)25.12.202211某地區(qū)100個百貨商店銷售額(萬元)05.01.2023106對于離散變量,相鄰組組限可以間斷,也可重疊;對于連續(xù)變量,相鄰組組限必須重疊;符合“上組限不計入”原則;首末兩組可使用“××以下”及“××以上”的開口組。組限的表示方法25.12.202212對于離散變量,相鄰組組限可以間斷,也05.01.2023107開口式組距數(shù)列組中值的計算:

首組假定下限=首組上限-相鄰組組距末組假定上限=末組下限+相鄰組組距先計算開口組的假定上、下限:

因此有:首組組中值末組組中值25.12.202213開口式組距數(shù)列組中值的計算:05.01.2023108例:30名同齡兒童身高(cm):106,99,85,121,84,94,106,105,110,119,101,95,91,87,105,106,109,118,96,128,91,97,105,111,111,107,103,101,107,106。(1)將變量值按大小次序排列84,85,87,91,91,94,95,96,97,99,101,101,103,105,105,105,106,106,106,106,107,107,109,110,111,111,118,119,121,128。(2)計算全距:R=128-84=44(cm)(3)確定組數(shù)與組距令i=10cm,則組數(shù)n=44/10=4.4,取5組變量數(shù)列的編制。25.12.202214例:30名同齡兒童身高(cm):變量05.01.202310984,85,87,91,91,94,95,96,97,99,101,101,103,105,105,105,106,106,106,106,107,107,109,110,111,111,118,119,121,128。(4)編制變量數(shù)列25.12.20221584,85,87,91,91,94,05.01.2023110(二)、次數(shù)分布的主要類型1、鐘形分布分布特征:中間大、兩頭小。鐘形分布進一步區(qū)分為:(1)對稱分布(2)偏態(tài)分布正偏:又稱右偏,有極大值;負偏:又稱左偏,有極小值。右偏左偏25.12.202216(二)、次數(shù)分布的主要類型1、鐘形分05.01.20231112、U形分布3、J形分布分布特征:一邊大、一邊小。(1)正J分布:右大左??;次數(shù)隨變量值的增大而增多(2)反J分布:左大右?。淮螖?shù)隨變量值的增大而減少死亡率年齡分布特征:兩頭大、中間小。25.12.2022172、U形分布死亡率年齡05.01.2023112二、直方圖1、直方圖:直方圖是用直方形的高度和寬度來表示次數(shù)分布特征的圖形。橫軸表示變量;縱軸表示次數(shù)。寬表示組距,高表示次數(shù)。

2、折線圖將組中值用折線連接而成。曲線圖當組數(shù)無限增多,則組距無限減小,此時折線趨近于曲線。身高15129638090100110120130人數(shù)25.12.202218二、直方圖1、直方圖:直方圖是用直方05.01.2023113分組數(shù)據(jù)—直方圖

(直方圖的繪制)日加工零件數(shù)(個)圖某電腦公雖銷售量分布的直方圖我一眼就看出來了,大多數(shù)天的日銷售臺數(shù)在170~180之間!直方圖下的面積之和等于1頻數(shù)(臺)25.12.202219分組數(shù)據(jù)—直方圖

(直方圖的繪制)日05.01.2023114

將變量數(shù)列各組的次數(shù)和比率逐組累計相加而成累計次數(shù)分布,它表明總體在某一變量值的某一水平上下總共包含的總體次數(shù)和比率。累計分布分為向上累計和向下累計。組距數(shù)列中的向上累計,表明各組上限以下總共所包含的總體次數(shù)和比率有多少。組距數(shù)列中的向下累計,表明各組下限以上總共所包含的總體次數(shù)和比率有多少。三、累計分布圖25.12.202220三、累計分布圖05.01.20231152.2均值測度

次數(shù)分配數(shù)列的兩個重要特征:集中趨勢與離中趨勢。集中趨勢:反映一組數(shù)據(jù)向分布的中心集中的趨勢。離中趨勢:反映一組數(shù)據(jù)遠離中心的趨勢。測定集中趨勢的指標主要有均值。25.12.2022212.2均值測度05.01.2023116

基本公式=總體標志總量/總體單位總量(一)簡單算術平均數(shù)

適用未分組或各變量值出現(xiàn)次數(shù)相同資料一、算術平均數(shù)25.12.202222基本公式=總體標志總量05.01.2023117簡單均值

SimpleMean原始數(shù)據(jù): 10 5 9 13 6 825.12.202223簡單均值

SimpleMean原05.01.2023118(二)加權算術平均數(shù)適用已分組資料

注意:加權算術平均數(shù)不僅受各組變量值大小的影響,還受各組次數(shù)多少的影響。次數(shù)因其對平均的結果有權衡輕重的作用,因此,也叫權數(shù)。25.12.202224(二)加權算術平均數(shù)適用已分組資料05.01.2023119加權均值(WeightedMean)【例2.3】根據(jù)第三章表3-9中的數(shù)據(jù),計算電腦銷售量的平均數(shù)表2-5加權平均數(shù)計算表25.12.202225加權均值(WeightedMea05.01.2023120加權均值

(權數(shù)對均值的影響)

甲乙兩組各有10名學生,他們的考試成績及其分布數(shù)據(jù)如下

甲組:考試成績(X): 020100

人數(shù)分布(F):118

乙組:考試成績(X): 020100

人數(shù)分布(F):811x甲0×1+20×1+100×8n10i=1xi82(分)x乙0×8+20×1+100×1n10i=1xi12(分)25.12.202226加權均值

(權數(shù)對均值的影響)05.01.2023121權數(shù)與加權23456781925.12.202227權數(shù)與加權23456781905.01.2023122權數(shù)與加權23456781925.12.202228權數(shù)與加權23456781905.01.2023123權數(shù)與加權23456781925.12.202229權數(shù)與加權23456781905.01.2023124

權數(shù)的種類:

A、絕對權數(shù)(次數(shù))fB、相對權數(shù)(頻率或比重)f/f

只有當各組的次數(shù)不相等時,次數(shù)才具有權數(shù)的作用。

由此可見,簡單算術平均數(shù)是加權算術平均數(shù)的一個特例。25.12.202230權數(shù)的種類:由此可見,簡單算05.01.2023125A:是非標志——將總體全部單位劃分為“是”或“否”兩類的標志

(三)是非標志平均數(shù)25.12.202231A:是非標志——將總體全部單位劃分為05.01.2023126B、啞變量(0—1變量)25.12.202232B、啞變量(0—1變量)05.01.2023127【例】設X=(2,4,6,8),則其調和平均數(shù)可由定義計算如下:⒉再求算術平均數(shù):⒈求各標志值的倒數(shù):,,,⒊再求倒數(shù):是總體各單位標志值倒數(shù)的算術平均數(shù)的倒數(shù),又叫倒數(shù)平均數(shù)二、調和平均數(shù)harmean(harmonicmean)25.12.202233【例】設X=(2,4,6,8),則05.01.2023128[例]某種蔬菜早上0.4元/斤,中午0.25元/斤,晚上0.20元/斤,某人各買1斤,求平均價格。(算術平均法)

[例]類似地某人早、中、晚各買1元,求平均價格。

(一)簡單調和平均數(shù)(各變量值均為一個單位時使用)25.12.202234[例]某種蔬菜早上0.4元/斤,中午05.01.2023129式中:x代表各個變量值,n代表變量值項數(shù)25.12.202235式中:x代表各個變量值,n代表變量值05.01.2023130二.加權調和平均數(shù)——適用于總體資料經(jīng)過分組整理形成變量數(shù)列的情況式中:為第組的變量值;為第組的標志總量。25.12.202236二.加權調和平均數(shù)——適用于總體資05.01.2023131解:例:晚上白菜0.3元/斤,菠菜0.5元/斤,芹菜0.6元/斤,小王買了2元白菜,3元菠菜,4元芹菜,問平均每斤菜的價格?25.12.202237解:例:晚上白菜0.3元/斤,菠菜005.01.2023132[例]某局所屬四個企業(yè)有關資料如下,試計算該工業(yè)局的產(chǎn)值平均計劃完成百分比。25.12.202238[例]某局所屬四個企業(yè)有關資料如下05.01.2023133

算術平均數(shù)與調和平均數(shù)的適用前提:

A、已知基本公式母項資料用算術平均數(shù)計算

(子項資料未知)B、已知基本公式子項資料用調和平均數(shù)計算(母項資料未知)

調和平均數(shù)是算術平均數(shù)的變形原來只是計算時使用了不同的數(shù)據(jù)!25.12.202239算術平均數(shù)與調和平均數(shù)05.01.2023134

是N項變量值連乘積的開N

次方根三、幾何平均數(shù)Geomean(geomatricmean)用于計算現(xiàn)象的平均比率或平均速度應用各個比率或速度的連乘積等于總比率或總速度;相乘的各個比率或速度不為零或負值。應用的前提條件:25.12.202240是N項變量值連乘積的開N三、05.01.2023135A.簡單幾何平均數(shù)——適用于總體資料未經(jīng)分組整理尚為原始資料的情況式中:為幾何平均數(shù);為變量值的個數(shù);為第個變量值。幾何平均數(shù)的計算方法25.12.202241A.簡單幾何平均數(shù)——適用于總體資05.01.2023136(二)加權幾何平均數(shù)

注意:當觀察值有一項為零或負值時,不宜用幾何平均數(shù)計算。如用同一數(shù)據(jù)分別計算算術平均數(shù)、調和平均數(shù)和幾何平均數(shù)時,則有如下關系:25.12.202242(二)加權幾何平均數(shù)注意:當觀察值05.01.2023137四、中位數(shù)

把總體各變量值按大小順序排列起來,處于中點位置的變量值就是中位數(shù),用“Me”表示。(一)根據(jù)未分組資料確定中位數(shù)25.12.202243四、中位數(shù)把總體各變05.01.2023138當n為奇數(shù)時,Me=中間位置的那個變量值;原始數(shù)據(jù):

2422212620排序: 2021222426位置: 123

45中位數(shù)2225.12.202244當n為奇數(shù)時,Me=中間位置的05.01.2023139當n為偶數(shù)時,Me=中間位置兩側的兩個變量值的簡單平均。原始數(shù)據(jù):105 91268排序: 56891012位置: 123

4

56位置N+126+123.5中位數(shù)8+928.525.12.202245當n為偶數(shù)時,Me=中間位置兩側的05.01.20231401、由單項數(shù)列確定中位數(shù)(二)根據(jù)分組資料確定中位數(shù)25.12.2022461、由單項數(shù)列確定中位數(shù)05.01.2023141中點位置=(181+1)/2=第91個人

Me

應是第91個人的年齡

Me=18歲25.12.202247中點位置=(181+1)/2=第9105.01.2023142(二)根據(jù)組距數(shù)列確定中位數(shù)式中:L為中位數(shù)所在組的下限,U為上限;

i為中位數(shù)所在組的組距;Sm-1

為小于中位數(shù)的各組次數(shù)之和;Sm+1為大于中位數(shù)的各組次數(shù)之和;

fm為中位數(shù)所在組的次數(shù)。25.12.202248(二)根據(jù)組距數(shù)列確定中位數(shù)式中:05.01.2023143[例]下限公式:上限公式:并且:25.12.202249[例]下限公式:05.01.2023144

注意的問題:(1)中位數(shù)不受極端值的影響,比較穩(wěn)健。(2)中位數(shù)的取值只與中間位置的一或兩個數(shù)值有關,利用信息不充分,忽略了其它數(shù)據(jù)的大小,并且不適合于代數(shù)運算。25.12.202250注意的問題:05.01.2023145

眾數(shù)是觀察值中出現(xiàn)得最多的變量值。用Mo表示。在數(shù)據(jù)集中,眾數(shù)組是出現(xiàn)頻率最高的一組。數(shù)據(jù)集可能有一個眾數(shù)(組),或兩(多)個眾數(shù)(組)。五、Mode眾數(shù)25.12.202251眾數(shù)是觀察值中出現(xiàn)得05.01.2023146Themodalclass眾數(shù)組Forlargedatasetsthemodalclassismuchmorerelevantthantheasingle-valuemode.對于大的數(shù)據(jù)集來說,眾數(shù)組比單個眾數(shù)更合適。25.12.202252ThemodalclassFor05.01.2023147TypesofMode眾數(shù)的種類Nomode無眾數(shù)data:10591268Mode:一個眾數(shù)

data:65

9855Bimodal:雙眾數(shù)data:252828

364242Multimodal:多眾數(shù)

data:3232

32333434343536363625.12.202253TypesofMode眾數(shù)的05.01.2023148有時眾數(shù)是一個合適的代表值

比如在服裝行業(yè)中,生產(chǎn)商、批發(fā)商和零售商在做有關生產(chǎn)或存貨的決策時,更感興趣的是最普遍的尺寸而不是平均尺寸。

25.12.202254有時眾數(shù)是一個合適的代表值比如在服05.01.2023149STAT

五、眾數(shù)眾數(shù)是指總體中出現(xiàn)次數(shù)最多的變量值,用Mo表示。A、20,15,18,20,20,22,20,23;n=8Mo=20B、20,20,15,19,19,20,19,25;n=8Mo=20Mo=19C、10,11,13,16,15,25,8,12;n=8,但沒有眾數(shù)(一)由單項數(shù)列確定眾數(shù)在單項數(shù)列中,出現(xiàn)次數(shù)最多的變量值就是眾數(shù)。確定眾數(shù)組確定眾數(shù):Mo=1825.12.202255STAT五、眾數(shù)05.01.2023150式中:

L為眾數(shù)組的下限,U為上限;

i為眾數(shù)組的組距;1=fm-fm-1,即眾數(shù)組的次數(shù)與前一組次數(shù)之差;

2=fm-fm+1,即眾數(shù)組的次數(shù)與后一組次數(shù)之差。

(二)由組距數(shù)列確定眾數(shù)確定眾數(shù)組再用下述公式計算:25.12.202256式中:(二)由組距數(shù)列確定眾數(shù)05.01.20231514050607080901005040302010AGFBCED人數(shù)產(chǎn)值xy(L)(U)Mo=L+x=U-yO25.12.202257405005.01.2023152STAT4050607080901005040302010AGFBCED人數(shù)產(chǎn)值xy(L)(U)Mo=L+x=U-yO第2章描述統(tǒng)計學25.12.202258STAT405005.01.2023153眾數(shù)取值的特點:

眾數(shù)的數(shù)值始終偏向相鄰組中次數(shù)較大的組,當相鄰兩組的次數(shù)相等時,眾數(shù)則是眾數(shù)組的組中值。注意的問題:(1)優(yōu)點:不受極端值的影響。(2)缺點:未利用所有信息,缺乏敏感性和不適合代數(shù)運算。(3)可用于反映質量變量的集中趨勢。25.12.202259眾數(shù)取值的特點:05.01.2023154六、集中趨勢測度指標的比較

(一)各種數(shù)值平均數(shù)的比較適用場合不同。若總體標志總量等于總體各單位變量值之和,可采用算術平均數(shù)計算;若總體標志總量等于總體各單位變量值之積,則應采用幾何平均數(shù)計算某些數(shù)值平均數(shù)對于被平均變量的取值有著特殊的限制。25.12.202260六、集中趨勢測度指標的比較

(一)05.01.2023155(二)數(shù)值平均數(shù)與位置平均數(shù)的比較

數(shù)值平均數(shù)對于數(shù)據(jù)的概括能力比位置平均數(shù)更強。數(shù)值平均數(shù)對于數(shù)據(jù)變化的“靈敏度”很高。對極端值的“耐抗性”較低;位置平均數(shù)的“靈敏度”較低,但“耐抗性”卻很強。數(shù)值平均數(shù)只適用于定距尺度和定比尺度的數(shù)據(jù):位置平均數(shù)還適用于各種定序尺度的數(shù)據(jù),眾數(shù)甚至還適用于各種定類尺度的數(shù)據(jù)。25.12.202261(二)數(shù)值平均數(shù)與位置平均數(shù)的比較

05.01.2023156(三)中位數(shù)、眾數(shù)和算術平均數(shù)的關系對稱分布

均值=中位數(shù)=眾數(shù)左偏分布均值

中位數(shù)

眾數(shù)右偏分布眾數(shù)

中位數(shù)

均值25.12.202262(三)中位數(shù)、眾數(shù)和算術平均數(shù)的關系05.01.2023157

卡爾?皮爾遜經(jīng)驗公式:適度偏斜情況下,眾數(shù)與中位數(shù)之間的距離,大約為中位數(shù)到算術平均數(shù)之間距離的兩倍。25.12.202263卡爾?皮爾遜經(jīng)驗公式:適度偏斜情況05.01.2023158平均指標只能反映現(xiàn)象的集中趨勢而不能反映總體各單位標志值的差異程度。例

集中趨勢和離散程度是總體分布的兩個重要特征。離散趨勢指標是反映總體各單位標志值差異(離散)程度的指標。又稱標志變動指標、離散程度指標等。平均指標與離散趨勢指標的區(qū)別:平均指標考慮的是如何消除離差,顯示集中趨勢。而離散趨勢指標考慮的是如何計算離差,反映離散的程度及離差的大小。2.3變異程度測定25.12.202264平均指標只能反映現(xiàn)象的集中趨勢而不能05.01.2023159

離散趨勢指標作用:

1、衡量平均數(shù)代表性的大小25.12.202265離散趨勢指標作用05.01.2023160

2、反映變量值分布的離中趨勢和離散程度

25.12.2022662、反映變量值分布的離中趨勢05.01.20231613、反映社會經(jīng)濟現(xiàn)象的均衡性和穩(wěn)定性如甲、乙兩工廠某年四個季度的產(chǎn)量資料如下(單位:萬件):甲:65、68、72、75,平均每季產(chǎn)量為70萬件;乙:34,51,95,100,平均每季產(chǎn)量為70萬件。描述數(shù)據(jù)離散趨勢的指標主要有全距、平均差、標準差、方差及變異系數(shù)等。25.12.2022673、反映社會經(jīng)濟現(xiàn)象的均衡性和穩(wěn)定05.01.2023162

一、全距全距是總體各單位某一數(shù)量標志的最大值與最小值之差。全距(R)=最大值—最小值特點1、優(yōu)點:意義明確,簡單方便。

2、缺點:比較粗略,未考慮中間變量值的離散情況。25.12.202268一、全距全距是總體各單位某一數(shù)量標05.01.2023163平均差是各變量值對其算術平均數(shù)離差絕對值的算術平均數(shù)。常用“A·D”表示。(一)根據(jù)未分組資料計算

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論