版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
統(tǒng)計學安徽省重點學科財經(jīng)類核心課程統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
統(tǒng)計資料經(jīng)過加工整理形成分布數(shù)列后,我們對數(shù)據(jù)分布的類型和特征有了一個直觀的了解。然而,要作進一步的統(tǒng)計分析僅靠這些直觀了解是遠遠不夠的。
為進一步掌握數(shù)據(jù)分布的特征和規(guī)律,進行更深入的分析,還需要找到反映數(shù)據(jù)分布特征的各個代表值。
描述指標的分類:
在學習本章之前,首先應概括了解描述數(shù)據(jù)分布特征的測度值(指標)都有哪些。對統(tǒng)計數(shù)據(jù)的分布特征,可以從以下方面進行測度和描述:
描述數(shù)據(jù)分布集中趨勢的指標——反映各數(shù)據(jù)向其中心值靠攏或聚集的程度——變量數(shù)列分布中心位置的度量
;描述數(shù)據(jù)分布離散程度的指標——反映各數(shù)據(jù)遠離其中心值的趨勢——變量數(shù)列分布變異程度的度量
;描述分布偏度與峰度的指標——變量數(shù)列分布形狀的度量。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度第一節(jié)集中趨勢的測度第二節(jié)離散程度的測度第三節(jié)分布偏態(tài)與峰度的測度第五章數(shù)據(jù)分布特征的測度統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度要點學習目的與要求:通過本章學習,掌握平均指標與變異指標的計算方法、應用條件,平均指標與變異指標的關系。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度數(shù)值平均數(shù)位置平均數(shù)平均指標集中趨勢集中趨勢的含義測定集中趨勢的作用第一節(jié)集中趨勢的測度統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度集中趨勢
指總體中總體單位的次數(shù)分布從兩邊向某一中心值集中(靠攏)的趨勢。
在分布數(shù)列中,越靠近中心值,標志值出現(xiàn)的次數(shù)越多,而遠離中心值的次數(shù)較少。
一、集中趨勢的含義
對集中趨勢進行測度就是尋找總體一般水平的中心值或代表值。
變量數(shù)列是以平均數(shù)為中心而上下波動,故平均數(shù)反映了總體分布的集中趨勢,集中趨勢測度就是要計算變量數(shù)列的平均數(shù)
。
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度集中趨勢二、測定集中趨勢的作用集中趨勢是現(xiàn)象共性的特征,是現(xiàn)象規(guī)律性的數(shù)量表現(xiàn)。
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度數(shù)值平均數(shù)位置平均數(shù)平均指標測定集中趨勢的意義平均指標的概念數(shù)值平均數(shù)與位置平均數(shù)第一節(jié)集中趨勢的測度統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度平均指標----總體分布集中趨勢的描述一、平均指標的概念
在同質(zhì)總體內(nèi),將總體各單位在某一標志下的數(shù)量差異抽象化,以反映總體在一定時間、地點和條件下所達到的一般水平的統(tǒng)計綜合指標,也稱統(tǒng)計平均數(shù)(均值)。平均指標是統(tǒng)計中廣泛應用的一種綜合指標。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度平均指標二、數(shù)值平均數(shù)與位置平均數(shù)
取得集中趨勢代表值(即平均數(shù))的方法通常有兩種:一是根據(jù)總體所有標志值計算。即從總體各單位標志值中抽象出具有一般水平的量,這個量不是各個單位的具體標志值,但又要反映總體各單位的一般水平,這種平均數(shù)稱為數(shù)值平均數(shù)。數(shù)值平均數(shù)有算術平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)等形式。
二是根據(jù)標志值所處的位置確定。
即先將總體各單位的標志值按一定順序排列,然后取某一位置的標志值來反映總體各單位的一般水平。把這個特殊位置上的數(shù)值看作是平均數(shù),稱作位置平均數(shù)。位置平均數(shù)有眾數(shù)、中位數(shù)、四分位數(shù)等形式。
數(shù)值平均數(shù)位置平均數(shù)平均指標的概念測定集中趨勢的意義算術平均數(shù)調(diào)和平均數(shù)幾何平均數(shù)統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度第一節(jié)集中趨勢的測度返回
總體中各總體單位的某個數(shù)量標志值的總和與總體單位數(shù)的比值,通常也稱為平均數(shù)(average)或均值(mean)。一般所稱的平均數(shù)常指算術平均數(shù)。用符號表示?!汹厔葜凶钪饕臏y度值
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度數(shù)值平均數(shù)一、算術平均數(shù)1、基本公式
算術平均數(shù)的基本公式要求,總體標志總量必須依附于總體單位數(shù)。
即公式的分子是分母具有的標志值,分母是分子的承擔者。各標志值與各單位之間是一一對應的。例:平均工資=工資總額/職工人數(shù)平均成本=總成本/產(chǎn)量統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度算術平均數(shù)2、計算方法
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度算術平均數(shù)
根據(jù)總體資料是否分組,算術平均數(shù)具體計算方法可分為簡單算術平均數(shù)和加權算術平均數(shù)兩種。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度(1)簡單算術平均數(shù)
如果掌握的資料是總體各單位的標志值,而且沒有經(jīng)過分組,則可先將各單位的(某一)標志值相加得出標志總量,然后再除以總體單位數(shù),通過此種方法計算得到的平均數(shù)稱為簡單算術平均數(shù)。算術平均數(shù)(1)未經(jīng)分組整理的原始數(shù)據(jù)計算算術平均數(shù)
(2)在變量分配數(shù)列中,各組次數(shù)都相等適用條件:設總體各單位標志值為,則:
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度簡單算術平均數(shù)06-07第二學期XX班40名學生《統(tǒng)計學》成績抄錄如下:
89、88、76、99、74、60、82、60、89、86、
92、85、70、93、99、94、82、77、79、97、
78、95、84、79、63、72、87、84、79、65、
98、67、59、83、66、65、73、81、56、77統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度簡單算術平均數(shù)06-07第二學期XX班40名學生《統(tǒng)計學》的平均成績:
簡單算術平均數(shù)之所以簡單,就是因為各個變量值出現(xiàn)的次數(shù)相同,因此,只要把各項變量值簡單相加再用項數(shù)去除就求出平均數(shù)了。
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度簡單算術平均數(shù)
某工廠某生產(chǎn)班組有11名工人,各人日產(chǎn)量為15、17、19、20、22、22、23、23、25、26、30件,求平均日產(chǎn)量。
解:=(15+17+19+20+22+22+23+23+25+26+30)/11=22件開機,2ndF,ON,在0的上方出現(xiàn)STAT15,M+,17,M+,19,M+,20,M+,22,M+,22M+,23M+,23M+,25M+,26M+,30M+,x→M
出現(xiàn)結果22統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度簡單算術平均數(shù)用統(tǒng)計功能計算
例2:5名工人日產(chǎn)零件數(shù)為12,13,14,14,15件,計算平均每人日產(chǎn)量。12,M+,13,M+,14,M+,14,M+,15,M+,RM,,5,=計算結果13.6,注意:每次開機后按x→M鍵,清內(nèi)存。用存儲功能算統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度簡單算術平均數(shù)按成績分組人數(shù)(人)50-6060-7070-8080-9090-1002711128合計(Σ)4089、88、76、99、74、60、82、60、89、86、92、85、70、93、99、94、82、77、79、97、78、95、84、79、63、72、87、84、79、65、98、67、59、83、66、65、73、81、56、77整理分組如何計算平均分數(shù)呢?
07-08第一學期XX班《統(tǒng)計學》成績(2)加權算術平均數(shù)
如果掌握的資料是經(jīng)過分組整理編成了單項數(shù)列或組距數(shù)列,并且每組次數(shù)不同時,就應采用加權算術平均數(shù)的方法計算算術平均數(shù)。
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度算術平均數(shù)
設原始數(shù)據(jù)被分成n組,各組的變量值分別為,各組變量值出現(xiàn)的次數(shù)分別為,則:統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度加權算術平均數(shù)加權算術平均數(shù)的適用條件:
在分配數(shù)列(單項數(shù)列或組距數(shù)列)中,各組變量值的次數(shù)不等。加權算術平均數(shù)統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
①單項式數(shù)列的加權算術平均數(shù)
基本的具體方法是:將各組標志值分別乘以相應的各組單位數(shù)(絕對權數(shù))求出各組標志總量,并加總得到總體標志總量,同時把各組單位數(shù)相加求出總體單位總數(shù),然后用總體標志總量除以總體單位總數(shù),即得算術平均數(shù)。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度加權算術平均數(shù)
例:某企業(yè)工人按日產(chǎn)量分組資料如下:日產(chǎn)量(件)(x)工人人數(shù)(人)(f)(f/∑f)15161718191020305040713203327合計150100要求:根據(jù)資料計算工人的平均日產(chǎn)量。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度返回單項式數(shù)列的加權算術平均數(shù)解:以次數(shù)為權數(shù)計算:=(15×10+16×20+17×30+18×50+19×40)/150=17.6(件)以比重為權數(shù)計算:=15×7%+16×13%+17×20%+18×33%+19×27%=17.6(件)統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度單項式數(shù)列的加權算術平均數(shù)
成績組中值人數(shù)比重(cm)(cm)
(人)(%)
50-60552560-7065717.570-80751127.580-9085123090-10095820
總計40100某班《統(tǒng)計學》成績資料組距數(shù)列加權算術平均數(shù)
組距數(shù)列算術平均數(shù)的計算:以組中值代替變量x,爾后按公式計算。X此時為組中值,因此由此計算出的平均數(shù)是近似值。組距數(shù)列的加權算術平均數(shù)次數(shù)f頻率f/Σf變量值x
次數(shù)f的作用:當比較大的變量值的次數(shù)多時,平均數(shù)就接近于變量值大的一方;當比較小的變量值次數(shù)多時,平均數(shù)就接近于變量值小的一方??梢?,次數(shù)對變量值在平均數(shù)中的影響起著某種權衡輕重的作用,因此被稱為權數(shù)。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
權數(shù):指變量數(shù)列中各組標志值出現(xiàn)的次數(shù),反映了各組的標志值對平均數(shù)的影響程度。
權數(shù)有兩種表現(xiàn)形式:絕對數(shù)權數(shù)和比重權數(shù),即頻數(shù)和頻率。
權數(shù)的意義不同的權數(shù)如何影響平均數(shù)?A、B兩班各10名學生的考試成績?nèi)缦拢篈:marks(x): 020100students(f):118B:marks(x): 020100students(f):811統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度權數(shù)的意義
選擇權數(shù)必須體現(xiàn)標志值對平均數(shù)的作用的大小,它與各組標志值或組中值相乘必須要有實際意義。如:以學號為權數(shù),計算全班統(tǒng)計學平均分數(shù),則其子項“某組考分代表值學號”是沒有實際意義的。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度權數(shù)的意義
又如,匯率決定理論中的購買力平價方法()即是對兩個國家的一籃子商品的價格所進行的加權平均。
例如,學生成績的評定,平時成績占20%,期末卷面成績占80%。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度權數(shù)的意義
簡單算術平均數(shù)其數(shù)值的大小只與變量值的大小有關。加權算術平均數(shù)其數(shù)值的大小不僅受各組變量值大小的影響,而且還受各組變量值出現(xiàn)的次數(shù)即權數(shù)大小的影響。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度權數(shù)的意義當f1=f2=……
=fn=A,如果各組的次數(shù)(權數(shù))均相同,即
則權數(shù)的權衡輕重作用也就消失了。算術平均數(shù)。簡單算術平均數(shù)實質(zhì)上是加權算術平均數(shù)在權數(shù)相等條件下的一個特例。這時,加權算術平均數(shù)會變成簡單統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度簡單算術平均數(shù)與加權算術平均數(shù)(1)集中趨勢的最常用測度值(2)一組數(shù)據(jù)的均衡點所在(3)體現(xiàn)了數(shù)據(jù)的必然性特征(4)易受極端值的影響(5)用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù)統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度算術平均數(shù)練習題:指出下列指標中的算術平均數(shù):①商品銷售額除以商業(yè)服務人員數(shù);②商品銷售額除以商品平均庫存額;③商業(yè)服務人員數(shù)除以該地區(qū)居民數(shù);④該地區(qū)居民數(shù)除以商業(yè)服務人員數(shù);⑤某商品銷售額除以該商品銷售量。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
算術平均數(shù)在統(tǒng)計學中有著重要的地位,它是進行統(tǒng)計分析和統(tǒng)計推斷的基礎,下面有關算術平均數(shù)的命題是其重要的數(shù)學性質(zhì)。1.算術平均數(shù)與總體單位總量的乘積等于總體標志總量。2.各變量值與算術平均數(shù)的離差之和等于零:3.各變量值與算術平均數(shù)的離差平方和為最小值。(這一性質(zhì)說明算術平均數(shù)是誤差最小的總體代表值)統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度算術平均數(shù)的數(shù)學性質(zhì)1、它是一個抽象化的數(shù)值(因為它將總體各單位具體的數(shù)量差異抽象掉了)
2、它是一個代表性數(shù)值(因為它用一個數(shù)值來代表總體各單位在具體條件下的一般水平)
3、它是一個特征值(因為它反映了總體分布的集中趨勢)和母項具有依存關系。4、只能對同質(zhì)總體求平均數(shù),計算平均數(shù)所依據(jù)的子項統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度算術平均數(shù)的特點
1.反映總體各單位變量分布的集中趨勢和一般水平??捎糜谕惉F(xiàn)象在不同空間的對比;
2.反映同類現(xiàn)象在不同時間的發(fā)展水平,可用于同類現(xiàn)象在不同時間的對比;
3.作為評判事物的標準;
4.可進行數(shù)量估算。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度平均指標的作用算術平均數(shù)與強度相對數(shù)的比較:相同點:均有平均的含義,一般為復名數(shù)。不同點:
(1)概念不同。強度相對數(shù)是兩個有聯(lián)系而性質(zhì)不同的總量指標對比而形成相對數(shù)指標。算術平均數(shù)是反映同質(zhì)總體單位標志值一般水平的指標。(2)主要作用不同。強度相對數(shù)反映兩不同總體現(xiàn)象形成的密度、強度。算術平均數(shù)反映同一現(xiàn)象在同一總體中的一般水平。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度(3)計算公式及內(nèi)容不同。算術平均數(shù)分子、分母分別是同一總體的標志總量和總體單位數(shù),分子、分母的元素具有一一對應的關系,而強度相對數(shù)是兩個總體現(xiàn)象之比,分子分母沒有一一對應關系。
比較:人均糧食消費量、人均糧食產(chǎn)量統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
在統(tǒng)計中,經(jīng)常需要將研究總體中的全部單位區(qū)分為非此即彼的兩大類,以研究它們之間的比例關系。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度返回
例如,合格品與不合格品,男工與女工等。這類以“是或非”、“有或無”來表述單位特征的標志稱為是非標志或交替標志——其標志表現(xiàn)只有兩種情況。具體體現(xiàn)在各總體單位要么具有該種屬性,要么不具有該種屬性。是非標志的平均數(shù)分組單位數(shù)變量值具有某一屬性不具有某一屬性10合計—為研究是非標志總體的數(shù)量特征,令:統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
(1)是非標志:是非標志又稱交替標志,它是一個只有兩種標志表現(xiàn)的標志。具有某種標志表現(xiàn)的單位數(shù)所占的成數(shù)不具有某種標志表現(xiàn)的單位數(shù)所占的成數(shù)
(2)成數(shù):指是非標志總體中具有某種表現(xiàn)或不具有某種表現(xiàn)的單位數(shù)占全部總體單位總數(shù)的比重。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度是非標志的平均數(shù)統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度是非標志的平均數(shù)統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度數(shù)值平均數(shù)二、調(diào)和平均數(shù)
假定有A、B兩家公司員工的月工資資料如下表的前三列。試分別計算其平均工資?!阈g平均數(shù)的變形
引例
兩公司員工工資情況表月工資(元)x工資總額(元)m(xf)員工人數(shù)(人)f=m/xA公司B公司A公司B公司80010001600合計480007000032000150000400004000040000120000607020150504025115統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度調(diào)和平均數(shù)計算A公司的平均工資,得到:統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度調(diào)和平均數(shù)統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度調(diào)和平均數(shù)
在這里,平均工資作為“單位標志平均數(shù)”仍然必須是標志總量(工資總額)與單位總數(shù)(員工總數(shù))之比。依據(jù)給出的月工資水平和工資總額的分組資料,可以首先用前者來除后者,得到各組的員工人數(shù),進而加總得到全公司的員工總數(shù)(表中后兩列),這樣就很容易計算出兩個公司各自的平均工資。將這些計算過程歸納起來,就是運用了調(diào)和平均數(shù)的公式。
對于B公司,固然也可以采用加權調(diào)和平均數(shù)公式來計算其平均工資:
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度調(diào)和平均數(shù)
然而在這里,由于各組的權數(shù)(工資總額)相同,實際上并沒有真正起到加權的作用。我們采用簡單調(diào)和平均數(shù)的公式來計算,可以得到完全相同的結果,而計算過程卻大大簡化了:統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度調(diào)和平均數(shù)
在統(tǒng)計分析中,有時會由于種種原因沒有頻數(shù)的資料,只有每組的變量值和相應的標志總量。這種情況下就不能直接運用算術平均方法來計算了,而需要以迂回的形式,即用每組的標志總量除以該組的變量值推算出各組的單位數(shù),才能計算出平均數(shù),我們可以用調(diào)和平均的方法完成這個計算。(加權)調(diào)和平均數(shù)的公式原來只是計算時使用了不同的數(shù)據(jù)!統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度調(diào)和平均數(shù)標志值倒數(shù)的算術平均數(shù)的倒數(shù)。又稱倒數(shù)平均數(shù)。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度調(diào)和平均數(shù)
調(diào)和平均數(shù)作為算術平均數(shù)的變形公式使用。仍是總體的標志總量與總體單位總量的對比,僅僅是因為資料的不同,需要將算術平均數(shù)變形。
當我們掌握的是各組標志值和各組的標志總量時,不能直接運用算術平均數(shù)的方法計算,應采用調(diào)和平均數(shù)的形式。
當m=xf時,統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度某日三種蔬菜的批發(fā)成交數(shù)據(jù)蔬菜名稱批發(fā)價格(元)Xi成交額(元)Xifi成交量(公斤)fi甲乙丙1.200.500.801800012500640015000250008000合計—3690048000【例】某蔬菜批發(fā)市場三種蔬菜的日成交數(shù)據(jù)如表,計算三種蔬菜該日的平均批發(fā)價格統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度調(diào)和平均數(shù)[例]某局所屬四個企業(yè)有關資料如下,試計算該工業(yè)局的產(chǎn)值平均計劃完成百分比。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度調(diào)和平均數(shù)
幾何平均數(shù)是N個變量值連乘積的N次方根。(簡單公式)(加權公式)統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度數(shù)值平均數(shù)三、幾何平均數(shù)——適用于特殊的變量值
(總體的標志總量等于各單位標志值之積)
2、就用途而言,幾何平均方法通常用在總量等于各分量乘積的情形。比如,求某些平均比率,平均發(fā)展速度等。【例】某流水生產(chǎn)線有前后銜接的五道工序。某日各工序產(chǎn)品的合格率分別為95﹪、92﹪、90﹪、85﹪、80﹪,求整個流水生產(chǎn)線產(chǎn)品的平均合格率。簡單公式及應用:統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度幾何平均數(shù)設最初投產(chǎn)A個單位,則第一道工序的合格品為A×0.95;第二道工序的合格品為(A×0.95)×0.92;
……第五道工序的合格品為(A×0.95×0.92×0.90×0.85)×0.80;
因該流水線的最終合格品即為第五道工序的合格品,故該流水線總的合格品應為A×0.95×0.92×0.90×0.85×0.80;則該流水線產(chǎn)品總的合格率為:結論:即該流水線總的合格率等于各工序合格率的連乘積,符合幾何平均數(shù)的適用條件,故需采用幾何平均法計算。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度幾何平均數(shù)加權公式及應用:【例】某金融機構以復利計息。近12年來的年利率有4年為3﹪,2年為5﹪,2年為8﹪,3年為10﹪,1年為15﹪。求平均年利率。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度幾何平均數(shù)設本金為V,則至各年末的本利和應為:第1年末的本利和為:第2年的計息基礎第12年的計息基礎………………結論:即12年總本利率等于各年本利率的連乘積,符合幾何平均數(shù)的適用條件,故計算平均年本利率應采用幾何平均法。第12年末的本利和為:第2年末的本利和為:統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度可看作是均值的一種變形:
注意:當變量值有一項為零或負值時,不宜用幾何平均數(shù)計算。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度幾何平均數(shù)
例:2003-2007年某市工業(yè)品的產(chǎn)量分別是上年的107.6%、102.5%、100.6%、102.7%、102.2%,計算這5年的平均發(fā)展速度。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度幾何平均數(shù)1.067,,1.025,,1.006,,1.027,,1.022,=,2ndF,,5,=出現(xiàn)結果:1.0309即103.1%計算器統(tǒng)計功能計算:統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度幾何平均數(shù)
【例】一位投資者購持有一種股票,在2008、2009、2010和20011年收益率分別為4.5%、2.1%、25.5%、1.9%。計算該投資者在這四年內(nèi)的平均收益率。例:某投資銀行25年的年利率分別是:1年3%,4年5%,8年8%,10年10%,2年15%,求平均年利率。1.03,,(,1.05,yx,4,),,(,1.08,yx,8,),,(,1.1,yx,10,),,(,1.15,yx,2,),=,2ndF,出現(xiàn)結果:1.086即108.6%統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度幾何平均數(shù)統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
數(shù)值平均數(shù)位置平均數(shù)平均指標的概念測定集中趨勢的意義中位數(shù)眾數(shù)第一節(jié)集中趨勢的測度算術平均數(shù)與中位數(shù)、眾數(shù)的關系統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
中位數(shù)的著眼點在于尋求全部變量值按其大小順序排列,居中間位置的變量值。在中位數(shù)數(shù)值沒有重復的條件下,其中,一半數(shù)值小于中位數(shù),另一半數(shù)值大于中位數(shù),因而,可用來代表數(shù)列的一般水平。(一)
中位數(shù)的概念:將總體各單位標志值按大小排列,居于中間位置的標志值就是中位數(shù)Me
位置平均數(shù)一、中位數(shù)(Me)
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度外行看統(tǒng)計中位數(shù)(Me)
例如,現(xiàn)行我國住戶調(diào)查公布的人均可支配收入采用平均數(shù)。但是,由于居民收入分布是偏態(tài)分布,分布曲線偏向高收入,使得平均數(shù)偏離中位數(shù)和眾數(shù),隨著收入差距的擴大,偏離程度也越來越大、收入水平達不到平均數(shù)的家庭比例不斷上升。
國家統(tǒng)計局根據(jù)對全國31個省份7.4萬戶農(nóng)村居民家庭和6.6萬戶城鎮(zhèn)居民家庭的抽樣調(diào)查顯示,2011年農(nóng)村居民收入方面,人均純收入為6977元,比上年增加1058元,城鎮(zhèn)居民人均可支配收入21810元,比上年增加2701元。國家統(tǒng)計局表示,由于調(diào)查的部分對象收入很高,此前公布的人均收入有可能會被高收入群體拉高,不能完全真實地反映部分人員收入情況;而中位數(shù)則更能反映出中低收入者的情況。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
2011年1月,國家統(tǒng)計局局長馬建堂在發(fā)布去年國民經(jīng)濟運行情況時提到,將在近日發(fā)布收入中位數(shù)。20日,這項數(shù)據(jù)得以發(fā)布。
2011年,農(nóng)村居民人均純收入中位數(shù)為6194元,比上年增加995元,農(nóng)村居民人均純收入中位數(shù)比人均純收入低783元;城鎮(zhèn)居民方面,人均可支配收入中位數(shù)為19118元,比上年增加2279元,城鎮(zhèn)居民人均可支配收入中位數(shù)比人均可支配收入低2692元。
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
我國人口年齡中位數(shù)統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度中位數(shù)(Me)
又如:人口的年齡分布往往近似J型:嬰兒數(shù)最多,隨著年齡的增大,人數(shù)逐漸下降,到了百歲左右,所剩的人數(shù)就很少了。如果計算年齡的算術平均數(shù),老年人口數(shù)雖然較少,但其年齡數(shù)值很高,這樣一來,計算的平均年齡就會偏向老年一方。因此,各國的人口統(tǒng)計資料中,平均年齡的計算一般采用中位數(shù)。
(二)中位數(shù)的確定【例】計算甲城市家庭對住房滿意狀況評價的中位數(shù)中位數(shù)的位次為:
300/2=150
從累計頻數(shù)看,中位數(shù)的在“一般”這一組別中。因此
Me=一般表3-2甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)
非常不滿意
不滿意
一般
滿意
非常滿意2410893453024132225270300合計300—統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度中位數(shù)(Me)1.定序數(shù)據(jù)的中位數(shù):首先確定中點位次,然后找出中點位次對應的變量值。
首先確定中點位次,然后找出中點位次對應的標志值。①當資料未分組時,中點位次=統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度2.數(shù)值型數(shù)據(jù)的中位數(shù)中位數(shù)(Me)當N為奇數(shù)當N為偶數(shù)
n為奇數(shù)中位數(shù)例子
原始數(shù)據(jù):24.1 22.621.523.7 22.6
由小到大排列:21.522.622.623.7 24.1
位次:12 34 5中位數(shù)位次Om中位數(shù)Me
22.6.
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度中位數(shù)(Me)n為偶數(shù)中位數(shù)例子
原始數(shù)據(jù):10.34.98.9 11.7 6.37.7
由小到大排列:4.96.37.7
8.9 10.3 11.7
位次:1234 56中位數(shù)位次
Om中位數(shù)Me7.78.3028.9統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度中位數(shù)(Me)[例]中點位次=
,
說明位于第90與第91個人之間,(1)當資料已分組且形成單項式變量數(shù)列時,中點位次=統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度中位數(shù)(Me)根據(jù)累計次數(shù)可確定中位數(shù)為第四組的變量值18歲。(2)資料已分組且形成組距式變量數(shù)列(插補法按比例推算)
(A)L為中位數(shù)所在組的下限,U為上限;(C)Sm-1
為小于中位數(shù)的各組次數(shù)之和;(D)Sm+1為大于中位數(shù)的各組次數(shù)之和;統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度中位數(shù)(Me)(B)d為中位數(shù)所在組的組距;(E)fm為中位數(shù)所在組的次數(shù)。中位數(shù)
中位數(shù)實際上就是位于累計次數(shù)達到的這一組中的某個數(shù)值。該數(shù)值就是這一組下限加上按一定幾何比例分割組距所得的一段組距,或這一組上限減去按一定幾何比例分割組距所得的一段組距。
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度中位數(shù)(Me)
506070(L)80(U)90100
xy103060110150180(Sm-1)第90個人Me=L+x=U-y假定中位數(shù)組的變量值呈均勻分布,則采用比例插值法得統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度中位數(shù)(Me)
(三)
中位數(shù)特點與應用場合:
1.中位數(shù)一定存在,主要用于測度定序數(shù)據(jù)的集中趨勢。也適用于數(shù)值型數(shù)據(jù)。但不適用于定類數(shù)據(jù);2.是一個位置代表值,不受極端值的影響,比較穩(wěn)健。
3.中位數(shù)的取值只與中間位置的一或兩個數(shù)值有關,利用信息不充分。
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度中位數(shù)(Me)
中位數(shù)是將統(tǒng)計分布從中間分成相等的兩部分,與中位數(shù)性質(zhì)相似的還有四分位數(shù)、十分位數(shù)和百分位數(shù)。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
三個數(shù)值可以將變量數(shù)列劃分為項數(shù)相等的四部分,這三個數(shù)值就定義為四分位數(shù)(Quartiles),分別稱為第一四分位數(shù)、第二四分位數(shù)和第三四分位數(shù),記作、和。對于不分組數(shù)據(jù)而言,三個四分位數(shù)的位置分別是:在處,在處,在處??梢娋褪侵形粩?shù)。(四)分位數(shù)
同理,十分位數(shù)(Dectile)和百分位數(shù)(Percentile)分別是將變量數(shù)列十等分和一百等分的數(shù)值。25%分位數(shù)50%分位數(shù)75%分位數(shù)最大
觀測值最小
觀測值中位數(shù)上四分位數(shù)下四
分位數(shù)(lowquartile)(upperquartile)50%的觀測值小于中位數(shù)50%的觀測值位于上下四分位數(shù)之間50%的觀測值大于中位數(shù)四分位數(shù):
回答類別頻頻累積次數(shù)
數(shù)
率%向上向下非常不滿意不滿意一般滿意非常滿意24108934530836311510241322252703003002761687530合計300100----Q1=不滿意Q3=滿意Me=一般甲城市家庭對住房增狀況的評價四分位數(shù)統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度小時數(shù)燈泡數(shù)累積43-482248-531353-582558-63212663-68285468-73288273-783311578-832614183-882116288-931918193-981019198-1036197103-1082199108-1130199113-1181200Me=75.5QU=85QL=6750%燈泡的壽命在67-85小時之間200只燈泡使用壽命頻數(shù)分布表四分位數(shù)思考題
你是Prudential-Bache證券公司的金融分析員。你已經(jīng)收集了新發(fā)行股票的下列收盤價:17,16,21,18,13,16,12,11.
試描述股票價格的集中趨勢統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
某商場某季度男皮鞋銷售情況男皮鞋號碼/厘米銷售量/雙24.01224.58425.011825.554126.032026.510427.052合計1200統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
某制鞋廠要了解消費者最需要哪種型號的男皮鞋,調(diào)查了某百貨商場某季度男皮鞋的銷售情況,得到資料如表:二、眾數(shù)(M0)位置平均數(shù)引例
從表中可以看到,25.5厘米的鞋號銷售量最多,如果我們計算算術平均數(shù),則平均號碼為25.65厘米,而這個號碼顯然是沒有實際意義的,而直接用25.5厘米作為顧客對男皮鞋所需尺寸的集中趨勢既便捷又符合實際。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度眾數(shù)(M0)
眾數(shù)的著眼點在于尋求分布數(shù)列中頻數(shù)最多(出現(xiàn)次數(shù)最多的)的變量值。說明總體中大多數(shù)單位所達到的一般水平,具有普遍性。
(一)定義:眾數(shù)是分布數(shù)列(總體)中出現(xiàn)次數(shù)最多的變量值。
上面的例子中,鞋號25.5厘米就是眾數(shù)。
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度眾數(shù)(M0)
在統(tǒng)計實踐中,常利用眾數(shù)來近似反映現(xiàn)象的一般水平。比如,一位食品部經(jīng)理想按照預期的銷售量來分配貨物架的空間。從這個意義上來說,我們應該依據(jù)眾數(shù),而不是算術平均數(shù)或中位數(shù)來確定,即過去具有最高銷售量的食品將得到最大限度的貨物架空間。
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
用眾數(shù)價格代表某一商品的價格,用眾數(shù)儲蓄余額代表居民儲蓄的一般水平,還有,在服裝行業(yè),生產(chǎn)商、批發(fā)商在做有關生產(chǎn)或存貨的決策時,更感興趣的是最普遍的尺寸,即尺寸的眾數(shù)。眾數(shù)(M0)眾數(shù)適用于品質(zhì)數(shù)列和變量數(shù)列。
如:銷售量最多的服裝款式或色彩(所謂“流行款式”或“流行色”)統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度返回眾數(shù)(M0)例:品質(zhì)數(shù)列(定類數(shù)據(jù))的眾數(shù)
某城市居民關注廣告類型的頻數(shù)分布廣告類型人數(shù)(人)比例頻率(%)
商品廣告
服務廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合計2001100
這里的變量為“廣告類型”,這是個定類變量,不同類型的廣告就是變量值。我們看到,在所調(diào)查的200人當中,關注商品廣告的人數(shù)最多,為112人,占總被調(diào)查人數(shù)的56%,因此眾數(shù)為“商品廣告”這一類別,即
Mo=商品廣告統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度眾數(shù)(M0)
例:品質(zhì)數(shù)列(定序數(shù)據(jù))的眾數(shù)
這里的數(shù)據(jù)為定序數(shù)據(jù)。變量為“回答類別”。甲城市中對住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即
Mo=不滿意
甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)
非常不滿意
不滿意
一般
滿意
非常滿意24108934530836311510合計300100.0統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度眾數(shù)(M0)(二)變量數(shù)列計算M0的方法1.由單項數(shù)列確定的M0:先確定眾數(shù)組,再確定眾數(shù):Mo=2統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度眾數(shù)(M0)家庭人口數(shù)戶數(shù)120266384551合計100
一般也可以次數(shù)最多的一組的組中值為眾數(shù),但這一數(shù)值往往隨著分組的不同而發(fā)生變動,為使M0更接近實際,在確定M0所在組后,計算M0的近似值——是按比例推算的近似值——用眾數(shù)組前后兩組的頻數(shù)作為決定眾數(shù)應在眾數(shù)所在組組中值上面或下面的加權因子,理解如下:統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度眾數(shù)(M0)2.由組距數(shù)列確定的M0:fm-1fm-1fm-1fm+1fm+1fm+1fm頻數(shù)頻數(shù)頻數(shù)M0M0M0fmfm(a)(b)(c)眾數(shù)的值與相鄰兩組頻數(shù)的分布有關:眾數(shù)(M0)(a):相鄰兩組的頻數(shù)相等時,眾數(shù)組的組中值即為眾數(shù)。(b)、(c)相鄰兩組的頻數(shù)不相等。
設眾數(shù)組的頻數(shù)為,眾數(shù)前一組的頻數(shù)為fm-1
,眾數(shù)后一組的頻數(shù)為fm+1
。當眾數(shù)相鄰兩組的頻數(shù)相等時,即
fm-1=fm+1
,眾數(shù)組的組中值即為眾數(shù);當眾數(shù)組的前一組的頻數(shù)多于眾數(shù)組后一組的頻數(shù)時,即fm-1>fm+1
,則眾數(shù)會向其前一組靠,眾數(shù)小于其組中值;當眾數(shù)組后一組的頻數(shù)多于眾數(shù)組前一組的頻數(shù)時,即fm-1
<fm+1
,則眾數(shù)會向其后一組靠,眾數(shù)大于其組中值?;谶@種思路,借助于幾何圖形而導出的分組數(shù)據(jù)眾數(shù)的計算公式。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度眾數(shù)(M0)由組距式頻布表計算眾數(shù)眾數(shù)先確定眾數(shù)組;再用下述公式計算:符號含義:(A)L為眾數(shù)組的下限,U為上限;(B)d為眾數(shù)組的組距;(C)1=fm-fm-1,即眾數(shù)組的次數(shù)與前一組次數(shù)之差;
2=fm-fm+1,即眾數(shù)組的次數(shù)與后一組次數(shù)之差。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度眾數(shù)(M0)小時數(shù)燈泡數(shù)43-48248-53153-58258-632163-682868-732873-783378-832683-882188-931993-981098-1036103-1082108-1130113-1181200只燈泡使用壽命頻數(shù)分布表200只燈泡使用壽命頻數(shù)分布直方圖眾數(shù)(三)眾數(shù)的特點及應用場合
1.主要用于測度定類數(shù)據(jù)的集中趨勢,也適用于定序和數(shù)值型數(shù)據(jù)的集中趨勢的測度值。
2.
眾數(shù)是根據(jù)眾數(shù)組及相鄰組的頻數(shù)分布信息來確定數(shù)據(jù)中心點位置的,因此,眾數(shù)是一個位置代表值,它不受數(shù)據(jù)中極端值的影響。
3.由于眾數(shù)的確定并不涉及每一個變量值,故其對變量值的變化反映不靈敏。
4.有時分布數(shù)列中可能沒有眾數(shù)或有幾個眾數(shù),難以反映總體的一般水平。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度眾數(shù)(M0)M0M0M0M0M0若有兩個次數(shù)相等的眾數(shù),則稱復眾數(shù)。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
①眾數(shù)的確定適用于總體單位數(shù)比較多,而且又有明顯的集中趨勢時才存在眾數(shù)。眾數(shù)(M0)下三圖無眾數(shù):
②在單位數(shù)很少,或單位數(shù)雖多但無明顯集中趨勢時,統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度計算眾數(shù)是沒有意義的。眾數(shù)(M0)數(shù)據(jù)類型定類數(shù)據(jù)定序數(shù)據(jù)定距數(shù)據(jù)定比數(shù)據(jù)*眾數(shù)*中位數(shù)*均值*均值-四分位數(shù)眾數(shù)調(diào)和平均數(shù)-眾數(shù)中位數(shù)幾何平均數(shù)--四分位數(shù)中位數(shù)---四分位數(shù)---眾數(shù)適用的測度值數(shù)據(jù)的類型和所適用的集中趨勢測度值*為該數(shù)據(jù)類型最適用的測度值統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度算術平均數(shù)與中位數(shù)、眾數(shù)的關系眾數(shù)是觀測值的重點中位數(shù)是觀測值的中心均值是觀測值的重心眾數(shù)、中位數(shù)、均值的比較(1)對稱分布:此處三者均等于35。
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
大部分數(shù)據(jù)都屬于單峰鐘形分布,其眾數(shù)、中位數(shù)和算術平均數(shù)之間具有以下關系:算術平均數(shù)與中位數(shù)、眾數(shù)的關系A、右(正)偏:說明數(shù)據(jù)中有極大值,必然拉動算術平均(2)偏態(tài)分布統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度算術平均數(shù)與中位數(shù)、眾數(shù)的關系數(shù)向大的數(shù)值靠近:
B、左(負)偏:說明數(shù)據(jù)中有極小值出現(xiàn),必然拉動算術平統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度算術平均數(shù)與中位數(shù)、眾數(shù)的關系均數(shù)向小的數(shù)值靠近。
從上面的分析可以看出,當頻數(shù)分布出現(xiàn)偏態(tài)時,極端值對算術平均數(shù)產(chǎn)生很大的影響,而對眾數(shù)、中位數(shù)沒有影響,此時,用眾數(shù)、中位數(shù)作為一組數(shù)據(jù)的中心值比算術平均數(shù)有較高的代表性。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
適度偏斜情況下,眾數(shù)與中位數(shù)之間的距離,大約為中位數(shù)到算術平均數(shù)之間距離的兩倍。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度算術平均數(shù)與中位數(shù)、眾數(shù)的關系卡爾.皮爾遜經(jīng)驗公式
據(jù)某單位資料知道,職工年收入小于25000元的占總?cè)藬?shù)的一半,年收入22360元人數(shù)為最多。試問:該單位職工人均年收入估計為多少?收入分配是左偏還是右偏?統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度算術平均數(shù)與中位數(shù)、眾數(shù)的關系思考收入分配呈右偏統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
不同類型變量適用的集中趨勢測度指標變量類型分類型順序型數(shù)值型集中趨勢測度指標※眾數(shù)---※中位數(shù)四分位數(shù)眾數(shù)-※均值中位數(shù)四分位數(shù)眾數(shù)※為該類變量最適用的測度指標統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度本章目錄統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度標志變異指標離散程度什么是離散程度為什么要測定離散程度第二節(jié)離散程度的測度
如果你一只腳放在攝氏0度的冰水里,另一只腳放在攝氏100度的沸水里,按統(tǒng)計學理論,你一定感覺很舒服,因為平均水溫50度!統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度一則笑話漫畫——都是不懂統(tǒng)計的緣故
他的溺斃完全是因為不懂統(tǒng)計,他還以為只要知道河水的平均深度就行了呢。R.I.P—RestinPeace統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度Mo=可口可樂甲商店乙商店Mo=可口可樂
兩商店軟飲料購買頻數(shù)的眾數(shù)都是可口可樂,但數(shù)據(jù)的離散程度不同。01020可口可樂雪碧
杏
仁露
新
騎士醒目01020可口可樂雪碧
杏
仁露
新
騎士醒目離散趨勢Me=一般甲城市乙城市非常不滿意一般滿意非常
滿意Me=一般非常不滿意一般滿意非常
滿意
兩城市對住房條件評價的中位數(shù)都是一般,但數(shù)據(jù)的離散程度不同。不滿意不滿意離散趨勢兩組數(shù)據(jù)均值均為,但離散程度不同。離散趨勢離散程度統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
分配數(shù)列中各標志值背離中心值的程度,即現(xiàn)象總體中各單位標志值間的變異狀況或差異程度。也稱為離中趨勢或離散趨勢,是數(shù)據(jù)分布的另一個重要特征。一、什么是離散程度
平均指標是一個代表性數(shù)值,它反映總體各單位某一數(shù)量標志的一般水平,而把總體各單位之間的差異抽象化了。但總體各單位之間的差異是客觀存在的,這種差異也是統(tǒng)計總體的重要特征之一。因此,要全面反映一個總體的特征,還必須測定總體各單位之間差異程度。二、為什么要測定離散程度統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度離散程度
標志變異指標(意義和作用)統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
反映總體各單位標志值之間差異程度大小的綜合指標,也稱做標志變動度。
是說明總體分布的另一個重要特征值。一、標志變異指標的含義統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度1、衡量平均指標代表性的大小的尺度甲、乙兩學生某次考試成績列表語文數(shù)學物理化學政治英語甲959065707585乙1107095508075二、標志變異指標的作用
標志變異指標(意義和作用)2、反映現(xiàn)象發(fā)展過程的均衡性或協(xié)調(diào)性、以及產(chǎn)品質(zhì)量的穩(wěn)定性供貨計劃完成百分比(%)季度總供貨計劃執(zhí)行結果一月二月三月鋼廠甲100323434乙100203050統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度標志變異指標測定離散程度的意義極差平均差第二節(jié)離散程度的測度標準差離散系數(shù)異眾比率
描述數(shù)據(jù)離散程度采用的測度值,主要有異眾比率、極差、四分位差、平均差、方差和標準差,以及測度相對離散程度的離散系數(shù)等。
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
標志變異指標(種類和計算)
異眾比率:又稱離異比率或變差比,是指非眾數(shù)組的頻數(shù)占總頻數(shù)的比率,計算公式為:式中,為異眾比率;為變量值的總頻數(shù);眾數(shù)組的頻數(shù)。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
標志變異指標(種類和計算)一、異眾比率統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
異眾比率的作用是衡量眾數(shù)對一組數(shù)據(jù)的代表程度。異眾比率越大,說明非眾數(shù)的頻數(shù)組占總頻數(shù)的比重越大,眾數(shù)的代表性就越差;異眾比率越小,說明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越小,眾數(shù)的代表性就越好。
異眾比率軟飲料頻數(shù)頻率%可口可樂1938雪碧1326杏仁露816新騎士510醒目510總計5010050次購買軟飲料的頻數(shù)分布異眾比統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
極差是總體各單位標志的最大值和最小值之差,也稱全距,表示某一總體全部變量值的變動范圍。
R=Xmax-Xmin
例:某班學生外語成績中,最低分為48分,最高分為96分。極差=96-48=48(分)統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
標志變異指標(種類和計算)二、極差
未分組數(shù)據(jù)和變量數(shù)列中單項數(shù)列:用數(shù)列中最大變量值減最小變量值。
在組距數(shù)列中:
R=最高組上限—最低組下限極差統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度日產(chǎn)量(件)工人數(shù)(人)5~1010~2020~3030~4040~50102440206合計100例:某車間工人日產(chǎn)量資料如下表所示:
最高上限=50,最低下限=5,全距R=50-5=45(件)
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度㈡極差的特點:
1、離散程度的最簡單測度值計算簡便,也易于理解,在實際工作中適用于度量變化比較穩(wěn)定的現(xiàn)象的離中趨勢;
2、只表示總體變動的范圍,且易受極端值影響不能全面反映總體各單位標志值的差異程度及分布狀況,也不能用來評價平均指標的代表性。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度極差評價方法:
極差值越小,說明標志變異程度越小,總體變量值分布越集中;極差值越大,說明標志變異程度越大,總體變量值分布越分散。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度極差統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度極差的應用
在實際工作中,極差又稱為“公差”,它是對產(chǎn)品質(zhì)量制訂的一個容許變化的界限,常用來檢查產(chǎn)品質(zhì)量的穩(wěn)定性和進行質(zhì)量控制。在正常生產(chǎn)條件下,極差在一定范圍內(nèi)波動,若極差超過給定的范圍,就說明有異常情況出現(xiàn)。因此,利用極差有助于及時發(fā)現(xiàn)問題,以便采取措施,保證產(chǎn)品質(zhì)量。
又如,描述社會成員的收入水平差異,是在極差的基礎上,計算得出最高收入與最低收入間相差的倍數(shù)。
國家統(tǒng)計局調(diào)查資料顯示:2006年,我國城鎮(zhèn)居民中10%最高收入組家庭人均可支配收入為31967.34元,10%最低收入組家庭人均可支配收入為為3568.73元;最高收入組為最低收入組的8.98倍。若以城市最高收入組與農(nóng)村最低收入組比較,更是高逾20倍。例
四分位差:是指第三四分位數(shù)與第一四分位數(shù)之差,也稱為內(nèi)距或四分間距,用表示。四分位差的計算公式為:
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
四分位差反映了中間50%數(shù)據(jù)的離散程度。其數(shù)值越小,說明中間的數(shù)據(jù)越集中;數(shù)值越大,說明中間的數(shù)據(jù)越分散。四分位差不受極值影響,因此,在某種程度上彌補了極差的一個缺陷。四分位差
回答類別甲城市乙城市頻數(shù)頻率%頻數(shù)頻率%非常不滿意不滿意一般滿意非常滿意2410893453083631151021997864387332621.312.7合計300100300100甲乙兩城市家庭對住房狀況評價頻數(shù)分布數(shù)據(jù)編碼:令非常不滿意為1;不滿意為2;一般為3;滿意為4;非常滿意為5。則:結果說明50%的家庭對住房狀況在滿意與不滿意之間。四分位差統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度QU=85QL=6718小時數(shù)燈泡數(shù)累積43-482248-531353-582558-63212663-68285468-73288273-783311578-832614183-882116288-931918193-981019198-1036197103-1082199108-1130199113-1181200200只燈泡使用壽命頻數(shù)分布表四分位差與盒形圖50%的觀測值集中于盒子之內(nèi)。盒子越窄,表明集中程度越高,即離散程度越低。QU=85QL=67四分位差
平均差是各總體單位標志值與其算術平均數(shù)離差絕對值的算術平均數(shù)。反映的是各標志值對其平均數(shù)的平均差異程度。
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度標志變異指標(種類和計算)三、平均差
由于各變量值與其平均數(shù)離差之和等于零,所以,在計算平均差時,是取絕對值形式的。根據(jù)掌握數(shù)據(jù)資料不同,平均差的計算采用兩種不同形式。計算公式:統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度平均差平均差(meandeviation)的特點:平均差統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
1、綜合反映了總體各單位標志值的差異程度,較全距為優(yōu);
2、數(shù)學性質(zhì)較差,不便于作數(shù)學處理和參與統(tǒng)計分析運算,實際應用中受到很大限制。評價方法:
平均差越小,標志變異程度越小,總體變量值分布越集中,平均數(shù)的代表性便越大;平均差越大,標志變異程度越大,總體變量值分布越分散,平均數(shù)的代表性便越小。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度平均差例題分析:某電腦公司銷售量數(shù)據(jù)平均差計算表按銷售量分組組中值(xi)頻數(shù)(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計—120—2040統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度返回平均差
含義:每一天的銷售量與平均數(shù)相比,平均相差17臺
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度平均差
班級同學成績分布統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度平均差解:統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度平均差
標準差是總體各單位標志值與其算術平均數(shù)離差平方和的算術平均數(shù)的平方根。又稱為均方差。
標準差的實質(zhì)與平均差基本相同,只是在數(shù)學處理方法上與平均差不同。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度返回標志變異指標(種類和計算)四、標準差
之所以稱其為標準差,是因為在正態(tài)分布條件下,它和平均數(shù)有明確的數(shù)量關系,是真正度量離中趨勢的標準。
計算公式:根據(jù)掌握的數(shù)據(jù)資料不同,有簡單式和加權式兩種。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度標準差統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度標準差
方差是各個數(shù)據(jù)與其算術平均數(shù)的離差平方的平均數(shù),通常以σ2表示。方差的計量單位不便于從經(jīng)濟意義上進行解釋(方差的計量單位是標志值計量單位的平方),所以實際統(tǒng)計工作中多用方差的算術平方根——標準差來測度統(tǒng)計數(shù)據(jù)的差異程度,標準差的計量單位與觀測值計量單位是一致的。
標準差(StandardDeviation)特點:
1.用平方的方法消除各標志值與算術平均數(shù)離差的正負值問題,可方便地用于數(shù)學處理和統(tǒng)計分析運算。
2.應用最廣泛的離散程度測度值。
統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度標準差評價方法:
均方差越大,標志變動程度越大,總體變量值分布越分散,平均數(shù)的代表性便越??;均方差越小,標志變動程度越小,總體變量值分布越集中,平均數(shù)的代表性便越大。標準差統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度班級同學成績分布統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度標準差標準差的作用
標準差可以用來度量相對位置和異常值的檢測。Z分數(shù)
標準化的數(shù)值,標明Xi
距離其平均數(shù)的標準差個數(shù)。
某學生期末考試時,數(shù)學成績?yōu)?5分,據(jù)此計算的Z分數(shù)為0.5;英語成績?yōu)?0分,Z分數(shù)也是0.5。則說明該學生兩科考試成績的相對位置是相同的,即都高于平均成績0.5個標準差。
一個數(shù)據(jù)集中某個或某幾個數(shù)據(jù)反常地大或小,一般稱其為極端值或異常值,應當進一步加以檢查、鑒別。一般的建議是:凡Z分數(shù)小于-3或大于+3的數(shù)據(jù)均可以被認為是異常值。統(tǒng)計學——第5章數(shù)據(jù)分布特征的測度
質(zhì)量控制統(tǒng)計中控制圖的原理控制下限控制上限中心線
若數(shù)據(jù)落在控制線外,則認為生產(chǎn)過程失去控制,判斷錯誤的概率小于0.5%。標準差的應用68.27%95.45%99.73%返回
對于接近正態(tài)分布的數(shù)據(jù)集,有如下的經(jīng)驗法則:
約68%的數(shù)據(jù)與平均數(shù)的距離在1個標準差之內(nèi);約95%的數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 奢侈品培訓汽車
- 專業(yè)分包化標準精裝修工程管理
- Windows Server網(wǎng)絡管理項目教程(Windows Server 2022)(微課版)3.6 DHCP-任務5 DHCP客戶端配置
- 語法選修課 高中英語 非謂語動詞 A篇
- 江蘇省徐州市銅山區(qū)2023-2024學年九年級上學期期中英語試卷(含答案解析)
- 第六章質(zhì)量與密度基礎練習題(含解析)2024-2025學年初中物理人教版八年級上冊
- 2024至2030年中國干豬膀胱行業(yè)投資前景及策略咨詢研究報告
- 2024至2030年中國多用途雙面黏貼布帶行業(yè)投資前景及策略咨詢研究報告
- 2024至2030年中國保安單元殼數(shù)據(jù)監(jiān)測研究報告
- 2024年山東省中考語文試題含解析
- 教師孝行事跡材料
- 5個人股東合作協(xié)議書
- 輕質(zhì)陶粒墻板項目立項申請報告
- 化工廠用電安全講課
- 學術英語寫作(本科)智慧樹知到期末考試答案2024年
- 糧油質(zhì)量檢驗-課件-項目四-小麥粉質(zhì)量檢驗
- AQ2059-2016 磷石膏庫安全技術規(guī)程
- 安全員繼續(xù)教育考試題庫1000道附參考答案(完整版)
- 2024年中儲糧集團招聘筆試參考題庫附帶答案詳解
- (2024年)保安培訓圖文課件
- 2023年《中職音樂》期末考試試卷及參考答案(卷)
評論
0/150
提交評論