數(shù)據(jù)分布特征的描述_第1頁(yè)
數(shù)據(jù)分布特征的描述_第2頁(yè)
數(shù)據(jù)分布特征的描述_第3頁(yè)
數(shù)據(jù)分布特征的描述_第4頁(yè)
數(shù)據(jù)分布特征的描述_第5頁(yè)
已閱讀5頁(yè),還剩93頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、.,1,數(shù)據(jù)分布特征的描述,.,2,第一節(jié) 統(tǒng)計(jì)變量集中趨勢(shì)的測(cè)定 第二節(jié) 統(tǒng)計(jì)變量離散趨勢(shì)的測(cè)定 第三節(jié) 變量分布的偏度與峰度,目錄,.,3,分類 分組 整理 圖示,統(tǒng)計(jì)數(shù)據(jù),尋找 反映數(shù)據(jù)分布特征的代表值: 集中趨勢(shì);離散程度;形狀。,對(duì)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行排序、分組、整理、圖示,是對(duì)數(shù)據(jù)的分布特征進(jìn)行描述的一個(gè)基本方面,為進(jìn)一步掌握數(shù)據(jù)的分布特征及其變化規(guī)律,以進(jìn)行深入的分析,還需找出反映數(shù)據(jù)分布特征的各個(gè)代表值。 統(tǒng)計(jì)學(xué)中主要從以下三方面刻劃數(shù)據(jù)分布特征:數(shù)據(jù)分布的集中趨勢(shì);數(shù)據(jù)分布的離散程度;數(shù)據(jù)分布的形狀。,.,4,數(shù)據(jù)分布的特征,.,5,數(shù)據(jù)分布特征和適用的描述統(tǒng)計(jì)量,.,6,一、測(cè)定集

2、中趨勢(shì)的指標(biāo)及其作用 二、數(shù)值平均數(shù) 三、眾數(shù)與中位數(shù),第一節(jié) 統(tǒng)計(jì)變量集中趨勢(shì)的測(cè)定,.,7,一、測(cè)定集中趨勢(shì)的指標(biāo)及其作用,集中趨勢(shì):(central tendency) 較大和較小的觀測(cè)值出現(xiàn)的頻率比較低,大多數(shù)觀測(cè)值密集分布在中心附近,使得全部數(shù)據(jù)呈現(xiàn)出向中心聚集或靠攏的態(tài)勢(shì)。,.,8,測(cè)度數(shù)據(jù)集中趨勢(shì)的指標(biāo)分類,測(cè)度集中趨勢(shì)的指標(biāo)有兩大類: 數(shù)值平均數(shù)是根據(jù)全部數(shù)據(jù)計(jì)算得到的代表值,主要有算術(shù)平均數(shù)、調(diào)和平均數(shù)及幾何平均數(shù); 位置代表值根據(jù)數(shù)據(jù)所處位置直接觀察、或根據(jù)與特定位置有關(guān)的部分?jǐn)?shù)據(jù)來(lái)確定的代表值,主要有眾數(shù)和中位數(shù)。,.,9,測(cè)定集中趨勢(shì)指標(biāo)的作用,1反映變量分布的集中趨勢(shì)

3、和一般水平。 如用平均工資了解職工工資分布的中心,反映職工工資的一般水平。 2可用來(lái)比較同一現(xiàn)象在不同空間或不同階段的發(fā)展水平。 不受總體規(guī)模大小的影響, 在一定程度上使偶然因素的影響相互抵消。 3可用來(lái)分析現(xiàn)象之間的依存關(guān)系。 如研究勞動(dòng)者的文化程度與收入的關(guān)系 4平均指標(biāo)也是統(tǒng)計(jì)推斷中的一個(gè)重要統(tǒng)計(jì)量,是進(jìn)行統(tǒng)計(jì)推斷的基礎(chǔ)。,.,10,二、數(shù)值平均數(shù),.,11,(一)算術(shù)平均數(shù),算術(shù)平均數(shù)是計(jì)算平均指標(biāo)最常用的方法,其基本公式是: 分子、分母的口徑及包含的內(nèi)容應(yīng)嚴(yán)格一致,即各標(biāo)志值與各單位之間必須一一對(duì)應(yīng)。 例:計(jì)算某企業(yè)職工平均工資,是該企業(yè)所有職工工資總額除以職工總?cè)藬?shù)所得。如工資總額

4、150000元,總?cè)藬?shù)300人,平均工資500元。,.,12,1、簡(jiǎn)單算術(shù)平均數(shù),計(jì)算公式: 其中: 代表算術(shù)平均數(shù),xi代表各單位標(biāo)志值(變量值),n代表總體單位數(shù)(項(xiàng)數(shù))。 適用條件: 原始資料(或資料未分組); 各變量出現(xiàn)次數(shù)相等的情況下應(yīng)用;,.,13,表3-1,解:采用簡(jiǎn)單算術(shù)平均法計(jì)算,即全體隊(duì)員的平均年齡為(單位:周歲),分組數(shù)據(jù)不能簡(jiǎn)單平均!因?yàn)楦鹘M變量值的次數(shù)不等!若采用簡(jiǎn)單平均:,表3-2,.,14,2、加權(quán)算術(shù)平均數(shù),計(jì)算公式: 加權(quán)為了體現(xiàn)各變量值輕重不同的影響作用,對(duì)各個(gè)變量值賦予不盡相同的權(quán)數(shù)( fi ) 其中: 代表算術(shù)平均數(shù),x 代表各單位標(biāo)志值(變量值),f

5、代表各組單位數(shù)(項(xiàng)數(shù))。,.,15,權(quán)數(shù)的含義和表現(xiàn)形式,權(quán)數(shù)(fi)也稱權(quán)重,計(jì)算總體平均數(shù)或綜合水平的過(guò)程中對(duì)各個(gè)數(shù)據(jù)起著權(quán)衡輕重作用的變量。 權(quán)數(shù)的表現(xiàn)形式:可以是絕對(duì)數(shù)形式,也可以是比重形式(如頻率)來(lái)表示: 事實(shí)上比重權(quán)數(shù)更能夠直接表明權(quán)數(shù)的權(quán)衡輕重作用的實(shí)質(zhì)。,.,16,加權(quán)算術(shù)平均數(shù)就成了簡(jiǎn)單算術(shù)平均數(shù),也就是說(shuō)簡(jiǎn)單算術(shù)平均數(shù)是加權(quán)算術(shù)平均數(shù)的一種特殊形式。,當(dāng)權(quán)數(shù)完全相等時(shí),.,17,例3-1正確的計(jì)算是:,由單項(xiàng)數(shù)列計(jì)算算術(shù)平均數(shù)可直接用加權(quán)算術(shù)平均法進(jìn)行計(jì)算。,.,18,【例3.】根據(jù)表3-中的數(shù)據(jù),計(jì)算50 名工人日加工零件數(shù)的均值,.,19,權(quán)數(shù)對(duì)算術(shù)平均數(shù)的影響,加權(quán)

6、算術(shù)平均數(shù)其數(shù)值的大小,不僅受各組變量值大小的影響,而且受各組變量值出現(xiàn)的頻數(shù)即權(quán)數(shù)大小的影響。如果某一組的權(quán)數(shù)大,說(shuō)明該組的數(shù)據(jù)較多,那么該組數(shù)據(jù)的大小對(duì)算術(shù)平均數(shù)的影響就越大,反之,則越小。,.,20,甲乙兩組各有10名學(xué)生,他們的考試成績(jī)及其分布數(shù)據(jù)如下: 甲組: 考試成績(jī)(X ): 0 20 100 人數(shù)分布(F ):1 1 8 乙組: 考試成績(jī)(X ): 0 20 100 人數(shù)分布(F ):8 1 1,.,21,3、由組距數(shù)列計(jì)算算術(shù)平均數(shù),在組距分組的情況下,由于各組的組限只表明各組標(biāo)志值的上下界限,因此由組距數(shù)列計(jì)算加權(quán)算術(shù)平均數(shù)時(shí),必須先計(jì)算各組的組中值,以組中值代表該組標(biāo)志值

7、,然后再計(jì)算加權(quán)算術(shù)平均數(shù)。,各組變量值用組中值來(lái)表示; 假定條件是各組內(nèi)數(shù)據(jù)呈均勻分布或?qū)ΨQ分布; 計(jì)算結(jié)果是近似值。,.,22,某批次節(jié)能燈泡使用壽命的分組數(shù)據(jù),.,23,4、對(duì)相對(duì)數(shù)求算術(shù)平均數(shù),由于各個(gè)相對(duì)數(shù)的對(duì)比基礎(chǔ)不同,采用簡(jiǎn)單算術(shù)平均通常不合理,需要加權(quán)。,權(quán)數(shù)的選擇必須符合該相對(duì)數(shù)本身的計(jì)算公式。 權(quán)數(shù)通常為該相對(duì)數(shù)的分母指標(biāo)。,.,24,5、算術(shù)平均數(shù)的主要數(shù)學(xué)性質(zhì),(1)算術(shù)平均數(shù)與變量值個(gè)數(shù)的乘積等于各個(gè)變量值的總和。,(2)各變量值與算術(shù)平均數(shù)的離差之總和等于零。,(3)各變量值與算術(shù)平均數(shù)的離差平方之總和為最小。,.,25,(二)調(diào)和平均數(shù),概念:調(diào)和平均數(shù)又稱倒數(shù)平

8、均數(shù),是變量倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。 公式: A.簡(jiǎn)單調(diào)和平均數(shù),B.加權(quán)調(diào)和平均數(shù),式中:M各組的標(biāo)志總量;X各組的標(biāo)志值。,.,26,應(yīng)用調(diào)和平均數(shù)應(yīng)注意問(wèn)題,1、變量x的值不能為0。 2、調(diào)和平均數(shù)易受極端值的影響。 3、要注意其運(yùn)用的條件。(已知各組的標(biāo)志總量和標(biāo)志值,而權(quán)數(shù)未知),.,27,例 題,例 水果甲級(jí)每元1公斤,乙級(jí)每元1.5公斤,丙級(jí)每元2公斤。問(wèn): (1)若各買1公斤,平均每元可買多少公斤? (2)各買6.5公斤,平均每元可買多少公斤? (3)若買甲級(jí)3公斤,乙級(jí)2公斤,丙級(jí)1公斤,平均每元可買幾公斤? (4)甲乙丙三級(jí)各買1元,每元可買幾公斤?,.,28,解答:,(1

9、) (2) (3) (4),.,29,算術(shù)平均數(shù)與調(diào)和平均數(shù)的關(guān)系,1.從數(shù)學(xué)定義角度看算術(shù)平均數(shù)與調(diào)和平均數(shù)是不一樣的,但在社會(huì)經(jīng)濟(jì)應(yīng)用領(lǐng)域,調(diào)和平均數(shù)實(shí)際上只是算術(shù)平均數(shù)的另一種表現(xiàn)形式,二者本質(zhì)上是一致的,惟一的區(qū)別是計(jì)算時(shí)使用了不同的數(shù)據(jù)。 2.計(jì)算比率的平均數(shù)時(shí),如果已知比率及其基本計(jì)算式的分母資料,則采用加權(quán)算術(shù)平均法;如果已知比率及其基本計(jì)算式的分子資料,則采用加權(quán)調(diào)和平均法。,.,30,例 自行車賽時(shí)速:甲30公里,乙28公里,丙20公里,全程200公里,問(wèn)三人平均時(shí)速是多少?若甲乙丙三人各騎車2小時(shí),平均時(shí)速是多少?,.,31,(三)幾何平均數(shù),概念:幾何平均數(shù)是n個(gè)變量連乘

10、積的n次根。 適用于現(xiàn)象各變量值的連乘積等于總體標(biāo)志總量的場(chǎng)合,是計(jì)算平均比率和平均速度常用的一種方法。如:銀行平均利率、各年平均發(fā)展速度、產(chǎn)品平均合格率等 計(jì)算公式: (1)簡(jiǎn)單幾何平均數(shù) (2)加權(quán)幾何平均數(shù),.,32,應(yīng)注意的問(wèn)題,1、變量數(shù)列中任何一個(gè)變量值不能為0,一個(gè)為0,則幾何平均數(shù)為0。 2、幾何平均法主要用于動(dòng)態(tài)平均數(shù)的計(jì)算。 3、實(shí)際統(tǒng)計(jì)中,為了計(jì)算上的方便,通常利用對(duì)數(shù)。,.,33,【例3.8】一位投資者持有一種股票,1996年、1997年、1998年和1999年收益率分別為4.5%、2.0%、3.5%、5.4%。計(jì)算該投資者在這四年內(nèi)的平均收益率。,平均收益率103.8

11、4%-1=3.84%,.,34,三、眾數(shù)與中位數(shù),(一)眾數(shù)(Mode),1.概念:眾數(shù)是指變量數(shù)列中出現(xiàn)次數(shù)最多或頻率最大的變量值。 2.適用條件:只有集中趨勢(shì)明顯時(shí),才能用眾數(shù)作為總體的代表值。,.,35,3.眾數(shù)的計(jì)算方法:,(1)單項(xiàng)數(shù)列確定眾數(shù),即出現(xiàn)次數(shù)最多(頻率最大)的標(biāo)志值就是眾數(shù)。 (2)組距數(shù)列確定眾數(shù):在等距數(shù)列條件下,先確定眾數(shù)組,然后再通過(guò)公式進(jìn)行具體計(jì)算,找出眾數(shù)點(diǎn)的標(biāo)志值。,.,36,定類數(shù)據(jù)眾數(shù)的確定,【例3.1】根據(jù)表3-1中的數(shù)據(jù),計(jì)算眾數(shù)。,解:這里的變量為“廣告類型”,這是個(gè)定類變量,不同類型的廣告就是變量值。我們看到,在所調(diào)查的200人當(dāng)中,關(guān)注商品廣

12、告的人數(shù)最多,為112人,占總被調(diào)查人數(shù)的56%,因此眾數(shù)為“商品廣告”這一類別,即 Mo商品廣告,.,37,定序數(shù)據(jù)眾數(shù)的確定,【例3.2】根據(jù)表3-2中的數(shù)據(jù),計(jì)算眾數(shù)。,解:這里的數(shù)據(jù)為定序數(shù)據(jù)。變量為“回答類別”。甲城市中對(duì)住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即 Mo不滿意,.,38,4.計(jì)算公式:,公式1(下限公式):用眾數(shù)所在組的下限為起點(diǎn)值計(jì)算 公式2(上限公式):用眾數(shù)所在組的上限為起點(diǎn)值計(jì)算 U為眾數(shù)所在組組距的上限,L為眾數(shù)所在組組距的下限, 為眾數(shù)組的上限, 為眾數(shù)組次數(shù)與前一組次數(shù)之差, 為眾數(shù)組與后一組之差,i 為眾數(shù)組的組距。,.,3

13、9,數(shù)值型分組數(shù)據(jù)眾數(shù)的確定,【例3.3】根據(jù)表3-3中的數(shù)據(jù),計(jì)算50名工人日加工零件數(shù)的眾數(shù),.,40,(二)中位數(shù),1、概念:將總體單位的某一數(shù)量標(biāo)志的各個(gè)數(shù)值按照大小順序排列,居于中間位置的那個(gè)數(shù)值就是中位數(shù)。 中位數(shù)是位置平均數(shù),它不受極端值的影響,在具有個(gè)別極大或極小標(biāo)志值的分布數(shù)列中,中位數(shù)比計(jì)算算術(shù)平均數(shù)更具有代表性; 從中位數(shù)的概念可以看出,總體中有一半項(xiàng)目的數(shù)值小于中位數(shù),一半項(xiàng)目的數(shù)值大于中位數(shù)。,.,41,2、計(jì)算方法: (1)由未分組資料確定中位數(shù) 排序:按大小順序排序(某一標(biāo)志值) 確定中位數(shù)位置 計(jì)算(確定)中位數(shù)數(shù)值:分兩種: 奇數(shù):中間位置的標(biāo)志值為中位數(shù)。

14、偶數(shù):中間位置相鄰兩個(gè)變量值的簡(jiǎn)單平均數(shù)是中位數(shù)。,.,42,某組學(xué)生考試成績(jī)(8人):72,75,78,79,81,82,84,90 則 若9人,成績(jī)分別為:72,73,75,78,79,81,82,84,90 則,.,43,(2)由分組資料確定中位數(shù),第一步:確定中位數(shù)所處位置,按 確定(f為次數(shù))。 第二步:確定中位數(shù)組: 第三步:采用公式計(jì)算 下限法:用“向上累計(jì)”法確定中位數(shù)。 上限法:用“向下累計(jì)”法確定中位數(shù)。 其中:U是中位數(shù)所在組的上限,L是中位數(shù)所在組的下限,fm是中位數(shù)所在組的次數(shù),Sm+1是中位數(shù)所在組后面各組累計(jì)次數(shù),Sm-1是中位數(shù)所在組前面各組累計(jì)次數(shù),i是中位數(shù)

15、所在組的組距。,.,44,例 現(xiàn)檢測(cè)某廠生產(chǎn)的一批電子產(chǎn)品的耐用時(shí)間,得到資料如下表所示:,.,45,.,46,分位數(shù),二分位數(shù)(中位數(shù))、四分位數(shù)、十分位數(shù)和百分位數(shù)等。其中主要有四分位數(shù)。 排 位 處于 25%和75%位置上的值即 四分位數(shù),不受極端值的影響 要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)(各種分位數(shù)可由spss計(jì)算),.,47,四分位數(shù)的位置,未分組數(shù)據(jù):,組距分組數(shù)據(jù):,.,48,數(shù)值型未分組數(shù)據(jù)的四分位數(shù),原始數(shù)據(jù): 23 21 30 32 28 25 26,QL= 23,QU = 30,.,49,數(shù)值型未分組數(shù)據(jù)的四分位數(shù) (6個(gè)(N+1不能被4整除)數(shù)據(jù)的

16、算例),原始數(shù)據(jù): 23 21 30 28 25 26 排 序: 21 23 25 26 28 30 位 置: 1234 5 6,QL= 21+0.75(23-21) = 22. 5,QU = 28+0.25(30-28) = 28.5,.,50,數(shù)值型分組數(shù)據(jù)的四分位數(shù)(計(jì)算公式),上四分位數(shù):,下四分位數(shù):,.,51,數(shù)值型分組數(shù)據(jù)的四分位數(shù)(計(jì)算示例),QL位置50/412.5,QU位置350/437.5,【例】根據(jù)表3-5中的數(shù)據(jù),計(jì)算50名工人日加工零件數(shù)的四分位數(shù),.,52,(三)眾數(shù)、中位數(shù)和算術(shù)平均值的比較,1算術(shù)平均數(shù)。 算術(shù)平均數(shù)應(yīng)用范圍最廣。 易受極端值的影響。 當(dāng)分布數(shù)

17、列中存在開(kāi)口組時(shí),會(huì)影響平均數(shù)的準(zhǔn)確性。 算術(shù)平均數(shù)適用于數(shù)值型數(shù)據(jù)。,.,53,2調(diào)和平均數(shù) 適用于計(jì)算比率的平均數(shù)。 它容易受極端值的影響,數(shù)列中只要有一個(gè)變量值為零,則不能計(jì)算調(diào)和平均數(shù),故其應(yīng)用范圍受到限制。 調(diào)和平均數(shù)適用于數(shù)值型數(shù)據(jù)。,.,54,3幾何平均數(shù) 適用于各比率連乘積等于總比率的條件下計(jì)算比率的平均數(shù)。 數(shù)列中若有一項(xiàng)為零或負(fù)數(shù),計(jì)算幾何平均數(shù)無(wú)意義,應(yīng)用范圍較小。 幾何平均數(shù)適用于數(shù)值型數(shù)據(jù)。,.,55,4眾數(shù) 眾數(shù)的意義易于理解,有時(shí)容易計(jì)算,且不受極端值的影響。 當(dāng)數(shù)據(jù)分布沒(méi)有明顯的集中趨勢(shì)而趨于均勻分布時(shí),則無(wú)眾數(shù)可言;對(duì)不等距分布數(shù)列,眾數(shù)不易確定。 當(dāng)分布數(shù)列

18、中出現(xiàn)雙眾數(shù)或多眾數(shù)時(shí),難以反映所有數(shù)據(jù)的一般水平。 變量值的變化反映不靈敏。 眾數(shù)適用于分類數(shù)據(jù)、順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)。,.,56,5中位數(shù) 中位數(shù)不受極端值的影響。 當(dāng)分布數(shù)列中存在極端值或組距數(shù)列中存在開(kāi)口組時(shí),計(jì)算中位數(shù)比較好。 中位數(shù)缺乏靈敏性,沒(méi)有算術(shù)平均數(shù)可靠,且不易用代數(shù)方法計(jì)算。 中位數(shù)適用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)。,.,57,右偏分布,眾數(shù),中位數(shù),均值,對(duì)何種數(shù)據(jù)而言的?,均值=中位數(shù)=眾數(shù),均值中位數(shù)眾數(shù),均值中位數(shù)眾數(shù),.,58,(一)算術(shù)平均數(shù)、幾何平均數(shù)和調(diào)和平均數(shù)三者的關(guān)系 (二)算術(shù)平均數(shù)、眾數(shù)和中位數(shù)三者的關(guān)系 1、當(dāng)總體分布成對(duì)稱狀態(tài)時(shí),三者合而為一。 2、

19、當(dāng)總體分布呈右偏時(shí),則 3、當(dāng)總體分布呈左偏時(shí),則,.,59,當(dāng)分布偏態(tài)時(shí),三者之間的數(shù)量關(guān)系是: 若 則說(shuō)明分布右偏 若 則說(shuō)明分布左偏 若 則說(shuō)明分布對(duì)稱,.,60,第二節(jié) 統(tǒng)計(jì)變量離散程度的測(cè)定,對(duì)數(shù)據(jù)分布特征的另一個(gè)測(cè)度指標(biāo)是數(shù)據(jù)分布離散程度。 它反映各數(shù)據(jù)遠(yuǎn)離其中心值的程度,因此,也稱離中趨勢(shì)。 集中趨勢(shì)反映的是各變量值向其中心值聚集的程度, 離中趨勢(shì)反映各變量值之間的差異狀況。 注意: 集中趨勢(shì)的測(cè)度值概括地反映了數(shù)據(jù)的一般水平,它對(duì)該組數(shù)據(jù)的代表程度,取決于該組數(shù)據(jù)的離散水平。 數(shù)據(jù)的離散程度越大,集中趨勢(shì)的測(cè)度值對(duì)該組數(shù)據(jù)的代表性就越差。,.,61,測(cè)度離散程度的指標(biāo)稱為變異指

20、標(biāo)。,變異指標(biāo)的主要作用:,1.說(shuō)明數(shù)據(jù)的分散程度,反映變量的穩(wěn)定性、均衡性。 數(shù)據(jù)之間差異越大,變量的穩(wěn)定性或均衡性越差。 2.衡量平均數(shù)的代表性。 離散程度越大,平均數(shù)的代表性就越小。 3. 統(tǒng)計(jì)推斷的重要依據(jù) 判別統(tǒng)計(jì)推斷前提條件是否成立, 衡量推斷效果好壞的重要尺度。,.,62,離散程度的測(cè)度指標(biāo),分類數(shù)據(jù):異眾比率(variation ratio) 順序數(shù)據(jù):四分位差(quartile range ) 數(shù)值型數(shù)據(jù): 極差( range ) 平均差(mean deviation) 方差和標(biāo)準(zhǔn)差( Variance and standard deviation) 相對(duì)位置的度量:標(biāo)準(zhǔn)化值

21、( standard score) 相對(duì)離散程度:離散系數(shù)( Coefficient of Variation ),.,63,極差,1.一組數(shù)據(jù)的最大值與最小值之差 2.易受極端值影響,未分組數(shù)據(jù) R = max(Xi) - min(Xi),3.計(jì)算公式為,.,64,四分位差,對(duì)順序數(shù)據(jù)離散程度的測(cè)度 也稱為內(nèi)距或四分間距 上四分位數(shù)與下四分位數(shù)之差 反映了中間50%數(shù)據(jù)的離散程度 用于衡量中位數(shù)的代表性,.,65,定序數(shù)據(jù)的算例,【例3.13】根據(jù)第三章表3-13中的數(shù)據(jù),計(jì)算甲城市家庭對(duì)住房滿意狀況評(píng)價(jià)的四分位差,解:設(shè)非常不滿意為1,不滿意為2, 一般為3, 滿意為 4, 非常滿意為5

22、已知 QL = 不滿意 = 2 QU = 一般 = 3 四分位差: QD = QU = QL = 3 2 = 1,.,66,數(shù)值型分組數(shù)據(jù)的四分位差,【例3.12-2】根據(jù)表3-12中的數(shù)據(jù),計(jì)算50 名工人日加工零件數(shù)的四分位差。,.,67,平均差,1. 離散程度的測(cè)度值之一 2. 各變量值與其均值離差絕對(duì)值的平均數(shù) 3. 能全面反映一組數(shù)據(jù)的離散程度 4. 數(shù)學(xué)性質(zhì)較差,實(shí)際中應(yīng)用較少,計(jì)算公式為,未分組數(shù)據(jù),組距分組數(shù)據(jù),.,68,算例,【例3.14】根據(jù)第三章表3-14中的數(shù)據(jù),計(jì)算工人日加工零件數(shù)的平均差,.,69,方差和標(biāo)準(zhǔn)差,1. 離散程度的測(cè)度值之一 2. 最常用的測(cè)度值 3.

23、 反映了數(shù)據(jù)的分布 4. 反映了各變量值與均值的平均差異 5. 根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差或標(biāo)準(zhǔn)差,.,70,總體方差和標(biāo)準(zhǔn)差(計(jì)算公式),未分組數(shù)據(jù):,組距分組數(shù)據(jù):,標(biāo)準(zhǔn)差的計(jì)算公式,.,71,總體標(biāo)準(zhǔn)差(計(jì)算過(guò)程及結(jié)果),【例3.15】根據(jù)第三章表3-15中的數(shù)據(jù),計(jì)算工人日加工零件數(shù)的標(biāo)準(zhǔn)差,.,72,方差的主要數(shù)學(xué)性質(zhì),(3)分組條件下,總體的方差等于組間方差與各組方差平均數(shù)之和。,(1)常數(shù)的方差等于零。a為常數(shù),則 (2)變量的線性函數(shù)的方差等于變量系數(shù)的平方乘以變量的方差。設(shè)a,b為常數(shù),y=a+bx,則有:,組間方差,各組方差平

24、均數(shù),.,73,標(biāo)準(zhǔn)化值,1)對(duì)某一個(gè)值在一組數(shù)據(jù)中相對(duì)位置的度量 2)可用于判斷一組數(shù)據(jù)是否有離群點(diǎn) 3)用于對(duì)變量的標(biāo)準(zhǔn)化處理 4)計(jì)算公式為,.,74,注意: z分?jǐn)?shù)只是將原始數(shù)據(jù)進(jìn)行了線性變換,它并沒(méi)有改變一個(gè)數(shù)據(jù)在該組數(shù)據(jù)中的位置,也沒(méi)有改變?cè)摻M數(shù)據(jù)分布的形狀,而只是將該組數(shù)據(jù)變?yōu)榫禐?,標(biāo)準(zhǔn)差為1。,.,75,算例,假定某班學(xué)生先后兩個(gè)兩次進(jìn)行了難度不同的綜合考試,第一次考試成績(jī)的均值和標(biāo)準(zhǔn)差分別為80分和10分,而第二次考試成績(jī)的均值和標(biāo)準(zhǔn)差分別為70分和7分。張三第一、二次考試的成績(jī)分別為92分和80分,那么全班相比較而言,他哪一次考試的成績(jī)更好呢?,解:由于兩次考試成績(jī)的均

25、值和標(biāo)準(zhǔn)差不同,每個(gè)學(xué)生兩次考試的成績(jī)不宜直接比較。 利用標(biāo)準(zhǔn)化值進(jìn)行對(duì)比,表明第二次考試的成績(jī)更好一些。,.,76,離散系數(shù),1.標(biāo)準(zhǔn)差與其相應(yīng)的均值之比 2.消除了數(shù)據(jù)水平高低和計(jì)量單位的影響 3.測(cè)度了數(shù)據(jù)的相對(duì)離散程度 4.用于對(duì)不同組別數(shù)據(jù)離散程度的比較 5. 計(jì)算公式為,.,77,全距、四分位差、平均差、標(biāo)準(zhǔn)差都是絕對(duì)指標(biāo),都與平均指標(biāo)有相同的計(jì)量單位。 不宜直接來(lái)比較不同水平數(shù)列之間的標(biāo)志離散程度。 離散系數(shù)也稱為標(biāo)志變動(dòng)系數(shù)。最常用的是根據(jù)標(biāo)準(zhǔn)差與算術(shù)平均數(shù)對(duì)比的離散系數(shù),稱作“標(biāo)準(zhǔn)差系數(shù)”。,.,78,例如: 有兩個(gè)不同水平的工人日產(chǎn)量(件)資料: 甲組:60,65,70,7

26、5,80 乙組:2,5,7,9,12 由此計(jì)算得: 計(jì)算其離散系數(shù)來(lái)比較:,.,79,算例,【例】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表4.7。試比較產(chǎn)品銷售額與銷售利潤(rùn)的離散程度,.,80,結(jié)論: 計(jì)算結(jié)果表明,V1V2,說(shuō)明產(chǎn)品銷售額的離散程度小于銷售利潤(rùn)的離散程度,.,81,異眾比率,1.離散程度的測(cè)度值之一 2.非眾數(shù)組的頻數(shù)占總頻數(shù)的比率 3.用于衡量眾數(shù)的代表性,4. 計(jì)算公式為,.,82,算例,【例3.10】根據(jù)第三章表3-10中的數(shù)據(jù),計(jì)算異眾比率,.,83,數(shù)據(jù)類型與離散程度測(cè)度值,.,84,變量分布的偏度與峰度,一、矩(動(dòng)差 ),矩(動(dòng)差 ) 一系列刻畫數(shù)據(jù)分布特

27、征的指標(biāo)的統(tǒng)稱。 變量值與數(shù)值 a 之離差的 K 次方的平均數(shù)稱為變量 x 關(guān)于 a 的K 階矩,即:,.,85,K 階原點(diǎn)矩(當(dāng)a = 0 時(shí))是數(shù)據(jù)的K次方的平均數(shù). 一階原點(diǎn)矩即算術(shù)平均數(shù); 二階原點(diǎn)矩即平方平均數(shù)。,K 階中心矩矩(當(dāng)a =均值 時(shí))是以均值為中心計(jì)算的離差 K 次方的平均數(shù) k=1時(shí),稱為一階中心矩,它恒等于0,即 m1=0; k=2時(shí),稱為二階中心矩,也就是方差,即m2=2。,.,86,二、偏度(Skewness),偏度指數(shù)據(jù)分布的不對(duì)稱程度或偏斜程度。 以 對(duì)稱分布 為標(biāo)準(zhǔn)來(lái)區(qū)分 偏態(tài)分布又分左偏(負(fù)偏)和右偏(正偏).,.,87,偏態(tài)的測(cè)度方法,一般有:,(一)由均值與眾數(shù)(中位數(shù))之間的關(guān)系求偏態(tài)系數(shù):,.,88,(二)由三個(gè)四分位數(shù)之間的關(guān)系求偏態(tài)系數(shù),值域:-1 Sk 1,.,89,(三)利用 3 階中心矩來(lái)計(jì)算偏度系數(shù)。 測(cè)定偏度最常用的方法 原理:若分布不對(duì)稱

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論