計量經(jīng)濟(jì)學(xué)第1章-數(shù)據(jù)的特征數(shù)_第1頁
計量經(jīng)濟(jì)學(xué)第1章-數(shù)據(jù)的特征數(shù)_第2頁
計量經(jīng)濟(jì)學(xué)第1章-數(shù)據(jù)的特征數(shù)_第3頁
計量經(jīng)濟(jì)學(xué)第1章-數(shù)據(jù)的特征數(shù)_第4頁
計量經(jīng)濟(jì)學(xué)第1章-數(shù)據(jù)的特征數(shù)_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第第 1 章章 數(shù)據(jù)的特征數(shù)數(shù)據(jù)的特征數(shù) 本本章以及第章以及第 2、3 章的內(nèi)容來自推斷統(tǒng)計學(xué)。章的內(nèi)容來自推斷統(tǒng)計學(xué)。 在本書中在本書中經(jīng)濟(jì)經(jīng)濟(jì)觀測值觀測值對應(yīng)的變量對應(yīng)的變量稱稱為經(jīng)濟(jì)變量, 或簡稱為變量為經(jīng)濟(jì)變量, 或簡稱為變量, 通常通常是當(dāng)作隨機是當(dāng)作隨機變量處理的變量處理的。 但現(xiàn)實中經(jīng)濟(jì)變量能否滿足隨機變量的定義要求, 是我們在實際研究中但現(xiàn)實中經(jīng)濟(jì)變量能否滿足隨機變量的定義要求, 是我們在實際研究中始終應(yīng)關(guān)注的問題。始終應(yīng)關(guān)注的問題。 這一章把數(shù)據(jù)的特征這一章把數(shù)據(jù)的特征數(shù)數(shù)分為分為 4 大類, 即描述大類, 即描述集中位置的特征數(shù)、 分散程度的特征集中位置的特征數(shù)、 分散程度

2、的特征數(shù)、分布狀況的特征數(shù)和數(shù)、分布狀況的特征數(shù)和兩兩變量線性變量線性相關(guān)相關(guān)的特征數(shù)的特征數(shù)。本章共介紹本章共介紹 10 個特征數(shù),分別個特征數(shù),分別是是算術(shù)平均數(shù)、幾何平均數(shù)算術(shù)平均數(shù)、幾何平均數(shù)、中位數(shù)、中位數(shù)、極極差、方差、標(biāo)準(zhǔn)差、差、方差、標(biāo)準(zhǔn)差、偏度、峰度、協(xié)方差和偏度、峰度、協(xié)方差和相關(guān)系數(shù)相關(guān)系數(shù)。在介紹特征數(shù)之前,先給出求和算子和畫圖的概念。在介紹特征數(shù)之前,先給出求和算子和畫圖的概念。 注意:注意:本章本章所說的所說的一組數(shù)據(jù)一組數(shù)據(jù)如果如果不不作作特別說特別說明明,則既可以,則既可以指指一個總體,也可以一個總體,也可以指指一個樣本。一個樣本。 第第 1 章章 數(shù)據(jù)的特征數(shù)

3、數(shù)據(jù)的特征數(shù) 1.1 累計累計求和算子的運算規(guī)則求和算子的運算規(guī)則 總體總體:研究對象的全體稱為總體:研究對象的全體稱為總體。常用。常用x1, x2, , xN或或y1, y2, , yN等表示。等表示。 個體個體:組成總體的每個基本單位稱為個體。:組成總體的每個基本單位稱為個體。常用常用 xi, 或或 yi等表示。等表示。 總體容量總體容量:總體中所含個體的個數(shù)??傮w中所含個體的個數(shù)。總體總體x1, x2, , xN中的中的 N 表示表示總體容量總體容量。 樣本樣本: 總體中抽出若干個體而: 總體中抽出若干個體而組組成的集體稱為樣本。 常用成的集體稱為樣本。 常用x1, x2, , xn或或

4、y1, y2, , yn等等表示。表示。 樣本容量樣本容量:樣本中所含個體的個數(shù):樣本中所含個體的個數(shù)稱作稱作樣本容量樣本容量,樣本樣本x1, x2, , xn中的中的下標(biāo)下標(biāo) n 表示表示樣本容量樣本容量。 比如比如某某銀行分理處銀行分理處共有共有 20 486 個活期存款儲戶個活期存款儲戶。如果要。如果要研究研究這這 20 486 個儲戶在某個個儲戶在某個時點的存款額時點的存款額, 那么, 那么這這 20 486 個個存款額存款額就是一個總體,就是一個總體, 存款額存款額的的總體容量總體容量是是 20 486,而每一個而每一個存款額存款額是一個個體。是一個個體。 比如從中隨機抽取比如從中隨

5、機抽取 20 個個存款額數(shù)據(jù)存款額數(shù)據(jù), 則這, 則這 20 個個存款額存款額數(shù)據(jù)數(shù)據(jù)構(gòu)成一個構(gòu)成一個隨機隨機樣本。樣本。樣本容量樣本容量是是 20。 特征數(shù)特征數(shù):用于描述一組數(shù)據(jù):用于描述一組數(shù)據(jù)(總體總體或或樣本樣本)特征的數(shù)值稱作特征數(shù)。特征的數(shù)值稱作特征數(shù)。 本章本章介紹的平均數(shù)、中位數(shù)、方差、相關(guān)系數(shù)等都是一組數(shù)據(jù)的特征數(shù)。介紹的平均數(shù)、中位數(shù)、方差、相關(guān)系數(shù)等都是一組數(shù)據(jù)的特征數(shù)。 累計累計求和算子定義求和算子定義:對于:對于 T 個觀測值,個觀測值,x1, x2, , xT,累計累計求和可以簡化地求和可以簡化地表示為表示為 x1 + x2 + + xT = Tttx1。其中其中

6、)(稱作稱作累計累計求和算子求和算子,用大寫希臘,用大寫希臘字母字母 表示表示。 的上的上、下標(biāo)下標(biāo) t=1 和和 T 表示表示 xt從從 x1累加至累加至 xT。 累計累計求和算子的運算規(guī)則如下求和算子的運算規(guī)則如下: (1)觀測值倍數(shù)的觀測值倍數(shù)的累加累加和等于觀測值和等于觀測值累加累加和的倍數(shù)。和的倍數(shù)。 Tttkx1= kTttx1 其中其中 k 是常數(shù),是常數(shù),xt是觀測值。是觀測值。 (2)兩兩組組觀測值觀測值相應(yīng)求相應(yīng)求和和(或差)或差)的的累加累加和等于它們分別求和等于它們分別求累加累加和后再和后再相加相加(或相減)(或相減) 。 Ttttyx1)(= Tttx1 Ttty1

7、(3)T 個常數(shù)個常數(shù) k 求和等于該常數(shù)求和等于該常數(shù) k 與與 T 的乘積的乘積。Ttk1= kT。其中其中 k 是常數(shù)。是常數(shù)。 (4)用)用雙雙下標(biāo)表示的下標(biāo)表示的 T T 個個觀測值觀測值的的累加和累加和可以用雙可以用雙重重累加累加和和符號表示符號表示為為 (x11 + x12 + + x1T) + (x21 + x22 + + x2T) + + (xT1 + xT2 + + xTT) =Ti 1(xi1 + xi 2 + + xiT) =TjijTix11 (5)兩組觀測值相應(yīng)求和兩組觀測值相應(yīng)求和的雙重的雙重累加累加和等于它們各自雙重和等于它們各自雙重累加累加和的和。和的和。 T

8、jijijTiyx11)(= TjijTix11+TjijTiy11 (6) 兩兩組組不同單下標(biāo)不同單下標(biāo)觀測值觀測值積的雙重積的雙重累計累計求和等于它們各自求和等于它們各自累計累計求和的乘積。求和的乘積。 TjjiTiyx11= (Tiix1) (Tjjy1) 1.2.1 直方圖直方圖 直方圖分直方圖分頻數(shù)直方圖和頻率直方圖兩類。直方圖用橫軸表示觀測值,并把橫軸分頻數(shù)直方圖和頻率直方圖兩類。直方圖用橫軸表示觀測值,并把橫軸分成若干個區(qū)間(每個區(qū)間的寬度稱作組距) ;用縱軸表示落在相應(yīng)區(qū)間內(nèi)的觀測值成若干個區(qū)間(每個區(qū)間的寬度稱作組距) ;用縱軸表示落在相應(yīng)區(qū)間內(nèi)的觀測值頻數(shù)(個數(shù))頻數(shù)(個數(shù)

9、)或頻率,并用矩形(長條形)表示組頻數(shù)或或頻率,并用矩形(長條形)表示組頻數(shù)或組組頻率的圖形。頻率的圖形。 例例 1-1: 20 個新生兒體重值 (克) 數(shù)據(jù)見表個新生兒體重值 (克) 數(shù)據(jù)見表 1-1。 畫畫 20 個個新生兒體重值的新生兒體重值的頻數(shù) (頻頻數(shù) (頻率)率)直方圖。直方圖。 表表 1-1 新生兒體重值新生兒體重值 xi數(shù)據(jù)數(shù)據(jù) 單位:克單位:克 序序號號 體體重值重值 序序號號 體體重值重值 1 2440 11 3180 2 2620 12 3200 3 2700 13 3200 4 2880 14 3300 5 2900 15 3420 6 3000 16 3440 7

10、3020 17 3500 8 3040 18 3500 9 3080 19 3600 10 3100 20 3860 1.2.1 直方圖直方圖 例例 1-1:首先首先把這把這 20 個新生兒體重值按從小到大順序排列如下:個新生兒體重值按從小到大順序排列如下: 2440,2620,2700,2880,2900,3000,3020,3040,3080,3100,3180,3200,3200,3300,3420,3440,3500,3500,3600,3860。 知最小值是知最小值是 2440 克, 最大值是克, 最大值是 3860 克。 把觀測值的取值范圍按克。 把觀測值的取值范圍按 2400 2

11、700,2700 3000,3000 3300,3300 3600,3600 3900 分成分成 5 組。記錄這組。記錄這 20 個觀測值個觀測值分別落在這分別落在這 5 個組內(nèi)的頻數(shù)(個數(shù)) 。結(jié)果分別是個組內(nèi)的頻數(shù)(個數(shù)) 。結(jié)果分別是 2,3,8,5,2。用總觀測值個。用總觀測值個數(shù)數(shù) 20 除每個組頻數(shù)除每個組頻數(shù),得,得組頻率值分別組頻率值分別是是 0.10,0.15,0.40,0.25,0.10。用上面的。用上面的結(jié)果結(jié)果制成制成頻數(shù)(頻率)分布表頻數(shù)(頻率)分布表(見(見表表 1-2) 。 表表 1-2 20 個新生兒體重值分組數(shù)據(jù)頻數(shù)(頻率)分布表個新生兒體重值分組數(shù)據(jù)頻數(shù)(頻

12、率)分布表 體重體重值值(克)(克) 頻數(shù)頻數(shù) 頻頻率率 組中值組中值(克)(克) 24002700 以下以下 2 0.10 2550 27003000 以下以下 3 0.15 2850 30003300 以下以下 8 0.40 3150 33003600 以下以下 5 0.25 3450 36003900 以下以下 2 0.10 3750 合計合計 20 1.00 例例 1-1: 表表 1-2 20 個新生兒體重值分組數(shù)據(jù)頻數(shù)(頻率)分布表個新生兒體重值分組數(shù)據(jù)頻數(shù)(頻率)分布表 體重體重值值(克)(克) 頻數(shù)頻數(shù) 頻頻率率 組中值組中值(克)(克) 24002700 以下以下 2 0.10

13、 2550 27003000 以下以下 3 0.15 2850 30003300 以下以下 8 0.40 3150 33003600 以下以下 5 0.25 3450 36003900 以下以下 2 0.10 3750 合計合計 20 1.00 圖圖 1-1 新生兒體重值的頻數(shù)分布直方圖新生兒體重值的頻數(shù)分布直方圖 圖圖 1-2 新生兒體重值的頻率分布直方圖新生兒體重值的頻率分布直方圖 注意:注意: (1)頻數(shù)頻數(shù)、頻率、頻率直方圖所展示的數(shù)據(jù)分布特征是一樣的直方圖所展示的數(shù)據(jù)分布特征是一樣的,只不過前者的縱軸表示的是,只不過前者的縱軸表示的是頻數(shù),后者縱軸表示的是頻率。頻數(shù),后者縱軸表示的是

14、頻率。 (2)當(dāng)觀測值正巧等于組邊界值時,注意不要當(dāng)觀測值正巧等于組邊界值時,注意不要在相鄰兩組中重復(fù)記錄頻數(shù)在相鄰兩組中重復(fù)記錄頻數(shù)。以表。以表 1-2為例,記錄組頻數(shù)的規(guī)則是組下限值包括在本組內(nèi),組上限值不包括在本組內(nèi)。比如為例,記錄組頻數(shù)的規(guī)則是組下限值包括在本組內(nèi),組上限值不包括在本組內(nèi)。比如觀測值觀測值 2700 克正巧落在組邊界值上。觀測值克正巧落在組邊界值上。觀測值 2700 克應(yīng)該記錄在第克應(yīng)該記錄在第 2 組,而不是第組,而不是第 1組組中中。觀測值觀測值 3000 克也正巧落在組邊界值上。觀測值克也正巧落在組邊界值上。觀測值 3000 克應(yīng)該記錄在第克應(yīng)該記錄在第 3 組,

15、而組,而不是第不是第 2 組中。組中。 (3)同樣一組數(shù)據(jù)由于分組數(shù)不同,所畫頻數(shù)(頻率)直方圖的特征會不一樣同樣一組數(shù)據(jù)由于分組數(shù)不同,所畫頻數(shù)(頻率)直方圖的特征會不一樣。實際。實際中應(yīng)該選擇一個最合適的分組數(shù),以便充分展示數(shù)據(jù)的分布特征。一般分組數(shù)在中應(yīng)該選擇一個最合適的分組數(shù),以便充分展示數(shù)據(jù)的分布特征。一般分組數(shù)在 5 15之間。之間。 (4)很多專用軟件都有畫直方圖的功能,非常方便。)很多專用軟件都有畫直方圖的功能,非常方便。畫直方圖的畫直方圖的 EViews 步驟步驟是,打是,打開單數(shù)開單數(shù)據(jù)組據(jù)組窗口,點擊窗口,點擊 View/descriptive Statistics &a

16、mp; Tests/Histogram and Stats 功能。功能。 -20-100102000.020.040.060.080.10.12-20-100102000.020.040.060.080.10.12-20-100102000.020.040.060.080.10.121.2.2 折線圖折線圖 折線圖:把觀測點按折線圖:把觀測點按序號序號或或時間順序時間順序用直線連接起來的圖形。用直線連接起來的圖形。 對于截面數(shù)據(jù)對于截面數(shù)據(jù),橫軸表示觀測值的序號,縱軸,橫軸表示觀測值的序號,縱軸表示觀測值。對于時間序列數(shù)據(jù),橫軸表示觀測值。對于時間序列數(shù)據(jù),橫軸表示時間,縱軸表示觀測值。時間序

17、列折線圖也稱時間序列圖。表示時間,縱軸表示觀測值。時間序列折線圖也稱時間序列圖。 圖圖 1-3 給出的是給出的是 2005 年年 7 月月 22 日至日至 2007 年年 4 月月 30 日日 433 天的天的美美元兌元兌人民幣人民幣元匯率元匯率值值時間序列圖。時間序列圖。 通過這張圖可以清晰地通過這張圖可以清晰地看到在看到在該該期間期間人民幣一直處于升值的大趨勢中。人民幣一直處于升值的大趨勢中。 圖圖 1-3 2005 年年 7 月月 22 日至日至 2007 年年 4 月月 30 日日 433 天的天的人民幣元兌美元匯率值人民幣元兌美元匯率值時間序列圖時間序列圖 畫折線圖的畫折線圖的 EV

18、iews 步驟是,打開數(shù)據(jù)組窗口,點擊步驟是,打開數(shù)據(jù)組窗口,點擊 View/Graph 功能。在隨后打開的功能。在隨后打開的Graph Options(畫圖選擇)(畫圖選擇)窗口中的窗口中的 Specific(圖類設(shè)定)選項框中(圖類設(shè)定)選項框中選選 Line & Symbol(折線圖) ,點擊確定鍵。(折線圖) ,點擊確定鍵。 7707807908008108203000310032003300rate1.2.3 散點圖散點圖 散點圖:用兩個變量散點圖:用兩個變量的的成對觀測值畫成對觀測值畫出的觀測點圖。出的觀測點圖。 通過散點圖可以分析兩個變量之間是否存在某種關(guān)系。如果存在關(guān)系

19、,那么這種關(guān)系通過散點圖可以分析兩個變量之間是否存在某種關(guān)系。如果存在關(guān)系,那么這種關(guān)系是線性的,還是非線性的。是線性的,還是非線性的。 圖圖 1-4 給出的是給出的是 2002 年年中國各地區(qū)城中國各地區(qū)城鎮(zhèn)鎮(zhèn)居民家庭人均消費性支出(居民家庭人均消費性支出(Y2002,元)元)與可支配收入(與可支配收入(X2002,元)數(shù)據(jù)元)數(shù)據(jù)散點圖散點圖。右上方右上方 4 個觀測點分別代表北京、上海、個觀測點分別代表北京、上海、浙江省和廣東省。浙江省和廣東省。通過散點圖可以清楚地看到通過散點圖可以清楚地看到經(jīng)濟(jì)相對發(fā)達(dá)地區(qū)經(jīng)濟(jì)相對發(fā)達(dá)地區(qū)的的城鎮(zhèn)居民城鎮(zhèn)居民家庭人均家庭人均支出、可支配收入額都很高支出

20、、可支配收入額都很高;經(jīng)濟(jì)相對欠發(fā)達(dá)地區(qū),如甘肅、寧夏、青海、內(nèi)蒙古等經(jīng)濟(jì)相對欠發(fā)達(dá)地區(qū),如甘肅、寧夏、青海、內(nèi)蒙古等城鎮(zhèn)城鎮(zhèn)居民居民家庭人均支出、可支配收入額都家庭人均支出、可支配收入額都相對較相對較低。低。 圖圖 1-4 2002 年年中國城中國城鎮(zhèn)鎮(zhèn)居民家庭人均支出居民家庭人均支出(y2002)與可支配收入與可支配收入(x2002)散點圖散點圖 400060008000100001200060008000100001200014000X2002Y20021.3 算術(shù)平均數(shù)算術(shù)平均數(shù) 下面介紹的下面介紹的平均數(shù)平均數(shù),中位數(shù)等都是,中位數(shù)等都是描述一組數(shù)據(jù)集中位置的描述一組數(shù)據(jù)集中位置的特

21、征數(shù)。特征數(shù)。 對于不分組數(shù)據(jù)對于不分組數(shù)據(jù),均值和算術(shù)平均數(shù)分別均值和算術(shù)平均數(shù)分別定義定義如下。如下。 均值均值:一組數(shù)據(jù),如果是總體,用:一組數(shù)據(jù),如果是總體,用 x1, x2 , , xN 表示,容量為表示,容量為 N,則,則均值均值 定義為定義為 = NxxxN.21=NiixN11 (1-1) 其中其中 表示表示均值,均值,xi表示觀測值,表示觀測值,N 表示總體容量表示總體容量。 算術(shù)平均數(shù)算術(shù)平均數(shù):一組數(shù)據(jù),:一組數(shù)據(jù),如如果是果是樣本樣本, x1, x2 , , xn ,容量為,容量為 n,則算術(shù)平均數(shù),則算術(shù)平均數(shù)x定定義義為為 x= nxxxn.21=niixn11 (

22、1-2) 其中其中x表示表示算術(shù)平均數(shù)算術(shù)平均數(shù),xi表示觀測值,表示觀測值,n 表示表示樣本樣本容量容量。關(guān)于總體均值或數(shù)學(xué)期望的關(guān)于總體均值或數(shù)學(xué)期望的概率定義概率定義見見附錄附錄 B。 x=203860.26202440= 3149(克) 算術(shù)平均算術(shù)平均數(shù)的數(shù)的 EViews 操作:打開數(shù)據(jù)組窗口。點擊操作:打開數(shù)據(jù)組窗口。點擊 View 鍵,選鍵,選 Descriptive Statistics/ histogram and Stats 功能。計算結(jié)果中的功能。計算結(jié)果中的 mean 就是就是算術(shù)平均算術(shù)平均數(shù)的值。數(shù)的值。 1.3 算術(shù)平均數(shù)算術(shù)平均數(shù) 算術(shù)平均數(shù)算術(shù)平均數(shù)是一個常

23、用概念。算術(shù)平均數(shù)是一個常用概念。算術(shù)平均數(shù)的性質(zhì)的性質(zhì)如下。如下。 (1)觀測值的和等于其平均數(shù)與觀測值個數(shù)的乘積。觀測值的和等于其平均數(shù)與觀測值個數(shù)的乘積。niix1= nx 。 x對一組數(shù)據(jù)對一組數(shù)據(jù)有代表性。若不考慮有代表性。若不考慮 xt的差異。用的差異。用x代替代替全部全部 xt,則總和,則總和與與 xt的累計的累計和和相等。所以人們常用相等。所以人們常用算術(shù)平均數(shù)算術(shù)平均數(shù)描述數(shù)據(jù)。如平均年齡,平均工資描述數(shù)據(jù)。如平均年齡,平均工資,平均得分,平均得分等。等。 (2)一組觀測值與其一組觀測值與其算術(shù)算術(shù)平均數(shù)的離差平均數(shù)的離差之之和等于零和等于零,即即 niixx1)(= 0。

24、證證明明:利用利用累計累計求和算子的運算規(guī)則(求和算子的運算規(guī)則(2) 、 (、 (3)和和式式(1-3)結(jié)果,)結(jié)果, niixx1)(=niix1-nix1=niix1- nx= 0 此性質(zhì)以后常常用到。此性質(zhì)以后常常用到。 (3)一組觀測值)一組觀測值與某一定值與某一定值 A 的離差平方和的離差平方和niiAx1)(的值的值以以 A =x時為最小。時為最小。 1.4 幾何平均數(shù)幾何平均數(shù) 當(dāng)數(shù)據(jù)是以環(huán)比形式給出時,當(dāng)數(shù)據(jù)是以環(huán)比形式給出時, 用用算術(shù)算術(shù)平均平均值求平均值求平均數(shù)數(shù)是不合理的。是不合理的。 應(yīng)應(yīng)該用幾何平均數(shù)該用幾何平均數(shù)求該求該組組數(shù)據(jù)的平均數(shù)據(jù)的平均比值比值和和平均平

25、均增增長長率。率。 幾何平均數(shù)幾何平均數(shù)定義定義:一組環(huán)比數(shù)據(jù):一組環(huán)比數(shù)據(jù)r1, r2, , rk,個數(shù)(或稱容量)個數(shù)(或稱容量)為為 k,則幾何平均,則幾何平均數(shù)數(shù) r= kkrrr.21 (1-6) 例例 1-3:中國人口自然增長中國人口自然增長環(huán)比環(huán)比數(shù)據(jù)數(shù)據(jù)如如表表 1-3。按按式式(1-6)計算,)計算, r= 400587. 100601. 100645. 100695. 1= 1.00632 2000 2004 期間中國人口自然增長期間中國人口自然增長年平均年平均環(huán)比值是環(huán)比值是1.00632, 年平均增長率為, 年平均增長率為 6.32 。 表表 1-3 中國人口自然增長環(huán)

26、比數(shù)據(jù)中國人口自然增長環(huán)比數(shù)據(jù) 年份年份 自然增長率(自然增長率() 2000 2001 1.00695 2002 1.00645 2003 1.00601 2004 1.00587 資料來源: 中國統(tǒng)計年鑒資料來源: 中國統(tǒng)計年鑒2005,表,表 4-2(經(jīng)作者加工)(經(jīng)作者加工) ,中國統(tǒng)計出版社。,中國統(tǒng)計出版社。 注意:注意:求求幾何平均數(shù)時,幾何平均數(shù)時,開方數(shù)開方數(shù) k 不要用錯。不要用錯。 仍然是按不分組數(shù)據(jù)和分組數(shù)據(jù)兩種情況討論仍然是按不分組數(shù)據(jù)和分組數(shù)據(jù)兩種情況討論中位數(shù)中位數(shù)定義定義。 中位數(shù)中位數(shù)定義(定義(不分組數(shù)據(jù)情形不分組數(shù)據(jù)情形) :一組) :一組 n 個觀測值,

27、按數(shù)值大小排列如下個觀測值,按數(shù)值大小排列如下,x1, x2, , xn。處于中央位置的處于中央位置的觀測值觀測值稱稱作作中位數(shù)中位數(shù)。用。用 Md 表示表示。 為偶數(shù)為奇數(shù)nxxnxMdnnn,2,1)2/(2/21 例例 1-4: 5 名學(xué)生的考試分?jǐn)?shù)名學(xué)生的考試分?jǐn)?shù)是是 93,90,85,82,80 分。分。 因為因為 n=5,是是奇數(shù),奇數(shù),所以所以中位數(shù)中位數(shù) Md = 85。 例例 1-5:以表以表 1-4 中數(shù)據(jù)為例,從小到大整理后中數(shù)據(jù)為例,從小到大整理后 的的數(shù)據(jù)如數(shù)據(jù)如表表 1-5。 Md =21( x12 / 2 + x (12 / 2) + 1) = 21( x6 +

28、x7) =27868. 57612. 5= 5.774 中位數(shù)中位數(shù) 5.774 比平均數(shù)比平均數(shù) 6.00745 的代表性要的代表性要好好。 表表1-5 表表1-4中中12個匯率值個匯率值的的從小到大排列從小到大排列 序序號號 人民幣元兌美元匯率值人民幣元兌美元匯率值 1 5.7084 2 5.7190 3 5.7290 4 5.7402 5 5.7612 6 5.7612 7 5.7868 8 5.7868 9 5.7918 10 5.8000 11 5.8050 12 8.7000 1.5 中位數(shù)中位數(shù) 例例 1-6:一組數(shù)據(jù)是:一組數(shù)據(jù)是 3,9,6,1,5。哪個是中位數(shù)?。哪個是中位

29、數(shù)? 解:把數(shù)據(jù)解:把數(shù)據(jù)按按從小到大從小到大排序,排序,得,得,1,3,5,6,9。n = 5 為奇數(shù)。則為奇數(shù)。則 Md = x(5+1) / 2 = x3 = 5 即中位數(shù)是即中位數(shù)是 5。 中位數(shù)中位數(shù)定義(分組數(shù)據(jù)情形)定義(分組數(shù)據(jù)情形) :對于分組數(shù)據(jù),:對于分組數(shù)據(jù),Md 的計算公式的計算公式定義定義如下:如下: Md = L +hnn21 (1-8) 其中:其中:L 為中位數(shù)所在組的下限值為中位數(shù)所在組的下限值。 n1為中位數(shù)所在組內(nèi)為中位數(shù)所在組內(nèi)達(dá)到中位數(shù)所需達(dá)到中位數(shù)所需觀測值個觀測值個數(shù)數(shù)(頻數(shù))(頻數(shù)) 。 n 2為中位數(shù)所在組內(nèi)為中位數(shù)所在組內(nèi)觀測值總觀測值總個數(shù)

30、(頻數(shù))個數(shù)(頻數(shù)) 。 h 為該中位數(shù)所在組為該中位數(shù)所在組的的組距。組距。 對于分組數(shù)據(jù),由于看不到原始數(shù)據(jù),定義中位數(shù)的原理是,先確定中位數(shù)落對于分組數(shù)據(jù),由于看不到原始數(shù)據(jù),定義中位數(shù)的原理是,先確定中位數(shù)落在哪個組,然后計算在哪個組,然后計算在該組中在該組中達(dá)到中位數(shù)所需的頻數(shù)與該組頻數(shù)的比值,用這達(dá)到中位數(shù)所需的頻數(shù)與該組頻數(shù)的比值,用這個比值在組距中確定中位數(shù)位置。個比值在組距中確定中位數(shù)位置。 1.5 中位數(shù)中位數(shù)例例1-8:1987年全國人口數(shù)年全國人口數(shù)1%抽樣調(diào)查分組數(shù)據(jù)見表抽樣調(diào)查分組數(shù)據(jù)見表1-6,分布圖如圖,分布圖如圖1-6。表表 1-6 1987 年年 1%抽樣調(diào)

31、查全國人口數(shù)抽樣調(diào)查全國人口數(shù) 資料來源: 中國統(tǒng)計年鑒資料來源: 中國統(tǒng)計年鑒1988,中國統(tǒng)計出版社,中國統(tǒng)計出版社 組序號組序號 年齡年齡分組分組(歲)(歲) 人數(shù)(人數(shù)(人)人) 累計人數(shù)累計人數(shù) 1 0 10 以下以下 1 952 781 1 952 781 2 10 20 以下以下 2 481 611 4 434 329 3 20 30 以下以下 1 958 780 6 393 172 4 30 40 以以下下 1 610 804 5 40 50 以下以下 996 183 6 50 60 以下以下 856 192 7 60 70 以下以下 561 877 8 70 80 以下以下

32、273 803 9 80 90 以下以下 65 584 10 90 100 以下以下 3 593 11 100 110 以下以下 99 合計合計 10 679 307 0501001502002503000102030405060708090100 110AGEPOPULATION數(shù)據(jù)的特點是數(shù)據(jù)的特點是 0 60 歲之間人口歲之間人口分布不均分布不均勻勻。年輕人人數(shù)多,。年輕人人數(shù)多,中中老老年年人數(shù)人數(shù)相對較相對較少。少。人人口的這種年齡分布特征無論對口的這種年齡分布特征無論對中國的中國的勞動力市場,還是勞動力市場,還是已就業(yè)勞動力數(shù)都會造成已就業(yè)勞動力數(shù)都會造成多年多年的連續(xù)的連續(xù)沖擊。

33、經(jīng)計算沖擊。經(jīng)計算平均年齡是平均年齡是 28.8 歲。顯然這個特征數(shù)偏高,不能十分滿意地反映歲。顯然這個特征數(shù)偏高,不能十分滿意地反映數(shù)據(jù)的特征。數(shù)據(jù)的特征。 計算中位數(shù)如下。計算中位數(shù)如下。 中位數(shù)的序數(shù)是中位數(shù)的序數(shù)是 10 679 307/2 = 5 339 654。前兩組的總?cè)藬?shù)是。前兩組的總?cè)藬?shù)是 4 434 329,前前 3 組的總組的總?cè)藬?shù)是人數(shù)是 6 393 172,所以,中位數(shù),所以,中位數(shù) Md 應(yīng)該應(yīng)該落在第落在第 3 組。組。按按式式(1-8) ,下限值) ,下限值 L=20。中。中位數(shù)所在組內(nèi)達(dá)到中位數(shù)所需觀測位數(shù)所在組內(nèi)達(dá)到中位數(shù)所需觀測值個數(shù)值個數(shù) n1 =533

34、.96535-443.4329= 90.5262(萬人)(萬人) 中位數(shù)所在組內(nèi)觀測值總個數(shù)中位數(shù)所在組內(nèi)觀測值總個數(shù)n 2= 195.8780 (萬人)(萬人) 。 中位數(shù)所在組的組距中位數(shù)所在組的組距h = 30-20 =10。 Md = 第第 3 組下限組下限值值+(第第 3 組組內(nèi)內(nèi)達(dá)中位數(shù)所需頻數(shù)達(dá)中位數(shù)所需頻數(shù)/第第 3 組頻數(shù))組頻數(shù)) 第第 3 組組組組距距 = 20 +1958780905262 10 = 24.6(歲)(歲) 中位數(shù)中位數(shù) 24.6 (歲)(歲) 比平均數(shù)比平均數(shù) 28.8 (歲)(歲) 更有代表性。更有代表性。 中位數(shù)在本例中的實際意義是中位數(shù)在本例中的實際意義是 1987年全國年全國 1%抽樣人口中小于抽樣人口中小于 24.6 歲和大于歲和大于 24.6 歲的人口數(shù)各占一半。歲的人口數(shù)各占一半。 中位數(shù)性質(zhì)中位數(shù)性質(zhì)如下如下: (1) 當(dāng)觀測值出現(xiàn)重復(fù)的現(xiàn)象不很多時, 中位數(shù)意味著比它小的觀測值個數(shù)有一半, 比當(dāng)觀測值出現(xiàn)重復(fù)的現(xiàn)象不很多時, 中位數(shù)意味著比它小的觀測值個數(shù)有一半, 比它大的有一半。若有它大的有一半。若有 2 萬農(nóng)戶的年家庭收入萬農(nóng)戶的年家庭收入額額的中位數(shù)為的中位數(shù)為 2 000 元,則知有一萬戶收元,則知有一萬戶收入低于入低于 2 000 元,有一萬戶收入高于元,有一萬戶收入高于 2 000 元。元。 (2) 一組數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論