第四章 集中趨勢(shì)和離中趨勢(shì)_第1頁(yè)
第四章 集中趨勢(shì)和離中趨勢(shì)_第2頁(yè)
第四章 集中趨勢(shì)和離中趨勢(shì)_第3頁(yè)
第四章 集中趨勢(shì)和離中趨勢(shì)_第4頁(yè)
第四章 集中趨勢(shì)和離中趨勢(shì)_第5頁(yè)
已閱讀5頁(yè),還剩42頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四章集中趨勢(shì)和離中趨勢(shì)4.1集中趨勢(shì)的計(jì)量4.2離中趨勢(shì)的計(jì)量4.3數(shù)據(jù)的分布形狀1.簡(jiǎn)單算術(shù)平均數(shù)計(jì)算公式:

它是反映數(shù)據(jù)集中的主要測(cè)度。4.1集中趨勢(shì)的計(jì)算集中趨勢(shì)反映一組數(shù)據(jù)中各數(shù)據(jù)所具有的共同趨勢(shì),即資料中各數(shù)據(jù)聚集的位置。一、算術(shù)平均(也叫均值)算術(shù)平均的統(tǒng)計(jì)含義:算術(shù)平均數(shù)是同質(zhì)總體各數(shù)據(jù)偶然性、隨機(jī)性特征互相抵消后的穩(wěn)定數(shù)值。反映數(shù)據(jù)集中的特征。例某生產(chǎn)班組11個(gè)工人的日產(chǎn)零件數(shù)分別為:15,17,19,20,22,…26,30。求該生產(chǎn)班組工人的平均日產(chǎn)零件數(shù)。22*******…解:算術(shù)平均值的性質(zhì)一:數(shù)據(jù)觀察值與均值的離差值之和為零.此性質(zhì)表明均值是各數(shù)值的重心算術(shù)平均值的性質(zhì)二:觀察值與均值的離差平方和最小。為任意數(shù)故用算術(shù)平均值來(lái)預(yù)測(cè)作為估計(jì)值,誤差平方和最小。數(shù)列:1,2,2,3平均數(shù)為2數(shù)列:1,2,2,5平均數(shù)為2.5數(shù)列:1,2,2,7平均數(shù)為3均值的缺點(diǎn):均值易受極端值的影響,某個(gè)極端大值或極端小值都會(huì)影響均值的代表性。同時(shí)還影響其對(duì)集中趨勢(shì)測(cè)度的準(zhǔn)確性。2.加權(quán)算術(shù)平均數(shù)如果數(shù)據(jù)是分組資料,經(jīng)過(guò)整理形成了次數(shù)分配,由于各組次數(shù)不同,要用次數(shù)作權(quán)數(shù)計(jì)算加權(quán)算術(shù)平均數(shù)。則均值的計(jì)算公式為:其中Xi表示第i組的組中值,fi表示第i組的次數(shù)。工人一周生產(chǎn)零件數(shù)工人數(shù)fi組中值xixifi60以下75538560-702165136570-802575187580-901985161590以上895760合計(jì)80---6000例:某單位80工人一周生產(chǎn)零件數(shù)的分組統(tǒng)計(jì)資料如下表:二、中位數(shù)將數(shù)據(jù)觀察值x1,x2,…,xn按其變量值由小到大的順序排列,處于數(shù)列中點(diǎn)位置的數(shù)值就是中位數(shù)(Me)。

中位數(shù)的確定方法:①如果數(shù)據(jù)個(gè)數(shù)為奇數(shù),則處于(n+1)/2位置的標(biāo)志值是中位數(shù)。②如果數(shù)據(jù)個(gè)數(shù)為偶數(shù),則處于n/2、n/2+1的兩個(gè)標(biāo)志值的平均數(shù)為中位數(shù)。③如果是組距分組資料,公式為:中位數(shù)是n/2位置上的數(shù)值,設(shè)落在第i組,Li是中位數(shù)所在組的下限,fi是中位數(shù)所在組的次數(shù)。Fi-1是中位數(shù)所在組的前一組的累積次數(shù)Ui-Li是中位數(shù)所在組的組距=上限-下限向上累積向下累積某單位80工人一周生產(chǎn)零件數(shù)分組統(tǒng)計(jì)資料如下:工人一周生產(chǎn)零件數(shù)工人數(shù)fi組中值xixifi向上累計(jì)頻數(shù)向下累計(jì)頻數(shù)60以下75538578060-7021651365287370-8025751875535280-9019851615722790以上895760808合計(jì)80---6000------中位數(shù)是位置平均數(shù),不受極端值的影響。各個(gè)數(shù)值相對(duì)其中位數(shù)的絕對(duì)離差之和為最小。不足:中位數(shù)確定時(shí)只與中間位置的相關(guān)數(shù)據(jù)有關(guān),而不考慮其它數(shù)值的大小,缺乏敏感性;計(jì)算復(fù)雜。三、眾數(shù)眾數(shù)是一組資料中出現(xiàn)次數(shù)最多的那個(gè)數(shù)值,也反映數(shù)據(jù)集中的程度(M0)。①未分組資料,M0就是出現(xiàn)次數(shù)最多的變量值。20,15,18,20,20,22,20,2320,20,15,19,19,

20,19,2510,11,13,16,15,25,8,12②分組資料:在等距分組的情況下,頻數(shù)最多的組是眾數(shù)組,在該組內(nèi)確定眾數(shù)。設(shè)眾數(shù)在第i組,則Li是眾數(shù)所在組的下限,Ui是眾數(shù)所在組的上限;fi是眾數(shù)所在組的次數(shù)。di=Ui-Li是中位數(shù)所在組的組距=上限-下限某單位80工人一周生產(chǎn)零件數(shù)分組統(tǒng)計(jì)資料如下:工人一周生產(chǎn)零件數(shù)工人數(shù)fi組中值xixifi向上累計(jì)頻數(shù)向下累計(jì)頻數(shù)60以下75538578060-7021651365287370-8025751875535280-9019851615722790以上895760808合計(jì)80---6000------在Excel中AVERAGE()—計(jì)算算術(shù)平均數(shù)利用SUM()函數(shù)和SUMPRODUCT()函數(shù)求加權(quán)算術(shù)平均。MEDIAN()—計(jì)算中位數(shù)MODE()—計(jì)算眾數(shù)四、均值、中位數(shù)、眾數(shù)三者之間的關(guān)系XfXfXf(對(duì)稱分布)正偏態(tài)分布(右)負(fù)偏態(tài)分布(左)均值是數(shù)據(jù)分布的平衡點(diǎn)或重心,中位數(shù)把這個(gè)分布劃分為兩半,眾數(shù)正好是分布的頂端。在偏斜不大時(shí),中位數(shù)大約位于均值與眾數(shù)的1/3處。算術(shù)平均數(shù)適用于定距變量(或數(shù)值變量、定量變量),中位數(shù)適用于定序變量,眾數(shù)則適用于定類變量(或定性變量)五、集中趨勢(shì)的其它測(cè)度量1.分位數(shù):四分位數(shù)、十分位數(shù)、百分位數(shù)。分位數(shù)的計(jì)算:(1)將資料按大小順序排列;(2)求出分位數(shù)所在位置i;(3)若i為整數(shù),則所求分位數(shù)為該位置上的數(shù)值;若i為非整數(shù),則取第i與第i+1位置的兩個(gè)數(shù)值的平均數(shù)為所求分位數(shù)。(4)若資料為分組數(shù)據(jù),則各分位數(shù)可按下式計(jì)算:Ki表示第i個(gè)K分位數(shù);Li表示第i個(gè)K分位數(shù)所在組的下限;N表示數(shù)據(jù)總個(gè)數(shù);Fi-1表示第i個(gè)K分位數(shù)所在組的前一組的累積次數(shù);fi是第i個(gè)K分位數(shù)所在組的次數(shù)。di=Ui-Li是第i個(gè)K分位數(shù)所在組的組距。其中[]表示中位數(shù)的位置取整。這樣計(jì)算出的四分位數(shù)的位置,要么是整數(shù),要么在兩個(gè)數(shù)之間0.5的位置上四分位數(shù)的位置確定方法:方法1:定義算法方法2:以中位數(shù)為中心,從兩端再計(jì)算中位數(shù),公式:方法3Excel給出的四分位數(shù)位置的確定方法無(wú)論哪種算法,如果位置是整數(shù),四分位數(shù)就是該位置對(duì)應(yīng)的值;如果是在0.5的位置上,則取該位置兩側(cè)值的平均數(shù);如果在0.25或0.75位置上,則四分位數(shù)等于該位置的下側(cè)值加上按比例分?jǐn)偽恢脙蓚?cè)數(shù)值的差值?!纠浚?個(gè)家庭的人均月收入數(shù)據(jù)(3種方法計(jì)算)

原始數(shù)據(jù):15007507801080850960200012501630

排序:75078085096010801250150016302000

位置:123456789方法1:方法2:所以QL為從最小值數(shù)第3個(gè)數(shù)值,即850元;Qu為從最大值數(shù)第3個(gè)數(shù)值,即1500元;方法3Excel方法所以QL為第3個(gè)數(shù)值,即850元;Qu為7個(gè)數(shù)值,即1500元;可見(jiàn)三種方法計(jì)算的四分位數(shù)不完全相同。但對(duì)他們的解釋是一樣的,即排序數(shù)據(jù)中,至少25%的數(shù)據(jù)小于等于QL,至少75%的數(shù)據(jù)小于等于Qu。原始數(shù)據(jù):15007507801080850960200012501630

排序:75078085096010801250150016302000

位置:1234567892.幾何平均數(shù)公式為:

用于計(jì)算平均比率或平均速度。包括(1)對(duì)比率進(jìn)行平均;(2)測(cè)定生產(chǎn)或經(jīng)濟(jì)變量的時(shí)間序列的平均增長(zhǎng)率。舉例:將一筆錢存入銀行,存期10年,以復(fù)利計(jì)息,10年的利率分配是:第1年至第2年為5%、第3年至5年為8%、第6年至第8年為10%、第9年至第10年12%,計(jì)算平均年利率。注意:當(dāng)觀測(cè)值有一項(xiàng)為0或負(fù)值時(shí),不易計(jì)算幾何平均數(shù)。3.調(diào)和平均值調(diào)和平均值是觀察值倒數(shù)之平均數(shù)的倒數(shù),也稱倒數(shù)平均數(shù)。用表示:(1)具有倒數(shù)性質(zhì)例如某人前10公里以時(shí)速50公里行駛,后10公里以30公里時(shí)速行駛。這20公里花了0.533小時(shí),所以平均時(shí)速(2)總體單位數(shù)未知時(shí),例4.11(71)加權(quán)調(diào)和平均數(shù)應(yīng)用條件:資料經(jīng)過(guò)分組,各組次數(shù)不同。算術(shù)平均、幾何平均、調(diào)和平均三者關(guān)系三者均屬于均值體系算術(shù)平均值是直接對(duì)觀測(cè)值進(jìn)行平均;幾何平均值是對(duì)觀察值對(duì)數(shù)后的平均;調(diào)和平均值是對(duì)觀察值取倒數(shù)后平均;一般情況下,有如下關(guān)系:在Excel中QUARTILE()—計(jì)算四分位數(shù)PERCENTILE()—計(jì)算百分位數(shù)GEOMEAN()—計(jì)算幾何平均數(shù)HARMEAN()—計(jì)算簡(jiǎn)單調(diào)和平均數(shù)4.2離中趨勢(shì)的計(jì)算離中趨勢(shì)是數(shù)據(jù)分布的又一特征,它表明變量值的差異或離散程度。離中趨勢(shì)測(cè)度經(jīng)常用到的指標(biāo)有:極差、方差和標(biāo)準(zhǔn)差、四分位差等,它們也被稱為變異指標(biāo)。一、極差極差也稱為全距,是一組數(shù)據(jù)的最大值和最小值的差:

缺點(diǎn):易受極端值的影響。全距值越小,數(shù)據(jù)變動(dòng)范圍越小,平均數(shù)的代表性越高;全距值越大,數(shù)據(jù)數(shù)據(jù)變動(dòng)范圍越大,平均數(shù)的代表性越低。二、平均差1、平均差是指數(shù)據(jù)值與其均值之差的絕對(duì)值的算術(shù)平均值,用符號(hào)A·D表示。計(jì)算公式:2、優(yōu)點(diǎn):完整地反映了全部數(shù)據(jù)的分散程度,計(jì)算方法簡(jiǎn)單;缺點(diǎn):易受極值影響,絕對(duì)值計(jì)算不方便。分組數(shù)據(jù):未分組數(shù)據(jù):平均差越大,平均數(shù)代表性越低;平均差愈小,平均數(shù)代表性越高三、方差與標(biāo)準(zhǔn)差總體方差是觀察值與其均值離差平方和的均值;總體標(biāo)準(zhǔn)差是總體方差的正平方根;如果計(jì)算總體方差的資料是次數(shù)分配數(shù)據(jù),在計(jì)算總體方差時(shí)要將各組權(quán)數(shù)考慮進(jìn)去,有如下公式:總體方差的另一種表達(dá)方式:總體方差愈大,數(shù)據(jù)的變動(dòng)程度愈大,總體方差愈小,數(shù)據(jù)的變動(dòng)程度愈小。樣本方差與樣本標(biāo)準(zhǔn)差當(dāng)樣本數(shù)據(jù)個(gè)數(shù)足夠大時(shí),樣本方差與總體方差很接近在Excel中Max()-min()—計(jì)算極差A(yù)VEDEV()—計(jì)算平均差VARP()—計(jì)算總體方差VAR()—計(jì)算樣本方差STDEVP()—計(jì)算總體標(biāo)準(zhǔn)差STDEV()—計(jì)算樣本標(biāo)準(zhǔn)差四、Chebishev定理與經(jīng)驗(yàn)法則1.Chebishev定理:對(duì)任何一組資料,觀測(cè)值落于均值左右k個(gè)標(biāo)準(zhǔn)差的區(qū)間內(nèi)的比例,至少為(1-1/k2)。Chebishev定理適用于任何形狀的次數(shù)分布資料,但此區(qū)間是一個(gè)比較保守的估計(jì)值。2.經(jīng)驗(yàn)法則:當(dāng)資料分布呈對(duì)稱形狀時(shí),有:(1)約有68%的觀測(cè)值落于的區(qū)間內(nèi);(2)約有95%的觀測(cè)值落于的區(qū)間內(nèi);(3)約有

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論