管理里統(tǒng)計(jì)學(xué)3統(tǒng)計(jì)資料的綜合_第1頁
管理里統(tǒng)計(jì)學(xué)3統(tǒng)計(jì)資料的綜合_第2頁
管理里統(tǒng)計(jì)學(xué)3統(tǒng)計(jì)資料的綜合_第3頁
管理里統(tǒng)計(jì)學(xué)3統(tǒng)計(jì)資料的綜合_第4頁
管理里統(tǒng)計(jì)學(xué)3統(tǒng)計(jì)資料的綜合_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

表示統(tǒng)計(jì)資料的特征數(shù)有哪些?幾何平均數(shù)與調(diào)和平均數(shù)各適合于什么情況?計(jì)算樣本方差與總體方差公式有何區(qū)別?集中位置分散程度偏倚程度3.1表示集中位置的特征數(shù)3.1.1平均數(shù)算術(shù)平均數(shù)(Arithmeticaverage)幾何平均數(shù)(GeometricMean)調(diào)和平均數(shù)定義:一組n個(gè)觀測(cè)值x1,x2,…,xn的算術(shù)平均數(shù),定義為(1)算術(shù)平均數(shù)(Arithmeticaverage)如果資料已經(jīng)分組,組數(shù)為k,用x1,x2,…,xk

表示各組中點(diǎn),f1,f2…,fk

表示相應(yīng)的頻數(shù),那么(1)算術(shù)平均數(shù)(Arithmeticaverage)表3-1某校125位大學(xué)一年級(jí)新生體重表體重(公斤)組中值(x)

人數(shù)(f)46—4847449—51502052—54532555—57563858—60592161—63621264—66655(1)算術(shù)平均數(shù)(Arithmeticaverage)其平均體重:===55.592(1)算術(shù)平均數(shù)(Arithmeticaverage)

當(dāng)時(shí)最小

性質(zhì)(1)算術(shù)平均數(shù)(Arithmeticaverage)在數(shù)據(jù)為環(huán)比類型的問題中,算術(shù)平均數(shù)是不適用的。例如下表是天津市工業(yè)總產(chǎn)值在“十五”期間的逐年增長(zhǎng)率,如求該期間平均增長(zhǎng)率,算術(shù)平均數(shù)是不恰當(dāng)?shù)?。幾何平均?shù)可以解決這個(gè)問題。(2)幾何平均數(shù)(GeometricMean)表3-2天津市工業(yè)總產(chǎn)值年份比上年增長(zhǎng)%2000200114.0200219.6200324.1200431.0200520.8(天津市2005統(tǒng)計(jì)年鑒)

(2)幾何平均數(shù)(GeometricMean)定義:一組n個(gè)數(shù)據(jù)的幾何平均數(shù)定義為在上式中,依次為114.0,119.6,124.1,十五期間天津市工業(yè)總產(chǎn)值年均增長(zhǎng)率為21.8%。131.0,120.8于是幾何平均數(shù):(2)幾何平均數(shù)(GeometricMean)當(dāng)數(shù)據(jù)是相對(duì)變化率,求平均數(shù)時(shí),算術(shù)平均數(shù)也不恰當(dāng)。例如:甲乙兩地相距120公里,某人乘車往返甲乙兩地之間,去時(shí)速度每小時(shí)20公里,回來時(shí)速度為每小時(shí)30公里,若求平均速度,這時(shí)用算術(shù)平均數(shù)是不對(duì)的,但調(diào)和平均數(shù)可解決此類問題。(3)調(diào)和平均數(shù)在上例中,(公里/小時(shí))定義:一組n個(gè)數(shù)據(jù)的調(diào)和平均數(shù)H,由下式定義(3)調(diào)和平均數(shù)算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)是三種不同形式平均數(shù),分別有各自的應(yīng)用條件

進(jìn)行統(tǒng)計(jì)研究時(shí),適宜采用算術(shù)平均數(shù)時(shí)就不能用調(diào)和平均數(shù)或幾何平均數(shù),適宜用調(diào)和平均數(shù)時(shí),同樣也不能采用其他兩種平均數(shù)。但從數(shù)量關(guān)系來考慮,如果用同一資料(變量各值不相等):調(diào)和平均數(shù)≤幾何平均數(shù)≤算術(shù)平均數(shù)算術(shù)平均數(shù)表示了集中位置特征,它照顧到每一個(gè)值,但它不見得是出現(xiàn)次數(shù)最多的值(甚至也可能不是觀測(cè)值中的一個(gè))。所以有必要研究表示集中位置的其它的特征數(shù)。3.1.2眾數(shù)(Mode)定義:對(duì)于有頻數(shù)分布的變量,它的眾數(shù)指頻數(shù)最大的變量的值表3-3頻數(shù)分布表Xf3155273對(duì)于已分組且等組距的頻數(shù)分布,根據(jù)最大頻數(shù),可求得眾數(shù)所在組。根據(jù)眾數(shù)定義,可知眾數(shù)不唯一。3.1.2眾數(shù)(Mode)算術(shù)平均數(shù)作為集中位置的特征還有一缺點(diǎn),就是受觀測(cè)值中極端值的影響很大,而一組觀測(cè)值中的極端值常常沒有代表性。中位數(shù)將避免這種影響。3.1.3中位數(shù)(Median)

一組n個(gè)觀測(cè)值按數(shù)值大小排列,處于中央位置的值稱為中位數(shù)以表示,,當(dāng)n為奇數(shù),當(dāng)n為偶數(shù)定義:即3.1.3中位數(shù)(Median)性質(zhì):一組觀測(cè)值中小于Me的個(gè)數(shù)和大于Me的個(gè)數(shù)相等。當(dāng)最小第25百分位數(shù)又稱第一個(gè)四分位數(shù)(FirstQuartile),用Q1表示;第50百分位數(shù)又稱第二個(gè)四分位數(shù)(SecondQuartile),用Q2表示;第75百分位數(shù)又稱第三個(gè)四分位數(shù)(ThirdQuartile),用Q3表示。中位數(shù)是第50百分位數(shù)一組n個(gè)觀測(cè)值按數(shù)值大小排列如x1,x2,x3,x4…處于p%位置的值稱第p百分位數(shù)。定義:3.1.4百分位數(shù)(Percentile)計(jì)算第p百分?jǐn)?shù)第1步:以遞增順序排列原數(shù)據(jù)(即從小到大排列)。第2步:計(jì)算指數(shù)

第3步1.若i不是整數(shù),將i向上取整。大于I的毗鄰整數(shù)為第p百分位數(shù)的位置。2.若i是整數(shù),則第P百分位數(shù)是第i項(xiàng)與第(i+l)項(xiàng)數(shù)據(jù)的平均值。如何計(jì)算百分位數(shù)2210225523502380238023902420244024502550263028253.1.4四分位數(shù)(quartile)數(shù)據(jù)的變異程度產(chǎn)品質(zhì)量檢查的結(jié)果說明生產(chǎn)是否穩(wěn)定測(cè)量的結(jié)果說明測(cè)量方法或儀器是精密還是粗糙學(xué)生的成績(jī)成績(jī)是否整齊(而不是高低)3.2表示變異(分散)程度的特征數(shù)定義

其中xmax和xmin分別為數(shù)據(jù)中的極大值和極小值。3.2.1極差(或稱全距Range)R對(duì)于已分組的頻數(shù)分布(組數(shù)為k)定義平均差M.D.是離差的絕對(duì)值的平均數(shù),即3.2.2平均差(MeanAbsoluteDeviation)方差

樣本

對(duì)于已分組的頻數(shù)分布(組數(shù)為k)總體

樣本

總體

3.2.3方差(Variance),標(biāo)準(zhǔn)差(Standard

Deviation)標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差總體標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差總體標(biāo)準(zhǔn)差對(duì)于已分組的頻數(shù)分布(組數(shù)為k)標(biāo)準(zhǔn)差的單位與X的單位相同。3.2.3方差(Variance),標(biāo)準(zhǔn)差(Standard

Deviation)定義變異系數(shù)C是一個(gè)無量綱的量。它適于用在比較有不同算術(shù)平均數(shù)或有不同量綱的兩組數(shù)據(jù)的情況。例如比較大學(xué)生身高與小學(xué)生身高,或比較130名大學(xué)生身高和體重哪個(gè)變化波動(dòng)范圍比較大時(shí),都可用變異系數(shù)。3.2.4變異系數(shù)(CoefficientofVariation)3.3.1比較眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的相對(duì)位置

下圖列舉出了對(duì)稱的、具有左偏態(tài)(負(fù)偏態(tài))和右偏態(tài)(正偏態(tài))的頻數(shù)分布的例子。注意到它們的特點(diǎn)是:①對(duì)稱的分布的眾數(shù)、中位數(shù)和算術(shù)平均數(shù)相同;②具有偏倚性的分布,算術(shù)平均數(shù)突出在外,偏向分布的尾端,而中位數(shù)則介于眾數(shù)與算術(shù)平均數(shù)之間。偏倚性是表示各觀測(cè)值分布不對(duì)稱情況或程度的。3.3表示偏倚情況或程度的特征數(shù)

圖3-13.3.1比較眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的相對(duì)位置>Me>Mo<Me<Mo

=Me=Mo可以看出,對(duì)于單峰的分布,對(duì)稱態(tài):左偏態(tài):右偏態(tài):3.3.1比較眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的相對(duì)位置(1)Pearson偏倚系數(shù)Pearson分布對(duì)稱,則k=0左偏態(tài),則k<0右偏態(tài),則k>03.3.2定量地描述偏倚性,常用的兩個(gè)公式(2)用標(biāo)準(zhǔn)化的三階矩陣g表示3.3.2定量地描述偏倚性,常用的兩個(gè)公式

3.4五數(shù)概括法五數(shù)概括法(2)第1四分位數(shù)(Q1)。(3)中位數(shù)(Q2)。(4)第3四分位數(shù)(Q3)。(5)最大值。(1)最小值。首先將數(shù)據(jù)按遞增順序排列,然后很容易就能確定最小值、3個(gè)四分位數(shù)和最大值了。對(duì)12個(gè)月薪數(shù)據(jù)的樣本,按照遞增順序排列如下:221022552350|238023802390|242024402450|255026302825Q1=2365Q2=2405Q3=2500上述起薪數(shù)據(jù)以五數(shù)概括為:2210,2365,2405,2500,2825。3.4五數(shù)概括法盒形圖實(shí)際上是以圖形來概括數(shù)據(jù)。我們將盒形圖延至這一章才講是因?yàn)樗年P(guān)鍵是計(jì)算中位數(shù)和四分位數(shù)Q1和Q3。此外還將用到四分位數(shù)間距IQR=Q3-Q1

。盒形圖的畫法步驟如下:

(1)畫一個(gè)方盒,其邊界恰好是第1和第3四分位數(shù)。對(duì)于上述的起薪數(shù)據(jù),Q1=2365,Q3=2500。這個(gè)方盒包含了中間的50%的數(shù)據(jù)。(2)在方盒上中位數(shù)的位置畫一條垂線(對(duì)起薪數(shù)據(jù),中位數(shù)為2405)。因此中位數(shù)將數(shù)據(jù)分為相等的兩個(gè)部分。3.5盒形圖(3)利用四分位數(shù)間距IQR=Q

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論