平均數(shù)標準差和變異系數(shù)_第1頁
平均數(shù)標準差和變異系數(shù)_第2頁
平均數(shù)標準差和變異系數(shù)_第3頁
平均數(shù)標準差和變異系數(shù)_第4頁
平均數(shù)標準差和變異系數(shù)_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

平均數(shù)標準差和變異系數(shù)第1頁,共41頁,2023年,2月20日,星期一第三章平均數(shù)、標準差和變異系數(shù)平均數(shù)(mean)用于反映資料的集中性,即觀測值以某一數(shù)值為中心而分布的性質(zhì)。標準差(standarddeviation)與變異系數(shù)(variationcoefficient)反映資料的離散性,即觀測值分散變異的性質(zhì)。第2頁,共41頁,2023年,2月20日,星期一第一節(jié)平均數(shù)一、平均數(shù)的意義和種類二、算術(shù)平均數(shù)的計算方法三、算術(shù)平均數(shù)的重要特性四、算術(shù)平均數(shù)的作用五、總體平均數(shù)第3頁,共41頁,2023年,2月20日,星期一一、平均數(shù)的意義和種類平均數(shù)(average)是數(shù)據(jù)的代表值,表示資料中觀察值的中心位置,并且可作為資料的代表而與另一組資料相比較,借以明確二者之間相差的情況。平均數(shù)是統(tǒng)計學中最常用的統(tǒng)計量,用來表明資料中各觀測值相對集中較多的中心位置。平均數(shù)主要包括有:算術(shù)平均數(shù)(arithmeticmean)中位數(shù)(median)眾數(shù)(mode)幾何平均數(shù)(geometricmean)調(diào)和平均數(shù)(harmonicmean)第4頁,共41頁,2023年,2月20日,星期一算術(shù)平均數(shù):一個數(shù)量資料中各個觀察值的總和除以觀察值個數(shù)所得的商數(shù),稱為算術(shù)平均數(shù)(arithmeticmean),記作。因其應用廣泛,常簡稱平均數(shù)或均數(shù)(mean)。均數(shù)的大小決定于樣本的各觀察值。012345678910平均數(shù)=5平均數(shù)=61234567141、算術(shù)平均數(shù)第5頁,共41頁,2023年,2月20日,星期一2、中位數(shù)中位數(shù):將資料內(nèi)所有觀察值從大到小排序,居中間位置的觀察值稱為中數(shù)(median),計作Md。當觀測值的個數(shù)是偶數(shù)時,則以中間兩個觀測值的平均數(shù)作為中位數(shù)。當所獲得的數(shù)據(jù)資料呈偏態(tài)分布時,中位數(shù)的代表性優(yōu)于算術(shù)平均數(shù)。中位數(shù)的計算方法因資料是否分組而有所不同。對于未分組資料,先將各觀測值由小到大依次排列,找到中間的1個數(shù)(n為奇數(shù))或2個數(shù)(n為偶數(shù)),之后求平均即可。0123456789101214012345678910中位數(shù)=5中位數(shù)=5第6頁,共41頁,2023年,2月20日,星期一眾數(shù):資料中最常見的一數(shù),或次數(shù)最多一組的中點值,稱為眾數(shù)(mode),記為M0。如棉花纖維檢驗時所用的主體長度即為眾數(shù)。3、眾數(shù)眾數(shù)可能不存在可能有多個眾數(shù)多用于屬性數(shù)據(jù)01234567891011121314眾數(shù)=9沒有眾數(shù)第7頁,共41頁,2023年,2月20日,星期一幾何平均數(shù):如有n個觀察值,其相乘積開n次方,即為幾何平均數(shù)(geometricmean),用G代表。其計算公式如下:

4、幾何平均數(shù)第8頁,共41頁,2023年,2月20日,星期一為了計算方便,可將各觀測值取對數(shù)后相加除以n,得lgG,再求lgG的反對數(shù),即得G值,即:第9頁,共41頁,2023年,2月20日,星期一調(diào)和平均數(shù):(harmonicmean)各觀測值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),稱為調(diào)和平均數(shù),記為H。即

(4.6)5、調(diào)和平均數(shù)第10頁,共41頁,2023年,2月20日,星期一對于同一資料:算術(shù)平均數(shù)>幾何平均數(shù)>調(diào)和平均數(shù)上述五種平均數(shù),最常用的是算術(shù)平均數(shù)。第11頁,共41頁,2023年,2月20日,星期一算術(shù)平均數(shù)可根據(jù)樣本大小及分組情況而采用直接法或加權(quán)法計算。(一)直接法主要用于未經(jīng)分組資料平均數(shù)的計算。二、算術(shù)平均數(shù)的計算方法第12頁,共41頁,2023年,2月20日,星期一設(shè)某一資料包含n個觀測值:x1、x2、…、xn,則樣本平均數(shù)可通過下式計算:(4.1)簡寫:第13頁,共41頁,2023年,2月20日,星期一【例1】某植保站測得10只某類害蟲的體重分別為500、520、535、560、585、600、480、510、505、490(mg),求其平均數(shù)。由于Σx=500+520+535+560+585+600+480+510+505+490=5285,n=10得:即10只害蟲的平均體重為528.5mg。第14頁,共41頁,2023年,2月20日,星期一(二)加權(quán)法(4.2)式中:xi-第i組的組中值;fi-第i組的次數(shù);k-分組數(shù)第i組的次數(shù)fi是權(quán)衡第i組組中值xi

在資料中所占比重大小的數(shù)量,因此將fi稱為是xi

的“權(quán)”,加權(quán)法也由此而得名。對于樣本含量n≥30以上且已分組的資料,可以在次數(shù)分布表的基礎(chǔ)上采用加權(quán)法計算平均數(shù),計算公式為:第15頁,共41頁,2023年,2月20日,星期一【例2】從A、B兩小區(qū)分別抽取4個和5個小麥麥穗,測得其樣本如下,用兩種方法計算其平均值,并比較計算結(jié)果。

第16頁,共41頁,2023年,2月20日,星期一【例3】140行水稻產(chǎn)量(P38),用兩種方法求其平均數(shù),并比較計算結(jié)果。(1)直接法:第17頁,共41頁,2023年,2月20日,星期一(2)加權(quán)法:第18頁,共41頁,2023年,2月20日,星期一1、算術(shù)平均數(shù)的計算與每一個數(shù)(值)都有關(guān)。

2、如果是n1個值的平均數(shù),是n2個值的平均數(shù),那么全部n1+n2個值的算術(shù)平均數(shù)是(加權(quán)平均數(shù))

三、算術(shù)平均數(shù)的重要特性第19頁,共41頁,2023年,2月20日,星期一

3、樣本各觀測值與平均數(shù)之差的和為零,即離均差之和等于零。

或簡寫成第20頁,共41頁,2023年,2月20日,星期一

4、樣本各觀測值與平均數(shù)之差的平方和為最小,即離均差平方和為最小。(常數(shù))或簡寫為:第21頁,共41頁,2023年,2月20日,星期一5、若A為任意常數(shù),第22頁,共41頁,2023年,2月20日,星期一6、平均數(shù)是有單位的數(shù)值,與原資料單位相同。注意:必須性狀同質(zhì)時,才有代表性。第23頁,共41頁,2023年,2月20日,星期一第24頁,共41頁,2023年,2月20日,星期一算術(shù)平均數(shù)是描述觀測資料的重要特征數(shù),它的作用主要有以下兩點:1.指出數(shù)據(jù)資料的中心位置,標志著資料所代表性狀的數(shù)量水平和質(zhì)量水平。2.可以作為樣本或資料的代表數(shù)據(jù)與其他資料進行比較。四、算術(shù)平均數(shù)的作用第25頁,共41頁,2023年,2月20日,星期一

對于總體而言,通常用μ表示總體平均數(shù),有限總體的平均數(shù)為:

(4.3)

式中,N表示總體所包含的個體數(shù)。當一個統(tǒng)計量的數(shù)學期望等于所估計的總體參數(shù)時,則稱此統(tǒng)計量為該總體參數(shù)的無偏估計量。統(tǒng)計學中常用樣本平均數(shù)()作為總體平均數(shù)(μ)的估計量,并已證明樣本平均數(shù)是總體平均數(shù)μ的無偏估計量。五、總體平均數(shù)第26頁,共41頁,2023年,2月20日,星期一第二節(jié)變異數(shù)平均數(shù)作為樣本的代表,其代表性的強弱受樣本資料中各觀測值變異程度的影響。每個樣本有一批觀察值,除以平均數(shù)作為樣本的集中性表現(xiàn)外,還應該考慮樣本內(nèi)各個觀察值的變異情況,才能通過樣本的觀察數(shù)據(jù)更好地描述樣本,乃至描述樣本所代表的總體,為此必須有度量變異的統(tǒng)計數(shù)。常用的描述變異程度指標有:1、極差(range)2、方差(variance)3、標準差(standarddeviation)4、變異系數(shù)(variationcoefficient)第27頁,共41頁,2023年,2月20日,星期一一、極差極差(range),又稱全距,記作R,是資料中最大觀察值與最小觀察值的差數(shù)。極差雖可以對資料的變異有所說明,但它只是兩個極端數(shù)據(jù)決定的,沒有充分利用資料的全部信息,而且易于受到資料中不正常的極端值的影響。所以用它來代表整個樣本的變異度是有缺陷的。第28頁,共41頁,2023年,2月20日,星期一二、方差為了正確反映資料的變異度,較合理的方法是根據(jù)樣本全部觀察值來度量資料的變異度。這時要選定一個數(shù)值作為共同比較的標準。平均數(shù)既作為樣本的代表值,則以平均數(shù)作為比較的標準較為合理,但同時應該考慮各樣本觀察值偏離平均數(shù)的情況,為此這里給出一個各觀察值偏離平均數(shù)的度量方法。第29頁,共41頁,2023年,2月20日,星期一為了準確地表示樣本內(nèi)各個觀測值的變異程度,人們首先會考慮到以平均數(shù)為標準,求出各個觀測值與平均數(shù)的離差,(),稱為離均差。雖然離均差能表示一個觀測值偏離平均數(shù)的性質(zhì)和程度,但因為離均差有正、有負,離均差之和為零,即Σ()=0,因而不能用離均差之和Σ()來表示資料中所有觀測值的總偏離程度。為了解決離均差有正、有負,離均差之和為零的問題,可先求離均差的絕對值并將各離均差絕對值之和除以觀測值個數(shù)n求得平均絕對離差,即Σ|x–x|/n。雖然平均絕對離差可以表示資料中各觀測值的變異程度,但由于平均絕對離差包含絕對值符號,使用很不方便,在統(tǒng)計學中未被采用。第30頁,共41頁,2023年,2月20日,星期一

我們還可以采用將離均差平方的辦法來解決離均差有正、有負,且離均差之和為零的問題。先將各個離均差平方,即()2,再求離均差平方和,即,簡稱平方和,記為SS;由于離差平方和常隨樣本大小而改變,為了消除樣本大小的影響,用平方和除以樣本大小,即,求出離均差平方和的平均數(shù);第31頁,共41頁,2023年,2月20日,星期一為了使所得的統(tǒng)計量是相應總體參數(shù)的無偏估計量,統(tǒng)計學證明,在求離均差平方和的平均數(shù)時,分母不用樣本含量n,而用自由度n-1,于是,我們采用統(tǒng)計量表示資料的變異程度。統(tǒng)計量稱為均方(meansquare,縮寫為MS),又稱樣本方差,記為S2,即

S2=(4.7)第32頁,共41頁,2023年,2月20日,星期一相應的總體參數(shù)叫總體方差,記為σ2。對于有限總體而言,σ2的計算公式為:(4.8)第33頁,共41頁,2023年,2月20日,星期一標準差為方差的正平方根值,用以表示資料的變異度,其單位與觀察值的度量單位相同。從樣本資料計算標準差的公式為:同樣,樣本標準差是總體標準差的估計值??傮w標準差用表示:

第34頁,共41頁,2023年,2月20日,星期一由于樣本方差帶有原觀測單位的平方單位,在僅表示一個資料中各觀測值的變異程度而不作其它分析時,常需要與平均數(shù)配合使用,這時應將平方單位還原,即應求出樣本方差的平方根。統(tǒng)計學上把樣本方差S2的平方根叫做樣本標準差,記為S,即:三、標準差第35頁,共41頁,2023年,2月20日,星期一由于所以(4.9)式可改寫為:(4.10)第36頁,共41頁,2023年,2月20日,星期一相應的總體參數(shù)叫總體標準差,記為σ。對于有限總體而言,σ的計算公式為:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論