平均數(shù)標(biāo)準(zhǔn)差與變異系數(shù)_第1頁
平均數(shù)標(biāo)準(zhǔn)差與變異系數(shù)_第2頁
平均數(shù)標(biāo)準(zhǔn)差與變異系數(shù)_第3頁
平均數(shù)標(biāo)準(zhǔn)差與變異系數(shù)_第4頁
平均數(shù)標(biāo)準(zhǔn)差與變異系數(shù)_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

平均數(shù)標(biāo)準(zhǔn)差與變異系數(shù)第1頁,課件共35頁,創(chuàng)作于2023年2月數(shù)據(jù)有兩種變化趨勢:集中趨勢和離散趨勢。表示數(shù)據(jù)集中趨勢的指標(biāo)有多個,如平均數(shù)(算術(shù)平均數(shù)、幾何平均數(shù))、中位數(shù)、眾數(shù),使用最多的是算術(shù)平均數(shù)。表示數(shù)據(jù)離散趨勢的指標(biāo)有多個,如極差、平均離差、方差與標(biāo)準(zhǔn)差,使用最多的是方差與標(biāo)準(zhǔn)差。第2頁,課件共35頁,創(chuàng)作于2023年2月資料中各觀察值的總和除以觀察值的個數(shù)所得的商,稱為算術(shù)平均數(shù),簡稱為平均數(shù)或均數(shù)。用符號表示。平均數(shù)的意義:平均數(shù)用來描述資料的集中性,即指出資料中數(shù)據(jù)集中較多的中心位置,常用于同類性質(zhì)資料間的相互比較。一、集中趨勢第3頁,課件共35頁,創(chuàng)作于2023年2月計算方法1.直接法適用于樣本含量較小的非頻數(shù)資料如果一個含量為n的樣本,其n個觀察值分別用x1、x2……xn表示,則它們的平均數(shù)為其中,(Sigma)為總和符號,表示從第一個觀察值x1累加到第n個觀察值xn,若在意義上已明確時,簡記為x。第4頁,課件共35頁,創(chuàng)作于2023年2月常數(shù)的總和等于該常數(shù)的n倍,即代數(shù)和的總和等于總和的代數(shù)和,即總和符號內(nèi)的常數(shù)因子可以提取到總和符號之外,即其中C為常數(shù)(a為常數(shù))關(guān)于總和符號的幾個性質(zhì)第5頁,課件共35頁,創(chuàng)作于2023年2月2.加權(quán)法如果樣本中有n1個x1,有n2個x2,那么,n1+n2個數(shù)的平均數(shù)是加權(quán)平均數(shù)。同理:各組的次數(shù)fi

是權(quán)衡各組中值

xi在資料中所占比重大小的數(shù)量,因此f被稱為是x的“權(quán)”,加權(quán)法也由此而得名。第6頁,課件共35頁,創(chuàng)作于2023年2月在計算離散型頻數(shù)資料的平均數(shù)時,式中x為組值,f為頻數(shù),N為總頻數(shù)(∑f),k為組數(shù)。第7頁,課件共35頁,創(chuàng)作于2023年2月表3-1

50只小雞出殼天數(shù)的頻數(shù)分布表第8頁,課件共35頁,創(chuàng)作于2023年2月在計算連續(xù)型頻數(shù)資料的平均數(shù)時,式中m為組中值,f、N和k同上式。第9頁,課件共35頁,創(chuàng)作于2023年2月組別組中值m頻數(shù)(f)fm44.25—45.029045.75—46.529347.25—48.01048048.75—49.51259450.25—51.026132651.75—52.544231053.25—54.043232254.75—55.5291609.556.25—57.01162757.75—58.515877.559.25—60.0212060.75—61.54246合計20010695表3-2某純系蛋雞200枚蛋重的頻數(shù)分布表

=10695/200=53.475第10頁,課件共35頁,創(chuàng)作于2023年2月平均數(shù)有以下幾個基本特性:(1)平均數(shù)的計算與樣本內(nèi)每個值都有關(guān),它的大小受每個值的影響。(2)若每個xi都乘以相同的數(shù)k,則平均數(shù)亦應(yīng)乘以k。(3)若每個xi都加上(或減去)相同的數(shù)A,則平均數(shù)亦應(yīng)加上(或減去)A。第11頁,課件共35頁,創(chuàng)作于2023年2月中位數(shù)(median)將資料中所有觀察值從小到大依次排列,處于中間位置的數(shù)。以Md表示。適用條件資料呈偏態(tài)分布或頻數(shù)分布類型不明,以及一端或兩端無確定數(shù)值,這種資料用中位數(shù)作為代表值比用算術(shù)平均數(shù)為好。非頻數(shù)資料,先將各觀察值由小到大排列,當(dāng)n為奇數(shù)時,第(n+1)/2位置的觀察值即為中位數(shù),即:Md=x(n+1)/2第12頁,課件共35頁,創(chuàng)作于2023年2月其中:L—中位數(shù)所在組的下限;i—組距;f—中位數(shù)所在組的頻數(shù);n—總頻數(shù);c—小于中數(shù)所在組的累積頻數(shù)。當(dāng)n為偶數(shù)時,和位置的兩個觀察值之和的二分之一即為中位數(shù),即:若資料已分組,并編制成了頻數(shù)分布表,可利用頻數(shù)分布表計算中數(shù)。第13頁,課件共35頁,創(chuàng)作于2023年2月潛伏期(小時)病例數(shù)f累計例數(shù)0——252512——588324——4012336——2314648——1215860——516372——1164[例]某地區(qū)有164人因沙門氏菌食物中毒,其潛伏期資料經(jīng)整理如下表,試計算中位數(shù)。第14頁,課件共35頁,創(chuàng)作于2023年2月眾數(shù)(Mode)資料中出現(xiàn)次數(shù)最多的那個數(shù)或頻數(shù)最多一組的組中值,記為Mo。第15頁,課件共35頁,創(chuàng)作于2023年2月

fmax=24,Mo=22

50只小雞出殼天數(shù)的頻數(shù)分布表Md=22第16頁,課件共35頁,創(chuàng)作于2023年2月組別組中值m頻數(shù)(f)fx44.25—45.029045.75—46.529347.25—48.01048048.75—49.51259450.25—51.026132651.75—52.544231053.25—54.043232254.75—55.5291609.556.25—57.01162757.75—58.515877.559.25—60.0212060.75—61.54246合計20010695表3-2某純系蛋雞200枚蛋重的頻數(shù)分布表

=10695/200=53.475fmax=44,Mo=52.5Md=53.35第17頁,課件共35頁,創(chuàng)作于2023年2月幾何平均數(shù)(Geometricmean)定義

指n個觀察值乘積的n次方根。即適用條件

主要應(yīng)用于數(shù)據(jù)呈倍數(shù)關(guān)系或不對稱分布的資料,算術(shù)平均數(shù)對這類資料的代表性差。如抗體效價(1:10,1:100,1:1000,1:10000)、增長率或生長率、動態(tài)發(fā)展速度等。第18頁,課件共35頁,創(chuàng)作于2023年2月計算1、應(yīng)用公式計算(實際應(yīng)用時常取對數(shù))第19頁,課件共35頁,創(chuàng)作于2023年2月例海蝦養(yǎng)殖試驗,各旬的生長速度3.0,1.51.3,1.2,1.2,1.1,1.1,求海蝦的旬平均生長速度。解:即海蝦平均生長速度為1.38。其算術(shù)平均數(shù)為第20頁,課件共35頁,創(chuàng)作于2023年2月當(dāng)資料編成頻數(shù)分布表時,

—各組組中值;

—各組次數(shù);第21頁,課件共35頁,創(chuàng)作于2023年2月二、離散趨勢資料的另一方面的特征是變異程度。如:

A組資料:3、4、5、6、7平均數(shù)為:5

B組資料:1、3、5、7、9平均數(shù)為:5

這里的平均數(shù)5對于A組資料的代表性好?還是對于B組資料的代表性好?

可見,只表明了數(shù)據(jù)的集中程度是遠(yuǎn)遠(yuǎn)不夠的,還需要進(jìn)一步說明數(shù)據(jù)的變異程度。只有通過變異程度的描述,才知道代表值的代表性。表示數(shù)據(jù)變異特征的數(shù)值叫變異數(shù)。常用的變異數(shù)有:極差、平均離差、方差、標(biāo)準(zhǔn)差、變異系數(shù)等。第22頁,課件共35頁,創(chuàng)作于2023年2月極差(全距)極差=最大值-最小值只利用了資料中最大值和最小值,不能準(zhǔn)確表達(dá)資料中各個觀察值的變異程度。平均離差

第23頁,課件共35頁,創(chuàng)作于2023年2月它不能表示整個資料中所有觀察值的總偏離程度使用不方便,在統(tǒng)計學(xué)中未被采用消除離均差的負(fù)號離均差的平方之和(簡稱平方和,記為SS)稱為均方(縮寫為MS),又稱為樣本方差,記為S2標(biāo)準(zhǔn)差S離均差第24頁,課件共35頁,創(chuàng)作于2023年2月首先求出離均差,即每個數(shù)與它們的平均數(shù)之間的離差;然后將所有的離均差平方,再相加,得出離均差平方和;最后用n-1除離均差平方和(按照統(tǒng)計學(xué)理論,不要用樣本含量n去除),所得的商稱為樣本方差,用符號s2表示。方差s2是離均差平方的平均數(shù)。雖然方差在實際應(yīng)用中用得最廣泛,但因它的單位是原始數(shù)據(jù)單位的平方,所以它不能直接地指出某個數(shù)x與平均數(shù)之間的偏離究竟達(dá)到什么程度。為此,采用標(biāo)準(zhǔn)差s做標(biāo)準(zhǔn),衡量x與平均數(shù)之間的離散程度。第25頁,課件共35頁,創(chuàng)作于2023年2月自由度(degreeoffreedom):統(tǒng)計學(xué)借此來反映一批變量的約束條件。例如一個有5個觀察值的樣本,因為受到統(tǒng)計數(shù)的約束,在5個離均差中,只有4個數(shù)值可以在一定范圍內(nèi)自由變動取值,而第五個離均差必須滿足這一限制條件。自由度記作DF,一般樣本自由度等于觀察值個數(shù)(n)減去約束條件的個數(shù)(k),即DF=n-k。

第26頁,課件共35頁,創(chuàng)作于2023年2月樣本方差樣本標(biāo)準(zhǔn)差第27頁,課件共35頁,創(chuàng)作于2023年2月為了方便計算,將離均差平方和轉(zhuǎn)化為另一種形式,同時略去下標(biāo),上式可表示為:第28頁,課件共35頁,創(chuàng)作于2023年2月在計算離散型頻數(shù)資料的標(biāo)準(zhǔn)差時,式中x為組值,f為頻數(shù),N為總頻數(shù)(∑f),k為組數(shù)。第29頁,課件共35頁,創(chuàng)作于2023年2月在計算連續(xù)型頻數(shù)資料的標(biāo)準(zhǔn)差時,式中m為組中值,f、N和k同上式。第30頁,課件共35頁,創(chuàng)作于2023年2月標(biāo)準(zhǔn)差的特性(一)標(biāo)準(zhǔn)差的大小受資料中各觀察值的影響,觀察值間變異大的標(biāo)準(zhǔn)差也大,反之則??;(二)計算標(biāo)準(zhǔn)差時,各觀測值加上或減去一個常數(shù),標(biāo)準(zhǔn)差的值不變;

(三)當(dāng)每個觀察值都乘以一個常數(shù)a時,所得的標(biāo)準(zhǔn)差是原來標(biāo)準(zhǔn)差的a倍.第31頁,課件共35頁,創(chuàng)作于2023年2月樣本的方差為總體的方差為第32頁,課件共35頁,創(chuàng)作于2023年2月變異系數(shù)Coeffcientofvariation資料的單位不同或平均數(shù)相差很大時,直接利用標(biāo)準(zhǔn)差比較資料間變異程度是不妥的,需用變異系數(shù)。變異系數(shù)同標(biāo)準(zhǔn)差一樣是衡量資料變異程度的統(tǒng)計量。變異系數(shù)消除了不同單位和平均數(shù)的影響,可以用來比較不同資料的相對變異程度。第33頁,課件共35頁,創(chuàng)作

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論