第一三章基本概念平均數(shù)變異數(shù)_第1頁
第一三章基本概念平均數(shù)變異數(shù)_第2頁
第一三章基本概念平均數(shù)變異數(shù)_第3頁
第一三章基本概念平均數(shù)變異數(shù)_第4頁
第一三章基本概念平均數(shù)變異數(shù)_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第一三章基本概念平均數(shù)變異數(shù)第1頁,共21頁,2023年,2月20日,星期三第一章

基本概念、平均數(shù)、變異數(shù)學習要求

通過本次課堂的學習,使同學了解生物統(tǒng)計與試驗設(shè)計等一些常用名詞的基本概念;了解生物統(tǒng)計課程的性質(zhì)、地位和任務(wù)及在生物學領(lǐng)域科學研究中的功用。使學生理解數(shù)量性狀資料最基本的統(tǒng)計特征數(shù)(平均數(shù)、標準差和變異數(shù))的含意及特性,掌握它們的計算方法。重點與難點重點:生物統(tǒng)計、總體、樣本、試驗誤差、準確性與精確性的概念,掌握平均數(shù)、標準差和變異數(shù)的特性及計算方法難點:如何根據(jù)本課程及專業(yè)上的特點掌握學習的要點

第2頁,共21頁,2023年,2月20日,星期三第一節(jié)生物統(tǒng)計與試驗設(shè)計的概念生物統(tǒng)計(Biometry)是應(yīng)用概率論和數(shù)理統(tǒng)計原理來研究生物界數(shù)量變化的學科。

任務(wù):根據(jù)這些原理和方法,能正確設(shè)計科學試驗,正確處理試驗結(jié)果,從而推導出較為客觀的結(jié)論。地位:是公共的專業(yè)基礎(chǔ)課、必修課;是當代農(nóng)業(yè)科學研究和生產(chǎn)上必不可少的工具。

1、介紹生物統(tǒng)計與試驗設(shè)計的基本概念。2、闡明生物統(tǒng)計與試驗設(shè)計之間的關(guān)系以及在生產(chǎn)、科研工作中的作用。功用:試驗設(shè)計(Experimetaldesign)是指在試驗工作進行前,應(yīng)用生物統(tǒng)計原理,來制訂合理的試驗方案,包括抽樣設(shè)計的最優(yōu)配置,以及正確選擇試驗動物等,使我們可以利用較少的人力、物力和時間,獲得較多的可靠的信息來進行統(tǒng)計分析,從而得出科學的結(jié)論。第3頁,共21頁,2023年,2月20日,星期三常用名詞基本概念

1、總體(population)是指被研究對象的全體,是由所有性質(zhì)相似的個體所組成的集團。2、樣本(sample)由總體抽出若干個體所組成的單位稱為樣本。3、參數(shù)(Parameter)由總體計算的數(shù)稱為參數(shù)。4、統(tǒng)計量(statistics)由樣本計算的數(shù)稱為統(tǒng)計量。5、系統(tǒng)誤差(systematicerror)是由于試驗條件所帶來的差異。6、隨機誤差(randomerror)是指由偶然因素引起的差異。7、錯誤(error)是指由于工作上的粗心大意、或精神上的疲勞所造成的差錯。8、準確性(accuracy)觀察值與真值接近的程度稱為準確性。9、精確性(precision)同一性狀重復觀察各觀察值彼此接近的程度稱為精確性。10、隨機抽樣法(randomsampling)是指總體內(nèi)每一個體,抽取作樣本的機會是均等的。

例析常用名詞,重點掌握總體、樣本、試驗誤差、準確性與精確性的概念,理解由樣本推論總體這一思維邏輯是生物統(tǒng)計學的基本指導思維。

重要性:一切研究工作中,試驗設(shè)計是研究工作成敗的關(guān)鍵。關(guān)聯(lián)性:試驗設(shè)計需要豐富的生物統(tǒng)計知識作基礎(chǔ),大量的試驗數(shù)據(jù)又為統(tǒng)計方法提了豐富可靠的資料。第4頁,共21頁,2023年,2月20日,星期三第二節(jié)

平均數(shù)

一、平均數(shù)的意義

意義:作為資料的代表,用來指出資料中各變數(shù)的集中性,并用來與另一資料相比較。

種類:

1、算術(shù)平均數(shù)一個資料中,各變數(shù)的總和被變數(shù)個數(shù)除所得的商數(shù),稱為算術(shù)平均數(shù)。在統(tǒng)計學中,它是最常用的一種,簡稱平均數(shù)或均數(shù),其符號用表示。

2、中位數(shù)將資料內(nèi)所有變數(shù)從小到大依次排列,位于中間那個變數(shù),稱為中位數(shù),當變數(shù)個數(shù)是偶數(shù)時,則以中間兩個變數(shù)的平均數(shù)作為中位數(shù)。數(shù)據(jù)資料呈偏態(tài)分布時多用中位數(shù),這時中位數(shù)代表性比平均數(shù)為優(yōu),其符號用Md表示。若資料已分組,制成次數(shù)分布表,則可用下式求得Md。(1—1)式中:L為中位數(shù)所在組的下限;i為組距;f為中位數(shù)所在組的次數(shù);n為總次數(shù);c為小于中位數(shù)所在組的累加次數(shù)。例1.某奶牛場68頭健康母牛從分娩到第一次發(fā)情間隔時間整理成次數(shù)分布表如下,求中位數(shù)。第5頁,共21頁,2023年,2月20日,星期三3、眾數(shù)在資料中某一個變數(shù)出現(xiàn)的次數(shù)最多,即稱該變數(shù)為眾數(shù)。連續(xù)性變數(shù)資料確定眾數(shù)需要制成次數(shù)分布表,在表內(nèi)次數(shù)出現(xiàn)最多一組的組中值,即為眾數(shù)。如羊毛纖維檢驗時,測定羊毛毛叢長度,應(yīng)用眾數(shù)計算。

表1—168頭母牛從分娩到第一次發(fā)情間隔時間次數(shù)分布表間隔時間(d)頭數(shù)(f)累加頭數(shù)12~2627~4142~5657~7172~8687~101102~116≥11712132016122213163652646668由表1—1可見:i=15,n=68,因而中位數(shù)只能在累加次數(shù)為36所對應(yīng)“57~71”這一組,于是可確定L=57,f=20,c=16,代入公式(3—1)得:即奶牛頭胎分娩到第一次發(fā)情間隔時間的中位數(shù)為70.5d。(1—2)4、幾何平均數(shù)

如有n個變數(shù),其相乘積開n次方所得的方根,即為幾何平均數(shù)。生物群體的數(shù)量變化呈幾何級數(shù)的資料,應(yīng)用幾何平均數(shù),其符號用G表示。第6頁,共21頁,2023年,2月20日,星期三幾何平均數(shù)在畜牧生產(chǎn)中可用來求家畜的平均增殖率。例2.某羊場各年度的存欄數(shù),見表1—2。試求其年平均增長率。

表1—2某羊場各年度的存欄數(shù)與增長率(1—3)代入公式(1—3):

年度存欄數(shù)(只)增長率(x)lgx1997199819992000140200280350—0.4290.4000.250—-0.368-0.398-0.602∑lgx=-1.368即年平均增長率為0.3501或35.01%。又如,在池內(nèi)作藍藻培育試驗,水體中藍藻的初始濃度為281.4,24小時后濃度為540.5,求試驗開始后12小時的濃度。設(shè)每小時的增長率為r,初始生物量為N0,則在時刻t的生物量為

Nt=N0rt

第7頁,共21頁,2023年,2月20日,星期三于是有

N24=N0r24,r24=N24/N0

從而得上式表明12小時后的初始濃度與24小時后濃度的幾何平均數(shù),將試驗數(shù)據(jù)代入

獸醫(yī)學上,如食物中毒的潛伏期、抗體的滴度及血清的效價等資料常用到幾何平均數(shù)。

關(guān)于速度一類資料,如反映畜群不同階段的平均增長率等,常用調(diào)和平均數(shù)。例3.仔豬斷奶后肥育增重試驗,在原體重基礎(chǔ)上凈增150kg時結(jié)束試驗。由于各期增重速度不同,求全期每天平均增重須用調(diào)和平均數(shù)計算。經(jīng)測定第一個50kg的每天增重速度為0.3kg,第二個50kg的每天增重速度為0.4kg,第三個50kg的每天增重速度為0.6kg。代入公式(1—4):

5、調(diào)和平均數(shù)

調(diào)和平均數(shù)的定義為各變數(shù)倒數(shù)的平均數(shù)的倒數(shù)。其符號用H表示。

第8頁,共21頁,2023年,2月20日,星期三平均增重為每天0.4kg,因此豬體重凈增到150kg時所需要天數(shù)為150÷0.4=375天。在第一個50kg時,飼養(yǎng)天數(shù)為50/0.3天;第二個50kg時,飼養(yǎng)天數(shù)為50/0.4天;第三個50kg時,飼養(yǎng)天數(shù)為50/0.6天,因此豬體重凈增到150kg時。所需天數(shù)為(50/0.3)+(50/0.4)+(50/0.6)=375天。用調(diào)和平均數(shù)求出的平均增重與實際相符。用算術(shù)平均數(shù)求出的平均增重為(0.3+0.4+0.6)/3=0.433kg/每天,如豬體重凈增到150kg時則需346.5天,顯然與事實不符。同一個資料,求出的算術(shù)平均數(shù)大于幾何平均數(shù),而幾何平均數(shù)又大于調(diào)和平均數(shù)。上述五種平均數(shù)中,算術(shù)平均數(shù)、幾何平均數(shù)是最常用的平均數(shù)。

二、平均數(shù)的計算方法平均數(shù)的計算方法可根據(jù)樣本的大小和分組情況而采用不同的計算方法。1、直接法

樣本一般在30個變數(shù)以下未經(jīng)分組的資料可用此法計算平均數(shù)。設(shè)有一個含n個變數(shù)的小樣本,用x代表任何一個變數(shù),則第一個變數(shù)至n個變數(shù)可用x1、x2、x3……xn表示。平均數(shù)用表示,可用下列公式計算:

第9頁,共21頁,2023年,2月20日,星期三因此公式可簡寫成:=∑x /n(1—5)上式中,x為變數(shù),∑x表示從第一個變數(shù)xl一直加到第n個變數(shù)xn,n為變數(shù)的個數(shù)。例4.某品種雞一年中各月產(chǎn)蛋量記錄:18、20、21、22、23、23、24、25、25、25、26、26,求一年當中月平均產(chǎn)蛋數(shù)。∑x=18+20+21+22+23+23+24+25+25+25+26+26=278代入公式(1—5):=∑x/n=178/12=13.17(枚)例5.兩個基因頻率不同的群體混合,當代的基因頻率是這兩個群體的基因頻率以其各自群體大小為權(quán)的加權(quán)平均數(shù)。譬如一個有1000個個體的群體,某一基因的頻率為0.6,另一個400個個體的群體,同一基因的頻率為0.3,這兩個群體混合在一起,整個混合群體的這個基因的頻率為:(0.6×1000+0.3×400)/1400=0.51312、加權(quán)法

如變數(shù)x1、x2、x3……xn,其比重占得大的對平均數(shù)的影響大,比重占得小的對平均數(shù)的影響小。因此,不能平等地來看待這些變數(shù),所以用一種權(quán)衡輕重的方法,計算時先將各個變數(shù)x乘上它自己的權(quán)數(shù),再經(jīng)過總和后除以權(quán)數(shù)的總和;這就稱之為加權(quán)平均數(shù)。

第10頁,共21頁,2023年,2月20日,星期三如在分組資料中,以組中值代替每組內(nèi)的變數(shù),以“f”表示每組內(nèi)變數(shù)出現(xiàn)的次數(shù),次數(shù)f表示變數(shù)x在整個資料中所占的比重,亦可稱為權(quán)數(shù),這就可采用加權(quán)法求平均數(shù)。計算時,將各組的組中值分別乘以該組的次數(shù),乘積相加再除以總次數(shù),就可得出平均數(shù),其公式為:=∑fx/n(1—6)例6.從200頭大白母豬的仔豬一月窩重的次數(shù)分布中,求加權(quán)平均數(shù)。表1—3200頭大白母豬的仔豬一月窩重的次數(shù)分布表組別組中值(x)次數(shù)(f)fxfx28—16—24—32—40—48—56—64—72—80—88—96—104—112—1220283644526068768492100108116469101317263528211684348120252360572884156023802128176414728004323485762400705612960251684596893600161840161728148176135424800004665640368總和20013120961920第11頁,共21頁,2023年,2月20日,星期三2、樣本各變數(shù)與平均數(shù)的差的平方和比各個變數(shù)與其他數(shù)的差的平方和為小,即離均差的平方和為最小。由于離均差平方和為最小,所以平均數(shù)與各變數(shù)是最接近的一個數(shù)值。因此,它能代表這個樣本的集中趨勢,這一特性,證明如下:a為任何數(shù)值,可能比大或比小,但不等于,用算式表示:

a=±△△(讀delta)表示與a的差數(shù)?!?x—a)2=∑(x—±△)2=∑[(x—)±△]2=∑(x—)2±2△∑(x—)+n△2已知∑(x)=0,由此2△∑(x-)亦等于零。移項∑(x-)2=∑(x-a)2-n(-a)2∵n(-a)2>0∴∑(x-)2<∑(x-a)2代入公式(1—6):=∑fx/n=13120/200=65.60(kg)三、平均數(shù)的特性1、樣本各變數(shù)與平均數(shù)的差之和等于零。即離均差總和為零?!?xi-)=0,可證明如下:第12頁,共21頁,2023年,2月20日,星期三第二節(jié)

標準差

一、標準差的意義意義:用來指出資料中各變數(shù)的變異程度(離散性),并用來衡量樣本平均數(shù)的代表性。若各個變數(shù)相同沒有變異,則平均數(shù)完全可以代表整個樣本;如各變異數(shù)間變異較大,則平均數(shù)代表性就小。為了正確地評定樣本的代表性,就有必要度量其變異程度。因此,單靠平均數(shù)不能使我們了解樣本中各個變數(shù)間的變異程度和平均數(shù)作為整個樣本的代表程度。因為有時兩個樣本的兩個平均數(shù)可能相同,但這兩個樣本所包含的變數(shù)其變異程度可能是不相同的。例7.有甲和乙兩個豬種,經(jīng)分別測定10頭母豬的產(chǎn)仔數(shù),其結(jié)果如下:表1—4甲、乙兩品種母獵的產(chǎn)仔數(shù)

豬號產(chǎn)仔數(shù)甲品種乙品種1234567891084161222176146514811911121014138總和110110平均產(chǎn)仔數(shù)1111第13頁,共21頁,2023年,2月20日,星期三由上表看出,甲和乙兩品種的平均產(chǎn)仔數(shù)是相同的,都是11頭,看不出差異情況,似乎沒有優(yōu)劣之分。但進一步研究,可知兩個樣本的變異程度并不相同。如甲品種產(chǎn)仔數(shù)最少的為4頭,最多的為22頭。全距是18;而乙品種產(chǎn)仔數(shù)最少的為8頭,最多的為14頭,全距是6。實際上甲品種產(chǎn)仔數(shù)的變異程度大于乙品種,因此僅有平均數(shù)是不夠的。由于兩個樣本的變異程度不同反映出所得的平均數(shù)代表性也不同。因此,研究生物的性狀和特性時,除計算平均數(shù)之外還應(yīng)測定其變異程度。測定樣本的變異程度最簡單的方法,是應(yīng)用全距來表示。全距僅由兩個極端數(shù)差的大小來衡量,它不能代表樣本各變數(shù)間的變異程度。目前廣泛被應(yīng)用的是以標準差來度量樣本內(nèi)各個變數(shù)的變異程度和表明平均數(shù)的代表情況。應(yīng)用標準差表示樣本的變異程度比全距要好得多,因它考慮了每個變數(shù)與平均數(shù)的離差。每個變數(shù)與平均數(shù)相差愈小,則樣本變異程度小,反之則愈大。如每個變數(shù)與平均數(shù)之差為零,這時表示每個變數(shù)與平均數(shù)沒有差異。所以標準差是從各變數(shù)與平均數(shù)差的大小來觀察變異程度的一個統(tǒng)計量。二、標準差的計算方法測定某一樣本的變異程度時,先以每個變數(shù)與其平均數(shù)相減求出離均差。但由于離均差之和等于零,故不能直接算出離均差的平均數(shù)。為了合理地算出平均差異,可利用離均差平方的辦法來消除正負號。離均差平方相加所得的總和,稱為平方和,常用符號SS表示。然后求平方和的平均數(shù),第14頁,共21頁,2023年,2月20日,星期三稱為樣本方差或均方,以消除變數(shù)個數(shù)多少的影響。由于各個離均差經(jīng)過平方使原來度量的單位都變?yōu)槠椒絾挝?,所以最后還需開平方,使之還原。用這種方法表示數(shù)據(jù)的變異程度,在統(tǒng)計學中稱為標準差。通常用符號S表示。標準差公式來源:離均差=(x)離均差之和=∑(x)=0離均差平方和SS=∑(x)2

樣本均方樣本標準差

總體方差

總體標準差

其中μ為總體平均數(shù),μ=∑x/N,N為總體中所包含的變數(shù)的個數(shù)。第15頁,共21頁,2023年,2月20日,星期三1、未分組資料的計算方法未分組資料,一般指小樣本而言,其公式如下:(1—7)公式中,n-1為自由度,n為樣本含量,小樣本應(yīng)用自由度計算標準差的目的,在于糾正由于樣本小而發(fā)生的取樣誤差影響。如一個樣本含有n個變數(shù),從理論上說,n個變數(shù)都同樣用以計算標準差,n個變數(shù)與相減有n個離均差。表面上雖有n個比較,但實質(zhì)上僅有n-1個可以自由變動,最后一個離均差受到∑(x)=0這個條件的限制。所以不能自由。例如,有5個變數(shù),其4個離均差為-2、-1、1、2,則第5個離均差必等于0,如4個離均差為-1、0、1、2時,則第5個離均差必等于-2,這樣才能使離均差的總和等于0。這5個離均差中,因受離均差之和等于0的限制,所以只有4個能自由變動。這時的自由度就是n-1。自由度等于樣本變數(shù)的總個數(shù)減去計算過程中使用的條件數(shù)。在計算標準差時,條件就是一個,即∑(x)=0,故自由度為n-1。如計算樣本某一個統(tǒng)計數(shù)應(yīng)用2個條件,其自由度則為n-2,應(yīng)用k個條件,則自由度為n-k。小樣本常用自由度來計算標準差或其他統(tǒng)計數(shù)。因小樣本的全距較群體為小,若為大樣本當與群體較接近時,可不用自由度,直接用n亦可。自由度的符號以“df”表示。

標準差是測定離中性的統(tǒng)計量,因此用原數(shù)據(jù)的單位表示。根據(jù)樣本數(shù)據(jù)的多少,標準差的計算方法有以下兩種。例8.計算10頭考力代綿羊產(chǎn)毛量的標準差。

第16頁,共21頁,2023年,2月20日,星期三表1—510頭考力代綿羊產(chǎn)毛量的資料單位:kg剪毛量(x)(x)(x)2x24.54.55.05.05.55.55.56.06.06.5-0.9-0.9-0.4-0.40.10.10.10.60.61.10.810.810.160.160.010.010.010.360.361.2120.2520.2525.0025.0030.2530.2530.2536.0036.0042.25∑x=54∑(x)=0∑(x)2=3.9∑x2=295.5將表1—5中,有關(guān)總和數(shù)值代入公式中:

第17頁,共21頁,2023年,2月20日,星期三標準差公式中∑(x)2,因使用函數(shù)型電子計算器計算不方便,現(xiàn)在一般常用下列公式。公式推導:因:

2、分組資料的計算方法

當數(shù)據(jù)很大時,一般超過30個變數(shù)以上的大樣本,須先分組制成次數(shù)分布表,然后計算標準差。分組資料計算標準差方法采用加權(quán)法,即:次數(shù)分布表中各組的組中值與其平均數(shù)的離差再平方,乘上次數(shù),總和后被n-1除,再開方,即得標準差,其公式:

第18頁,共21頁,2023年,2月20日,星期三(1—8)

因:

上式中,f為各組次數(shù),x為各組的組中值,根據(jù)公式推導,可將公式3—8化簡為:

(1—9)

例9.用表1—3,200頭大白母豬的仔豬一月窩重的資料計算標準差將表1—3中各項總和代入公式(1—9)中:

用以上方法算出標準差后,可以測定樣本內(nèi)變數(shù)的分布情況。當標準差小,則說明樣本內(nèi)變數(shù)的分布集中于平均數(shù)兩側(cè);如標準差大,則說明變數(shù)的分布愈分散。因此,標準差的大小可以衡量樣本平均數(shù)的代表性,當標準差小,則說明平均數(shù)的代表性強,而標準差大,說明平均數(shù)的代表性弱。

第19頁,共21頁,2023年,2月20日,星期三三、標準差的特性1、標準差的大小,受每個變數(shù)值的影響,如變數(shù)與變數(shù)間變異大,其離均差亦大,用此求得的標準差必然也大,反之則小。2、計算標準差時,在各變數(shù)上加或減一個常數(shù),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論