田間試驗(yàn)統(tǒng)計(jì)第三章次數(shù)分布和平均數(shù)、變異數(shù)匯編課件_第1頁(yè)
田間試驗(yàn)統(tǒng)計(jì)第三章次數(shù)分布和平均數(shù)、變異數(shù)匯編課件_第2頁(yè)
田間試驗(yàn)統(tǒng)計(jì)第三章次數(shù)分布和平均數(shù)、變異數(shù)匯編課件_第3頁(yè)
田間試驗(yàn)統(tǒng)計(jì)第三章次數(shù)分布和平均數(shù)、變異數(shù)匯編課件_第4頁(yè)
田間試驗(yàn)統(tǒng)計(jì)第三章次數(shù)分布和平均數(shù)、變異數(shù)匯編課件_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、田間試驗(yàn)統(tǒng)計(jì)第三章次數(shù)分布和平均數(shù)、變異數(shù)匯編田間試驗(yàn)統(tǒng)計(jì)第三章次數(shù)分布和平均數(shù)、變異數(shù)匯編第一節(jié) 總體與樣本1.數(shù)據(jù)的變異和趨中性 數(shù)據(jù)(data)在科學(xué)試驗(yàn)或調(diào)查過(guò)程中,對(duì)研究對(duì)象的某些特征、特性進(jìn)行觀察記載得到的數(shù)字資料的總稱(chēng)。 數(shù)據(jù)是千差萬(wàn)別,各不相同,這就是數(shù)據(jù)的變異性,也是數(shù)據(jù)的最基本特征。 數(shù)據(jù)除了變異的特征外,還具有趨中性,即一組數(shù)據(jù)中數(shù)字位于平均數(shù)附近的分布較多,離平均數(shù)越遠(yuǎn),分布越少。第一節(jié) 總體與樣本1.數(shù)據(jù)的變異和趨中性 數(shù)據(jù)(da2.變數(shù)和變量 變數(shù)(variable)生物個(gè)體具有變異性的特征、特性。如作物的株高、抽穗期、穗粒數(shù)、產(chǎn)量,植株的害蟲(chóng)頭數(shù)、發(fā)病率等。 變數(shù)

2、的某一具體數(shù)值稱(chēng)為變量(variate)或觀測(cè)值(observed value),用英文大寫(xiě)字母表示,并附下角碼。如有一個(gè)變數(shù),用y表示,yi 表示某一具體觀測(cè)值;如有多個(gè)變數(shù),可分別用X、Y、Z等表示。2.變數(shù)和變量 變數(shù)(variable)生物個(gè)變數(shù) 連續(xù)性變數(shù)是指觀測(cè)值在一定范圍內(nèi)可以取任何一個(gè)數(shù)值,這些觀測(cè)值一般是通過(guò)測(cè)量或稱(chēng)量的方法獲得的。如作物的株高、穗長(zhǎng)、粒重、產(chǎn)量等。 離散性變數(shù)是指觀測(cè)值只能取0或正整數(shù)的變數(shù),其觀測(cè)值一般通過(guò)觀察和計(jì)數(shù)的方法獲得的。如昆蟲(chóng)的頭數(shù)、病菌的個(gè)數(shù)、作物的穗粒數(shù)和穗數(shù)等。連續(xù)性變數(shù)(continuous variable)離散性變數(shù)(disconti

3、nuous or discrete variable)變數(shù) 連續(xù)性變數(shù)是指觀測(cè)值在一定范圍內(nèi)可以取任何3.總體和樣本 總體(population or universe) 根據(jù)研究目的而確定的,具有共同性質(zhì)的個(gè)體所組成的集團(tuán),或者說(shuō)是整個(gè)研究對(duì)象中每個(gè)個(gè)體某一變數(shù)所有觀測(cè)值的總稱(chēng)。 按總體中的個(gè)體數(shù)目可分為:無(wú)限總體有限總體 總體中每一個(gè)個(gè)體稱(chēng)為總體單位??傮w中的個(gè)體數(shù)目 稱(chēng)為總體單位數(shù)或總體容量,常用大寫(xiě) N 表示。 根據(jù)總體全體觀測(cè)值算出的總體特征數(shù)稱(chēng)為參數(shù)(parameter)。參數(shù)常用希臘字母表示。如總體平均數(shù) ,方差2,標(biāo)準(zhǔn)差 等。3.總體和樣本 總體(population or 總

4、體往往比較大,了解總體是很困難的,通常是從總體中抽出一部分有代表性的個(gè)體或觀測(cè)值來(lái)調(diào)查,這一部分個(gè)體或觀測(cè)值稱(chēng)為樣本(sample)。3.總體和樣本 樣本中的個(gè)體數(shù)稱(chēng)為樣本單位數(shù)或樣本容量。樣本容量用小寫(xiě)字母 n 表示。n30為大樣本, n30為小樣本。根據(jù)樣本所有觀測(cè)值計(jì)算出的樣本特征數(shù)稱(chēng)為統(tǒng)計(jì)數(shù)或統(tǒng)計(jì)量(statastic)。樣本統(tǒng)計(jì)數(shù)常用英文字母表示。 例如樣本平均數(shù) ,方差S2,標(biāo)準(zhǔn)差S等。 總體往往比較大,了解總體是很困難的,通常是從總體第二節(jié) 次數(shù)分布 試驗(yàn)資料的性質(zhì) 農(nóng)業(yè)試驗(yàn)中所得的數(shù)據(jù),因所研究的性狀、特 性不同而有不同的性質(zhì),一般可以分為兩大類(lèi):一、數(shù)量性狀資料1、離散型或間

5、斷型隨機(jī)變數(shù):(由計(jì)數(shù)或測(cè)量方式得到) 是指用計(jì)數(shù)方法獲得的數(shù)據(jù),如基本苗數(shù)、分蘗數(shù)等,其各觀測(cè)值必須以整數(shù)表示。 指由稱(chēng)量、度量或測(cè)量等方法取得到的數(shù)據(jù),其各個(gè)數(shù)據(jù)并不限于整數(shù)。如粒重、株高等。2、連續(xù)型隨機(jī)變數(shù):第二節(jié) 次數(shù)分布 試驗(yàn)資料的性質(zhì) 農(nóng)業(yè)試驗(yàn)中所二、質(zhì)量性狀資料 (指能觀察而不能量測(cè)的性狀)1、按性狀的屬性把樣本個(gè)體分為若干類(lèi),數(shù)出 各類(lèi)個(gè)體的數(shù)目;這類(lèi)資料有時(shí)換算為百分 率或數(shù)。如調(diào)查300株碗豆的花色,其中紫 花植株數(shù)為220株,白花植株為80株。2、給予每類(lèi)性狀以相當(dāng)數(shù)量的方法:如小麥種 子芒的有無(wú),可令有芒種子為1,無(wú)芒種子 為0;等等。這種資料可按間斷型變數(shù)處理。一、

6、數(shù)量性狀資料(由計(jì)數(shù)或測(cè)量方式得到)這類(lèi)資料通??捎脙煞N方法取得數(shù)據(jù):二、質(zhì)量性狀資料 次數(shù)分布 從一個(gè)總體隨機(jī)抽取n個(gè)個(gè)體進(jìn)行調(diào)查,得到n個(gè)觀測(cè)值,不同數(shù)值(或區(qū)間)的個(gè)體數(shù)目不盡相同,這些次數(shù)將會(huì)按一定規(guī)律分配給不同的數(shù)值(或區(qū)間),這種分布情況叫次數(shù)分布。把次數(shù)分布以表的形式列出來(lái),得次數(shù)分布表。以圖的形式繪出來(lái),得次數(shù)分布圖。 次數(shù)分布 從一個(gè)總體隨機(jī)抽取n個(gè)個(gè)體進(jìn)行調(diào)查 間斷性變數(shù)資料的整理1、若變數(shù)可取值個(gè)數(shù)不多時(shí)以自然單位進(jìn)行分組例如 因?yàn)槿≈祩€(gè)數(shù)只有15 、16、17、18、19和20等六種,所以以自然單位分組。第二節(jié) 次數(shù)分布 間斷性變數(shù)資料的整理1、若變數(shù)可取值個(gè)數(shù)不多時(shí)以

7、自然單位第二節(jié) 次數(shù)分布第二節(jié) 次數(shù)分布連續(xù)性變數(shù)資料的整理 它的整理方法有以下4個(gè)步驟:1. 求極差;2. 確定組數(shù)和組距;3. 選定組中值和組限;4. 數(shù)據(jù)歸組。第二節(jié) 次數(shù)分布以課本p.38的表3.4為例說(shuō)明。R = Max(x) - Min(x) = 254 - 75 = 179組數(shù):擬分為12組組距 = 1791214.915連續(xù)性變數(shù)資料的整理1. 求極差;2. 確定組數(shù)和組距;3 連續(xù)性變數(shù)資料的整理 它的整理方法有以下5個(gè)步驟:1. 求極差;2. 確定組數(shù)和組距;3. 選定組中值和組限;4. 數(shù)據(jù)歸組。第二節(jié) 次數(shù)分布以課本p.38的表3.4為例說(shuō)明。R = Max(x) -

8、Min(x) = 254 - 75 = 179組數(shù):擬分為12組組距 = 1791214.915(用打“正”字的方法,計(jì)算出應(yīng)歸入各組的觀察值個(gè)數(shù)。)丁正丁一271次數(shù)140 連續(xù)性變數(shù)資料的整理1. 求極差;2. 確定組數(shù)和組距;2、若變數(shù)可取值個(gè)數(shù)太多,則可按取值大小,從小 到大相鄰若干個(gè)值合為一組的方法進(jìn)行整理(一般 要求組距相等)。(課本p.37表3.3)第二節(jié) 次數(shù)分布2、若變數(shù)可取值個(gè)數(shù)太多,則可按取值大小,從小第二節(jié) 次數(shù)分1. 方柱形圖2. 多邊形圖;3. 條形圖;4. 餅圖; 次數(shù)分布圖適用于表示連續(xù)性變數(shù)的次數(shù)分布;以課本p.39的表3.6的分布為例說(shuō)明。1. 方柱形圖2.

9、 多邊形圖;3. 條形圖;4. 餅圖; 次1. 方柱形圖2. 多邊形圖3. 條形圖;4. 餅圖; 次數(shù)分布圖適用于表示連續(xù)性變數(shù)的次數(shù)分布;適用于表示連續(xù)性變數(shù)的次數(shù)分布;以課本p.39的表3.6的分布為例說(shuō)明。1. 方柱形圖2. 多邊形圖3. 條形圖;4. 餅圖; 次數(shù)1. 方柱形圖2. 多邊形圖3. 條形圖4. 餅圖 次數(shù)分布圖適用于表示連續(xù)性變數(shù)的次數(shù)分布;適用于表示連續(xù)性變數(shù)的次數(shù)分布;適用于表示間斷性和屬性變數(shù)的資料;以課本p.37的表3.3的分布為例說(shuō)明。1. 方柱形圖2. 多邊形圖3. 條形圖4. 餅圖 次數(shù)分布1. 方柱形圖2. 多邊形圖3. 條形圖4. 餅圖 次數(shù)分布圖適用于

10、表示連續(xù)性變數(shù)的次數(shù)分布;適用于表示連續(xù)性變數(shù)的次數(shù)分布;適用于表示間斷性和屬性變數(shù)的資料;以課本p.37的表3.3的分布為例說(shuō)明。適用于表示間斷性和屬性變數(shù)的資料;以課本p.39的表3.7的分布為例說(shuō)明。1. 方柱形圖2. 多邊形圖3. 條形圖4. 餅圖 次數(shù)分布第三節(jié) 平均數(shù) 平均數(shù)的意義和種類(lèi) 算術(shù)平均數(shù): 平均數(shù)(average or mean)是數(shù)據(jù)的代表值,表示資料中觀測(cè)值的中心位置。 中(位)數(shù)(median): 眾數(shù)(mode): 幾何平均數(shù)(geometric mean): 所有觀測(cè)值的總和除以觀測(cè)值 數(shù)目所得的商。 將資料所有觀測(cè)值排序后,居于中間位置的那個(gè)觀測(cè)值的值(或,

11、當(dāng)觀測(cè)值數(shù)目為偶數(shù)時(shí),那兩個(gè)觀測(cè)值的和之半)。 資料中最常見(jiàn)的一數(shù),或次數(shù)分布表中次數(shù)最多的那組的組中值。 n個(gè)觀測(cè)值的乘積的n次方根。其中以算術(shù)平均數(shù)最為常用。 將資料所有觀測(cè)值排序后,居于中間位置的那個(gè)觀測(cè)值的值(或,當(dāng)觀測(cè)值數(shù)目為偶數(shù)時(shí),那兩個(gè)觀測(cè)值的和之半)。 資料中最常見(jiàn)的一數(shù),或次數(shù)分布表中次數(shù)最多的那組的組中值。 將資料所有觀測(cè)值排序后,居于中間位置的那個(gè)觀測(cè)值的值(或,當(dāng)觀測(cè)值數(shù)目為偶數(shù)時(shí),那兩個(gè)觀測(cè)值的和之半)。第三節(jié) 平均數(shù) 平均數(shù)的意義和種類(lèi) 算術(shù)平均數(shù): 平均數(shù)( 算術(shù)平均數(shù)所有觀測(cè)值的總和除以觀察 值數(shù)目所得的商。 總體平均數(shù)(population mean):在不會(huì)

12、混淆時(shí)記為:對(duì)于分組資料: 樣本平均數(shù)(sample mean):在不會(huì)混淆時(shí)記為:對(duì)于分組資料: 算術(shù)平均數(shù)所有觀測(cè)值的總和除以觀察 總體平均數(shù)(popu 算術(shù)平均數(shù)的作用:1.衡量一組數(shù)據(jù)的中心位置或一般水平。2.作為一組數(shù)據(jù)的代表值與其他數(shù)據(jù)作比較。 某觀測(cè)值的離均差 資料中所有觀測(cè)值的離均差之和為0。 離均差的兩個(gè)重要特性: 資料中所有觀測(cè)值的離均差平方之和最小。 對(duì)于任意實(shí)數(shù) 有關(guān)系: 該觀測(cè)值與整個(gè)資料的平均數(shù)之間的差。 證明:記 則有 算術(shù)平均數(shù)的作用:1.衡量一組數(shù)據(jù)的中心位置或一般水平。2 算術(shù)平均數(shù)的局限性: 平均數(shù)是最具有代表數(shù)據(jù)資料整體水平的數(shù)值,但不同數(shù)據(jù)資料,其平均

13、數(shù)的代表性是不一樣的,因此單用平均數(shù)還不足以很好地表達(dá)一組數(shù)據(jù)的主要特征。例如下面的兩組人,平均年齡都是25歲,能說(shuō)兩組都是青年人嗎?24歲26歲25歲25歲49歲1歲 算術(shù)平均數(shù)的局限性: 平均數(shù)是最具有代表數(shù)據(jù)資料整體水平第四節(jié) 變異數(shù)極差(range) 一組數(shù)據(jù)的最大值與最小值之差。 即:R=Max(y)-Min(y)上例中:第一組數(shù)據(jù)的極差為:R1 = 26-24 = 2 第二組數(shù)據(jù)的極差為:R2 = 49-1 = 48 可見(jiàn)第二組人的年齡變異大的多 存在問(wèn)題:極差只考慮了數(shù)據(jù)中的兩個(gè)極端值,而且極端值往往是數(shù)據(jù)中最不可靠的觀測(cè)值 因此,利用極差來(lái)表示數(shù)據(jù)資料的變異具有明顯的局限性第四

14、節(jié) 變異數(shù)極差(range) 一組數(shù)據(jù)的最大值與最為了解決資料中所有觀測(cè)值的離均差正負(fù)抵消的問(wèn)題,采用先平方后再相加的辦法。數(shù)據(jù)資料的變異取決于觀測(cè)值的離散程度,這自然會(huì)聯(lián)想到所有觀測(cè)值離均差的大小,如果把這些差值加在一起,數(shù)值大就說(shuō)明這組數(shù)據(jù)離散程度大,聽(tīng)起來(lái)似乎比較合理,但是我們由平均數(shù)的第一個(gè)性質(zhì)知道:用什么特征數(shù)來(lái)表示數(shù)據(jù)資料的變異大小比較合理呢?第四節(jié) 變異數(shù) 離均差平方和:上例中:第一組數(shù)據(jù)的平方和為:SS1 = (24-25)2 + (25-25)2 +(26-25)2 = 2 第二組數(shù)據(jù)的平方和為:SS2 = (1-25)2 + (25-25)2 +(49-25)2 = 115

15、2 當(dāng)兩組資料中觀測(cè)值的數(shù)目不等時(shí),用平方和來(lái)表示數(shù)據(jù)資料的變異性是否有局限性呢?例如現(xiàn)在有2個(gè)組,一班為1組(25人),二班為1組(22人),以身高作為考查指標(biāo),用SS來(lái)比較哪個(gè)組身高的離散程度大,若哪個(gè)組身高的離散程度大就發(fā)給哪個(gè)組每人一張電影票。試問(wèn),是一班同學(xué)有意見(jiàn)還是二班同學(xué)有意見(jiàn)?這不公平,因?yàn)槎嗟娜藬?shù)多。因此必需消除樣本容量對(duì)離均差平方和的影響,這就需要引入另外一個(gè)特征數(shù)-方差為了解決資料中所有觀測(cè)值的離均差正負(fù)抵消的問(wèn)題,采用先平方后計(jì)算公式:樣本方差(sample variance):另外:n-1稱(chēng)為樣本方差的自由度(degree of freedom,df or DF o

16、r ) 二)方差總體方差(population variance):第四節(jié) 變異數(shù)因?yàn)榇蠖鄶?shù)情況下 根據(jù)平均數(shù)的第二個(gè)重要特性:所以用 來(lái)估計(jì) 老是偏小。而樣本方差是用于無(wú)偏估計(jì)總體方差的,所以在計(jì)算樣本方差時(shí)用樣本的SS除以n-1,來(lái)進(jìn)行矯正。這在統(tǒng)計(jì)學(xué)上也得到了證明。那么為什么是除以n-1,而不是除以n-2或n-3等其它數(shù)?df=n-k 例如有這樣一組數(shù)據(jù):2,4,6,8,其平均數(shù)等于5,那么這4個(gè)數(shù)中只3個(gè)數(shù)值可以自由變動(dòng),若2變成4,4變成9,6變成1,那么最后一個(gè)數(shù)只能是6,否則平均數(shù)就不等于5了,這里的限制條件只有一個(gè),就是平均數(shù)。因此df=n-1=4-1=3計(jì)算公式:樣本方差(s

17、ample variance):另外:1、總體標(biāo)準(zhǔn)差(Population SD):2、樣本標(biāo)準(zhǔn)差(Sample SD):方差的限制性:在計(jì)算SS時(shí)由于對(duì)離均差進(jìn)行了平方,所以它的單位是 原來(lái)數(shù)據(jù)單位的平方,在實(shí)踐上難以解釋?zhuān)袥](méi)有其它 方法來(lái)彌補(bǔ)方差在度量數(shù)據(jù)資料變異大小時(shí)存的不足呢?三)標(biāo)準(zhǔn)差第四節(jié) 變異數(shù)1、總體標(biāo)準(zhǔn)差(Population SD):2、樣本標(biāo)準(zhǔn)差4、方差和標(biāo)準(zhǔn)差的功能(1)方差和標(biāo)準(zhǔn)差的值均大于零(2)資料中各觀測(cè)值都加上或減去一個(gè)常數(shù)a,方差和標(biāo)準(zhǔn)差不變(3)資料中各觀測(cè)值都乘以或除以一個(gè)常數(shù)a,方差增加或減少a2倍,標(biāo) 準(zhǔn)差增加或減少a倍3、方差和標(biāo)準(zhǔn)差的特性 方差和標(biāo)準(zhǔn)差是表示數(shù)據(jù)資料最常用的變異數(shù),在統(tǒng)計(jì)分析中通常用 方差來(lái)估計(jì)和比較變異大小,用標(biāo)準(zhǔn)差作為度量變異的標(biāo)準(zhǔn)單位 但是用標(biāo)準(zhǔn)差來(lái)表示數(shù)據(jù)資料的變異性仍有其局限性,在日常生活中 我們很容易體驗(yàn)到 如果你到一個(gè)商店去購(gòu)物,你花950元購(gòu)買(mǎi)一件標(biāo)價(jià)為1000元的商品和花50元購(gòu)買(mǎi)一件標(biāo)價(jià)為100元的物品,你的感受有何不同? 950,1000(s=35.36) 與 50,100(s=35.36)調(diào)查一組人的身高,得又調(diào)查他們的體重,得 能認(rèn)為體高的變異10cm比體重的變異4kg大嗎?事實(shí)上這批人體重的變異比體高的變異大一些因此當(dāng)不同數(shù)據(jù)資料的平均數(shù)不相等或單位不一致,又

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論