版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第2章數(shù)據(jù)的組織與表達(dá)ArrangementandPresentationofData第2章數(shù)據(jù)的組織與表達(dá)ArrangementandPr1Section2.1
DataandDataType
數(shù)據(jù)與數(shù)據(jù)類型
Section2.1
DataandDataTyp2一、原始數(shù)據(jù)的組織資料以電子表格(spreadsheet)方式記錄。包括個(gè)體(Individual):一筆數(shù)據(jù)所描述的對(duì)象(object)。電子表格中輸入在一行。及變量(Variable):描述任何一個(gè)個(gè)體的特征,一個(gè)變量對(duì)不同的個(gè)體取不同的數(shù)值(value)。電子表格中輸入在一列。一、原始數(shù)據(jù)的組織資料以電子表格(spreadsheet)方3(一)數(shù)量性狀資料數(shù)量性狀(quantitativetrait)的度量有計(jì)數(shù)和量測(cè)兩種方式,其所得變數(shù)不同。1.不連續(xù)性或間斷性變數(shù)(discontinuousordiscretevariable)指用計(jì)數(shù)方法獲得的數(shù)據(jù)。2.連續(xù)性變數(shù)(continuousvariable)指稱量、度量或測(cè)量方法所得到的數(shù)據(jù),其各個(gè)觀察值并不限于整數(shù),在兩個(gè)數(shù)值之間可以有微量數(shù)值差異的第三個(gè)數(shù)值存在。二、試驗(yàn)資料的性質(zhì)與分類(一)數(shù)量性狀資料二、試驗(yàn)資料的性質(zhì)與分類4(二)質(zhì)量性狀資料
質(zhì)量性狀(qualitativetrait)指能觀察而不能量測(cè)的狀即屬性性狀,如花藥、子粒、穎殼等器官的顏色、芒的有無(wú)、絨毛的有無(wú)等。要從這類性狀獲得數(shù)量資料,可采用下列兩種方法:統(tǒng)計(jì)次數(shù)法于一定總體或樣本內(nèi),統(tǒng)計(jì)其具有某個(gè)性狀的個(gè)體數(shù)目及具有不同性狀的個(gè)體數(shù)目,按類別計(jì)其次數(shù)或相對(duì)次數(shù)。
2.
給分法給予每類性狀以相對(duì)數(shù)量的方法二、試驗(yàn)資料的性質(zhì)與分類(二)質(zhì)量性狀資料二、試驗(yàn)資料的性質(zhì)與分類5Section2.2
次數(shù)分布表
Section2.2
次數(shù)分布表6表1100個(gè)麥穗的每穗小穗數(shù)18151719161520181917171817161820191716181716171918181717171818151618181817201918171915171717161718181719191719171816181717191616171717151716181918181919201716191817182019161819171615161817181717161917一、間斷性變數(shù)資料的整理表1100個(gè)麥穗的每穗小穗數(shù)181517191615207每穗小穗數(shù)(
y
)次數(shù)(f)1561615173218251917205總次數(shù)(
n
)100表2100個(gè)麥穗每穗小穗數(shù)的次數(shù)分布表從表2中看到,一堆雜亂的原始資料表,經(jīng)初步整理后,就可了解資料的大致情況,另外,經(jīng)過(guò)整理的資料也便于進(jìn)一步的分析。每穗小穗數(shù)在15—20的范圍內(nèi)變動(dòng),把所有觀察值按每穗小穗數(shù)多少加以歸類,共分為6組,組與組間相差為1小穗,稱為組距。這樣可得表2形式的次數(shù)分布表。一、間斷性變數(shù)資料的整理每穗小穗數(shù)(y)次數(shù)(f)15616151732188二、連續(xù)性變數(shù)資料的整理17721519797123159245119119131149152167104161214125175219118192176175951361991161652149515883137801381511871261961342061379897129143179174159165136108101141148168163176102194145173751301491501611551111581311899114214015415216312320514915513120918397119181149187131215111186118150155197116254239160172179151198124179135184168169173181188211197175122151171166175143190213192231163159158159177147194227141169124159表3140行水稻產(chǎn)量(單位:克)二、連續(xù)性變數(shù)資料的整理1772151979712319具體步驟:1.數(shù)據(jù)排序(sort)首先對(duì)數(shù)據(jù)按從小到大排列(升序)或從大到小排列(降序)。2.求極差(range)所有數(shù)據(jù)中的最大觀察值和最小觀察值的差數(shù),稱為極差,亦即整個(gè)樣本的變異幅度。從表3中查到最大觀察值為254g,最小觀察值為75g,極差為254-75=179g。二、連續(xù)性變數(shù)資料的整理具體步驟:二、連續(xù)性變數(shù)資料的整理103.確定組數(shù)和組距(classinterval)根據(jù)極差分為若干組,每組的距離相等,稱為組距。
在確定組數(shù)和組距時(shí)應(yīng)考慮:(1)觀察值個(gè)數(shù)的多少;(2)極差的大??;(3)便于計(jì)算;(4)能反映出資料的真實(shí)面貌等方面。樣本大小(即樣本內(nèi)包含觀察值的個(gè)數(shù)的多少)與組數(shù)多少的關(guān)系可參照表4來(lái)確定。二、連續(xù)性變數(shù)資料的整理3.確定組數(shù)和組距(classinte11表4樣本容量與組數(shù)多少的關(guān)系樣本內(nèi)觀察值的個(gè)數(shù)分組時(shí)的組數(shù)505—101008—1620010—2030012—2450015—30100020—40組數(shù)確定后,還須確定組距。組距=極差/組數(shù)。以表3中140行水稻產(chǎn)量為例,樣本內(nèi)觀察值的個(gè)數(shù)為140,查表4可分為8—16組,假定分為12組,則組距為179/12=14.9g,為分組方便起見(jiàn),可以15g作為組距。二、連續(xù)性變數(shù)資料的整理表4樣本容量與組數(shù)多少的關(guān)系樣本內(nèi)觀察值的個(gè)數(shù)分組時(shí)的組數(shù)124.選定組限(classlimit)和組中點(diǎn)值(組值,classvalue)以表3中140行水稻產(chǎn)量為例,選定第一組的中點(diǎn)值為75g,與最小觀察值75g相等;則第二組的中點(diǎn)值為75+15=90g,余類推。各組的中點(diǎn)值選定后,就可以求得各組組限。每組有兩個(gè)組限,數(shù)值小的稱為下限(lowerlimit),數(shù)值大的稱為上限(upperlimit)。上述資料中,第一組的下限為該組中點(diǎn)值減去1/2組距,即75-(15/2)=67.5g,上限為中點(diǎn)值加1/2組距,即75+(15/2)=82.5g。故第一組的組限為67.5—82.5g。按照此法計(jì)算其余各組的組限。二、連續(xù)性變數(shù)資料的整理4.選定組限(classlimit)和135.把原始資料的各個(gè)觀察值按分組數(shù)列的各組組限歸組
可按原始資料中各觀察值的次序,逐個(gè)把數(shù)值歸于各組。待全部觀察值歸組后,即可求得各組的次數(shù),制成一個(gè)次數(shù)分布表。例如表3中第一個(gè)觀察值177應(yīng)歸于表5中第8組,組限為172.5—187.5;第二個(gè)觀察值149應(yīng)歸于第6組,組限為142.5—157.5;……。依次把140個(gè)觀察值都進(jìn)行歸組,即可制成140行水稻產(chǎn)量的次數(shù)分布表(表5)。二、連續(xù)性變數(shù)資料的整理二、連續(xù)性變數(shù)資料的整理14表5140行水稻的次數(shù)分布組限中點(diǎn)值(
y
)次數(shù)(f)67.5—82.575282.5—97.590797.5—112.51057112.5—127.512013127.5—142.513517142.5—157.515020157.5—172.516525172.5—187.518021187.5—202.519513202.5—217.52109217.5—232.52253232.5—247.52402247.5—262.52551合計(jì)(
n
)140
注:前面提到分為12組,但由于第一組的中點(diǎn)值接近于最小觀察值,故第一組的下限小于最小觀察值,實(shí)際上差不多增加了1/2組;這樣也使最后一組的中點(diǎn)值接近于最大值,又增加了1/2組,故實(shí)際的組數(shù)比原來(lái)確定的要多一個(gè)組,為13組。二、連續(xù)性變數(shù)資料的整理表5140行水稻的次數(shù)分布組限中點(diǎn)值(y)次15三、屬性變數(shù)資料的整理屬性變數(shù)的資料,也可以用類似次數(shù)分布的方法來(lái)整理。在整理前,把資料按各種質(zhì)量性狀進(jìn)行分類,分類數(shù)等于組數(shù),然后根據(jù)各個(gè)體在質(zhì)量屬性上的具體表現(xiàn),分別歸入相應(yīng)的組中,即可得到屬性分布的規(guī)律性認(rèn)識(shí)。例如,某水稻雜種第二代植株米粒性狀的分離情況,歸于表6。表6水稻雜種二代植株米粒性狀的分離情況屬性分組(
y
)次數(shù)(
f)紅米非糯96紅米糯稻37白米非糯31白米糯稻15合計(jì)(
n
)179三、屬性變數(shù)資料的整理屬性變數(shù)的資料,也可16Section2.3
次數(shù)分布圖
Section2.3
次數(shù)分布圖17
一、方柱形圖方柱形圖(histogram)適用于表示連續(xù)性變數(shù)的次數(shù)分布。
現(xiàn)以表3的140行水稻產(chǎn)量的次數(shù)分布表為例加以說(shuō)明。即成方柱形次數(shù)分布圖1。圖1140行水稻產(chǎn)量次數(shù)分布方柱形圖一、方柱形圖方柱形圖(histogram)適用于表示18二、多邊形圖
多邊形圖(polygon)也是表示連續(xù)性變數(shù)資料的一種普通的方法,且在同一圖上可比較兩組以上的資料。仍以140行水稻產(chǎn)量次數(shù)分布為例,所成圖形即為次數(shù)多邊形圖(圖2)。圖2140行水稻產(chǎn)量次數(shù)分布多邊形圖二、多邊形圖多邊形圖(polygon)也19三、條形圖
條形圖(bar)適用于間斷性變數(shù)和屬性變數(shù)資料,用以表示這些變數(shù)的次數(shù)分布狀況。一般其橫軸標(biāo)出間斷的中點(diǎn)值或分類性狀,縱軸標(biāo)出次數(shù)?,F(xiàn)以表6水稻雜種第二代米粒性狀的分離情況為例,可畫成水稻雜種第二代植株4種米粒性狀分離情況條形圖(圖3)。圖3水稻F2代米粒性狀分離條形圖三、條形圖條形圖(bar)適用于間斷性變20
四、餅圖
餅圖(pie)適用于間斷性變數(shù)和屬性變數(shù)資料,用以表示這些變數(shù)中各種屬性或各種間斷性數(shù)據(jù)觀察值在總觀察個(gè)數(shù)中的百分比。如圖4中白米糯稻在F2群體中占8%,白米非糯、紅米糯稻和紅米非糯分別占17%、21%和54%。圖4水稻F2代米粒性狀分離的餅圖四、餅圖餅圖(pie)適用于間斷性變21Section2.4
平均數(shù)
Section2.4
平均數(shù)22一、平均數(shù)的意義和種類平均數(shù)的意義:
平均數(shù)(average)是數(shù)據(jù)的代表值,表示資料中觀察值的中心位置,并且可作為資料的代表而與另一組資料相比較,借以明確二者之間相差的情況。一、平均數(shù)的意義和種類平均數(shù)的意義:23平均數(shù)的種類:(1)算術(shù)平均數(shù)一個(gè)數(shù)量資料中各個(gè)觀察值的總和除以觀察值個(gè)數(shù)所得的商數(shù),稱為算術(shù)平均數(shù)(arithmeticmean),記作。因其應(yīng)用廣泛,常簡(jiǎn)稱平均數(shù)或均數(shù)(mean)。均數(shù)的大小決定于樣本的各觀察值。(2)中數(shù)將資料內(nèi)所有觀察值從大到小排序,居中間位置的觀察值稱為中數(shù)(median),計(jì)作Md。如觀察值個(gè)數(shù)為偶數(shù),則以中間二個(gè)觀察值的算術(shù)平均數(shù)為中數(shù)。一、平均數(shù)的意義和種類平均數(shù)的種類:一、平均數(shù)的意義和種類24(3)
眾數(shù)資料中最常見(jiàn)的一數(shù),或次數(shù)最多一組的中點(diǎn)值,稱為眾數(shù)(mode),計(jì)作MO。如棉花纖維檢驗(yàn)時(shí)所用的主體長(zhǎng)度即為眾數(shù)。(4)幾何平均數(shù)如有n個(gè)觀察值,其相乘積開(kāi)n次方,即為幾何平均數(shù)(geometricmean),用G代表。一、平均數(shù)的意義和種類(3)眾數(shù)資料中最常見(jiàn)的一數(shù),或次數(shù)最多25二、算術(shù)平均數(shù)的計(jì)算方法
若樣本較小,即資料包含的觀察值個(gè)數(shù)不多,可直接計(jì)算平均數(shù)。設(shè)一個(gè)含有n個(gè)觀察值的樣本,其各個(gè)觀察值為x1、x2、x3、…、xn,則算術(shù)平均數(shù)由下式算得:
若樣本較大,且已進(jìn)行了分組,可采用加權(quán)法計(jì)算算術(shù)平均數(shù),即用組中點(diǎn)值代表該組出現(xiàn)的觀測(cè)值以計(jì)算平均數(shù),其公式為其中yi為第i
組中點(diǎn)值,fi為第i組變數(shù)出現(xiàn)次數(shù)。二、算術(shù)平均數(shù)的計(jì)算方法若樣本較小,即資料包含26
[例1]在水稻品種比較試驗(yàn)中,湘矮早四號(hào)的5個(gè)小區(qū)產(chǎn)量分別為20.0、19.0、21.0、17.5、18.5kg,求該品種的小區(qū)平均產(chǎn)量。
[例2]利用表5資料計(jì)算平均每行水稻產(chǎn)量。若采用直接法,=157.47。因此,兩者的結(jié)果十分相近。二、算術(shù)平均數(shù)的計(jì)算方法[例1]在水稻品種比較試驗(yàn)中,湘矮早四27三、總體平均數(shù)總體平均數(shù)用來(lái)代表,它同樣具有算術(shù)平均數(shù)所具有的特性。上式Xi代表各個(gè)觀察值,N代表有限總體所包含的個(gè)體數(shù),表示總體內(nèi)各個(gè)觀察值的總和。三、總體平均數(shù)總體平均數(shù)用來(lái)代表,它同28Section2.5
變異數(shù)
Section2.5
變異數(shù)29一、極差
極差(range),又稱全距,記作R,是資料中最大觀察值與最小觀察值的差數(shù)。表7兩個(gè)小麥品種的每穗小穗數(shù)品種名稱每穗小穗數(shù)總和平均甲1314151718181921222318018乙1616171818181819202018018甲品種R=23-13=10;乙品種R=20-16=4。兩品種的平均同為18,但甲品種的極差大,平均數(shù)的代表性差;乙品種的極差小,平均數(shù)代表性好。一、極差極差(range),又稱全距30二、方差離均差平方和(簡(jiǎn)稱平方和)SS
樣本SS=
總體SS=
均方或方差(variance)樣本均方(meansquare):
總體方差:
樣本均方是總體方差的無(wú)偏估計(jì)值二、方差離均差平方和(簡(jiǎn)稱平方和)SS樣本SS=31三、標(biāo)準(zhǔn)差(一)標(biāo)準(zhǔn)差的定義樣本標(biāo)準(zhǔn)差:總體標(biāo)準(zhǔn)差:樣本標(biāo)準(zhǔn)差是總體標(biāo)準(zhǔn)差的估計(jì)值。
三、標(biāo)準(zhǔn)差(一)標(biāo)準(zhǔn)差的定義總體標(biāo)準(zhǔn)差:樣本標(biāo)準(zhǔn)差是總體32(二)自由度樣本n-1稱為自由度,記作DF,其具體數(shù)值則常用表示。統(tǒng)計(jì)意義:是指樣本內(nèi)獨(dú)立而能自由變動(dòng)的離均差個(gè)數(shù)。三、標(biāo)準(zhǔn)差(二)自由度樣本n-1稱為自由度,記作DF,其具體數(shù)值則33(三)標(biāo)準(zhǔn)差的計(jì)算方法
1.直接法
[例3]設(shè)某一水稻單株粒重的樣本有5個(gè)觀察值,以克為單位,其數(shù)為2、8、7、5、4。計(jì)算項(xiàng)目yy22-3.210.24482.87.846471.83.24495-0.20.04254-1.21.4416總和26022.80158平均5.2三、標(biāo)準(zhǔn)差(三)標(biāo)準(zhǔn)差的計(jì)算方法1.直接法[例342.矯正數(shù)法
其中項(xiàng)稱為矯正數(shù),記作C。在上例中,將有關(guān)數(shù)字代入即有:三、標(biāo)準(zhǔn)差2.矯正數(shù)法其中項(xiàng)353.
加權(quán)法
若樣本較大,已生成次數(shù)分布表,可采用加權(quán)法計(jì)算標(biāo)準(zhǔn)差,其公式為:三、標(biāo)準(zhǔn)差3.加權(quán)法三、標(biāo)準(zhǔn)差36[例4]利用表5的次數(shù)分布資料計(jì)算每行水稻產(chǎn)量的標(biāo)準(zhǔn)差。若采用直接法,其標(biāo)準(zhǔn)差s=36.23(g)。由此可見(jiàn),直接法和加權(quán)法的結(jié)果是很相近的。三、標(biāo)準(zhǔn)差[例4]利用表5的次數(shù)分布資料計(jì)算每行水稻37四、變異系數(shù)
變異系數(shù)(coefficientofvariation):變異系數(shù)是一個(gè)不帶單位的純數(shù),可用以比較二個(gè)事物的變異度大小。四、變異系數(shù)變異系數(shù)(coefficient38例如表8為兩個(gè)小麥品種主莖高度的平均數(shù)、標(biāo)準(zhǔn)差和變異系數(shù)。如只從標(biāo)準(zhǔn)差看,品種甲比乙的變異大些;但因兩者的均數(shù)不同,標(biāo)準(zhǔn)差間不宜直接比較。如果算出變異系數(shù),就可以相互比較,這里乙品種的變異系數(shù)為11.3%,甲品種為9.5%,可見(jiàn)乙品種的相對(duì)變異程度較大。品種(cm)s(cm)變異系數(shù)CV(%)甲95.09.029.5乙75.08.5011.3表8
兩個(gè)小麥品種主莖高度的測(cè)量結(jié)果四、變異系數(shù)例如表8為兩個(gè)小麥品種主莖高度的平均數(shù)、標(biāo)準(zhǔn)差39第2章數(shù)據(jù)的組織與表達(dá)ArrangementandPresentationofData第2章數(shù)據(jù)的組織與表達(dá)ArrangementandPr40Section2.1
DataandDataType
數(shù)據(jù)與數(shù)據(jù)類型
Section2.1
DataandDataTyp41一、原始數(shù)據(jù)的組織資料以電子表格(spreadsheet)方式記錄。包括個(gè)體(Individual):一筆數(shù)據(jù)所描述的對(duì)象(object)。電子表格中輸入在一行。及變量(Variable):描述任何一個(gè)個(gè)體的特征,一個(gè)變量對(duì)不同的個(gè)體取不同的數(shù)值(value)。電子表格中輸入在一列。一、原始數(shù)據(jù)的組織資料以電子表格(spreadsheet)方42(一)數(shù)量性狀資料數(shù)量性狀(quantitativetrait)的度量有計(jì)數(shù)和量測(cè)兩種方式,其所得變數(shù)不同。1.不連續(xù)性或間斷性變數(shù)(discontinuousordiscretevariable)指用計(jì)數(shù)方法獲得的數(shù)據(jù)。2.連續(xù)性變數(shù)(continuousvariable)指稱量、度量或測(cè)量方法所得到的數(shù)據(jù),其各個(gè)觀察值并不限于整數(shù),在兩個(gè)數(shù)值之間可以有微量數(shù)值差異的第三個(gè)數(shù)值存在。二、試驗(yàn)資料的性質(zhì)與分類(一)數(shù)量性狀資料二、試驗(yàn)資料的性質(zhì)與分類43(二)質(zhì)量性狀資料
質(zhì)量性狀(qualitativetrait)指能觀察而不能量測(cè)的狀即屬性性狀,如花藥、子粒、穎殼等器官的顏色、芒的有無(wú)、絨毛的有無(wú)等。要從這類性狀獲得數(shù)量資料,可采用下列兩種方法:統(tǒng)計(jì)次數(shù)法于一定總體或樣本內(nèi),統(tǒng)計(jì)其具有某個(gè)性狀的個(gè)體數(shù)目及具有不同性狀的個(gè)體數(shù)目,按類別計(jì)其次數(shù)或相對(duì)次數(shù)。
2.
給分法給予每類性狀以相對(duì)數(shù)量的方法二、試驗(yàn)資料的性質(zhì)與分類(二)質(zhì)量性狀資料二、試驗(yàn)資料的性質(zhì)與分類44Section2.2
次數(shù)分布表
Section2.2
次數(shù)分布表45表1100個(gè)麥穗的每穗小穗數(shù)18151719161520181917171817161820191716181716171918181717171818151618181817201918171915171717161718181719191719171816181717191616171717151716181918181919201716191817182019161819171615161817181717161917一、間斷性變數(shù)資料的整理表1100個(gè)麥穗的每穗小穗數(shù)1815171916152046每穗小穗數(shù)(
y
)次數(shù)(f)1561615173218251917205總次數(shù)(
n
)100表2100個(gè)麥穗每穗小穗數(shù)的次數(shù)分布表從表2中看到,一堆雜亂的原始資料表,經(jīng)初步整理后,就可了解資料的大致情況,另外,經(jīng)過(guò)整理的資料也便于進(jìn)一步的分析。每穗小穗數(shù)在15—20的范圍內(nèi)變動(dòng),把所有觀察值按每穗小穗數(shù)多少加以歸類,共分為6組,組與組間相差為1小穗,稱為組距。這樣可得表2形式的次數(shù)分布表。一、間斷性變數(shù)資料的整理每穗小穗數(shù)(y)次數(shù)(f)156161517321847二、連續(xù)性變數(shù)資料的整理17721519797123159245119119131149152167104161214125175219118192176175951361991161652149515883137801381511871261961342061379897129143179174159165136108101141148168163176102194145173751301491501611551111581311899114214015415216312320514915513120918397119181149187131215111186118150155197116254239160172179151198124179135184168169173181188211197175122151171166175143190213192231163159158159177147194227141169124159表3140行水稻產(chǎn)量(單位:克)二、連續(xù)性變數(shù)資料的整理17721519797123148具體步驟:1.數(shù)據(jù)排序(sort)首先對(duì)數(shù)據(jù)按從小到大排列(升序)或從大到小排列(降序)。2.求極差(range)所有數(shù)據(jù)中的最大觀察值和最小觀察值的差數(shù),稱為極差,亦即整個(gè)樣本的變異幅度。從表3中查到最大觀察值為254g,最小觀察值為75g,極差為254-75=179g。二、連續(xù)性變數(shù)資料的整理具體步驟:二、連續(xù)性變數(shù)資料的整理493.確定組數(shù)和組距(classinterval)根據(jù)極差分為若干組,每組的距離相等,稱為組距。
在確定組數(shù)和組距時(shí)應(yīng)考慮:(1)觀察值個(gè)數(shù)的多少;(2)極差的大??;(3)便于計(jì)算;(4)能反映出資料的真實(shí)面貌等方面。樣本大小(即樣本內(nèi)包含觀察值的個(gè)數(shù)的多少)與組數(shù)多少的關(guān)系可參照表4來(lái)確定。二、連續(xù)性變數(shù)資料的整理3.確定組數(shù)和組距(classinte50表4樣本容量與組數(shù)多少的關(guān)系樣本內(nèi)觀察值的個(gè)數(shù)分組時(shí)的組數(shù)505—101008—1620010—2030012—2450015—30100020—40組數(shù)確定后,還須確定組距。組距=極差/組數(shù)。以表3中140行水稻產(chǎn)量為例,樣本內(nèi)觀察值的個(gè)數(shù)為140,查表4可分為8—16組,假定分為12組,則組距為179/12=14.9g,為分組方便起見(jiàn),可以15g作為組距。二、連續(xù)性變數(shù)資料的整理表4樣本容量與組數(shù)多少的關(guān)系樣本內(nèi)觀察值的個(gè)數(shù)分組時(shí)的組數(shù)514.選定組限(classlimit)和組中點(diǎn)值(組值,classvalue)以表3中140行水稻產(chǎn)量為例,選定第一組的中點(diǎn)值為75g,與最小觀察值75g相等;則第二組的中點(diǎn)值為75+15=90g,余類推。各組的中點(diǎn)值選定后,就可以求得各組組限。每組有兩個(gè)組限,數(shù)值小的稱為下限(lowerlimit),數(shù)值大的稱為上限(upperlimit)。上述資料中,第一組的下限為該組中點(diǎn)值減去1/2組距,即75-(15/2)=67.5g,上限為中點(diǎn)值加1/2組距,即75+(15/2)=82.5g。故第一組的組限為67.5—82.5g。按照此法計(jì)算其余各組的組限。二、連續(xù)性變數(shù)資料的整理4.選定組限(classlimit)和525.把原始資料的各個(gè)觀察值按分組數(shù)列的各組組限歸組
可按原始資料中各觀察值的次序,逐個(gè)把數(shù)值歸于各組。待全部觀察值歸組后,即可求得各組的次數(shù),制成一個(gè)次數(shù)分布表。例如表3中第一個(gè)觀察值177應(yīng)歸于表5中第8組,組限為172.5—187.5;第二個(gè)觀察值149應(yīng)歸于第6組,組限為142.5—157.5;……。依次把140個(gè)觀察值都進(jìn)行歸組,即可制成140行水稻產(chǎn)量的次數(shù)分布表(表5)。二、連續(xù)性變數(shù)資料的整理二、連續(xù)性變數(shù)資料的整理53表5140行水稻的次數(shù)分布組限中點(diǎn)值(
y
)次數(shù)(f)67.5—82.575282.5—97.590797.5—112.51057112.5—127.512013127.5—142.513517142.5—157.515020157.5—172.516525172.5—187.518021187.5—202.519513202.5—217.52109217.5—232.52253232.5—247.52402247.5—262.52551合計(jì)(
n
)140
注:前面提到分為12組,但由于第一組的中點(diǎn)值接近于最小觀察值,故第一組的下限小于最小觀察值,實(shí)際上差不多增加了1/2組;這樣也使最后一組的中點(diǎn)值接近于最大值,又增加了1/2組,故實(shí)際的組數(shù)比原來(lái)確定的要多一個(gè)組,為13組。二、連續(xù)性變數(shù)資料的整理表5140行水稻的次數(shù)分布組限中點(diǎn)值(y)次54三、屬性變數(shù)資料的整理屬性變數(shù)的資料,也可以用類似次數(shù)分布的方法來(lái)整理。在整理前,把資料按各種質(zhì)量性狀進(jìn)行分類,分類數(shù)等于組數(shù),然后根據(jù)各個(gè)體在質(zhì)量屬性上的具體表現(xiàn),分別歸入相應(yīng)的組中,即可得到屬性分布的規(guī)律性認(rèn)識(shí)。例如,某水稻雜種第二代植株米粒性狀的分離情況,歸于表6。表6水稻雜種二代植株米粒性狀的分離情況屬性分組(
y
)次數(shù)(
f)紅米非糯96紅米糯稻37白米非糯31白米糯稻15合計(jì)(
n
)179三、屬性變數(shù)資料的整理屬性變數(shù)的資料,也可55Section2.3
次數(shù)分布圖
Section2.3
次數(shù)分布圖56
一、方柱形圖方柱形圖(histogram)適用于表示連續(xù)性變數(shù)的次數(shù)分布。
現(xiàn)以表3的140行水稻產(chǎn)量的次數(shù)分布表為例加以說(shuō)明。即成方柱形次數(shù)分布圖1。圖1140行水稻產(chǎn)量次數(shù)分布方柱形圖一、方柱形圖方柱形圖(histogram)適用于表示57二、多邊形圖
多邊形圖(polygon)也是表示連續(xù)性變數(shù)資料的一種普通的方法,且在同一圖上可比較兩組以上的資料。仍以140行水稻產(chǎn)量次數(shù)分布為例,所成圖形即為次數(shù)多邊形圖(圖2)。圖2140行水稻產(chǎn)量次數(shù)分布多邊形圖二、多邊形圖多邊形圖(polygon)也58三、條形圖
條形圖(bar)適用于間斷性變數(shù)和屬性變數(shù)資料,用以表示這些變數(shù)的次數(shù)分布狀況。一般其橫軸標(biāo)出間斷的中點(diǎn)值或分類性狀,縱軸標(biāo)出次數(shù)?,F(xiàn)以表6水稻雜種第二代米粒性狀的分離情況為例,可畫成水稻雜種第二代植株4種米粒性狀分離情況條形圖(圖3)。圖3水稻F2代米粒性狀分離條形圖三、條形圖條形圖(bar)適用于間斷性變59
四、餅圖
餅圖(pie)適用于間斷性變數(shù)和屬性變數(shù)資料,用以表示這些變數(shù)中各種屬性或各種間斷性數(shù)據(jù)觀察值在總觀察個(gè)數(shù)中的百分比。如圖4中白米糯稻在F2群體中占8%,白米非糯、紅米糯稻和紅米非糯分別占17%、21%和54%。圖4水稻F2代米粒性狀分離的餅圖四、餅圖餅圖(pie)適用于間斷性變60Section2.4
平均數(shù)
Section2.4
平均數(shù)61一、平均數(shù)的意義和種類平均數(shù)的意義:
平均數(shù)(average)是數(shù)據(jù)的代表值,表示資料中觀察值的中心位置,并且可作為資料的代表而與另一組資料相比較,借以明確二者之間相差的情況。一、平均數(shù)的意義和種類平均數(shù)的意義:62平均數(shù)的種類:(1)算術(shù)平均數(shù)一個(gè)數(shù)量資料中各個(gè)觀察值的總和除以觀察值個(gè)數(shù)所得的商數(shù),稱為算術(shù)平均數(shù)(arithmeticmean),記作。因其應(yīng)用廣泛,常簡(jiǎn)稱平均數(shù)或均數(shù)(mean)。均數(shù)的大小決定于樣本的各觀察值。(2)中數(shù)將資料內(nèi)所有觀察值從大到小排序,居中間位置的觀察值稱為中數(shù)(median),計(jì)作Md。如觀察值個(gè)數(shù)為偶數(shù),則以中間二個(gè)觀察值的算術(shù)平均數(shù)為中數(shù)。一、平均數(shù)的意義和種類平均數(shù)的種類:一、平均數(shù)的意義和種類63(3)
眾數(shù)資料中最常見(jiàn)的一數(shù),或次數(shù)最多一組的中點(diǎn)值,稱為眾數(shù)(mode),計(jì)作MO。如棉花纖維檢驗(yàn)時(shí)所用的主體長(zhǎng)度即為眾數(shù)。(4)幾何平均數(shù)如有n個(gè)觀察值,其相乘積開(kāi)n次方,即為幾何平均數(shù)(geometricmean),用G代表。一、平均數(shù)的意義和種類(3)眾數(shù)資料中最常見(jiàn)的一數(shù),或次數(shù)最多64二、算術(shù)平均數(shù)的計(jì)算方法
若樣本較小,即資料包含的觀察值個(gè)數(shù)不多,可直接計(jì)算平均數(shù)。設(shè)一個(gè)含有n個(gè)觀察值的樣本,其各個(gè)觀察值為x1、x2、x3、…、xn,則算術(shù)平均數(shù)由下式算得:
若樣本較大,且已進(jìn)行了分組,可采用加權(quán)法計(jì)算算術(shù)平均數(shù),即用組中點(diǎn)值代表該組出現(xiàn)的觀測(cè)值以計(jì)算平均數(shù),其公式為其中yi為第i
組中點(diǎn)值,fi為第i組變數(shù)出現(xiàn)次數(shù)。二、算術(shù)平均數(shù)的計(jì)算方法若樣本較小,即資料包含65
[例1]在水稻品種比較試驗(yàn)中,湘矮早四號(hào)的5個(gè)小區(qū)產(chǎn)量分別為20.0、19.0、21.0、17.5、18.5kg,求該品種的小區(qū)平均產(chǎn)量。
[例2]利用表5資料計(jì)算平均每行水稻產(chǎn)量。若采用直接法,=157.47。因此,兩者的結(jié)果十分相近。二、算術(shù)平均數(shù)的計(jì)算方法[例1]在水稻品種比較試驗(yàn)中,湘矮早四66三、總體平均數(shù)總體平均數(shù)用來(lái)代表,它同樣具有算術(shù)平均數(shù)所具有的特性。上式Xi代表各個(gè)觀察值,N代表有限總體所包含的個(gè)體數(shù),表示總體內(nèi)各個(gè)觀察值的總和。三、總體平均數(shù)總體平均數(shù)用來(lái)代表,它同67Section2.5
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025知識(shí)產(chǎn)權(quán)合同版權(quán)及注冊(cè)申明協(xié)議書范本
- 店長(zhǎng)個(gè)人工作計(jì)劃7篇
- 2021教師節(jié)座談會(huì)青教師發(fā)言稿范文
- 2024年甲方家庭與乙方月嫂寵物護(hù)理合同
- 2024年精練商鋪?zhàn)赓U合同范本
- 土木工程專業(yè)實(shí)習(xí)報(bào)告錦集8篇
- 2024年環(huán)保設(shè)備更新采購(gòu)協(xié)議范本版
- 教師節(jié)日演講稿范文
- 2024年版權(quán)質(zhì)押合同法律風(fēng)險(xiǎn)評(píng)估
- 2021小學(xué)教師讀書心得范文
- 廣東省深圳市寶安區(qū)2023-2024學(xué)年高三上學(xué)期期末考試數(shù)學(xué)試卷
- 《嬰幼兒活動(dòng)設(shè)計(jì)與指導(dǎo)》 課件-13-18月兒童親子活動(dòng)指導(dǎo)
- 2024年安全員A證考試題庫(kù)及答案(1000題)
- 國(guó)開(kāi) 2024 年秋《機(jī)電控制工程基礎(chǔ)》形考任務(wù)1234答案+【2020形考1234答案】全析
- 廣東省湛江市雷州市2023-2024學(xué)年四年級(jí)上學(xué)期語(yǔ)文期末試卷
- 面部設(shè)計(jì)美學(xué)培訓(xùn)
- 制冷原理與設(shè)備(上)知到智慧樹(shù)章節(jié)測(cè)試課后答案2024年秋煙臺(tái)大學(xué)
- 加工裝配業(yè)務(wù)合作框架協(xié)議
- 2020年同等學(xué)力申碩《計(jì)算機(jī)科學(xué)與技術(shù)學(xué)科綜合水平考試》歷年真題及答案
- 公共體育(三)學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 帶式輸送機(jī)機(jī)械設(shè)計(jì)課程設(shè)計(jì)(帶式輸送機(jī))
評(píng)論
0/150
提交評(píng)論