數(shù)據(jù)的組織與表達(dá)課件_第1頁
數(shù)據(jù)的組織與表達(dá)課件_第2頁
數(shù)據(jù)的組織與表達(dá)課件_第3頁
數(shù)據(jù)的組織與表達(dá)課件_第4頁
數(shù)據(jù)的組織與表達(dá)課件_第5頁
已閱讀5頁,還剩34頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第2章數(shù)據(jù)的組織與表達(dá)ArrangementandPresentationofDataSection2.1

DataandDataType

數(shù)據(jù)與數(shù)據(jù)類型

一、原始數(shù)據(jù)的組織資料以電子表格(spreadsheet)方式記錄。包括個體(Individual):一筆數(shù)據(jù)所描述的對象(object)。電子表格中輸入在一行。及變量(Variable):描述任何一個個體的特征,一個變量對不同的個體取不同的數(shù)值(value)。電子表格中輸入在一列。(二)質(zhì)量性狀資料

質(zhì)量性狀(qualitativetrait)指能觀察而不能量測的狀即屬性性狀,如花藥、子粒、穎殼等器官的顏色、芒的有無、絨毛的有無等。要從這類性狀獲得數(shù)量資料,可采用下列兩種方法:統(tǒng)計次數(shù)法于一定總體或樣本內(nèi),統(tǒng)計其具有某個性狀的個體數(shù)目及具有不同性狀的個體數(shù)目,按類別計其次數(shù)或相對次數(shù)。

2.

給分法給予每類性狀以相對數(shù)量的方法二、試驗資料的性質(zhì)與分類Section2.2

次數(shù)分布表

表1100個麥穗的每穗小穗數(shù)18151719161520181917171817161820191716181716171918181717171818151618181817201918171915171717161718181719191719171816181717191616171717151716181918181919201716191817182019161819171615161817181717161917一、間斷性變數(shù)資料的整理每穗小穗數(shù)(

y

)次數(shù)(f)1561615173218251917205總次數(shù)(

n

)100表2100個麥穗每穗小穗數(shù)的次數(shù)分布表從表2中看到,一堆雜亂的原始資料表,經(jīng)初步整理后,就可了解資料的大致情況,另外,經(jīng)過整理的資料也便于進(jìn)一步的分析。每穗小穗數(shù)在15—20的范圍內(nèi)變動,把所有觀察值按每穗小穗數(shù)多少加以歸類,共分為6組,組與組間相差為1小穗,稱為組距。這樣可得表2形式的次數(shù)分布表。一、間斷性變數(shù)資料的整理具體步驟:1.數(shù)據(jù)排序(sort)首先對數(shù)據(jù)按從小到大排列(升序)或從大到小排列(降序)。2.求極差(range)所有數(shù)據(jù)中的最大觀察值和最小觀察值的差數(shù),稱為極差,亦即整個樣本的變異幅度。從表3中查到最大觀察值為254g,最小觀察值為75g,極差為254-75=179g。二、連續(xù)性變數(shù)資料的整理3.確定組數(shù)和組距(classinterval)根據(jù)極差分為若干組,每組的距離相等,稱為組距。

在確定組數(shù)和組距時應(yīng)考慮:(1)觀察值個數(shù)的多少;(2)極差的大??;(3)便于計算;(4)能反映出資料的真實面貌等方面。樣本大小(即樣本內(nèi)包含觀察值的個數(shù)的多少)與組數(shù)多少的關(guān)系可參照表4來確定。二、連續(xù)性變數(shù)資料的整理4.選定組限(classlimit)和組中點值(組值,classvalue)

以表3中140行水稻產(chǎn)量為例,選定第一組的中點值為75g,與最小觀察值75g相等;則第二組的中點值為75+15=90g,余類推。各組的中點值選定后,就可以求得各組組限。每組有兩個組限,數(shù)值小的稱為下限(lowerlimit),數(shù)值大的稱為上限(upperlimit)。上述資料中,第一組的下限為該組中點值減去1/2組距,即75-(15/2)=67.5g,上限為中點值加1/2組距,即75+(15/2)=82.5g。故第一組的組限為67.5—82.5g。按照此法計算其余各組的組限。二、連續(xù)性變數(shù)資料的整理5.把原始資料的各個觀察值按分組數(shù)列的各組組限歸組

可按原始資料中各觀察值的次序,逐個把數(shù)值歸于各組。待全部觀察值歸組后,即可求得各組的次數(shù),制成一個次數(shù)分布表。例如表3中第一個觀察值177應(yīng)歸于表5中第8組,組限為172.5—187.5;第二個觀察值149應(yīng)歸于第6組,組限為142.5—157.5;……。依次把140個觀察值都進(jìn)行歸組,即可制成140行水稻產(chǎn)量的次數(shù)分布表(表5)。二、連續(xù)性變數(shù)資料的整理表5140行水稻的次數(shù)分布組限中點值(

y

)次數(shù)(f)67.5—82.575282.5—97.590797.5—112.51057112.5—127.512013127.5—142.513517142.5—157.515020157.5—172.516525172.5—187.518021187.5—202.519513202.5—217.52109217.5—232.52253232.5—247.52402247.5—262.52551合計(

n

)140

注:前面提到分為12組,但由于第一組的中點值接近于最小觀察值,故第一組的下限小于最小觀察值,實際上差不多增加了1/2組;這樣也使最后一組的中點值接近于最大值,又增加了1/2組,故實際的組數(shù)比原來確定的要多一個組,為13組。二、連續(xù)性變數(shù)資料的整理Section2.3

次數(shù)分布圖

一、方柱形圖方柱形圖(histogram)適用于表示連續(xù)性變數(shù)的次數(shù)分布。

現(xiàn)以表3的140行水稻產(chǎn)量的次數(shù)分布表為例加以說明。即成方柱形次數(shù)分布圖1。圖1140行水稻產(chǎn)量次數(shù)分布方柱形圖二、多邊形圖

多邊形圖(polygon)也是表示連續(xù)性變數(shù)資料的一種普通的方法,且在同一圖上可比較兩組以上的資料。仍以140行水稻產(chǎn)量次數(shù)分布為例,所成圖形即為次數(shù)多邊形圖(圖2)。圖2140行水稻產(chǎn)量次數(shù)分布多邊形圖

四、餅圖

餅圖(pie)適用于間斷性變數(shù)和屬性變數(shù)資料,用以表示這些變數(shù)中各種屬性或各種間斷性數(shù)據(jù)觀察值在總觀察個數(shù)中的百分比。如圖4中白米糯稻在F2群體中占8%,白米非糯、紅米糯稻和紅米非糯分別占17%、21%和54%。圖4水稻F2代米粒性狀分離的餅圖Section2.4

平均數(shù)

一、平均數(shù)的意義和種類平均數(shù)的意義:

平均數(shù)(average)是數(shù)據(jù)的代表值,表示資料中觀察值的中心位置,并且可作為資料的代表而與另一組資料相比較,借以明確二者之間相差的情況。(3)

眾數(shù)資料中最常見的一數(shù),或次數(shù)最多一組的中點值,稱為眾數(shù)(mode),計作MO。如棉花纖維檢驗時所用的主體長度即為眾數(shù)。(4)幾何平均數(shù)如有n個觀察值,其相乘積開n次方,即為幾何平均數(shù)(geometricmean),用G代表。一、平均數(shù)的意義和種類二、算術(shù)平均數(shù)的計算方法

若樣本較小,即資料包含的觀察值個數(shù)不多,可直接計算平均數(shù)。設(shè)一個含有n個觀察值的樣本,其各個觀察值為x1、x2、x3、…、xn,則算術(shù)平均數(shù)由下式算得:

若樣本較大,且已進(jìn)行了分組,可采用加權(quán)法計算算術(shù)平均數(shù),即用組中點值代表該組出現(xiàn)的觀測值以計算平均數(shù),其公式為其中yi為第i

組中點值,fi為第i組變數(shù)出現(xiàn)次數(shù)。Section2.5

變異數(shù)

一、極差

極差(range),又稱全距,記作R,是資料中最大觀察值與最小觀察值的差數(shù)。表7兩個小麥品種的每穗小穗數(shù)品種名稱每穗小穗數(shù)總和平均甲1314151718181921222318018乙1616171818181819202018018甲品種R=23-13=10;乙品種R=20-16=4。兩品種的平均同為18,但甲品種的極差大,平均數(shù)的代表性差;乙品種的極差小,平均數(shù)代表性好。二、方差離均差平方和(簡稱平方和)SS

樣本SS=

總體SS=

均方或方差(variance)樣本均方(meansquare):

總體方差:

樣本均方是總體方差的無偏估計值三、標(biāo)準(zhǔn)差(一)標(biāo)準(zhǔn)差的定義樣本標(biāo)準(zhǔn)差:總體標(biāo)準(zhǔn)差:樣本標(biāo)準(zhǔn)差是總體標(biāo)準(zhǔn)差的估計值。

(二)自由度樣本n-1稱為自由度,記作DF,其具體數(shù)值則常用表示。統(tǒng)計意義:是指樣本內(nèi)獨立而能自由變動的離均差個數(shù)。三、標(biāo)準(zhǔn)差(三)標(biāo)準(zhǔn)差的計算方法

1.直接法

[例3]設(shè)某一水稻單株粒重的樣本有5個觀察值,以克為單位,其數(shù)為2、8、7、5、4。計算項目yy22-3.210.24482.87.846471.83.24495-0.20.04254-1.21.4416總和26022.80158平均5.2三、標(biāo)準(zhǔn)差2.矯正數(shù)法

其中項稱為矯正數(shù),記作C。在上例中,將有關(guān)數(shù)字代入即有:三、標(biāo)準(zhǔn)差3.

加權(quán)法

若樣本較大,已生成次數(shù)分布表,可采用加權(quán)法計算標(biāo)準(zhǔn)差,其公式為:三、標(biāo)準(zhǔn)差[例4]利用表5的次數(shù)分布資料計算每行水稻產(chǎn)量的標(biāo)準(zhǔn)差。若采用直接法,其標(biāo)準(zhǔn)差s=36.23(g)。由此可見,直接法和加權(quán)法的結(jié)果是很相近的。三、標(biāo)準(zhǔn)差四、變異系數(shù)

變異系數(shù)(coefficientofvariation):變異系數(shù)是一個不帶單位的純數(shù),可用以比較二個事物的變

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論