《生物統(tǒng)計學(xué)》02 試驗資料的整理與特征值的計算_第1頁
《生物統(tǒng)計學(xué)》02 試驗資料的整理與特征值的計算_第2頁
《生物統(tǒng)計學(xué)》02 試驗資料的整理與特征值的計算_第3頁
《生物統(tǒng)計學(xué)》02 試驗資料的整理與特征值的計算_第4頁
《生物統(tǒng)計學(xué)》02 試驗資料的整理與特征值的計算_第5頁
已閱讀5頁,還剩75頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1第二章試驗資料的整理與特征數(shù)的計算第三節(jié)

試驗資料特征數(shù)的計算第二節(jié)

試驗資料的搜集與整理第一節(jié)

統(tǒng)計工作的基本步驟2一、研究設(shè)計二、搜集數(shù)據(jù)三、整理數(shù)據(jù)四、分析數(shù)據(jù)五、結(jié)果呈報與解釋第一節(jié)

統(tǒng)計工作的基本步驟3制定計劃,對整個過程進行安排。是整個工作的關(guān)鍵。如何進行設(shè)計?舉例:背景-目的-方法-內(nèi)容-經(jīng)費預(yù)算。⒈調(diào)查設(shè)計對研究對象不施加任何干預(yù),通常建立隨機抽樣方案。⒉實驗設(shè)計對研究對象施加干預(yù),如動物實驗研究、臨床試驗,通常建立隨機分組方案。一、研究設(shè)計4實驗設(shè)計的三個基本原則隨機化對照重復(fù)

Fisher在他的著作中多次強調(diào),統(tǒng)計學(xué)家與科學(xué)研究者的合作應(yīng)該在實驗設(shè)計階段,而不是在需要數(shù)據(jù)處理的時候?!霸囼炌瓿珊笤僬医y(tǒng)計學(xué)家,無異于請統(tǒng)計學(xué)家為試驗進行“尸體解剖”。統(tǒng)計學(xué)家或許只能告訴你試驗失敗的原因?!?根據(jù)計劃取得可靠、完整的資料。收集資料的方法有三種:統(tǒng)計報表日常性工作專題調(diào)查要遵循準(zhǔn)確、完整、及時三個原則。資料搜集計劃包括:①選擇搜集資料的地點、人員和時間;②搜集資料人員的培訓(xùn)方案;③預(yù)調(diào)查或預(yù)實驗方案擬定;④資料的記錄方式;⑤調(diào)查表的擬訂和印刷;⑥調(diào)查或?qū)嶒瀮x器、試劑的準(zhǔn)備;⑦調(diào)查資料的抽樣復(fù)核比例和方法;⑧搜集資料所需經(jīng)費的準(zhǔn)備等。二、搜集數(shù)據(jù)6原始資料的整理、核對,使其條理化、系統(tǒng)化便于計算和分析??山柚谟嬎銠C(常用軟件:SPSS、SAS、Excel)。編碼,將數(shù)據(jù)輸入計算機;糾錯改錯、補漏等。三、整理數(shù)據(jù)7OfficeExcel的界面8SPSS軟件的數(shù)據(jù)界面9SAS軟件的數(shù)據(jù)界面10統(tǒng)計學(xué)的關(guān)鍵所在。運用統(tǒng)計學(xué)的基本原理和方法,分析計算有關(guān)的指標(biāo)和數(shù)據(jù),揭示事物內(nèi)部的規(guī)律。四、分析數(shù)據(jù)11描述統(tǒng)計內(nèi)容搜集數(shù)據(jù)整理數(shù)據(jù)展示數(shù)據(jù)目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律12推斷統(tǒng)計內(nèi)容參數(shù)估計假設(shè)檢驗?zāi)康膶傮w特征作出推斷13一、資料的分類二、資料的整理三、常用統(tǒng)計表與統(tǒng)計圖第二節(jié)

試驗資料的搜集與整理14資料的分類是資料整理的前提。在調(diào)查或試驗中,由觀察、測量所得的數(shù)據(jù)按其性質(zhì)的不同,一般可以分為:數(shù)量性狀資料質(zhì)量性狀資料半定量(等級)資料一、資料的分類15數(shù)量性狀(quantitativecharacter):

是指能夠以量測、稱量或計數(shù)的方式表示其特征的性狀。數(shù)量性狀資料(dataofquantitativecharacteristics):觀察測定數(shù)量性狀而獲得的數(shù)據(jù)就是。1、數(shù)量性狀資料16計量資料(measurementdata):

指用量測方式獲得的數(shù)量性狀資料,即用度、量、衡等計量工具直接測定獲得的數(shù)量性狀資料。特征:數(shù)據(jù)用長度、容積、重量等來表示各觀測值不一定是整數(shù)兩相鄰的整數(shù)間可以有帶小數(shù)的任何數(shù)值出現(xiàn)變異是連續(xù)性的計數(shù)資料(countdata):指用計數(shù)方式獲得的數(shù)量性狀資料。

特征:各觀察值只能是整數(shù)兩相鄰整數(shù)間不得有任何帶小數(shù)的數(shù)值出現(xiàn)變異不連續(xù)

計量資料Vs計數(shù)資料17計量資料計數(shù)資料18例1:例2:

在研究豬的肉色遺傳時,常用的方法是將屠宰后2小時的豬眼肌橫切面與標(biāo)準(zhǔn)圖譜對比,由淺到深分別給予15分的評分。質(zhì)量性狀(qualitativecharacter):是指能觀察到而不能直接測量的性狀。這類性狀本身不能直接用數(shù)值表示,要獲得這類性狀的數(shù)據(jù)資料,須對其觀察結(jié)果作數(shù)量化處理,方法有二:統(tǒng)計次數(shù)法評分法2、質(zhì)量性狀資料19半定量或等級資料(semi-quantitativeorrankeddata):是指按照觀察單位按所考察的性狀或指標(biāo)等級進行分組,然后清點各組觀察單位的次數(shù)而得的資料。這類資料既有次數(shù)資料的特點,又有程度或量的不同。此類數(shù)據(jù)在醫(yī)學(xué)上最常見,如:癌癥分期早、中、晚藥物療效治愈好轉(zhuǎn)無效死亡3、半定量(等級)資料204、三類資料間關(guān)系

例:一組2040歲成年人的血壓計量資料

<8低血壓

8

正常血壓

12

輕度高血壓

15

中度高血壓

17

重度高血壓等級資料以12kPa為界分為正常與異常兩組質(zhì)量資料21㈠、資料的檢查與核對檢查和核對原始資料的目的在于確保原始資料的完整性和正確性。完整性指原始資料無遺缺或重復(fù)。正確性指原始資料的測量和記載無差錯或未進行不合理的歸并。檢查中要特別注意特大、特小和異常數(shù)據(jù)(可結(jié)合專業(yè)知識作出判斷)。二、資料的整理22㈡、資料的整理方法當(dāng)觀測值不多(n≤30)時,不必分組,直接進行統(tǒng)計分析。當(dāng)觀測值較多(n>30)時,宜將觀測值分成若干組,以便統(tǒng)計分析。231、計數(shù)資料的整理若觀察值較多,變異范圍較大的資料,可擴大為以幾個相鄰觀察值為一組,適當(dāng)減少組數(shù)。24基本步驟和方法:求全距全距是資料中最大值與最小值之差,又稱為極差(range),用R表示,即

R=Max(x)-Min(x)確定組數(shù)組數(shù)要適當(dāng),一般以達到既簡化資料又不影響反映資料的規(guī)律性為原則。2、計量資料的整理──組距式分組法25確定組距每組最大值與最小值之差稱為組距,記為i。分組時要求各組的組距相等。

組距(i)=全距/組數(shù)確定組限組限(組下限,組上限)組中值:每組的中點值,是該組觀察值的代表值。

組中值=(組下限+組上限)/2=組下限+1/2組距=組上限-1/2組距在分組時為了避免第一組中觀察值過多,一般第一組的組中值以接近或等于資料中的最小值為好。注意,最末一組的上限應(yīng)大于資料中的最大值。歸組劃線計數(shù),作次數(shù)分布表26R=65.0-37.0=28.0(kg)n=126,初定為10。i=28.0/10≈3.027為了使恰好等于前一組上限和后一組下限的數(shù)據(jù)能確切歸組,約定將其歸入后一組。通常將上限略去不寫。練習(xí)

組距式分組做次數(shù)分布表28R=24-19=5n=50,組距初定為1。i=5/1+1=6293、質(zhì)量性狀資料、半定量(等級)資料的整理

對于質(zhì)量性狀資料、半定量(等級)資料,可按性狀或等級進行分組,分別統(tǒng)計各組的次數(shù),然后制成次數(shù)分布表。30統(tǒng)計表(statisticaltable)——數(shù)據(jù)代替文字描述,便于統(tǒng)計結(jié)果的精確、簡潔的表達和對比分析。統(tǒng)計圖(statisticalchart)——用圖形代替數(shù)據(jù),獲得直觀、形象的效果。三、常用統(tǒng)計表與統(tǒng)計圖31㈠、統(tǒng)計表⒈

統(tǒng)計表的結(jié)構(gòu)統(tǒng)計表由標(biāo)題、橫標(biāo)目、縱標(biāo)目、線條和數(shù)字構(gòu)成,其基本格式如下表:32①標(biāo)題標(biāo)題簡明扼要、準(zhǔn)確地說明表的內(nèi)容②標(biāo)目標(biāo)目分橫標(biāo)目和縱標(biāo)目兩項橫標(biāo)目列在表的左側(cè),用以表示被說明事物的主要標(biāo)志縱標(biāo)目列在表的上端,說明橫標(biāo)目各統(tǒng)計指標(biāo)內(nèi)容,并注明計算單位,如%、kg、cm等等③數(shù)字一律用阿拉伯?dāng)?shù)字,數(shù)字以小數(shù)點對齊,小數(shù)位數(shù)一致無數(shù)字的用“─”表示數(shù)字是“0”的,則填寫“0”④線條

表的上下兩條邊線略粗縱、橫標(biāo)目間及合計用細(xì)線分開表的左右邊線可省去,表的左上角一般不用斜線。33⒉統(tǒng)計表的種類根據(jù)分組標(biāo)目的復(fù)雜程度,統(tǒng)計表可大致分為簡單表和復(fù)合表。簡單表(simpletable):只按一個特征或標(biāo)志分組。如表2-11。復(fù)合表(combinativetable):按兩個或兩個以上特征或標(biāo)志結(jié)合起來分組。如表2-12。34⒊

不良統(tǒng)計表的修改舉例35㈡、統(tǒng)計圖⒈統(tǒng)計圖的結(jié)構(gòu)統(tǒng)計圖由以下幾個部分組成:①標(biāo)題②標(biāo)目③點線條面④刻度⑤圖例36Excel繪制的圖形37統(tǒng)計圖繪制的基本要求:標(biāo)題簡明扼要,列于圖的下方??v、橫兩軸應(yīng)有刻度,注明單位。橫軸由左至右、縱軸由下而上,數(shù)值由小到大;圖形長寬比例約5:4或6:5。圖中需用不同顏色或線條代表不同事物時,應(yīng)有圖例說明。以下圖形均由計算機繪制!ExcelSTATISTICA38⒉常用統(tǒng)計圖及其繪制方法

常用的統(tǒng)計圖有長條圖、圓圖、線圖、直方圖和折線圖等。計量資料采用直方圖、線圖和折線圖。計數(shù)資料、質(zhì)量性狀資料、半定量(等級)資料常用長條圖或圓圖等。39⑴、長條圖(barchart)用等寬長條的高低表示某一研究指標(biāo)的數(shù)量或頻率分布??煞譃椋簡问?simple)條圖具有一個統(tǒng)計指標(biāo)、一個分組標(biāo)志。如圖2-2。復(fù)式(clustered)條圖每組涉及兩個或兩個以上的統(tǒng)計指標(biāo)。如圖2-3。40分段(stacked)條圖具有兩個統(tǒng)計指標(biāo),一個分組,分段顯示。如圖2-4。誤差條圖(error-bar)用條圖或線圖表示均數(shù)的基礎(chǔ)上,附上標(biāo)準(zhǔn)差的范圍。如圖2-5。41縱軸的刻度必須從“0”開始,否則會改變各對比組間的比例關(guān)系。橫軸各直條一般按統(tǒng)計指標(biāo)由大到小排列,也可按事物本身的自然順序排列。各直條的寬度要一致,各直條應(yīng)有相等的間隔,其寬度一般與直條的寬度相等或為直條寬度的一半。繪制條圖注意事項:42

用于表達事物內(nèi)部的百分構(gòu)成比大小。用于表示計數(shù)資料、質(zhì)量性狀資料的構(gòu)成比例。圓圖每3.6°圓心角所對應(yīng)的扇形面積為1%。圓圖上各部分按資料順序或大小順序,以時鐘12時為起點,順時針方向排列。⑵、圓圖(piechart)43用線段的升降來表示事物或現(xiàn)象的變化發(fā)展情況。單式線圖表示某一事物或現(xiàn)象的動態(tài)。復(fù)式線圖在同一圖上表示兩種或兩種以上事物或現(xiàn)象的動態(tài)。⑶、線圖(linechart)44用矩形面積表示連續(xù)變量的頻數(shù)分布。橫軸:連續(xù)變量的組段;縱軸:頻數(shù),從0開始。各矩形條之間不留空隙。矩形的高度為頻數(shù),寬度為組距。⑷、直方圖(histogram)45頻數(shù)(人)1512963105110115120125130135140日加工零件數(shù)(個)直方圖下的面積之和等于1圖2-11某車間工人日加工零件數(shù)的直方圖我一眼就看出來了,大多數(shù)人的日加工零件數(shù)在120~125之間!46折線圖也稱頻數(shù)多邊形圖(Frequencypolygon)是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個終點要與橫軸相交,具體的做法是:第一個矩形的頂部中點連接相鄰矩形的頂部中點,最后一個矩形頂部中點與其豎邊中點連接到橫軸。折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的。⑸、折線圖(linechart)471512963105110115120125130135140日加工零件數(shù)(個)頻數(shù)(人)折線圖下的面積與直方圖的面積相等!圖2-12某車間工人日加工零件數(shù)的折線圖48第三節(jié)

試驗資料特征數(shù)的計算資料的集中性平均數(shù)資料的分散性標(biāo)準(zhǔn)差變異系數(shù)49一組數(shù)據(jù)向其中心值靠攏的傾向和程度不同類型的數(shù)據(jù)具有不同的集中趨勢測度值可用峰度值β(或其它參數(shù))表示,β>3屬于尖頂曲線,

β越大,峰度越尖(高)集中趨勢(Centraltendency)50離中趨勢的各測度值是對數(shù)據(jù)離散程度所作的描述可用β(或其它參數(shù))表示,β>3屬于尖頂曲線β越小,峰度越平,離中趨勢越明顯β值接近于1.8時,呈水平矩形分布形態(tài)離中趨勢51

平均數(shù)是用來表明資料中各觀測值相對集中較多的中心位置。主要包括有:算術(shù)平均數(shù)(arithmeticmean)中位數(shù)(median)眾數(shù)(mode)幾何平均數(shù)(geometricmean)調(diào)和平均數(shù)(harmonicmean)一、平均數(shù)(mean)

52算術(shù)平均數(shù)是指資料中各觀測值的總和除以觀測值個數(shù)所得的商,簡稱平均數(shù)或均數(shù),記為。根據(jù)樣本大小及分組情況而采用直接法或加權(quán)法計算。1、直接法用于樣本含量n≤30以下、未經(jīng)分組資料平均數(shù)的計算。公式:㈠、算術(shù)平均數(shù)53【例1】某種公牛站測得10頭成年公牛的體重分別為500、520、535、560、585、600、480、510、505、490(kg),求其平均數(shù)。

即10頭種公牛平均體重為528.5kg。542、加權(quán)法對于樣本含量n≥30

以上且已分組的資料,可以在次數(shù)分布表的基礎(chǔ)上采用加權(quán)法計算平均數(shù)。公式:xi

—第i組的組中值;fi

—第i組的次數(shù);k—分組數(shù)。55計算1,3,3,7,7,9,9,9的均數(shù)?56【例2】將100頭長白母豬的仔豬一月窩重(kg)資料整理成次數(shù)分布表如下,求其加權(quán)數(shù)平均數(shù)。57【例3】某牛群有黑白花奶牛1500頭,其平均體重為750kg,而另一牛群有黑白花奶牛1200頭,平均體重為725kg,如果將這兩個牛群混合在一起,其混合后平均體重為多少?計算若干個來自同一總體的樣本的平均數(shù)時,如果樣本含量不等,也應(yīng)采用加權(quán)法計算。583、平均數(shù)的基本性質(zhì)樣本各觀測值與平均數(shù)之差的和為零,即離均差之和等于零。樣本各觀測值與平均數(shù)之差的平方和為最小,即離均差平方和為最小。59將資料內(nèi)所有觀測值從小到大依次排列,位于中間的那個觀測值,稱為中位數(shù),記為Md。㈡、中位數(shù)1、未分組資料中位數(shù)的計算方法

n為奇數(shù)Md=x(n+1)/2n為偶數(shù)60【例4】觀察得9只西農(nóng)莎能奶山羊的妊娠天數(shù)為144、145、147、149、150、151、153、156、157,求其中位數(shù)。此例n=9,則:Md=x(n+1)/2=150(天)

即西農(nóng)莎能奶山羊妊娠天數(shù)的中位數(shù)為150天。【例5】

某犬場發(fā)生犬瘟熱,觀察得10只仔犬發(fā)現(xiàn)癥狀到死亡分別為7、8、8、9、11、12、12、13、14、14天,求其中位數(shù)。此例n=10,則:即10只仔犬從發(fā)現(xiàn)癥狀到死亡天數(shù)的中位數(shù)為11.5天。612、分組資料中位數(shù)的計算方法公式:式中:L—中位數(shù)所在組的下限;i—組距;f

—中位數(shù)所在組的次數(shù);n

—總次數(shù);c—小于中位數(shù)所在組的累加次數(shù)。62【例6】某奶牛場68頭健康母牛從分娩到第一次發(fā)情間隔時間整理成次數(shù)分布表,求中位數(shù)。i=15,n=68中位數(shù)只能在累加頭數(shù)為36所對應(yīng)的“57—71”這一組。L=57,f=20,c=16即奶牛頭胎分娩到第一次發(fā)情間隔時間的中位數(shù)為70.5天。63

n個觀測值相乘之積開n次方所得的方根,稱為幾何平均數(shù),記為G。公式:或㈢、幾何平均數(shù)【例7】某波爾山羊群1997—2000年各年度的存欄數(shù)見表2-19,試求其年平均增長率。64資料中出現(xiàn)次數(shù)最多的那個觀測值或次數(shù)最多一組的組中值,稱為眾數(shù),記為Mo。㈣、眾數(shù)65資料中各觀測值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),稱為調(diào)和平均數(shù),記為H?!纠?】某保種牛群不同世代牛群保種的規(guī)模分別為:0世代200頭,1世代220頭,2世代210頭;3世代190頭,4世代210頭,試求其平均規(guī)模。㈤、調(diào)和平均數(shù)66對于同一資料:算術(shù)平均數(shù)幾何平均數(shù)調(diào)和平均數(shù)最常用的是算術(shù)平均數(shù)。67㈠、全距(極差)一組數(shù)據(jù)的最大值與最小值之差表示資料中各觀測值變異程度大小最簡便的統(tǒng)計量易受極端值影響未考慮數(shù)據(jù)的分布二、標(biāo)準(zhǔn)差(standarddeviation)當(dāng)資料很多而又要迅速對資料的變異程度作出判斷時,可以利用全距這個統(tǒng)計量。681、離均差能表示一個觀測值偏離平均數(shù)的性質(zhì)和程度離均差有正、有負(fù),離均差之和為零,即不能用離均差之和來表示資料中所有觀測值的總偏離程度2、平均差各變量值與其均值離均差絕對值的平均數(shù)能全面反映一組數(shù)據(jù)的離散程度數(shù)學(xué)性質(zhì)較差,實際中應(yīng)用較少㈡、平均差69離散程度的測度值最常用的測度值反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標(biāo)準(zhǔn)差離均差的平方和,記為SS解決離均差有正、有負(fù),離均差之和為零的問題。均方(MS),記為S2消除樣本大小的影響。㈢、方差和標(biāo)準(zhǔn)差70方差的計算公式:直接法加權(quán)法標(biāo)準(zhǔn)差的計算公式:直接法加權(quán)法1、總體方差和標(biāo)準(zhǔn)差712、樣本方差和標(biāo)準(zhǔn)差方差的計算公式:直接法加權(quán)法標(biāo)準(zhǔn)差的計算公式:直接法加權(quán)法試推導(dǎo)公式7273樣品方差的換算公式74總體方差樣本方差【例9】計算10只遼寧絨山羊產(chǎn)絨量:450,450,500,500,500,550,550,550,600,600,650(g)的標(biāo)準(zhǔn)差。3、簡化公式n=10Σx=5400Σx2=295500075【例10】利用某純系

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論