




已閱讀5頁(yè),還剩34頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第2章數(shù)據(jù)的組織與表達(dá) ArrangementandPresentationofData Section2 1DataandDataType數(shù)據(jù)與數(shù)據(jù)類型 一 原始數(shù)據(jù)的組織 資料以電子表格 spreadsheet 方式記錄 包括個(gè)體 Individual 一筆數(shù)據(jù)所描述的對(duì)象 object 電子表格中輸入在一行 及變量 Variable 描述任何一個(gè)個(gè)體的特征 一個(gè)變量對(duì)不同的個(gè)體取不同的數(shù)值 value 電子表格中輸入在一列 一 數(shù)量性狀資料數(shù)量性狀 quantitativetrait 的度量有計(jì)數(shù)和量測(cè)兩種方式 其所得變數(shù)不同 1 不連續(xù)性或間斷性變數(shù) discontinuousordiscretevariable 指用計(jì)數(shù)方法獲得的數(shù)據(jù) 2 連續(xù)性變數(shù) continuousvariable 指稱量 度量或測(cè)量方法所得到的數(shù)據(jù) 其各個(gè)觀察值并不限于整數(shù) 在兩個(gè)數(shù)值之間可以有微量數(shù)值差異的第三個(gè)數(shù)值存在 二 試驗(yàn)資料的性質(zhì)與分類 二 質(zhì)量性狀資料質(zhì)量性狀 qualitativetrait 指能觀察而不能量測(cè)的狀即屬性性狀 如花藥 子粒 穎殼等器官的顏色 芒的有無(wú) 絨毛的有無(wú)等 要從這類性狀獲得數(shù)量資料 可采用下列兩種方法 統(tǒng)計(jì)次數(shù)法于一定總體或樣本內(nèi) 統(tǒng)計(jì)其具有某個(gè)性狀的個(gè)體數(shù)目及具有不同性狀的個(gè)體數(shù)目 按類別計(jì)其次數(shù)或相對(duì)次數(shù) 2 給分法給予每類性狀以相對(duì)數(shù)量的方法 二 試驗(yàn)資料的性質(zhì)與分類 Section2 2次數(shù)分布表 表1100個(gè)麥穗的每穗小穗數(shù) 一 間斷性變數(shù)資料的整理 表2100個(gè)麥穗每穗小穗數(shù)的次數(shù)分布表 從表2中看到 一堆雜亂的原始資料表 經(jīng)初步整理后 就可了解資料的大致情況 另外 經(jīng)過(guò)整理的資料也便于進(jìn)一步的分析 每穗小穗數(shù)在15 20的范圍內(nèi)變動(dòng) 把所有觀察值按每穗小穗數(shù)多少加以歸類 共分為6組 組與組間相差為1小穗 稱為組距 這樣可得表2形式的次數(shù)分布表 一 間斷性變數(shù)資料的整理 二 連續(xù)性變數(shù)資料的整理 表3140行水稻產(chǎn)量 單位 克 具體步驟 1 數(shù)據(jù)排序 sort 首先對(duì)數(shù)據(jù)按從小到大排列 升序 或從大到小排列 降序 2 求極差 range 所有數(shù)據(jù)中的最大觀察值和最小觀察值的差數(shù) 稱為極差 亦即整個(gè)樣本的變異幅度 從表3中查到最大觀察值為254g 最小觀察值為75g 極差為254 75 179g 二 連續(xù)性變數(shù)資料的整理 3 確定組數(shù)和組距 classinterval 根據(jù)極差分為若干組 每組的距離相等 稱為組距 在確定組數(shù)和組距時(shí)應(yīng)考慮 1 觀察值個(gè)數(shù)的多少 2 極差的大小 3 便于計(jì)算 4 能反映出資料的真實(shí)面貌等方面 樣本大小 即樣本內(nèi)包含觀察值的個(gè)數(shù)的多少 與組數(shù)多少的關(guān)系可參照表4來(lái)確定 二 連續(xù)性變數(shù)資料的整理 表4樣本容量與組數(shù)多少的關(guān)系 組數(shù)確定后 還須確定組距 組距 極差 組數(shù) 以表3中140行水稻產(chǎn)量為例 樣本內(nèi)觀察值的個(gè)數(shù)為140 查表4可分為8 16組 假定分為12組 則組距為179 12 14 9g 為分組方便起見(jiàn) 可以15g作為組距 二 連續(xù)性變數(shù)資料的整理 4 選定組限 classlimit 和組中點(diǎn)值 組值 classvalue 以表3中140行水稻產(chǎn)量為例 選定第一組的中點(diǎn)值為75g 與最小觀察值75g相等 則第二組的中點(diǎn)值為75 15 90g 余類推 各組的中點(diǎn)值選定后 就可以求得各組組限 每組有兩個(gè)組限 數(shù)值小的稱為下限 lowerlimit 數(shù)值大的稱為上限 upperlimit 上述資料中 第一組的下限為該組中點(diǎn)值減去1 2組距 即75 15 2 67 5g 上限為中點(diǎn)值加1 2組距 即75 15 2 82 5g 故第一組的組限為67 5 82 5g 按照此法計(jì)算其余各組的組限 二 連續(xù)性變數(shù)資料的整理 5 把原始資料的各個(gè)觀察值按分組數(shù)列的各組組限歸組可按原始資料中各觀察值的次序 逐個(gè)把數(shù)值歸于各組 待全部觀察值歸組后 即可求得各組的次數(shù) 制成一個(gè)次數(shù)分布表 例如表3中第一個(gè)觀察值177應(yīng)歸于表5中第8組 組限為172 5 187 5 第二個(gè)觀察值149應(yīng)歸于第6組 組限為142 5 157 5 依次把140個(gè)觀察值都進(jìn)行歸組 即可制成140行水稻產(chǎn)量的次數(shù)分布表 表5 二 連續(xù)性變數(shù)資料的整理 表5140行水稻的次數(shù)分布 注 前面提到分為12組 但由于第一組的中點(diǎn)值接近于最小觀察值 故第一組的下限小于最小觀察值 實(shí)際上差不多增加了1 2組 這樣也使最后一組的中點(diǎn)值接近于最大值 又增加了1 2組 故實(shí)際的組數(shù)比原來(lái)確定的要多一個(gè)組 為13組 二 連續(xù)性變數(shù)資料的整理 三 屬性變數(shù)資料的整理 屬性變數(shù)的資料 也可以用類似次數(shù)分布的方法來(lái)整理 在整理前 把資料按各種質(zhì)量性狀進(jìn)行分類 分類數(shù)等于組數(shù) 然后根據(jù)各個(gè)體在質(zhì)量屬性上的具體表現(xiàn) 分別歸入相應(yīng)的組中 即可得到屬性分布的規(guī)律性認(rèn)識(shí) 例如 某水稻雜種第二代植株米粒性狀的分離情況 歸于表6 表6水稻雜種二代植株米粒性狀的分離情況 Section2 3次數(shù)分布圖 一 方柱形圖 方柱形圖 histogram 適用于表示連續(xù)性變數(shù)的次數(shù)分布 現(xiàn)以表3的140行水稻產(chǎn)量的次數(shù)分布表為例加以說(shuō)明 即成方柱形次數(shù)分布圖1 二 多邊形圖 多邊形圖 polygon 也是表示連續(xù)性變數(shù)資料的一種普通的方法 且在同一圖上可比較兩組以上的資料 仍以140行水稻產(chǎn)量次數(shù)分布為例 所成圖形即為次數(shù)多邊形圖 圖2 三 條形圖 條形圖 bar 適用于間斷性變數(shù)和屬性變數(shù)資料 用以表示這些變數(shù)的次數(shù)分布狀況 一般其橫軸標(biāo)出間斷的中點(diǎn)值或分類性狀 縱軸標(biāo)出次數(shù) 現(xiàn)以表6水稻雜種第二代米粒性狀的分離情況為例 可畫成水稻雜種第二代植株4種米粒性狀分離情況條形圖 圖3 圖3水稻F2代米粒性狀分離條形圖 四 餅圖 餅圖 pie 適用于間斷性變數(shù)和屬性變數(shù)資料 用以表示這些變數(shù)中各種屬性或各種間斷性數(shù)據(jù)觀察值在總觀察個(gè)數(shù)中的百分比 如圖4中白米糯稻在F2群體中占8 白米非糯 紅米糯稻和紅米非糯分別占17 21 和54 Section2 4平均數(shù) 一 平均數(shù)的意義和種類 平均數(shù)的意義 平均數(shù) average 是數(shù)據(jù)的代表值 表示資料中觀察值的中心位置 并且可作為資料的代表而與另一組資料相比較 借以明確二者之間相差的情況 平均數(shù)的種類 1 算術(shù)平均數(shù)一個(gè)數(shù)量資料中各個(gè)觀察值的總和除以觀察值個(gè)數(shù)所得的商數(shù) 稱為算術(shù)平均數(shù) arithmeticmean 記作 因其應(yīng)用廣泛 常簡(jiǎn)稱平均數(shù)或均數(shù) mean 均數(shù)的大小決定于樣本的各觀察值 2 中數(shù)將資料內(nèi)所有觀察值從大到小排序 居中間位置的觀察值稱為中數(shù) median 計(jì)作Md 如觀察值個(gè)數(shù)為偶數(shù) 則以中間二個(gè)觀察值的算術(shù)平均數(shù)為中數(shù) 一 平均數(shù)的意義和種類 3 眾數(shù)資料中最常見(jiàn)的一數(shù) 或次數(shù)最多一組的中點(diǎn)值 稱為眾數(shù) mode 計(jì)作MO 如棉花纖維檢驗(yàn)時(shí)所用的主體長(zhǎng)度即為眾數(shù) 4 幾何平均數(shù)如有n個(gè)觀察值 其相乘積開n次方 即為幾何平均數(shù) geometricmean 用G代表 一 平均數(shù)的意義和種類 二 算術(shù)平均數(shù)的計(jì)算方法 若樣本較小 即資料包含的觀察值個(gè)數(shù)不多 可直接計(jì)算平均數(shù) 設(shè)一個(gè)含有n個(gè)觀察值的樣本 其各個(gè)觀察值為x1 x2 x3 xn 則算術(shù)平均數(shù)由下式算得 若樣本較大 且已進(jìn)行了分組 可采用加權(quán)法計(jì)算算術(shù)平均數(shù) 即用組中點(diǎn)值代表該組出現(xiàn)的觀測(cè)值以計(jì)算平均數(shù) 其公式為 其中yi為第i組中點(diǎn)值 fi為第i組變數(shù)出現(xiàn)次數(shù) 例1 在水稻品種比較試驗(yàn)中 湘矮早四號(hào)的5個(gè)小區(qū)產(chǎn)量分別為20 0 19 0 21 0 17 5 18 5kg 求該品種的小區(qū)平均產(chǎn)量 例2 利用表5資料計(jì)算平均每行水稻產(chǎn)量 若采用直接法 157 47 因此 兩者的結(jié)果十分相近 二 算術(shù)平均數(shù)的計(jì)算方法 三 總體平均數(shù) 總體平均數(shù)用來(lái)代表 它同樣具有算術(shù)平均數(shù)所具有的特性 上式Xi代表各個(gè)觀察值 N代表有限總體所包含的個(gè)體數(shù) 表示總體內(nèi)各個(gè)觀察值的總和 Section2 5變異數(shù) 一 極差 極差 range 又稱全距 記作R 是資料中最大觀察值與最小觀察值的差數(shù) 表7兩個(gè)小麥品種的每穗小穗數(shù) 甲品種R 23 13 10 乙品種R 20 16 4 兩品種的平均同為18 但甲品種的極差大 平均數(shù)的代表性差 乙品種的極差小 平均數(shù)代表性好 二 方差 離均差平方和 簡(jiǎn)稱平方和 SS 樣本SS 總體SS 均方或方差 variance 樣本均方 meansquare 總體方差 樣本均方是總體方差的無(wú)偏估計(jì)值 三 標(biāo)準(zhǔn)差 一 標(biāo)準(zhǔn)差的定義樣本標(biāo)準(zhǔn)差 總體標(biāo)準(zhǔn)差 樣本標(biāo)準(zhǔn)差是總體標(biāo)準(zhǔn)差的估計(jì)值 二 自由度 樣本n 1稱為自由度 記作DF 其具體數(shù)值則常用表示 統(tǒng)計(jì)意義 是指樣本內(nèi)獨(dú)立而能自由變動(dòng)的離均差個(gè)數(shù) 三 標(biāo)準(zhǔn)差 三 標(biāo)準(zhǔn)差的計(jì)算方法 1 直接法 例3 設(shè)某一水稻單株粒重的樣本有5個(gè)觀察值 以克為單位 其數(shù)為2 8 7 5 4 三 標(biāo)準(zhǔn)差 2 矯正數(shù)法 其中項(xiàng)稱為矯正數(shù) 記作C 在上例中 將有關(guān)數(shù)字代入即有 三 標(biāo)準(zhǔn)差 3 加權(quán)法若樣本較大 已生成次數(shù)分布表 可采用加權(quán)法計(jì)算標(biāo)準(zhǔn)差 其公式為 三 標(biāo)準(zhǔn)差 例4 利用表5的次數(shù)分布資料計(jì)算每行水稻產(chǎn)量的標(biāo)準(zhǔn)差 若采用直接法 其標(biāo)準(zhǔn)差s 36 23 g 由此可見(jiàn) 直接法和加權(quán)法的結(jié)果是很相近的 三 標(biāo)準(zhǔn)差 四 變異系數(shù) 變異系數(shù) co
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 森林生態(tài)補(bǔ)償與林權(quán)流轉(zhuǎn)合作協(xié)議
- 網(wǎng)絡(luò)影視作品版權(quán)代理合作協(xié)議
- 綠色建筑電氣系統(tǒng)設(shè)計(jì)、安裝及性能驗(yàn)收協(xié)議
- 重型工業(yè)儀器定期校準(zhǔn)認(rèn)證與風(fēng)險(xiǎn)評(píng)估合同
- 生物制藥潔凈廠房空氣凈化系統(tǒng)租賃與安全檢測(cè)合同
- 航空貨運(yùn)代理航空貨物清關(guān)代理承包協(xié)議
- 海外留學(xué)行李保險(xiǎn)與全球托運(yùn)質(zhì)量監(jiān)管協(xié)議
- 《社會(huì)保險(xiǎn)知識(shí)普及教學(xué)課件》
- 《慢性腎衰竭》課件2
- 《農(nóng)業(yè)機(jī)械操作培訓(xùn)》課件
- 臨床類面試真題及答案
- 夫妻間借款協(xié)議合同
- 【8地一模 初二會(huì)考】2025年安徽省亳州市利辛縣中考一模地理試題(含解析)
- ktv服務(wù)員合同協(xié)議書范本
- 2025年中國(guó)心電電極片市場(chǎng)調(diào)查研究報(bào)告
- 監(jiān)管方式(貿(mào)易方式)與征免性質(zhì)與征免方式對(duì)應(yīng)關(guān)系及其代碼和解釋
- 廣東省退休年齡新規(guī)定
- 2025-2030醫(yī)療設(shè)備器械行業(yè)市場(chǎng)發(fā)展分析及投資前景研究報(bào)告
- 城投公司競(jìng)聘試題及答案
- 西部計(jì)劃面試題目及答案
- 公文筐的測(cè)試題及答案
評(píng)論
0/150
提交評(píng)論