




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、個體遺傳評定第1頁,共66頁,2022年,5月20日,2點59分,星期日矩陣代數(shù)基礎 純量、矩陣和向量 純量(scalar) 只有大小的一個數(shù)值,也稱為標量、數(shù)量或元向量。 用數(shù)字或經定義的拉丁字母斜體、小寫表示。 如a、r和k。第一節(jié) 有關基礎知識第2頁,共66頁,2022年,5月20日,2點59分,星期日 矩陣(matrix) 由一定行數(shù)和一定列數(shù)的純量,按一定順序排列的表。 一般用大寫粗體字母表示。 矩陣的階數(shù) (order) 或維數(shù)(dimension)是指矩陣的行數(shù) (m) 和列數(shù) (n) ,表示為m n。 例如:第3頁,共66頁,2022年,5月20日,2點59分,星期日 向量 (
2、Vector) 僅有一列或一行的矩陣,前者稱為列向量(column vector),后者稱為行向量(row vector)。 通常用小寫粗體字母表示。 為區(qū)別行向量和列向量,通常在字母的右上角加一撇表示行向量,不加撇表示列向量。 行向量的階數(shù)為1j,列向量的階數(shù)為j1。 例如:第4頁,共66頁,2022年,5月20日,2點59分,星期日 一些特殊矩陣 方陣(square matrix):行數(shù)與列數(shù)相等的矩陣,如Ann。其他矩陣稱為直角陣(rectangular matrices) 。 對稱陣 (symmetric matrix):元素間滿足 aij = aji 的方陣。第5頁,共66頁,202
3、2年,5月20日,2點59分,星期日 三角陣(triangular matrix): 上三角陣:主對角線以下元素全部為0,即當 j i 時, aij = 0 (j i 時, aij = 0 (i j)第6頁,共66頁,2022年,5月20日,2點59分,星期日 對角陣 (diagonal matrix):除 i=j 時的元素(主對角線元素)外,其它元素均為零的方陣,即aij = 0 (j i 時)。通??梢杂肈iag aj 表示,其中aj 為該陣的第 i 個對角線元素。 單位矩陣(identity matrix):所有對角線元素為1,其他元素均為0的矩陣。第7頁,共66頁,2022年,5月20
4、日,2點59分,星期日 分塊矩陣(block matrix):用水平和垂直虛線將矩陣分為若干小塊,此時的矩陣稱為分塊矩陣。其中的小塊稱為子陣(sub-matrix)。第8頁,共66頁,2022年,5月20日,2點59分,星期日 分塊對角陣 (block diagonal matrix):主對角線上的子陣都為方陣,其余子陣都是零陣的分塊陣。如: 稀疏矩陣 (sparse matrix):設矩陣Amn中有 s 個非零元素,若 s 遠遠小于矩陣元素的總數(shù) (即s 0,除非A = 0; |A| = 0 A=0 |kA| = |k| |A|(k為一純量); |A+B|A|+|B| |AB|A| |B|第
5、15頁,共66頁,2022年,5月20日,2點59分,星期日 逆矩陣 (inverse matrix):對于一方陣A,若存在另一矩陣B,使得AB=BA=I,則稱B為A的逆矩陣,并表示為A1,即A1 A=I。A1存在的先決條件: A必須是一方陣; A的行列式|A|0,即A為非奇異陣。其中,A*是A的伴隨矩陣。對任意 n 階矩陣A , 稱為A 的伴隨矩陣。其中,Aij 是A 中元素aij的代數(shù)余子式。 第16頁,共66頁,2022年,5月20日,2點59分,星期日A1具有如下性質: A1A=AA1=I; A1是唯一的; ; (A1) 1 =A,因而也是非奇異陣; (A1) =(A) 1; 如A為對
6、稱陣,則A1也是對稱陣; 若A、B均可逆,則(AB)1 =B1 A1 。如果 n 階矩陣A的行列式A0,則稱A是非奇異陣;否則,稱A為奇異陣。非奇異陣也就是滿秩矩陣 :對于方陣A,如果存在一個同階的方陣B,兩方陣的積為單位陣,則稱方陣A為滿秩方陣或非奇異陣。第17頁,共66頁,2022年,5月20日,2點59分,星期日 廣義逆 (generalized inverse):對于任一矩陣A,若有矩陣G,滿足:AGA = A則稱G為A的廣義逆,記為A,即AA A = A廣義逆的性質: 若A為方陣且滿秩,則A = A 1 ; 對于任意矩陣A, A必存在。第18頁,共66頁,2022年,5月20日,2點
7、59分,星期日 Kronecker乘積(或直積, direct product)設 和 分別為 mn 和 pq 階矩陣,定義 ,稱為 A 和 B 的Kronecker乘積或直積,記為 。即:第19頁,共66頁,2022年,5月20日,2點59分,星期日直積的有關性質: 0A=A0=0 (A1+A2)B=(A1B)+(A2B) A(B1+B2)=(AB1)+(AB2) ( A)( B)= (AB) (、 均為純量) (A1B1)(A2B2)=(A1A2) (B1B2) (如A1與A2、B1與B2可乘) (AB)=AB (AB)-1=A-1B-1 (如A、B均可逆) (x y)=y x=yx第20
8、頁,共66頁,2022年,5月20日,2點59分,星期日 Hadamard乘積:兩個矩陣A和B的元素間相乘,要求A和B同階。用*表示:第21頁,共66頁,2022年,5月20日,2點59分,星期日隨機變量的期望值和方差設X為一隨機變量,則: 其數(shù)學期望: ,且具有如下性質:(k 為一常數(shù))(X、Y相互獨立時) 其方差: , 且具有如下性質:(X、Y相互獨立時)(稱為X和Y的協(xié)方差)第22頁,共66頁,2022年,5月20日,2點59分,星期日 將上述內容推廣至多個變量。設x1, x2, xn為 n 個隨機變量,則:隨機向量x的期望向 量x 的方差-協(xié)方差矩陣V的對角線元素為n個變量的方差;非對
9、角線元素為變量間的協(xié)方差。第23頁,共66頁,2022年,5月20日,2點59分,星期日 動物育種中常用的是表型方差-協(xié)方差矩陣V、遺傳方差-協(xié)方差矩陣G和殘差方差-協(xié)方差矩陣R。第24頁,共66頁,2022年,5月20日,2點59分,星期日G陣的構建需要一個由個體間親緣相關系數(shù)組成的矩陣A,該矩陣稱為加性遺傳相關矩陣。由于它是由Wright計算近交系數(shù)公式中的分子計算而得,故又稱為分子血緣相關矩陣。個體 i 和 j 間的加性遺傳相關。計算公式:個體 i 的近交系數(shù)加1。即:第25頁,共66頁,2022年,5月20日,2點59分,星期日A陣元素計算機計算的遞推公式:式中: 和 分別為個體 i
10、的父親和母親; 和 分別為個體 j 的父親和母親; 為 和 間的加性遺傳或親緣相關系數(shù)。若個體 i 的一個親本或雙親未知, 。 和 分別為個體 i 與 和 間的加性遺傳相關。 未知時, ; 未知時, 。第26頁,共66頁,2022年,5月20日,2點59分,星期日線性模型基礎 模型 (model) 模型:指描述觀察值與影響觀察值變異性的各個因子間關系的方程式。 因子:影響觀察值的因子也稱為變量 變量可分為離散型變量(變異不連續(xù))和連續(xù)型變量; 離散型因子分為固定因子和隨機因子兩類; 連續(xù)性變量通常作為協(xié)變量看待。第27頁,共66頁,2022年,5月20日,2點59分,星期日 固定因子與隨機因子
11、:與抽樣和目的有關 固定因子(fixed factors):抽取因子的若干特定水平、水平數(shù)相對較少、研究目的是要對這些水平的效應進行估計或比較。 隨機因子(random factors):因子的各水平是其所有水平的一個隨機樣本、水平數(shù)相對較多、研究目的是要對該樣本去推斷總體。 固定效應與隨機效應 固定效應 (fixed effects):固定因子各水平對觀察值的效應。 隨機效應 (random effects):隨機因子各水平對觀察值的效應。第28頁,共66頁,2022年,5月20日,2點59分,星期日 線性模型 (linear model) 定義:模型中所包含的各個因子是以相加的形式影響觀察
12、值,即它們與觀察值的關系為線性關系。 組成:一個完整的模型應包括3部分內容: 數(shù)學方程式(或數(shù)學模型式)及其解釋; 模型中隨機變量的數(shù)學期望、方差協(xié)方差; 建立模型時的所有假設和約束條件。第29頁,共66頁,2022年,5月20日,2點59分,星期日例7.1: 模型中每個參數(shù)的解釋 yij :第 i 個日齡組的第 j 頭肉牛的體重, 為觀察值; :總體均值,是一常量; ai :第 i 個日齡組的效應,為固定效應; eij :隨機誤差或殘差效應。 隨機變量的期望、方差及協(xié)方差第30頁,共66頁,2022年,5月20日,2點59分,星期日 約束與假設 所有犢牛都來自同一個品種; 母親年齡對犢牛體重
13、無影響; 犢牛的性別相同或性別對體重無影響; 除日齡組外的其他環(huán)境條件相同。 對每一觀察值建立方程式第31頁,共66頁,2022年,5月20日,2點59分,星期日y11=198= + a1 +e11y12=204= + a1 +e12y13=201= + a1 +e13y21=203= + a2 +e21y22=206= + a2 +e22y23=210= + a2 +e23y31=205= + a3 +e31y32=212= + a3 +e32y33=216= + a3 +e33y41=225= + a4 +e41y42=220= + a4 +e42日齡組1 2 3 4觀察值殘 差個 體1
14、2 3 4日 齡 組 第32頁,共66頁,2022年,5月20日,2點59分,星期日y11 =198= + a1 + e11y12 =204= + a1 + e12y13 =201= + a1 + e13y21 =203= + a2 + e21y22 =206= + a2 + e22y23 =210= + a2 + e23y31 =205= + a3 + e31y32 =212= + a3 + e32y33 =216= + a3 + e33y41 =225= + a4 + e41y41 =220= + a4 + e42a1a2a3a4yae第33頁,共66頁,2022年,5月20日,2點59分
15、,星期日關聯(lián)矩陣:又稱設計矩陣或發(fā)生矩陣。指示 y 中的元素與 a 中元素的關聯(lián)情況。 a1 a2 a3 a4yaX第34頁,共66頁,2022年,5月20日,2點59分,星期日模型的矩陣表示:式中,y為觀察值向量,a為固定的日齡組向量,e為隨機殘差效應向量,X為a的關聯(lián)矩陣。且有:其中,I 為單位矩陣,2為觀察值的方差。第35頁,共66頁,2022年,5月20日,2點59分,星期日 線性模型的分類按模型中各因子的性質分類如下: 固定效應模型 (fixed effect model):模型中除隨機殘差外,其余所有效應均為固定效應。 隨機效應模型 (random effect model):模型
16、中除外,其余的所有效應均為隨機效應。第36頁,共66頁,2022年,5月20日,2點59分,星期日式中:y觀察值向量; b固定效應(包括)向量; u隨機效應向量; e 隨機殘差效應向量; X固定效應的關聯(lián)矩陣(設計矩陣或發(fā)生矩陣); Z隨機效應的關聯(lián)矩陣(設計矩陣或發(fā)生矩陣) 混合效應模型 (mixed effect model):模型中除和e外,既含有固定效應,也含有隨機效應。第37頁,共66頁,2022年,5月20日,2點59分,星期日第二節(jié) BLUP育種值估計背 景 BLUP法是基于克服傳統(tǒng)選擇指數(shù)法的缺點的。 選擇指數(shù)實質上就是育種值的估計值。 選擇指數(shù)法假定不存在影響觀察值的系統(tǒng)環(huán)境
17、效應,或者這些效應已知,可以對觀察值進行事先校正,則選擇指數(shù)是育種值的最佳無偏估值。但是這一假定幾乎不能成立。 BLUP的基本思路是在估計育種值的同時對系統(tǒng)環(huán)境效應進行估計和校正。 根據這一思路,BLUP法必須基于混合模型。第38頁,共66頁,2022年,5月20日,2點59分,星期日最佳 (Best):估計誤差方差 最小;無偏 (Unbiased):估計值無偏,即估計值的期望值就是真值, ;基本原理 BLUP的涵義:BLUP是Best Linear Unbiased prediction的首字母縮略詞,既最佳線性無偏預測。其中:線性 (Linear):估計值是觀察值的線性函數(shù);預測 (pre
18、diction):是可以對隨機效應進行預測。通常,對固定效應稱估計,對隨機效應稱預測。第39頁,共66頁,2022年,5月20日,2點59分,星期日 混合模型(Mixed model)式中,y觀察值向量;b和u分別為固定效應和隨機效應向量;e為隨機殘差向量;X和Z分別為b和u的關聯(lián)矩陣。且有:這里是假定固定效應與隨機效應間無互作。育種中是假定遺傳與環(huán)境間無互作。第40頁,共66頁,2022年,5月20日,2點59分,星期日 混合模型方程組(MME) MME的解:解向量 s右手項 r系數(shù)矩陣 C注意:盡管MME的解中有V-1,但MME中沒有,直接求解MME便可,即 。C-1可用分塊矩陣表示為:(
19、1)第41頁,共66頁,2022年,5月20日,2點59分,星期日式中,y 表型觀測值向量 b 為固定環(huán)境效應向量 X 固定環(huán)境效應b的關聯(lián)矩陣 a s個個體的隨機加性遺傳效應向量 Z 隨機遺傳效應a的關聯(lián)矩陣,當a中的所有個體都有觀測值時,即sn時,Z = I e 隨機殘差效應向量單性狀無重復觀察值的動物模型BLUP 模型表達式 一個個體時: n 個個體時:y為個體的觀察值;bj為第j個固定效應;a為個體的隨機加性遺傳效應;e為隨機殘差效應。第42頁,共66頁,2022年,5月20日,2點59分,星期日隨機效應a和e的數(shù)學期望為:隨機效應a和e的方差-協(xié)方差矩陣分別為:其中: 為加性遺傳方差
20、; 為隨機殘差方差;A為待估個體間的加性遺傳相關矩陣(additive genetic relationship matrix),即分子親緣相關系數(shù)矩陣(numerator relationship matrix)。 第43頁,共66頁,2022年,5月20日,2點59分,星期日 混合模型方差組(MME) 式中,A-1 A的逆矩陣 X X 的轉置矩陣 Z Z 的轉置矩陣與(1)式相比,(2)式是在(1)式兩邊同除了一個R-1變換而來。(2)第44頁,共66頁,2022年,5月20日,2點59分,星期日為系數(shù)矩陣的逆矩陣。 MME的求解也可表示為:其中, 為固定效應的BLUE值; 為隨機效應的B
21、LUP值。第45頁,共66頁,2022年,5月20日,2點59分,星期日 個體育種值估計的準確度 (Accuracy, ACC)用估計育種值與真實育種值之間的相關系數(shù)來度量,其計算公式為:式中, 為 中與個體 i 對應的對角線元素。 當個體 i 為非近交個體時: 當個體 i 為近交個體時: 式中,fi 為個體 i 的近交系數(shù)。第46頁,共66頁,2022年,5月20日,2點59分,星期日Relationship between true BV and EBV for three accuracy values, r= 0.8, 0.5 and 0.3 第47頁,共66頁,2022年,5月20日
22、,2點59分,星期日 對育種值估計準確度的進一步理解 個體某一性狀的真實育種值只有一個,而且永遠不變。 個體的估計育種值則與信息來源和信息的多少密切相關,并隨之變化。 一般而言,利用的信息越多,準確度越大。 準確度還是育種值估計中利用信息多少的一個度量。它表明了當擁有更多信息時,EBV變化的可能性。 隨著準確度的提高, EBV的變化減小。第48頁,共66頁,2022年,5月20日,2點59分,星期日 估計育種值的可靠性 (Reliability) 預測誤差方差(Prediction error variance, PEV)估計育種值與真實育種值之間的相關系數(shù) 的平方 稱為估計育種值的可靠性???/p>
23、靠性是一個決定系數(shù),是對真實育種值變異中由估計育種值說明的變異部分( )的一個度量。PEV是育種值預測時對誤差大小的一個度量。PEV是對真實育種值變異中未由估計育種值說明的變異部分 ( ) 的一個度量。第49頁,共66頁,2022年,5月20日,2點59分,星期日 當個體 i 為非近交個體時: 當個體 i 為近交個體時: 育種值估計的準確度可由預測誤差方差計算 預測誤差標準差 (Standard error of prediction, SEP)第50頁,共66頁,2022年,5月20日,2點59分,星期日第51頁,共66頁,2022年,5月20日,2點59分,星期日單性狀有重復觀察值的動物模
24、型BLUP 模型表達式重復力模型 (Repeatability model)式中,y為觀察值向量;b為固定效應向量;a為隨機加性遺傳效應向量;p為隨機永久環(huán)境效應向量;e為隨機殘差效應向量。Z1為加性遺傳效應的關聯(lián)矩陣;Z2為永久環(huán)境效應的關聯(lián)矩陣。且有:第52頁,共66頁,2022年,5月20日,2點59分,星期日 混合模型方程組其中:其中:h2為性狀的遺傳力,re為性狀的重復力。第53頁,共66頁,2022年,5月20日,2點59分,星期日動物模型BLUP的理想性質 能最有效地充分利用所有親屬的信息; 能校正由于選配所造成的偏差; 當利用個體的重復記錄時,可將由于淘汰造成的偏差降到最低;
25、能考慮不同群體及不同世代的遺傳差異; 能提供個體育種值的最精確的無偏估值。達到如上理想性質的前提是: 數(shù)據特別是系譜正確完整; 所用模型是真實模型; 隨機效應方差組分已知,而且是正確的。第54頁,共66頁,2022年,5月20日,2點59分,星期日多性狀動物模型BLUP 育種值估計 模型表達式以兩個性狀為例。性狀1的模型為:性狀2的模型為:令:則有:第55頁,共66頁,2022年,5月20日,2點59分,星期日 隨機效應的期望和方差-協(xié)方差其中, 和 分別為性狀1和2的加性遺傳方差; 為性狀1和2間的加性遺傳協(xié)方差。 和 分別為性狀1和2的殘差方差; 為性狀1和2間的殘差協(xié)方差。 A為分子血緣
26、相關矩陣;I為單位矩陣。第56頁,共66頁,2022年,5月20日,2點59分,星期日 MME及其求解計算G-1和R-1后,代入混合模型方程組求解,便可得到:固定效應的BLUE值加性遺傳效應的BLUP值第57頁,共66頁,2022年,5月20日,2點59分,星期日第三節(jié) 遺傳參數(shù)估計的REML方法最大似然 (Maximum likelihood, ML) 法 是統(tǒng)計學參數(shù)估計的一個重要方法, 由Fisher提出。最大似然法的一般原理概率函數(shù)與密度函數(shù)設f (x, ) 為隨機變量X的概率函數(shù)(X為離散型變量)或密度函數(shù)(X為連續(xù)型變量), 為有關的已知參數(shù),且X為 的函數(shù)。則f (x, )為已知
27、時,X=x的發(fā)生概率(X為離散型變量)或X=x的概率密度(X為連續(xù)型變量)。第58頁,共66頁,2022年,5月20日,2點59分,星期日似然函數(shù)(likelihood function)假定 為待估計的未知參數(shù),但 X=x 已知,為觀察值。將f (, x) 看作是x一定時 的一個函數(shù),稱之為似然函數(shù),記為L(, x),表示 取不同值時, X=x發(fā)生的可能性或似然性。最大似然原理尋找一個使得X=x發(fā)生可能性最大的 值 ,即當X=x時,尋找 ,滿足 其中為參數(shù)空間。如果 存在,則稱它為 的最大似然估值。第59頁,共66頁,2022年,5月20日,2點59分,星期日注意事項: 的估計值必須落在參數(shù)空間內。我們不考慮參數(shù)空間外的ML估值。似然函數(shù)通常用對數(shù)形式,即ln L或log L。因為在求最大值過程中需要求對數(shù)后求導。混合模型下參數(shù)的ML估計ML法要求說明數(shù)據的分布
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教版一年級美術下冊《第10課 泡泡飛呀飛》教學設計
- 2025至2030年中國便攜式光譜儀數(shù)據監(jiān)測研究報告
- 2025至2030年中國以色列玻璃制品數(shù)據監(jiān)測研究報告
- 涼山2024下半年四川涼山冕寧縣招聘小學教師60人筆試歷年參考題庫附帶答案詳解
- 年產20000噸功能助劑材料項目可行性研究報告
- 亳州2024年安徽亳州蒙城縣大學生鄉(xiāng)村醫(yī)生專項招聘6人筆試歷年參考題庫附帶答案詳解
- 四年級信息技術上冊 制作月歷 1教學設計 冀教版
- 云南2024年云南農業(yè)大學學生處(學生中心)招聘編制外人員筆試歷年參考題庫附帶答案詳解
- 任務一:《水培綠蘿》(教案)-2024-2025學年一年級上冊勞動魯科版
- 大學教師勞務協(xié)議書
- 超高頻開關電源技術的前沿研究
- 特許經營管理手冊范本(餐飲)
- 計算機應用基礎-終結性考試試題國開要求
- 《安裝條》浙江省建筑設備安裝工程提高質量的若干意見
- 光伏支架及組件安裝施工方案(最終版)
- 04S520埋地塑料排水管道施工標準圖集OSOS
- 220KV輸電線路組塔施工方案
- 高中班級讀書活動方案
- 六年級數(shù)學下冊《圖形的運動》
- 2022-2023學年北京海淀人大附數(shù)學八年級第二學期期末復習檢測試題含解析
- 高中歷史雙向細目表
評論
0/150
提交評論